NLP

开源词法分析工具LAC重大升级！打造属于自己的个性化分词器！ 3

知行编程网人工智能前沿 2年前 (2022-01-21) 48 0

本文将为大家介绍如何使用百度开源的词法分析工具LAC实现个性化分词（附代码），并展示LAC在各数据集上惊艳的性能表现。背景介绍分词是中文自然语言处理基础且重要的任务。词是表意的完整单位。“张三”这个词中，“张”其实既可以是姓也可以表“张开”之意，而“三”则常被表示为数字。但“张三”作为一个词出现在一起时，大家明确知道这表示的是个人名，故而句子经过分词后可降低理解的难度。分词也是文本检索、知识...

一句话超短摘要，速览752篇EMNLP论文 2

知行编程网人工智能前沿 2年前 (2022-01-26) 46 0

今年的EMNLP今天开始召开啦，不知道大家的论文列表都刷完没有呀~ 什么？论文太多，看不过来，怎么办？看了论文题目还是不知道讲的是什么，怎么办？别担心，今天阿花给大家带来一个刷论EMNLP论文列表的利器，帮助大家划重点啦！那就是Paper Digest团队给大家提供的 “One sentence highlight for every EMNLP-2020 Paper”。 Paper Diges...

NLP领域的首次Hard Label黑盒攻击！ 16

知行编程网人工智能前沿 2年前 (2022-02-05) 46 0

背景前段时间已经和大家分享了两篇关于NLP Privacy的文章。今天，我们又来给大家推送优质论文了（公众号学习法）。其实，NLP与其他方向的跨界结合这段时间层出不穷，且都发表到了非常好的顶会上。目前有越来越多的 NLP 研究者开始探索文本对抗攻击这一方向，以 2020 年 ACL 为例，粗略统计有超过 10 篇相关论文。NLP Privacy可谓是NLP研究的下一个风口。本次给大家介绍一篇文...

45个小众而实用的NLP开源字典和工具 3

知行编程网人工智能前沿 2年前 (2022-01-14) 42 0

一只小狐狸带你解锁NLP/ML/DL秘籍前言随着BERT、ERNIE、XLNet等预训练模型的流行，解决NLP问题时不用上预训练模型似乎总显得自己有点过时。但是这显然是不对的。众所周知，无论训练还是推理，预训练模型都会消耗大量的算力，且高度依赖GPU计算资源。然而，有很多的NLP问题实际上仅仅靠字典+规则就可以做到够用，那么这时候强行上笨重的模型无异于高射炮打蚊子，性价比是非常低的。于...

对话系统&聊天机器人的设计艺术（上） 2

知行编程网人工智能前沿 2年前 (2022-01-07) 38 0

前言关于本文的阅读方式：这不是一篇学术综述，也不是单纯的科普文，而是试图从目标出发来渐进式的思考对话系统的设计，顺便科普。因此本文不适合跳读，也不适合5分钟式浏览，而是适合在夜深人静的时候一个人... 我知道你们夜深人静的时候肯定不会看这个的(￣∇￣) 言归正传，其实本文最主要的目的还是试图理清楚对话系统的若干概念，对话是一个很大的概念，有非常非常多的子问题，刚入坑的小伙伴...

超一流 | 从XLNet的多流机制看最新预训练模型的研究进展 12

知行编程网人工智能前沿 2年前 (2022-01-19) 37 0

导读作为 NLP 近两年来的当红炸子鸡，以 ELMo/BERT 为代表的语言预训练技术相信大家已经很熟悉了。简单回顾下 18 年以来几个预训练的重要工作: ELMo, GPT and BERT ELMo 首先提出了基于语言模型的预训练技术，成功验证了在大规模语料上基于语言模型进行文本自监督学习的有效性。 GPT 提出了 NLP 预训练技术使用时应该像 CV 预训练技术一样，在下游任务中通过 fi...

ACL20 | 让笨重的BERT问答匹配模型变快！ 10

知行编程网人工智能前沿 2年前 (2022-01-18) 33 0

一只小狐狸带你解锁炼丹术&NLP秘籍背景 BERT、XLNet、RoBERTa等基于Transformer[1]的预训练模型推出后，自然语言理解任务都获得了大幅提升。问答任务（Question Answering，QA）[2]也同样取得了很大的进步。用BERT类模型来做问答或阅读理解任务，通常需要将问题和问题相关文档拼接一起作为输入文本，然后用自注意力机制对输入文本进行多层交互编码，之...

智能问答（Question Answering）的主要研究方向有哪些？

知行编程网人工智能前沿 2年前 (2022-01-11) 33 0

非事实类问题大多数研究关注于事实类问题，而非事实类问题的研究相对不足，包括数学类的问题、判断类的问题等。 [EMNLP 2019] NumNet: Machine Reading Comprehension with Numerical Reasoning 数学类问题 [NAACL19] MathQA: Towards Interpretable Math Word Problem Solving...

GPT-3诞生，Finetune也不再必要了！NLP领域又一核弹！ 5

知行编程网人工智能前沿 2年前 (2022-01-17) 27 0

一只小狐狸带你解锁炼丹术&NLP秘籍 2018年10月推出的BERT一直有着划NLP时代的意义，然而还有一个让人不能忽略的全程陪跑模型——OpenAI GPT（Generative Pre-Training）在以它的方式坚持着，向更通用的终极目标进发。最初的GPT只是一个12层单向的Transformer，通过预训练+精调的方式进行训练，BERT一出来就被比下去了。之后2019年初的GP...

写了一篇关于 NLP 综述的综述！ 19

知行编程网人工智能前沿 2年前 (2022-02-12) 25 0

综述，往往是了解一个子领域最为高效的起点。然而，对于AI这样一个日新月异高速发展的行业，时效性也自然地成为了我们选择综述的衡量指标之一。即使一篇 AI 综述具有超高 citation，如果它写于 20 年前，那对今天的我们来说，这份综述的总结必然是不够全面的。那么，站在 NLP 发展轨迹中的此时此刻，哪些综述是当前最值得阅读的呢？本文参考了 Elvis Saravia 相关主题的 twitter...