“你所知道的word2vec都是错的”:论文和代码天壤之别,是普遍现象了?

“你所知道的word2vec都是错的”:论文和代码天壤之别,是普遍现象了? 5

知行编程网 人工智能前沿 2年前 (2022-03-27) 6 0

来自 | 凹非寺出品 | 量子位word2vec是谷歌2013年开源的语言工具。两层网络,就能把词变成向量,在NLP领域举足轻重,是许多功能实现的基础。可是现在,有一位叫做bollu (简称菠萝) 的程序员,大声对世界说:“关于word2vec,你所知道的一切都是错的。”在他看来,论文里的算法解释,和代码实现一比,讲的根本是两回事。是不是只要开源了代码,论文写不写清楚都没关系?一番仔细的论述,引起...

NLP的游戏规则从此改写?从word2vec, ELMo到BERT

NLP的游戏规则从此改写?从word2vec, ELMo到BERT 20

知行编程网 人工智能前沿 2年前 (2022-01-06) 2 0

前言 还记得不久之前的机器阅读理解领域,微软和阿里在SQuAD上分别以R-Net+和SLQA超过人类,百度在MS MARCO上凭借V-Net霸榜并在BLEU上超过人类。这些网络可以说一个比一个复杂,似乎“如何设计出一个更work的task-specific的网络"变成了NLP领域政治正确的研究方向。而在这种风向下,不管word2vec也好,glove也好,fasttext也好,都只能充当一个锦上添...

扫一扫二维码分享