三言两语入门Bag-of-words模型

三言两语入门Bag-of-words模型

知行编程网 人工智能前沿 2年前 (2022-02-24) 31 0

Bag-of-words模型是信息检索领域常用的文档表示方法。 在信息检索中,BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现。(是顺序无关的) 也就是说,文档中任意一个位置出现的任何单词,都不受该文档语意影响而独立选择的。到底是什么意思呢?我们先给出具体的例子说明一下。 先举个栗子 Wikip...

扫一扫二维码分享