邱锡鹏老师 | 自然语言处理(nlp)为什么比计算机视觉(cv)发展缓慢？

知行编程网 2022-03-15 16:37 知行编程网 | 隐藏边栏 | 抢沙发 | 258 0

文章评分 0 次，平均分 0.0 ：

作者：邱锡鹏
链接：https://www.zhihu.com/question/295962495/answer/523282425
来源：知乎

本文给大家介绍邱锡鹏老师对于nlp领域和cv领域发展的见解。

NLP和CV都已经是很大的领域了，很难总体上说哪个更难。NLP领域中也很多比较容易的问题，CV领域也有很多很难的问题。

直观感受上，NLP在工业界应用很少，不成熟。但实际情况也并非如此。比如拼音输入法，几乎每个人都在用吧，其背后就是NLP的统计语言模型。每个大厂背后都有很多NLP的技术支撑。大厂对NLP工程师需求一点都不亚于CV工程师。

但为什么感觉上NLP不成熟呢？主要有两个原因：

预期太高

1 预期太高。NLP的技术发展永远落后于人们对他的预期。人们对NLP的预期等同于对科幻片中对AI的预期。NLP技术的难度和人们理想中的NLP水平很不一样。比如人们会认为实现类似SIRI的日常对话系统的难度低于专业领域的问答系统，但是实现难度可能刚好相反。

不能标准化

2 不能标准化。像语音识别、图像识别可以是相对比较标准化，输入和输出特别明确。这种可以利用大数据的优势，通过机器学习算法相对容易。

而NLP应用的大部分场景都是非标准化的，输入数据十分“dirty”，需要大量的预处理，输出也和场景结合十分紧密，没有统一标准。比如NLP中就连最底层的分词，也没有统一的标准，不同场景对分词的标准要求都不一样。这样就带来一个问题，NLP的大部分应用场景都缺少足够规模的标注数据，并且标注成本也非常高。因此准确率通常也不会很理想。同样道理，CV中涉及个性化的应用场景其实也都非常难。

另外，感觉上NLP在工业界的应用比较少，是因为大部分NLP的应用还都是在后台，为搜索、推荐等应用作为一个技术支撑，前台看不见而已。

—完—

为您推荐

一文读懂 12种卷积方法（含1x1卷积、转置卷积和深度可分离卷积等）

送你一座GitHub上的“金矿”

381页机器学习数学基础PDF下载

AI圣经 PRML《模式识别与机器学习》

我的2019秋招算法面经

本篇文章来源于: 深度学习这件小事

本文为原创文章，版权归知行编程网所有，欢迎分享本文，转载请保留出处！

知行编程网关注：1 粉丝：1

这个人很懒，什么都没写

内容反馈

你可能也喜欢

热评文章

发表评论

联系我们

标签云

推广返利