知行编程网知行编程网  2022-03-15 16:37 知行编程网 隐藏边栏 |   抢沙发  258 
文章评分 0 次,平均分 0.0

邱锡鹏老师 | 自然语言处理(nlp)为什么比计算机视觉(cv)发展缓慢?

作者:邱锡鹏
链接:https://www.zhihu.com/question/295962495/answer/523282425
来源:知乎


本文给大家介绍邱锡鹏老师对于nlp领域和cv领域发展的见解。


NLP和CV都已经是很大的领域了,很难总体上说哪个更难。NLP领域中也很多比较容易的问题,CV领域也有很多很难的问题。


直观感受上,NLP在工业界应用很少,不成熟。但实际情况也并非如此。比如拼音输入法,几乎每个人都在用吧,其背后就是NLP的统计语言模型。每个大厂背后都有很多NLP的技术支撑。大厂对NLP工程师需求一点都不亚于CV工程师。


但为什么感觉上NLP不成熟呢?主要有两个原因:


  预期太高


1 预期太高。NLP的技术发展永远落后于人们对他的预期。人们对NLP的预期等同于对科幻片中对AI的预期。NLP技术的难度和人们理想中的NLP水平很不一样。比如人们会认为实现类似SIRI的日常对话系统的难度低于专业领域的问答系统,但是实现难度可能刚好相反。

  不能标准化 


2 不能标准化。像语音识别、图像识别可以是相对比较标准化,输入和输出特别明确。这种可以利用大数据的优势,通过机器学习算法相对容易。


而NLP应用的大部分场景都是非标准化的,输入数据十分“dirty”,需要大量的预处理,输出也和场景结合十分紧密,没有统一标准。比如NLP中就连最底层的分词,也没有统一的标准,不同场景对分词的标准要求都不一样。这样就带来一个问题,NLP的大部分应用场景都缺少足够规模的标注数据,并且标注成本也非常高。因此准确率通常也不会很理想。 同样道理,CV中涉及个性化的应用场景其实也都非常难。


另外,感觉上NLP在工业界的应用比较少,是因为大部分NLP的应用还都是在后台,为搜索、推荐等应用作为一个技术支撑,前台看不见而已。

—完—

为您推荐

一文读懂 12种卷积方法(含1x1卷积、转置卷积和深度可分离卷积等)

送你一座GitHub上的“金矿”

381页机器学习数学基础PDF下载

AI圣经 PRML《模式识别与机器学习》

我的2019秋招算法面经


本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享