搜索引擎核心技术与算法 —— 倒排索引初体验 6
今天开启一个新篇章——智能搜索与NLP。本篇章将由羸弱菜鸡小Q和大家一同学习与智能搜索相关的知识和技术,希望能和大家一同学习与进步,冲鸭!! 这里首先区分两个概念:搜索和检索 检索:数据库时代的概念,及将数据存入数据库,有需要的时候进行查取。对结果的要求绝对精确;比如我要在图书馆里找到所有出现“白马”字样的图书,这里用到的就是检索。 搜索:互联网时代的概念,人们将信息资源放在网上,第三方将互联网的...
今天开启一个新篇章——智能搜索与NLP。本篇章将由羸弱菜鸡小Q和大家一同学习与智能搜索相关的知识和技术,希望能和大家一同学习与进步,冲鸭!! 这里首先区分两个概念:搜索和检索 检索:数据库时代的概念,及将数据存入数据库,有需要的时候进行查取。对结果的要求绝对精确;比如我要在图书馆里找到所有出现“白马”字样的图书,这里用到的就是检索。 搜索:互联网时代的概念,人们将信息资源放在网上,第三方将互联网的...
第二个标题:一般而特殊的前馈神经网络 前馈神经网络 在文章《逻辑回归到神经网络》(以下简写《LR到NN》)中,小夕为大家描述了一个从逻辑回归延伸到神经网络的过程。在《一般化机器学习与神经网络》中,小夕阐述了神经网络的一般性。这一篇会完全进入神经网络的状态,阐述神经网络的特殊性。 其实在《LR到NN》中的这张简单的图,就是本文要讲的前馈神经网络(feed-forward neural netwo...
【导读】本文是人工智能专家George Seif撰写的博文,介绍了在当前深度学习比较火热的情景下需要避免的三个坑。 Tweaking Neural Net Parameters Three reasons that you should NOT use deep learning 深度学习在过去几年一直是人工智能领域最热门的话题。事实上,正是它激发了科学家、政府、大公司以及其他所有人对人工...
尽管深度学习给工业界带来了一波上线春天,但是总有很多比较难的业务,模型反复迭代后准确率依然达不到预期的产品标准,难以满足用户期望。 以下为工业界常见讨(si)论(b)场景: R&D小哥哥一顿调参输出,RoBERTa都用上了,终于将模型从80%准确率提升到了90%,但是PM小姐姐说,“不行!咱们必须要达到95%准确率才能上线!否则就是对用户和产品逼格的伤害!” 怎么办呢? 熟悉工业界上线套路...
一起追剧鸭 简介 Berkeley全栈深度学习追剧计划是由夕小瑶的卖萌屋发起的优质公开课打卡项目,通过微信群为同期追剧的小伙伴提供交流平台。关于该计划的详请见这里。 1. Berkeley深度学习追剧群 目前已有1000+小伙伴加入,公众号后台回复口令 深度学习追剧 入群。 2. 课程主页 https://course.fullstackdeeplearning.com 第2期内容 本期是FSDL...
简介 Berkeley全栈深度学习追剧计划是由夕小瑶的卖萌屋发起的优质公开课打卡项目,通过微信群为同期追剧的小伙伴提供交流平台。关于该计划的详请见这里。 Berkeley深度学习追剧群 目前已有1000+小伙伴加入,公众号后台回复口令 深度学习追剧 入群。 课程主页 https://course.fullstackdeeplearning.com 第5期内容 神经网络的调试确实是让人头秃的事情,如...
1. 扫盲 对话的概念很大,从输入形式上分为文本和语音,本文当然只考虑文本。从对话目的上分为任务型对话与非任务型/闲聊型对话。顾名思义,任务型对话就是为了解决任务而进行的对话,比如你让Siri帮你定闹钟、发短信等,而闲聊型对话当然就是human-to-human的正常聊天啦。本文就不讨论任务型对话了,有兴趣的同学可以戳这里扫扫盲,本文聚焦在非任务型对话的多轮对话问题上。 要完成对话的建模,目前主要...
第三十三届AAAI人工智能顶级会议(AAAI-19)将于2019年1月27日至2月1日在美国夏威夷檀香山的希尔顿夏威夷村举行。程序委员会主席将是Pascal Van Hentenryck(美国密歇根大学)和周志华老师(中国南京大学)。 今天中午,周老师发微博说,人工智能顶级会议AAAI 2019,目前的论文摘要提交达到7745篇,又创下新的纪录。 注意,在AAAI 2018,投递论文为3808 篇...
面试官: 听说你对多模态感兴趣,请问为什么多模态学习要比单模态学习效果好? 候选人: 直观地,多模态学习可以聚合多源数据的信息,使得模型学习到的表示更加完备。以视频分类为例,同时使用字幕标题等文本信息、音频信息和视觉信息的多模态模型要显著好于只使用任意一种信息的单模态模型,这已经被多篇文章实验验证过。 面试官: 直觉+实验是老生常谈了,我听过很多次了,有没有更严谨一些的证明? (候选人内心语:面试...
在开放集的世界里如何进行目标检测呢?下面橙子姐姐带大家一起看看一项新的工作! 在许多应用中,例如自动驾驶、手动操作或机器人导航,物体检测方法必须能够检测到训练集中看不见的物体。开放世界检测 (OWD) 试图通过将检测性能推广到可见和不可见的类别来解决这个问题。最近的工作已经在生成与类别无关的建议方面取得了成功,本文称之为开放世界建议(OWP),但是当在检测模型中考虑这两个任务时,这是以分类任务的大...
推广返利