动手做个DialoGPT:生成式多轮对话模型

动手做个DialoGPT:生成式多轮对话模型 3

知行编程网 人工智能前沿 2年前 (2022-01-24) 36 0

前段时间刷Arixv的时候,发现清华大学开源了一个大规模的中文闲聊语料库LCCC,从开源的文件上来看,这可能是目前开源的数量最大、质量最好的闲聊语料库了,而且还包含了部分多轮对话聊天,总的来说可玩性还是蛮强的。笔者也被它吸引到了,尝试着用它来训练了一个闲聊对话模型,结果看上去还是不错的,在此分享一下自己的经验。 论文名称: 《A Large-Scale Chinese Short-Text Con...

谈谈工业界落地能力最强的机器学习算法

谈谈工业界落地能力最强的机器学习算法

知行编程网 人工智能前沿 2年前 (2022-01-28) 35 0

尽管BERT为代表的预训练模型大肆流行,但是身处工业界才会知道它落地有多难,尤其是QPS动辄几百的在线推荐、搜索系统,哪怕在大厂也很难在线上系统见到它们。 今天就想反其道而行之,谈谈工业界搜索、推荐、广告这类核心场景中落地能力最强的算法(之一):因子分解机(FM)。我不敢说它是最简单的(FM的确很简单),但是作为一个推荐算法调参工程师,掌握FM一定是性价比最高的。我推崇FM算法的原因,有以下三点:...

惊了,掌握了这个炼丹技巧的我开始突飞猛进

惊了,掌握了这个炼丹技巧的我开始突飞猛进 3

知行编程网 人工智能前沿 2年前 (2022-02-04) 34 0

从不拖稿的小夕今天在知乎上刷到一个问题: 哈?一向求真务实、高逼格讨论的知乎画风怎么突然就不一样了。 我以为回答区会有这张图: ▲如来神掌 结果竟然没有!知乎果然没有让我失望,还是一如既往的认真、严谨、有逼格。咳咳,作为一枚知乎算法圈的老司机小可爱,感觉自己有必要来添砖加瓦一下。 相信我,深刻理解数据的重要性与数据构造&迭代&使用技术,你会从算法小白突飞猛进到即将入门!(认真脸 首...

基于光谱数据和全连接神经网络的高光谱图像分类

基于光谱数据和全连接神经网络的高光谱图像分类

橙子 每日Arxiv 2年前 (2022-01-12) 34 0

今天橙子姐姐带大家看看高光谱如何实现分类吧~ 可以观察到,通过使用深度学习方法,可以对一维和二维信号实现高分类性能。在此背景下,大多数研究人员尝试使用深度学习方法对高光谱图像进行分类,这些图像的分类成功率已超过 90%。 深度神经网络 (DNN) 实际上由两部分组成:i) 卷积神经网络 (CNN) 和 ii) 全连接神经网络 (FCNN)。 CNN 确定特征时,FCNN 用于分类。在高光谱图像的分...

高光谱图像聚类新方法

高光谱图像聚类新方法

橙子 每日Arxiv 2年前 (2022-01-04) 33 0

稀疏子空间聚类友好深度字典学习在高光谱图像分类中的应用 子空间聚类技术在高光谱图像分割中显示出良好的应用前景。子空间聚类的基本假设是属于不同簇/段的样本位于可分离子空间中。如果这种情况不成立怎么办?下面和橙子姐姐一探究竟吧~ 本文推测,即使这个条件在原始空间中不成立,数据也可能被非线性地变换到一个空间,在那里它将被分成子空间。在这项工作中,本文提出了一种基于深度字典学习(DDL)原则的转换。特别地...

一人之力,刷爆三路榜单!信息抽取竞赛夺冠经验分享

一人之力,刷爆三路榜单!信息抽取竞赛夺冠经验分享 24

知行编程网 人工智能前沿 2年前 (2022-01-28) 33 0

在现如今的NLP竞赛中,信息抽取(IE)任务已占据半壁江山。来,让我们看看今年的一些IE竞赛都有啥: 看到如此众多的IE竞赛,心动的JayJay抽空参加了CHIP2020(中国健康信息处理大会)中的3个评测,最终获得了2个冠军、1个季军,具体如下表所示: 评测任务名称 所获名次 评测网址 中文医学实体关系抽取 第一 http://cips-chip.org.cn/2020/eval2 临床医学术语...

吐血整理:论文写作中注意这些细节,能显著提升成稿质量

吐血整理:论文写作中注意这些细节,能显著提升成稿质量 24

知行编程网 人工智能前沿 2年前 (2022-02-21) 33 0

前言 不知诸位在科研的起步阶段,是否曾有过如下的感受: 总感觉自己写的论文就是和自己读过的论文长得不太一样,也不知道为啥。 投稿的时候,审稿人也总是 get 不到论文的核心,只揪着论文的次要细节不放。 在本文中,笔者吐血整理大量的论文写作小细节。从格式到内容上帮你提升论文的清晰度和易读性,可以显著缓解论文写完后导师不爱看,评审看不懂等症状。 本文适合对LaTeX基本语法有所了解的同学食用。 符号篇...

小哥哥,检索式chatbot了解一下?

小哥哥,检索式chatbot了解一下? 26

知行编程网 人工智能前沿 2年前 (2022-01-06) 31 0

1. 扫盲 对话的概念很大,从输入形式上分为文本和语音,本文当然只考虑文本。从对话目的上分为任务型对话与非任务型/闲聊型对话。顾名思义,任务型对话就是为了解决任务而进行的对话,比如你让Siri帮你定闹钟、发短信等,而闲聊型对话当然就是human-to-human的正常聊天啦。本文就不讨论任务型对话了,有兴趣的同学可以戳这里扫扫盲,本文聚焦在非任务型对话的多轮对话问题上。 要完成对话的建模,目前主要...

一种自配置的医学目标检测方法

一种自配置的医学目标检测方法

橙子 每日Arxiv 2年前 (2022-01-15) 30 0

机器学习如何用于医学图像处理呢?今天橙子姐姐带大家看看深度学习用于肺部数据的检测。 医学图像中对象的同时定位和分类,也称为医学对象检测,具有很高的临床相关性,因为诊断决策通常取决于对象的评级而不是例如。像素。对于这项任务,方法配置的繁琐和迭代过程构成了主要的研究瓶颈。最近,nnU-Net 成功地解决了图像分割任务的这一挑战。按照 nnU-Net 的议程,在这项工作中,我们将医疗对象检测的配置过程系...

利用开放世界方案扩展一阶段检测

利用开放世界方案扩展一阶段检测 2

橙子 每日Arxiv 2年前 (2022-01-13) 29 0

在开放集的世界里如何进行目标检测呢?下面橙子姐姐带大家一起看看一项新的工作! 在许多应用中,例如自动驾驶、手动操作或机器人导航,物体检测方法必须能够检测到训练集中看不见的物体。开放世界检测 (OWD) 试图通过将检测性能推广到可见和不可见的类别来解决这个问题。最近的工作已经在生成与类别无关的建议方面取得了成功,本文称之为开放世界建议(OWP),但是当在检测模型中考虑这两个任务时,这是以分类任务的大...

扫一扫二维码分享