深度学习

动手做个DialoGPT：生成式多轮对话模型 3

知行编程网人工智能前沿 2年前 (2022-01-24) 36 0

前段时间刷Arixv的时候，发现清华大学开源了一个大规模的中文闲聊语料库LCCC，从开源的文件上来看，这可能是目前开源的数量最大、质量最好的闲聊语料库了，而且还包含了部分多轮对话聊天，总的来说可玩性还是蛮强的。笔者也被它吸引到了，尝试着用它来训练了一个闲聊对话模型，结果看上去还是不错的，在此分享一下自己的经验。论文名称：《A Large-Scale Chinese Short-Text Con...

谈谈工业界落地能力最强的机器学习算法

知行编程网人工智能前沿 2年前 (2022-01-28) 35 0

尽管BERT为代表的预训练模型大肆流行，但是身处工业界才会知道它落地有多难，尤其是QPS动辄几百的在线推荐、搜索系统，哪怕在大厂也很难在线上系统见到它们。今天就想反其道而行之，谈谈工业界搜索、推荐、广告这类核心场景中落地能力最强的算法（之一）：因子分解机（FM）。我不敢说它是最简单的（FM的确很简单），但是作为一个推荐算法调参工程师，掌握FM一定是性价比最高的。我推崇FM算法的原因，有以下三点：...

惊了，掌握了这个炼丹技巧的我开始突飞猛进 3

知行编程网人工智能前沿 2年前 (2022-02-04) 34 0

从不拖稿的小夕今天在知乎上刷到一个问题：哈？一向求真务实、高逼格讨论的知乎画风怎么突然就不一样了。我以为回答区会有这张图： ▲如来神掌结果竟然没有！知乎果然没有让我失望，还是一如既往的认真、严谨、有逼格。咳咳，作为一枚知乎算法圈的老司机小可爱，感觉自己有必要来添砖加瓦一下。相信我，深刻理解数据的重要性与数据构造&迭代&使用技术，你会从算法小白突飞猛进到即将入门！（认真脸首...

基于光谱数据和全连接神经网络的高光谱图像分类

橙子每日Arxiv 2年前 (2022-01-12) 34 0

今天橙子姐姐带大家看看高光谱如何实现分类吧~ 可以观察到，通过使用深度学习方法，可以对一维和二维信号实现高分类性能。在此背景下，大多数研究人员尝试使用深度学习方法对高光谱图像进行分类，这些图像的分类成功率已超过 90%。深度神经网络 (DNN) 实际上由两部分组成：i) 卷积神经网络 (CNN) 和 ii) 全连接神经网络 (FCNN)。 CNN 确定特征时，FCNN 用于分类。在高光谱图像的分...

高光谱图像聚类新方法

橙子每日Arxiv 2年前 (2022-01-04) 33 0

稀疏子空间聚类友好深度字典学习在高光谱图像分类中的应用子空间聚类技术在高光谱图像分割中显示出良好的应用前景。子空间聚类的基本假设是属于不同簇/段的样本位于可分离子空间中。如果这种情况不成立怎么办？下面和橙子姐姐一探究竟吧~ 本文推测，即使这个条件在原始空间中不成立，数据也可能被非线性地变换到一个空间，在那里它将被分成子空间。在这项工作中，本文提出了一种基于深度字典学习(DDL)原则的转换。特别地...

一人之力，刷爆三路榜单！信息抽取竞赛夺冠经验分享 24

知行编程网人工智能前沿 2年前 (2022-01-28) 33 0

在现如今的NLP竞赛中，信息抽取（IE）任务已占据半壁江山。来，让我们看看今年的一些IE竞赛都有啥：看到如此众多的IE竞赛，心动的JayJay抽空参加了CHIP2020（中国健康信息处理大会）中的3个评测，最终获得了2个冠军、1个季军，具体如下表所示：评测任务名称所获名次评测网址中文医学实体关系抽取第一 http://cips-chip.org.cn/2020/eval2 临床医学术语...

吐血整理：论文写作中注意这些细节，能显著提升成稿质量 24

知行编程网人工智能前沿 2年前 (2022-02-21) 33 0

前言不知诸位在科研的起步阶段，是否曾有过如下的感受：总感觉自己写的论文就是和自己读过的论文长得不太一样，也不知道为啥。投稿的时候，审稿人也总是 get 不到论文的核心，只揪着论文的次要细节不放。在本文中，笔者吐血整理大量的论文写作小细节。从格式到内容上帮你提升论文的清晰度和易读性，可以显著缓解论文写完后导师不爱看，评审看不懂等症状。本文适合对LaTeX基本语法有所了解的同学食用。符号篇...

小哥哥，检索式chatbot了解一下？ 26

知行编程网人工智能前沿 2年前 (2022-01-06) 31 0

1. 扫盲对话的概念很大，从输入形式上分为文本和语音，本文当然只考虑文本。从对话目的上分为任务型对话与非任务型/闲聊型对话。顾名思义，任务型对话就是为了解决任务而进行的对话，比如你让Siri帮你定闹钟、发短信等，而闲聊型对话当然就是human-to-human的正常聊天啦。本文就不讨论任务型对话了，有兴趣的同学可以戳这里扫扫盲，本文聚焦在非任务型对话的多轮对话问题上。要完成对话的建模，目前主要...

一种自配置的医学目标检测方法

橙子每日Arxiv 2年前 (2022-01-15) 30 0

机器学习如何用于医学图像处理呢？今天橙子姐姐带大家看看深度学习用于肺部数据的检测。医学图像中对象的同时定位和分类，也称为医学对象检测，具有很高的临床相关性，因为诊断决策通常取决于对象的评级而不是例如。像素。对于这项任务，方法配置的繁琐和迭代过程构成了主要的研究瓶颈。最近，nnU-Net 成功地解决了图像分割任务的这一挑战。按照 nnU-Net 的议程，在这项工作中，我们将医疗对象检测的配置过程系...

利用开放世界方案扩展一阶段检测 2

橙子每日Arxiv 2年前 (2022-01-13) 29 0

在开放集的世界里如何进行目标检测呢？下面橙子姐姐带大家一起看看一项新的工作！在许多应用中，例如自动驾驶、手动操作或机器人导航，物体检测方法必须能够检测到训练集中看不见的物体。开放世界检测 (OWD) 试图通过将检测性能推广到可见和不可见的类别来解决这个问题。最近的工作已经在生成与类别无关的建议方面取得了成功，本文称之为开放世界建议（OWP），但是当在检测模型中考虑这两个任务时，这是以分类任务的大...