深度学习

全球44家机构，55位大佬，历时两年，打造最强NLG评测基准！ 14

知行编程网人工智能前沿 2年前 (2022-02-03) 16 0

（大家好，我是已经鸽了夕总仨月没写文章了的小轶（yì）！新的一年一定改过自新，多读paper多写稿，望广大读者敦促(ง •̀_•́)ง）今天要和大家分享的是卖萌屋学术站上的本月最热paper。何以最热，看它头上顶了多少大厂tag大概就知道了：点开paper以后，小铁我更是直呼好家伙..... 超长author list——55位作者众星云集，来自共计全球44家不同机构。并且，在paper末尾更...

训练效率低？GPU利用率上不去？快来看看别人家的tricks吧～ 11

知行编程网人工智能前沿 2年前 (2022-01-06) 92 0

前言首先，如果你现在已经很熟悉tf.data+estimator了，可以把文章x掉了╮(￣▽￣””)╭ 但是！如果现在还是在进行session.run(..)的话！尤其是苦恼于GPU显存都塞满了利用率却上不去的童鞋，这篇文章或许可以给你打开新世界的大门噢(￣∇￣) 如果发现经过一系列改良后训练效率大大提高了，记得回来给小夕发小红包(￣∇￣) 不过，这并不是一篇怒贴一堆代码，言（三）简（言）意（两...

NeurIPS 2020 所有RL papers全扫荡

知行编程网人工智能前沿 2年前 (2022-01-26) 12 0

论文列表 1.《Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model》关键词：model-based reinforcement learning, minimaxity, planning, policy evaluation, instance-depend...

论文投稿新规则，不用跑出SOTA，还能“内定”发论文？！ 15

知行编程网人工智能前沿 2年前 (2022-02-09) 50 0

从5月初开始，CV圈似乎开始了一阵MLP“文艺复兴”的热潮：在短短4天时间里，来自谷歌、清华、牛津、Facebook四个顶级研究机构的研究者分别独立发布了4篇关于MLP结构在图像任务上取得不错效果的论文。虽然研究本身令人兴奋，但发表的过程却让人一言难尽：来自牛津的小哥Luke就在reddit上抱怨到他正在进行的实验被谷歌的MLP-Mixer抢先发表（scoop）了，所以他正在撰写的实验总结也只能以...

从逻辑回归到神经网络 21

知行编程网人工智能前沿 2年前 (2021-12-29) 21 0

回顾小夕在文章《逻辑回归》中详细讲解了逻辑回归模型，又在《Sigmoid与Softmax》中详细讲解了Sigmoid的实际意义（代表二类分类问题中，其中一个类别的后验概率）。至此，我们已经比较透彻的理解了逻辑回归模型假设函数(也就是用于预测类别的函数)。纯从计算顺序上来说，逻辑回归预测类别的顺序即： 1. 输入样本X与模型参数作内积，结果记为z 2. 将中间结果z输入到Sigmoid函数，...

详解医学顶刊《柳叶刀》最新发表新型冠状病毒研究论文 8

知行编程网人工智能前沿 2年前 (2022-01-14) 9 0

前言新型冠状病毒（2019-nCoV）的突发恰逢春节，千家万户都对疫情十分关注。令人心痛的是，病毒带来的不止有病痛，还有来自各路媒体的大量谣言和不实解读。作为科研工作者的我们，希望能略尽绵薄之力，为大家整理学术界最新研究成果，并进行通俗易懂、严谨客观的翻译和解读。具体来说，我们对 2020年1月24日发表在医学领域国际顶级期刊《柳叶刀》上的关于新型冠状病毒（2019-nCoV）的两篇论文（这也是...

ICLR最高分论文揭秘模型泛化，GNN是潜力股 19

知行编程网人工智能前沿 2年前 (2022-01-30) 3 0

文 | Jerry Qiu 编 | 小轶我们都知道，人类在很多任务上都可以很好地完成“外推”，例如：啊不——我是说——例如，我们学会两位数的加减乘除后，就可以轻松将其推广至任意大整数的四则运算：从数学的角度来讲，外推其实是与内插并列的一个概念。想必大家对多项式插值、样条插值等插值方法不陌生。通过已知的、离散的数据点，在范围内推求新数据点，即称为内插（Interpolation）。而如果我们在...

解析深度学习优化：Momentum、RMSProp 和 Adam 16

知行编程网人工智能前沿 2年前 (2022-02-25) 71 0

虽然局部极小值和鞍点会阻碍我们的训练，但病态曲率会减慢训练的速度，以至于从事机器学习的人可能会认为搜索已经收敛到一个次优的极小值。让我们深入了解什么是病态曲率。病态曲率考虑以下损失曲线图。 **病态曲率** 如你所知，我们在进入一个以蓝色为标志的像沟一样的区域之前是随机的。这些颜色实际上代表了在特定点上的损失函数的值，红色代表最高的值，蓝色代表最低的值。我们想要下降到最低点，因此，需要穿过峡...

如何与深度学习服务器优雅的交互？ 14

知行编程网人工智能前沿 2年前 (2022-01-04) 119 0

有没有想到小夕今天会发文章呢？(￣∇￣)有木有超级想小夕呢(￣∇￣) 小夕在前面写了一堆纯理论和半理论的文章，不要怕，这次来一篇纯工程的tricks集合！如果有人问小夕："小夕，要是人工智能的就业岗位一夜之间消失了，你会去转行做什么呢？" 答曰："当然是去做Linux运维啊23333" 小夕有一台自己负责的GPU服务器，她可让小夕操碎了心呐。最近好不容易把这娇气的小公举拉扯大了，下面就向各位服务...

学会提问的BERT：端到端地从篇章中构建问答对 3

知行编程网人工智能前沿 2年前 (2022-01-22) 8 0

机器阅读理解任务，相比不少读者都有所了解了，简单来说就是从给定篇章中寻找给定问题的答案，即“篇章 + 问题 → 答案”这样的流程，笔者之前也写过一些关于阅读理解的文章，比如《基于CNN的阅读理解式问答模型：DGCNN》[1]等。至于问答对构建，则相当于是阅读理解的反任务，即“篇章 → 答案 + 问题”的流程，学术上一般直接叫“问题生成（Question Generation）”，因为大多数情况下，...