人工智能前沿

一手AI资讯|计算机视觉|自然语言|机器学习|深度学习
使用 Transformer 来做物体检测

使用 Transformer 来做物体检测 12

知行编程网 1年前 (2022-08-09) 10 0

这是一个Facebook的目标检测Transformer (DETR)的完整指南。 介绍 DEtection TRansformer (DETR)是Facebook研究团队巧妙地利用了Transformer 架构开发的一个目标检测模型。在这篇文章中,我将通过分析DETR架构的内部工作方式来帮助提供一些关于它的直觉。 下面,我将解释一些结构,但是如果你只是想了解如何使用模型,可以直接跳到代码部分。 ...

Transformer 的稳健性更好吗?

Transformer 的稳健性更好吗? 7

知行编程网 1年前 (2022-08-09) 13 0

最近 Transformer 在计算机视觉遍地开花,从纯 Transformer 到 Transformer 和 CNN 的显式隐式杂交,各个任务仿佛嗷嗷待哺的婴儿,等着 Transformer 奶一口,这自然让人好奇 Transformer 的稳健性(Robustness)如何。 然而,Transformer 训练起来算力要求大,对抗训练加 Transformer 训练起来算力要求就是大上加大,...

图解 Git 工作原理

图解 Git 工作原理 25

知行编程网 1年前 (2022-08-09) 6 0

本文图解Git中的最常用命令。如果你稍微理解Git的工作原理,这篇文章能够让你理解的更透彻。基本用法上面的四条命令在工作目录、暂存目录(也叫做索引)和仓库之间复制文件。 git add files把当前文件放入暂存区域。 git commit给暂存区域生成快照并提交。 git reset – files用来撤销最后一次git add files,你也可以用git reset撤销所有暂存区域文件。 ...

SOTA排行榜大变天!MIT研究十个CV测试集,平均错误率超3.4%

SOTA排行榜大变天!MIT研究十个CV测试集,平均错误率超3.4% 10

知行编程网 1年前 (2022-08-09) 29 0

如果测试集不靠谱,那测出来的模型性能会靠谱吗?MIT研究了10个流行的CV的数据集,平均测试集的错误率超过3.4%,最多的竟然错误超10%。 「clean code」是机器学习的基础,在公开的数据集取得更好的效果也是发表论文的基础。 众所周知的是,公开数据集并不都是完美的,或多或少都存在标签错误的问题。之前的工作主要关注「训练数据集」中的错误,忽视了「测试数据集」的错误。 MIT在arxiv上传了...

一文透彻理解:图像卷积、边缘提取和滤波去噪

一文透彻理解:图像卷积、边缘提取和滤波去噪 7

知行编程网 1年前 (2022-08-09) 45 0

  本文通过通俗易懂的文字解释了图像卷积、边缘提取以及滤波去燥的概念及其分类。  目录 图像卷积 图像梯度 边缘提取 1. Prewitt算子 2. Sobel算子 3. Laplacian算子 平滑去噪 1. 高斯滤波 2. 均值滤波 3. 中值滤波 一、图像卷积 现在有一张图片 f(x,y) 和一个kernel核 w(a,b)。 卷积(Convolution):卷积运算就是对于图像 f(x,y...

1秒极速求解PDE:深度神经网络为何在破解数学难题上独具天赋?

1秒极速求解PDE:深度神经网络为何在破解数学难题上独具天赋? 8

知行编程网 1年前 (2022-08-09) 16 0

两种基于深度神经网络的新方法,均可成功求解 PDE,并且能够以更快的速度、更简单的方式建模复杂的系统。有趣的是,和大多神经网络一样,我们猜不透它们为什么如此优秀。 研究者们致力于使用偏微分方程(Partial differential equation,PDE)来描述涉及许多独立变量的复杂现象,比如模拟客机在空中飞舞、模拟地震波、模拟疾病在人群中蔓延的过程、模拟基本力和粒子之间的相互作用。一直以来...

多模态预训练模型简述

多模态预训练模型简述 15

知行编程网 1年前 (2022-08-09) 56 0

1.介绍 让机器能以人类智能相似的方式作出反应一直是人工智能研究人员的目标。为了让机器能听会说、能看会认、能理解会思考, 研究者提出一系列相关任务,如人脸识别、语音合成、阅读理解等来训练及评价机器在某一方面的智能程度。具体来说是,领域专家人工构造标准数据集,然后在其上训练及评价相关模型及方法。但由于相关技术的限制,要想获得效果更好、能力更强的模型,往往需要在大量的有标注的数据上进行训练。 近期预训...

扛鼎之作!Twitter 图机器学习大牛发表160页论文:以几何学视角统一深度学习

扛鼎之作!Twitter 图机器学习大牛发表160页论文:以几何学视角统一深度学习 11

知行编程网 1年前 (2022-08-09) 27 0

导语:近日,帝国理工学院教授、Twitter 首席科学家 Michael Bronstein 发表了一篇长达160页的论文(或者说书籍),试图从对称性和不变性的视角从几何上统一CNNs、GNNs、LSTMs、Transformers等典型架构,构建深度学习的“爱尔兰根纲领”!本文是Michael Bronstein对论文的精华介绍。 「几何深度学习」试图从对称性和不变性的视角从几何上统一多种机器学...

2020-2021年NLP有什么核心技术的更迭吗?或者有什么推动领域发展的paper吗?

2020-2021年NLP有什么核心技术的更迭吗?或者有什么推动领域发展的paper吗? 2

知行编程网 1年前 (2022-08-09) 13 0

抛砖引玉,欢迎指正。讲一个预训练模型使用上的范式更迭:finetune 到 prompt-based tuning/task-reformulation。 从BERT开始,预训练模型的使用范式长期是pretrain->finetune的范式,即先在大量无标注语料上预训练一个模型,然后将模型(可选地,增加一定模块后)放到特定下游任务上的标注数据finetune。后来实验还表明在下游任务的数据上...

缺陷检测算法汇总(传统+深度学习方式)|综述、源码

缺陷检测算法汇总(传统+深度学习方式)|综述、源码

知行编程网 1年前 (2022-08-09) 104 0

导读 本文是对缺陷算法的综述、源码等资源的汇总。 文献资料汇总: https://github.com/Eatzhy/surface-defect-detection 综述:机器视觉表面缺陷检测综述 缺陷检测工具箱: https://github.com/abin24/Saliency-detection-toolbox 基于深度学习方式 1、语义分割方式 https://github.com/W...

扫一扫二维码分享