知行编程网知行编程网  2022-05-13 15:00 知行编程网 隐藏边栏 |   抢沙发  67 
文章评分 1 次,平均分 5.0

思考:在计算机视觉任务上,CNN为何有效?

出品 | 深度学习这件小事

思考:在计算机视觉任务上,CNN为何有效?

自从AlexNet在ILSVRC-2012图像分类比赛中取得惊人的成绩以来,卷积神经网络(Convolutional Neural Networks, CNN)一直在计算机视觉领域扮演着相当重要的角色。

但为什么CNN在计算机视觉任务上可以达到如此效果呢?我们一起来从头思考一下。

   计算机视觉处理什么数据?

计算机视觉处理的数据类型不是统计表,也不是文本数据,而是图像。图像的特点是数据量大,存在许多冗余信息,因此我们需要巧妙地减少数据量并从中提取有效特征。

为了便于大家理解,我们这里举个例子:

假设我们需要根据一张人的照片确定其年龄,那么我们要做的就是提取有效特征从而进行推断。那什么可以作为有效特征呢?头发长短,有没戴眼镜吗?有的人会说,你这能看出啥,不如看他脸上的皱纹,有没有白头发。

嗯,很有道理,那我们接下来要怎么让模型提取出这些特征呢?

   如何从图像中提取特征

刚才咱提到了皱纹,这确实是判断人年龄的一大重要指标,那我们应该怎么从照片上提取出来代表皱纹的特征呢?咱先来看看皱纹长啥样。

思考:在计算机视觉任务上,CNN为何有效?
图 1 原图局部
唔。。看在皱纹的份上,这人年纪确实不小了。那模型怎么看皱纹呢?

思考:在计算机视觉任务上,CNN为何有效?
图 2 模型眼中的皱纹

模型眼中的皱纹类似图2,啧啧,不就是几条线嘛,这简单,我们只需要从图像中提取出皱纹的线条,就可以作为代表皱纹的特征了。一种主流提取线条的方法就是使用二维滤波器。

思考:在计算机视觉任务上,CNN为何有效?
图 3 二维滤波器

在这里,我们用的滤波器是一个3x3矩阵,对角线的值为1,其他值为0。利用此滤波与输入图像进行卷积操作,输出值越高就意味着图像中的该区域与滤波器形状越吻合,即输出值越高就意味着该局部区域越是线条状的。当然了,滤波器中的值不一定非得是0或1,也可以取-1以便进行严格的形状搜索。为提取皱纹特征,我们可以使用下列滤波器(图4)。

思考:在计算机视觉任务上,CNN为何有效?
图 4 边缘滤波器

用以上滤波器对原始图像进行卷积操作后,我们可以通过输出值知道从原始位置中提取的特征的位置和强度了。这就是CNN的核心操作之一。

   滤波器?我一般该用哪种滤波器呢?

对于一般任务而言,可以通过各种滤波器来提取特征。但是,我们现在很少为提取某个特征来设计具体的滤波器,因为我们有了一大神器CNN!

CNN不需要我们来设计某个具体的滤波器。实际上,CNN的训练就是对这些滤波器的训练,卷积神经网络的参数很大一部分就是这些滤波器的参数。因此,通过大量的训练样本,CNN可以自己学会提取特征,并彻底学到人类永远不会注意到的细节,这就是CNN的力量。 

参考链接:
https://www.artificialintelligencebits.com/convolutional-neural-networks-why-are-they-so-good-for-image-related-learning

<pre style="max-width: 100%;letter-spacing: 0.544px;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-right: 8px;margin-left: 8px;max-width: 100%;white-space: normal;color: rgb(0, 0, 0);font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;widows: 1;line-height: 1.75em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong>完<strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong></span></strong></span></strong></section><section style="max-width: 100%;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;widows: 1;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-right: 8px;margin-bottom: 15px;margin-left: 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(0, 0, 0);box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;font-family: 微软雅黑;caret-color: red;box-sizing: border-box !important;overflow-wrap: break-word !important;">为您推荐</span></strong></span></section><p style="margin-right: 8px;margin-bottom: 5px;margin-left: 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 1.75em;letter-spacing: 0px;box-sizing: border-box !important;overflow-wrap: break-word !important;">一文通俗了解对抗生成网络(GAN)核心思想<br style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"  /></p><section style="margin-bottom: 5px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);cursor: pointer;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;font-size: 14px;">MIT最新深度学习入门课,安排起来!</span></section><p style="margin-right: 8px;margin-bottom: 5px;margin-left: 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;line-height: 1.75em;letter-spacing: 0px;box-sizing: border-box !important;overflow-wrap: break-word !important;">五分钟了解机器学习十大算法<br style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"  /></p><p style="margin-right: 8px;margin-bottom: 5px;margin-left: 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;line-height: 1.75em;letter-spacing: 0px;box-sizing: border-box !important;overflow-wrap: break-word !important;">图深度学习入门难?这篇教程帮你理清楚了脉络</p><p style="margin-right: 8px;margin-bottom: 5px;margin-left: 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 1.75em;letter-spacing: 0px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;">谷歌出现新冠肺炎确诊病例,限制员工出行;比尔·盖茨:可能成百年不遇的大流行病</span><br style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"  /></p></section></section></section></section></section></section></section></section>

思考:在计算机视觉任务上,CNN为何有效?

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享