赶上最新的AI论文

CNN会不会知道地点?

图片识别

三个要点
✔️ CNN对位置信息进行编码
✔️ 0 填充学习位置信息。
✔️ 位置信息存储在更深的层次。

How Much Position Information Do Convolutional Neural Networks Encode?
written by Md Amirul IslamSen JiaNeil D. B. Bruce
(Submitted on 22 Jan 2020)

Comments: Accepted to ICLR2020
Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG)
Paper 
Official Code COMM Code

介绍:

CNN已经在许多计算机视觉任务中获得了成功,例如分类和检测任务。基本上,CNN主要作为对象的特征提取器。这是因为它们是经过本地过滤器训练的,基本不应该有任何位置信息。因此,这一点已经被指出,并提出了主要获取位置信息的模型,如胶囊网。所以很多人认为CNN的位置信息很少

然而,这项研究可能会改变这种隐含的想法。
见图1。

图1:图像的突出区域。

看最上面一排。在左边,中间的人身上有一个明显的区域。同样,你也可以看到,大部分的图片中间都有一个明显的区域。下图为下行,上行蓝线裁剪后的图像。注意到这里有些奇怪。由于他们只是对图片进行了裁剪,所以在纹理等方面没有变化,所以在明显的区域应该没有变化。然而,裁剪后的图像的突出区域明显向左移动(中心区域)。(这是因为就训练图像而言,突出区域在图像的中心,所以才会出现这种情况。)这与我们隐含的信念相反,即CNN没有位置信息

从这个结果来看,作者推测CNN可能在编码(获取)人类只是不理解的位置信息。本文是关于CNN的位置信息。

这篇论文被ICLR2020录用,所有审稿人都给了满分(8分)(2594篇论文中只有34篇获得满分)。如果你对其他论文的成绩感兴趣,请看这里

要阅读更多。

你需要在AI-SCHOLAR注册。

1分钟内免费轻松注册

  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!
加藤 avatar
AI-SCHOLAR是一个评论媒体,以通俗易懂的方式介绍关于AI(人工智能)的最新文章。 人工智能的作用不仅限于技术创新,日本的科研能力正在下降,政府也在不断削减研究预算。 向世界传达人工智能的技术、应用以及支持人工智能的基础科学的背景,是一个重要的外延,可以极大地影响社会对科学的理解和印象。 AI-SCHOLAR旨在帮助消除普通民众和专家之间对人工智能的理解差距,为人工智能融入社会做出贡献。 另外,我们希望帮助大家把自己的学习和研究经验在媒体上体现出来,在社会上表达出来。 任何人都可以用艰深的词汇来解释高深难懂的事情,但AI-SCHOLAR追求的是"可读性"和"可理解性",充分利用词汇和设计来传递信息,以此为媒介。

如果您对文章内容有任何改进建议等,请通过 "联系我们 "表格与爱学网编辑部联系。
如果您能通过咨询表与我们联系,我们将非常感激。

联系我们