CNN会不会知道地点?
三个要点
✔️ CNN对位置信息进行编码
✔️ 0 填充学习位置信息。
✔️ 位置信息存储在更深的层次。
How Much Position Information Do Convolutional Neural Networks Encode?
written by Md Amirul Islam, Sen Jia, Neil D. B. Bruce
(Submitted on 22 Jan 2020)
Comments: Accepted to ICLR2020
Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG)
Paper Official Code COMM Code
介绍:
CNN已经在许多计算机视觉任务中获得了成功,例如分类和检测任务。基本上,CNN主要作为对象的特征提取器。这是因为它们是经过本地过滤器训练的,基本不应该有任何位置信息。因此,这一点已经被指出,并提出了主要获取位置信息的模型,如胶囊网。所以很多人认为CNN的位置信息很少?
然而,这项研究可能会改变这种隐含的想法。
见图1。
图1:图像的突出区域。
看最上面一排。在左边,中间的人身上有一个明显的区域。同样,你也可以看到,大部分的图片中间都有一个明显的区域。下图为下行,上行蓝线裁剪后的图像。注意到这里有些奇怪。由于他们只是对图片进行了裁剪,所以在纹理等方面没有变化,所以在明显的区域应该没有变化。然而,裁剪后的图像的突出区域明显向左移动(中心区域)。(这是因为就训练图像而言,突出区域在图像的中心,所以才会出现这种情况。)这与我们隐含的信念相反,即CNN没有位置信息。
从这个结果来看,作者推测CNN可能在编码(获取)人类只是不理解的位置信息。本文是关于CNN的位置信息。
这篇论文被ICLR2020录用,所有审稿人都给了满分(8分)(2594篇论文中只有34篇获得满分)。如果你对其他论文的成绩感兴趣,请看这里。
要阅读更多。
你需要在AI-SCHOLAR注册。
或与本文相关的类别