方向和密集物体检测的准确性很高的方法出现了！

目标检测 16/09/2020

三个要点
✔️提出方向性和密集物体检测方法 DRN
✔️提出方向性和密集物体检测的数据集SKU110K-R。
✔️ 提高方向和密集物体检测的准确性

动态细化网络的定向和密集包装对象检测
，作者：。潘兴家, 任玉强, Kekai Sheng, 董伟明, 袁浩磊, 郭晓伟, 马重阳, 徐长生
(2020年5月20日提交(v1)，最后一次修订是2020年6月10日(本版，v2))
评论由CVPR2020口头发表
学科：《计算机视觉与模式识别》(cs.CV)计算机视觉和模式识别(cs.CV)

准则：

介绍：

物体检测一直在使用深度学习，在一些基准上产生令人惊讶的分数。但是，对象检测仍然存在一个特殊的问题。这就是识别任何方向的物体，并在密集的条件下检测它们的挑战。不可避免的是，大多数检测器多采用训练数据来训练模型，优化参数，然后使用固定的参数集。这就会导致在测试过程中，具体数据缺乏灵活性。

现代检测模型是基于RCNN系列框架的。这些方法首先生成大量的水平边界框作为RoIs，然后对这些RoIs进行分类和回归。然而，对于某些物体，由于目标错位，使用这种水平RoIs可能会有问题。事实上，航空影像中的目标通常是任意方向的、密集的，这是个问题，因为会出现大量的伪影。所以另一种技术是使用锚来处理任意方向的目标。然而，这种方法在计算上很复杂，因为它需要获得各种锚点，如角度、比例和长宽比。一些研究者使用RoI Trans（通过将轴向对齐的RoI转化为可旋转的RoI来解决RoI与方向目标之间的错位问题），旋转RoI本身，并通过学习旋转不变的特征来增加RoI的方向性。然而，这些都有明显的倾斜性。这是因为学习的初衷是为了从训练数据的世界中提取的具体数据中学习通用性。尽管如此，学习到的通用模型与目标方向之间的关系是扭曲的，目标方向是只增加一个具体的过程。所以最近，有人提出了一种使用动态滤波器并允许不同样本变化的方法。

作者对这一方法进行了改进，在CenterNet中也有介绍（在AI-SCHOLAR中也有介绍）。CenterNet），这种新方法将目标视为一个点而不是一个边界框，并增加了一个角度预测头作为基线，并提出了本文的网络--动态细化网络（DRN）!DRN由两个新的部分组成：特征选择模块（FSM）和动态精炼头（DRH）。

贡献

我们提出了一个模块，根据目标的形状和方向自适应调整神经元的接受场。这个FSM模块能有效缓解接受场和目标之间的不协调。

- 我们提出了两个DRH（分别用于分类和回归任务），DRH-C和DRH-R。这些DRHs可以根据每个样本的唯一性和特异性进行建模，并完善每个对象的预测。

-收集一个重新标记的数据集SKU110K-R，并对方向性边界框进行准确的注释，以促进方向性和密集物体检测的研究。

通过DOTA、HRSC2016、SKU110K和SKU110K-R，实现了方向性和密集物体检测的一致性精度提升。

要阅读更多。

你需要在AI-SCHOLAR注册。

1分钟内免费轻松注册

或

与本文相关的类别

目标检测

加藤: AI-SCHOLAR是一个评论媒体，以通俗易懂的方式介绍关于AI（人工智能）的最新文章。人工智能的作用不仅限于技术创新，日本的科研能力正在下降，政府也在不断削减研究预算。向世界传达人工智能的技术、应用以及支持人工智能的基础科学的背景，是一个重要的外延，可以极大地影响社会对科学的理解和印象。 AI-SCHOLAR旨在帮助消除普通民众和专家之间对人工智能的理解差距，为人工智能融入社会做出贡献。另外，我们希望帮助大家把自己的学习和研究经验在媒体上体现出来，在社会上表达出来。任何人都可以用艰深的词汇来解释高深难懂的事情，但AI-SCHOLAR追求的是"可读性"和"可理解性"，充分利用词汇和设计来传递信息，以此为媒介。