物体検出の新しいパラダイム:必要なのはセグメンテーションだけ
3つの要点
✔️ マルチモーダルアノテーションとセグメンテーションを組み合わせモデルを提案
✔️ 極端な場合に堅牢性を実現するための非NMSアプローチである
✔️ まだまだ改善の余地はあるものの従来手法と同等かそれ以上の性能であった
Segmentation is All You Need
written by Zehua Cheng, Yuxiang Wu, Zhenghua Xu, Thomas Lukasiewicz, Weiyang Wang
(Submitted on 30 Apr 2019 (v1), last revised 26 May 2019 (this version, v3))
Comments: Published by arXiv.
Subjects: Computer Vision and Pattern Recognition (cs.CV)
はじめに
ディープラーニングをコンピュータービジョンタスクに適用して大成功を収め、ディープラーニングは、コンピュータビジョンの分野でさまざまな困難なタスクを目覚ましく進歩させてきました。その中でも物体検出は実生活で最も広く採用されているタスクの1つです。しかし極端なケースが常に発生します。例えば、複雑なオクルージョン(図1(a))、劣悪な照明条件(図 1(b))、小さな対象物(図 1(c))のような両極端に遭遇すると、現在最も広く採用されているアプリケーションでも容認できないほど精度は低くなってしまいます。
こう言った状況を打破する一般的な方法としては、大きく分けると2つあります。1つ目が極端なケースを集めた学習データを学習させることでそう言った場合にも対応しようとする方法と2つ目が極端なケースに対応できるようなモデルを設計する方法です。それぞれに問題があり、1つ目は極端なケースを集めたデータは極端なのでデータが少なく、またアノテーションされているものはほとんど存在しないため、データの収集コストが高い。2つ目は複雑なモデルの設計をすることは、ハイパーパラメータの決定や複雑な問題に対しての一般化の問題があり、簡単ではない。
続きを読むには
(3023文字画像13枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー