画像生成でセグメンテーション？GANを使った教師なしセグメンテーション手法が登場！

論文 2019年09月03日

3 つの要点

✔️ 教師なしセグメンテーション手法「ReDO」の提案

✔️ 画像生成の仕組みでセグメンテーションタスクを解く新たな試み

✔️ 教師あり学習と比べても、様々な実データセットで良いパフォーマンスを発揮

はじめに

近年、様々な分野で画像認識技術が活用されています。これは深層学習技術の発展によって、画像認識の精度が大幅に向上したためです。画像認識技術には三段階のステップに分けられます。

１つ目は、画像に何が写っているか判断する「物体認識」です。「物体認識」では画像に何が写っているか判断するだけで、その物体の位置までは判断しません。

２つ目は、画像に写っている物体の名前と位置を判断する「物体検出」です。

３つ目は、画像のピクセル単位で物体認識を行う「セマンティックセグメンテーション」です。人間はピクセル単位で物体を認識しており、「セマンティックセグメンテーション」は私たちと同様の画像認識を機械に行わせる試みと言えます。その応用範囲は自動運転や医療など、様々な分野に渡ります。

　図1. 画像セグメンテーションの例

これら３つを総称して画像認識技術と言い、「物体認識」「物体検出」「セマンティックセグメンテーション」の順に教師データを作成するのに必要なコストは高くなります。特に、ピクセル単位でラベル付けを行う必要のある「セマンティックセグメンテーション」は他の２つに比べて、教師データの作成に非常に高いコストが掛かります。

そこで本研究では、「セマンティックセグメンテーション」を教師データを用いずに、「GAN」の仕組みを用いて行っています。

学習過程

図2.ReDOの学習手順

では、「GAN」の技術を用いた教師なし「セマンティックセグメンテーション」の過程を見ていきましょう。本研究で提案されたセグメンテーション手法を「ReDO」と呼びます。これは物体(Object)を再度描く(ReDrawing)というプロセスが由来です。「ReDO」の大まかな手順は以下の通りです。

続きを読むには

(3065文字画像6枚)

AI-SCHOLARに
登録いただく必要があります。

1分で無料で簡単登録する

または

この記事に関するカテゴリー

なかじめ: 元々画像認識を専門としていましたが、最近はセキュリティ分野、とくにバックドア攻撃に興味があり様々な論文を読んでいます。また、モデルの精度にはあまり興味がなく、これからAIが普及するにはどのような事が重要になってくるのか、といった視点で日々情報を収集しています。例えば、データのプライバシーや公平なAIに興味を持ち始めました。