画像生成でセグメンテーション?GANを使った教師なしセグメンテーション手法が登場!

3 つの要点

 

✔️ 教師なしセグメンテーション手法「ReDO」の提案

✔️ 画像生成の仕組みでセグメンテーションタスクを解く新たな試み

✔️ 教師あり学習と比べても、様々な実データセットで良いパフォーマンスを発揮

はじめに

近年、様々な分野で画像認識技術が活用されています。これは深層学習技術の発展によって、画像認識の精度が大幅に向上したためです。画像認識技術には三段階のステップに分けられます。

1つ目は、画像に何が写っているか判断する「物体認識」です。「物体認識」では画像に何が写っているか判断するだけで、その物体の位置までは判断しません。

2つ目は、画像に写っている物体の名前と位置を判断する「物体検出」です。

3つ目は、画像のピクセル単位で物体認識を行う「セマンティックセグメンテーション」です。人間はピクセル単位で物体を認識しており、「セマンティックセグメンテーション」は私たちと同様の画像認識を機械に行わせる試みと言えます。その応用範囲は自動運転や医療など、様々な分野に渡ります。

 図1. 画像セグメンテーションの例

これら3つを総称して画像認識技術と言い、「物体認識」「物体検出」「セマンティックセグメンテーション」の順に教師データを作成するのに必要なコストは高くなります。特に、ピクセル単位でラベル付けを行う必要のある「セマンティックセグメンテーション」は他の2つに比べて、教師データの作成に非常に高いコストが掛かります。

そこで本研究では、「セマンティックセグメンテーション」を教師データを用いずに、「GAN」の仕組みを用いて行っています。

学習過程

図2.ReDOの学習手順

では、「GAN」の技術を用いた教師なし「セマンティックセグメンテーション」の過程を見ていきましょう。本研究で提案されたセグメンテーション手法を「ReDO」と呼びます。これは物体(Object)を再度描く(ReDrawing)というプロセスが由来です。「ReDO」の大まかな手順は以下の通りです。

この記事をシェアする