最新AI論文をキャッチアップ

AI人材就職支援 vistAI

ドメイン知識なし教師なし学習を実現したImage GPT、画像生成もすごい! (画像の表現学習2020夏特集1)

ドメイン知識なし教師なし学習を実現したImage GPT、画像生成もすごい! (画像の表現学習2020夏特集1)

画像認識

3つの要点
✔️ 未知ドメイン知識なし教師なし表現学習成功、価値ある実証実験(PoC)、計算量は度外視
✔️ 生成モデルとしても驚きの画像生成能力

✔️ 獲得した表現を用いた画像分類でSOTA性能

Generative Pretraining from Pixels
written by 
(Submitted on 17 Jun 2020)

Comments: Published by Open AI

今回から3回の予定で、ライター持ち込み特集企画「画像の表現学習2020夏」と題して、教師なし学習による各種手法をご紹介していきたいと思います。この分野、性能が十分な域に達したためか様々な手法が数多く提案され、混戦の様相を呈しています。その中から特徴的な手法を選んでお届けしたいと思います。

はじめに〜教師なし+表現学習の意義

このシリーズを通して主に画像を扱う論文のご紹介となるため、CIFAR-10のようなデータセットで説明します。「教師なし学習」をこのようなデータセットに行うとき、ラベルを全く使わずにクラスタリングを行うようなケースが考えられます。
 
左端の列の画像と合うものを右に向かってクラスタリング
 
例えばこういった教師無しでのクラスタリングが可能になると、こんな応用が教示コストなしに実現できる道が(やや)開けますよね。
 
・部屋をお片付けするロボットが「おもちゃ」と「絵本」をそれぞれまとめる。
・工場で「ナットA」と「ボルトB」を分別する。
 
これを可能にするには、画像データの特徴を効率よく表現できる必要があります。「効率よく表現できているか」どうかは、その先の応用で決まります。多くの論文ではメジャーなデータセットの分類問題で性能を測定していますが、物体検出性能で測ることもよく見られます。
 
CNNで表現を学習し、その出力を使って様々な用途のheadで応用する例 (ライター作成)
 
一般的にはメジャーなCNNモデル(ResNet等)に表現を学習させて、その出力を様々な用途で使います(上記のhead)。
 
これまではImageNetなどで学習した「学習済みモデル」が一番高性能で、「転移学習」で様々な用途に使われてきました。ImageNetを「教師あり学習」で分類させるだけで、実はすでに良い特徴量が得られています。

続きを読むには

(9778文字画像20枚)

AI-SCHOLARに
登録いただく必要があります。

1分で無料で簡単登録する

または
daisukelab avatar
製造業を中心に数々の製品ソフトウェア設計を成功させたバックグラウンドを持ち、ディープラーニングをインパクトに変える研究開発をオープンに推進。ご相談はTwitterアカウントへのDMにてお願いします。

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする