オートエンコーダの進化系! 画像分割し、デフォルメ化を行う「DAEs」!

参考論文 : Deforming Autoencoders: Unsupervised Disentangling of Shape and Appearance

教師なし学習モデルの一つであるオートエンコーダ(自己符号化器)は、これまで次元削減など、機械学習の研究分野でも様々研究されてきました。

今回はオートエンコーダを用いて、1つの特徴量を解きほぐす(分解する)、いわゆるDisentagled Representaion問題を解く教師なしモデル「DAEs : Learing Disentagled Representation」を紹介します。

過去の研究は、様々な変動要因を説明する潜在変数を分離・分解することに取り組んできました。例えば、アイデンティティー、イルミネーション、空間サポート、回転、平行移動、拡大縮小などの低次元変換、または年齢、性別、変動などがそれらに当たります。

本モデルの特徴として、オートエンコーダの発展型であるため、正解データ用いることなく教師なし学習よって一枚の画像の特徴へ、外見と形に分解することができます。例えば手書き数字の「5」を認識させた場合、数字そのものの外見「5」と手書きのクセの2つに分割することを教師なしで行うことが可能となります。

この記事をシェアする