GANの進化形現る! 幾何学を利用した新たなモデル「Sphere GAN」理論

現在、様々な画像認識技術において”GAN”が利用されるようになり、その応用範囲はめざましいものがあります。新しく発表された「Sphere GAN」では幾何の理論を基に構成することで次元数を引き上げ、計算精度の向上を実現しています。

参考論文 : Sphere Generative Adversarial Network Based on Geometric Moment Matching

従来のGANモデルの弱点

従来のGANモデルの主なアイデアは、偽物のデータと本物のデータ間の分布散らばりを最小化するものでした。GANはこれまで様々なモデルに利用されてきましたが、処理できない複雑な問題も存在します。例えば、連続的に画像データを生成し学習しようとすると、計算が爆発してしまう場合があります。

従来のGANが処理できない問題を解決するため、これまでIPMs(integral probability metrics : 積分確率法)に着目したWGANモデルなどの発展形が提案されてきました。

WGANとは、GANの識別関数にWasserstein距離の概念を導入することにより、GANの勾配消失問題などの解決を試みる手法です。

しかしながら、WGANモデルでは、調整が必要なハイパパラメータも増えてしまい、より多大な計算処理が必要となってしまいます。さらに、多くのIPMsベースのGANは、1次元のWassertein距離における双対形式の統計量のみで計算を行うため、サンプルの制約条件によって計算の不安定さに苦しむことが多くあります。