印象操作を行い”記憶させやすい”画像を生成するGAN

印象の操作を行う、と言った”定性的な”画像の操作はAIにはこれまで難しいといわれていました。
例えば、”記憶させやすい”画像とはどのようなものでしょうか?記憶のしやすさは、それらに伴うもの具体的な定義がありません。

今回紹介する新たなアイデアでは、”記憶させやすい”という画像の操作がどのようなものか学習し最適化することで、任意の画像を人間にとって記憶させやすいように変化させます。
記憶のしやすい画像を、”物体を大きく・画像を明るく・形状を丸く”すれば良い。という風に具体的な操作に落とし込み、傾向を学習させることで生成を可能にします。

さらに、学習したパラメータに”重み付け”を行うことを今回は試みます。これにより、”記憶のしやすさ”という方向性を元に、どの程度記憶しやすいかを調整することが可能です。

例えば、上のチーズバーガーを考えてみてください。このモデルでは、右に移動するにつれて、より記憶に残るチーズバーガーを視覚化しています。
一番右のバーガーはより明るく、丸く、より規範的で、おいしそうに見えます。視覚化は”記憶のしやすさ”のモデルに基づいて学習されるので、逆に言えば、人間が見ているものが実際に人間の感覚や感性にどのような因果的な影響を与えることを検証することができます。

さらに、”記憶のしやすさ”だけではなく”美しい”や”エモーショナル”といった印象を操作することも可能です。

この記事をシェアする

コメント

中村幸雄 Yukio NAKAMURA  @yukio_n_being
2019/06/30 14:18

AIを用いて「記憶し易い」画像に変換する技術。同じ対象を撮影した写真でも、対象が通常の形状から崩れていたり、小さかったり、暗かったり、他の物が混在したりすると記憶に残りにくい。記憶に残り易い画像の傾向を学習したAIが画像変換を行うことで「記憶のしやすさ」を改善できる。新しい観点。 https://t.co/G4tQY2qRcf