印象操作を行い”記憶させやすい”画像を生成するGAN
印象の操作を行う、と言った”定性的な”画像の操作はAIにはこれまで難しいといわれていました。
例えば、”記憶させやすい”画像とはどのようなものでしょうか?記憶のしやすさは、それらに伴うもの具体的な定義がありません。
今回紹介する新たなアイデアでは、”記憶させやすい”という画像の操作がどのようなものか学習し最適化することで、任意の画像を人間にとって記憶させやすいように変化させます。
記憶のしやすい画像を、”物体を大きく・画像を明るく・形状を丸く”すれば良い。という風に具体的な操作に落とし込み、傾向を学習させることで生成を可能にします。
さらに、学習したパラメータに”重み付け”を行うことを今回は試みます。これにより、”記憶のしやすさ”という方向性を元に、どの程度記憶しやすいかを調整することが可能です。
例えば、上のチーズバーガーを考えてみてください。このモデルでは、右に移動するにつれて、より記憶に残るチーズバーガーを視覚化しています。
一番右のバーガーはより明るく、丸く、より規範的で、おいしそうに見えます。視覚化は”記憶のしやすさ”のモデルに基づいて学習されるので、逆に言えば、人間が見ているものが実際に人間の感覚や感性にどのような因果的な影響を与えることを検証することができます。
さらに、”記憶のしやすさ”だけではなく”美しい”や”エモーショナル”といった印象を操作することも可能です。
続きを読むには
(1848文字画像7枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー