「VDBによってGANの精度を改善する」敵対的学習の最新手法 

「敵対的学習」とは、『機械学習において、この 10 年間でもっともおもしろいアイデア』と言われるほど、研究ではもちろん実用レベルでも大変注目されている手法です。今回はこちらの論文を基に、「敵対的学習」の多岐にわたるAIへの応用例と、最新の研究で明らかにされたよりよい「敵対的学習」のコンセプトを紹介します。

本日取り上げる論文:
Variational Discriminator Bottleneck: Improving Imitation Learning, Inverse RL, and GANs by Constraining Information Flow

(1) 幅広く使われる敵対的学習

https://www.christies.com

先日、AIが描いたこちらのアート作品が日本円にして約4800万円で売れたとのことでニュースになっていましたが、今回紹介していく「敵対的学習」という手法は、まさにこの画家のようなAIの作り方に代表されます。

敵対的学習では、2つのAIが登場します。この2つのAIはよく「偽札製造者」と「警察」に例えられますが、「偽札製造者」は警察に偽札だとバレないようなものを作り、対して「警察」は偽札をもれなく見つけて摘発できるように、とAI同士で戦いながらそれぞれが賢くなる(より正確には少しづつパラメータを調整する)という手法です。

ここで、偽札ではなく「肖像画」に置き換えてこの敵対的学習を行った結果、「肖像画製造者」によって描かれたオリジナルの絵が冒頭に紹介したものとなっています。

このような、特に何かを生成することを目的とした敵対的学習手法を特にGAN(Generative Adversarial Network)と呼びます。GANは絵画の生成だけではなく、オリジナルの映像や音楽の生成、高解像度化や高フレームレート化、さらにはプライバシー保護を目的とした医療データの標本の生成など、実用レベルで様々な分野に応用され始めています。

敵対的学習の利用は、直接何かを生成する分野に限りません。今回紹介する論文では「GAN」に加えて、「模倣学習」, 「逆強化学習」への利用を例に上げており、この3つの分野で共通して用いることのできる、敵対的学習のより良い適用のためのコンセプトを提案しています。(模倣学習, 逆強化学習についてはこの記事ではあまり掘り下げないことにします。)

(2) VDB

1. 敵対的学習の難しさ

敵対的学習手法は実用的で面白く華やかな面も多々あるのですが、実はこれまであまり好き好んで使われる手法ではありませんでした。(エンジニア泣かせもいいところなのです。)

理由は簡単で、(1)で「敵対的学習とは、2つの敵対するAIが戦いながらそれぞれ賢くなる手法」と紹介しましたが、実際には両方のAIが賢くなり続けることはほとんど無く、先程の偽札の例を用いると大抵「警察」が優秀になりすぎて、「偽札製造者」がどのように工夫しても偽札を摘発されてしまい偽札製造者の学習が不可能になる、というようなことが起こるためです。

2. 手加減

そもそもなぜ「警察」が優秀になりすぎるのかというと、それは警察が偽札製造者の些細なミスを早々に見つけてしまうことにあると考えられます。例えば本物のお札に印刷される人物の髪の毛は一本一本丁寧に描かれていますが、偽札業者がそれを綺麗に描けるようになるには時間がかかります。しかし警察は一旦「髪の毛に注目した偽札か否かの見分け方」を見つけてしまうと次々に摘発を成功させてしまい、偽札業者が試行錯誤して上手い髪の毛の描き方を学習しても全く効果が現れず、スランプに陥ってしまうのです。(そのためGANは、他のAI手法と比べてもややリスキーな手法として扱われていました。)

そしてここから今回の論文の提案手法『VDB』の紹介になります。

これまでの考察をまとめると、警察が早い段階から、「お札」の画像データから様々な情報を抽出し、効率よく偽札を摘発する方法を見つけてしまうことが問題であった、と言えます。そこでVDBは、その警察が使える情報量を制限してしまおうという、ある種「手加減」(※1)のような提案になっています。少し踏み込んだ説明を加えると、警察はVDBにおいても自由に「お札」の画像データから摘発に必要な情報を抽出しますが、得られた情報量が細かすぎる、多すぎると判断された場合(極端な例だと、人物像の髪の毛の本数やシワの数などを特徴として抽出していた場合)、抽出できる情報量を減らすような制約が加えられます。

3. 結果

Figure 8左側のグラフに示されているのですが、VDBを使ったGANを用いた時、既存手法と比べ圧倒的に2つのAIの学習が安定し(一番下の折れ線グラフ)、加えて長時間AI同士を戦わせ学習させ続けられるようになったため、本物か偽物かより見分けられにくい画像が生成できるようになりました。(Figure 9は実際に生成された画像。)

さらに、「模倣学習」, 「逆強化学習」と呼ばれる敵対的学習手法を用いた他の分野のAIでも有用性が確認され、論文は高く評価されています。

以下は「模倣学習」を使って、アクロバティックな体の動かし方を生成した例です。このAIは敵対的学習によって「良い体の動かし方」と「悪い体の動かし方」をしっかり理解しているので、たとえ急にものをぶつけられても動じない、素晴らしい体幹を獲得していることが見て取れます。

(3) まとめ

「敵対的学習」について、その利用の幅の広さとこれまでの課題、そしてより長くAI同士が戦い続けるように提案された「手加減」について紹介しました。この手法を導入することによって敵対的学習の利用がより手軽になり、絵画の生成のみならず様々な産業分野での応用が期待できそうです。

ライター:東京大学 学生

(※1) 論文中で「手加減」という言葉は全く使われていませんが、ライターなりに意訳しました。


AIメディアライターを大募集中!

当メディアは、「AIをどこよりも分かりやすく、どこよりも身近に。」をコンセプトとした、AI論文翻訳メディアです。

そもそもAI(特にディープラーニング)は発展途上の技術であり、急激な勢いで進化しています。毎日、さまざまな論文が発表され、「最新の手法」が数週間で変わるぐらいその変化は激しいものです。

一方で、AIのビジネス活用の現場には、情報の非対称性が存在し、”何がほんとか分からない”と言う声も多く聞きます。ビジネスサイドのAI技術に対する理解不足が大きいため、真の課題解決やイノベーションに結びついていません。ブームに乗じて、それほど性能が高くないAIサービスや製品を見る機会も随分増えました。さらに今後の伸びしろに懐疑的な声も上がり始めています。

このサイトを見ることでAIの可能性を知り、わくわくしたり、考えたり、未来へ想いを巡らせる。そんな理解を深める”少しのきっかけ”を与えることができるメディアになれたらいいなと思っています。

「AI-SCHOLAR」では現在、このようなビジョンに共感してくれるエンジニアや研究者のライターを募集しています。

論文紹介から、コラム、動向紹介まで様々なジャンルでの募集です。
署名記事で書いて頂き、自分の会社やブログへのリンクを貼って頂くのもOK。
自社のブランディングや知名度アップに使って頂いても構いません。

自分ならもっと良いコンテンツが書けるのに。。という想いを一度でも感じたことがある人であれば、まずはAI-SCHOLARライターの扉を叩いて下さい。

お名前
必須
ふりがな
必須
生年月日

必須
性別 必須
電話番号 必須
出身校 必須
メールアドレス 必須
ライターとしての意気込み 任意
個人情報のお取り扱いについて

株式会社wevnal(以下「当社」といいます。)は、AI-SCHOLAR(以下「本サイト」といいます。)をご利用になる方(以下「ユーザー」といいます。)の個人情報保護の重要性について認識し、個人情報の保護に関する法律(以下「個人情報保護法」といいます。)を遵守すると共に、以下のプライバシーポリシー(以下「本プライバシーポリシー」といいます。)に従い、適切に取り扱うものとします。

1. 個人情報の定義

本プライバシーポリシーにおいて、個人情報とは、生存する個人に関する情報であって、当該情報に含まれる氏名、生年月日その他の記述等により特定の個人を識別することができるもの(他の情報と容易に照合することができ、それにより特定の個人を識別することができることとなるものを含みます。)を意味するものとします。

2. 個人情報の利用目的

当社は、ユーザーの個人情報を、以下の目的で利用いたします。
(1)本サイトのサービス提供のため
(2)本サイトの利用に伴うご案内のため
(3)本サイトのサービスに関するご意見、お問い合せ等への対応のため
(4)メールマガジン・DM・各種お知らせ等の配信・送付のため
(5)ユーザーの承諾・申込みに基づく、本サイト掲載企業等への個人情報の提供のため
(4)当社の商品、サービス等のご案内のため
(5)当社のサービスに関する当社の規約、ポリシー等に違反する行為への対応のため
(6)当社のサービスの改善、新サービスの開発、マーケティング等のため

3. 個人情報の第三者への提供

当社は、ユーザーの同意を得て、以下の提供先に、以下の提供情報内容を以下の手段又は方法で提供することがあります。
(1)提供先について
登録ユーザーが本サイトにおいて資料の請求、閲覧もしくはダウンロードする場合、その資料の提供元である本サイト掲載企業(当該提供元企業から委託を受けた者を含みます。なお、所属企業ではなく、企業に所属する個人が提供元である場合もあります。)に、以下の情報が提供されます。
(2)提供情報内容
ユーザーから取得した情報
(3)提供の手段又は方法
電磁的な方法による送信

また、次に掲げる場合は、関係法令に反しない範囲で、ユーザーの同意なく個人情報を第三者に提供することがあります。
(1) 法令により許容されている場合
(2) ユーザーが第三者に不利益を及ぼすと判断した場合
(3) 公衆衛生の向上または児童の健全な育成の推進のために特に必要がある場合であって、ユーザー本人の承諾を得ることが困難である場合
(4) 国の機関若しくは地方公共団体またはその委託を受けた者が法令の定める事務を遂行することに対して協力する必要がある場合で、ユーザー本人の同意を得ることによりその事務の遂行に支障を及ぼすおそれがある場合
(5) 裁判所、検察庁、警察またはこれらに準じた権限を有する機関から、個人情報についての開示を求められた場合
(6) 合併その他の事由による事業の承継に伴って個人情報が提供される場合であって、承継前の利用目的の範囲内で利用する場合

4. 個人情報取扱業務の外部委託

当社は、個人情報取扱業務の一部または全部を外部委託することがあります。なお、委託先における個人情報の取扱いについては当社が責任を負います。

5. 統計データの利用

当社は、個人を特定できないよう加工した統計データを作成することがあります。当社は、統計データを何ら制限なく利用することができるものとします。

6. 個人情報の開示・訂正・利用停止等

原則として、ユーザーご本人に限り、個人情報の開示、訂正、追加または削除、利用停止、ならびに第三者への提供の停止(以下「個人情報の開示等」といいます)を求めることができるものとします。ただし、以下の場合は個人情報の変更等に応じないことがあります。
(1) ユーザー本人または第三者の生命、身体、財産その他の権利・利益を害するおそれがある場合
(2) 当社のサービスの適正な実施に著しい支障を及ぼすおそれがある場合
(3) 他の法令に違反することとなる場合
また、当該個人情報の変更等に多額の費用を要する場合、その他の、個人情報の開示等を行うことが困難な場合であって、ユーザーの権利・利益を保護するため必要なこれに代わるべき措置をとるときは、個人情報の変更等に応じないことがあります。

7.  Cookie(クッキー)その他の技術の利用

当社サービスは、Cookie及びこれに類する技術を利用することがあります。これらの技術は、当社による当社サービスの利用状況等の把握に役立ち、サービス向上に資するものです。Cookieを無効化されたいユーザーは、ウェブブラウザの設定を変更することによりCookieを無効化することができます。但し、Cookieを無効化すると、当社サービスの一部の機能をご利用いただけなくなる場合があります。

8. お問い合わせ

開示等のお申出、ご意見、ご質問、苦情のお申出その他個人情報の取扱いに関するお問い合わせは、以下の個人情報管理責任者までお願い致します。

株式会社wevnal
担当:個人情報保護管理者 CTO 木曽隆
住所:東京都渋谷区渋谷1-11-8 渋谷パークプラザ5F
電話:03-5766-8877

9. プライバシーポリシーの変更

当社は、法令等の定めがある場合を除き、必要に応じて、本プライバシーポリシーを変更することができるものとします。

10. プライバシーマークに関して

当社は、プライバシーマークの認証を取得しています。
認証番号:21004560(01)

制定年月日   2011年4月1日
最終改訂年月日 2019年10月1日

この記事をシェアする