『避けられない事態』を理解する最新のプランニングロボット

AIロボットにお買い物を頼むとき、ロボットは家を出てから帰ってくるまでの計画をどのように立てれば良いでしょうか。なんでもできると思われがちなAIですが、実はプランニングは得意ではありません。今回は新たに提案された、『途中の状態をイメージしながらプランニングを行うAI』を紹介します。

論文

目次
1.プランニングの難しさ
2.未来予測で中間目標を見つけ出す
3.時間という概念にとらわれない未来予測AI
4.実験

(1) プランニングの難しさ

プランニングはとても難しい課題です。例えば「豆腐屋さんで木綿豆腐を買ってきて」とロボットにお願いしたとします。「豆腐屋へ行くにはバスに乗らなければならない」、「バスに乗るには近くのバス停まで行かなければならない」、「豆腐を買うにはお金を用意する必要がある」、「豆腐を受け取るにはボウルを持っている必要がある」などと中間の目標を正しく把握する必要があります。しかし中間の目標を立てるには事前知識として知らなければ行けないことが多く、また知っている事前知識をうまく活用できなければなりません。

他にもプランニングが難しい例としてよく上げられるものとして、『ルービックキューブ』があげられます。

https://ja.wikipedia.org/wiki/ルービックキューブ

ルービックキューブの解き方を覚えていれば簡単ですが、人であれば普通はルービックキューブが上手い人の操作を見て「一面ずつ揃えていけばいいんだな」とか「下の段、真ん中の段、上の段と順に揃えればいいんだな」などと目標を立てることができます。しかし単純なロボットだと、ランダムに操作するか、しらみ潰しに操作するしかできないでしょう。このように中間の目標を立てるというのはとても有効ですが、人であれば直感的に目標をたてられるものの、その直感をAIで再現することはとても難しいことでした。今回紹介する論文の提案手法は、まさに中間目標を直感的にイメージすることができるようなAIとなっています。

(2) 未来予測で中間目標を見つけ出す

この論文では、ルービックキューブの例のように誰かがプレイする様子を事前に見ることができるタスクを想定しています。またここからは下図(e)の迷路を解くプランニングAIを考えていきます。

迷路内をスタート地点からゴール地点まで練り歩くルートは様々ありますが、ある時スタート地点を出発した人の未来の状態をイメージすることを考えた時、いくつかの時刻についてその人の状態は、100%イメージすることができます(この迷路には必ず通らなければならない隙間があるため)。この、必ず通らなければならない道を通ることこそが『中間目標』であることは明らかで、いきなり「スタートからゴールまで行け」と言われても困りますが、この中間目標をうまく見つけることでスムーズに課題を遂行することができるはずです。

そして論文ではこの中間目標を見つけるための未来予測の仕方を提案しています。

 

(3) 時間という概念にとらわれない未来予測AI

既存のAIでも、少し先の未来であれば予測することができました。

https://japanese.engadget.com/2016/11/28/1-5-ai-mit/

これは、画像を入力すると数秒先まで未来を予測して映像を生成するというAIです。

このようなAIは2016年には既にあったのですが、予測する時間が長くなったり、映像内で起こることが連続的ではない場合(カメラの視点が変わる、他のモノが写ってくる、被写体が別の行動を始めるなど)、などには使えず未来の予測には限界があり、また映像も全体的にぼやけたものしか生成できませんでした。

このような既存の未来予測の手法では、ある時刻の画像を見てその次の時刻の画像を生成するということを逐次的に行い、より生成される映像を本物の映像に近づけることを目標にAIを学習させることが一般的な方法です。

しかし、提案手法ではガラッと趣を変え、『あるタスクを遂行中であるという前提で、映像ではなく、綺麗な未来の画像を何枚か生成をすること』に目標に未来予測を行います。

全体的な映像ではなく綺麗な画像を何枚か生成するだけで良いとなると、自然と『そのタスクを遂行するうえで必ず起こる状態の画像を生成すれば良い』となります。なぜなら、必ず起こるかわからない画像を生成することは目標から離れやすくなることであり、また、綺麗な画像を生成するためには、より起こりやすい状態の画像を狙って生成したほうが目標に近づけるためです。

つまり、『あるタスクを遂行中であるという前提で、綺麗な未来の画像を何枚か生成をすること』を指標として未来予測を行うAIを作ると、そのAIが生成する画像は中間目標を描いたものそのものであって、この未来予測AIを使えば高度なプランニングが可能となります。

この、未来予測という課題から時間という概念を捨て、より意味的に大事な未来だけを抽出するような方法を提案した点が、今回の論文の新規性となっています。

(4) 実験

論文ではこの中間目標を見つける手法の有効性を検証するために、『オブジェクトを持ち上げる』というとても簡単なロボットのタスクを扱っています。

『オブジェクトを持ち上げる』というタスクを遂行中であることを前提に、図左側のstartとgoalの画像をAIに入力すると、min/genminの画像が生成されました。これは、ちょうどオブジェクトを掴んでいるところのようなので、狙い通り、中間目標の生成に成功したと言えます。

このタスクは少々単純すぎている気はしますが、理論的には中間状態がいくつ合ってもそれらを列挙できるような手法となっています。また、明示的に中間目標を理解することができるAIというのはこれまでほとんどなかったため、これからのプランニングAIやロボットの研究に良い影響をもたらしそうだと言えるでしょう。

まとめ

今回、中間目標を生成するAIを紹介しました。ロボットのプランニングというのがこれほど難しいものだとは知らなかった、と思われる方も多いかもしれませんが、ロボットAIというのは本当に難しい分野で人間の直感がいかにすごいものかを痛感させられます。今回の提案手法のように、いかに人間の直感をAI,ディープラーニングの得意な手法で表現するかという研究が現在流行っており、だんたんAIが人間に近づいて来ているとも言えるでしょう。

ライター 東京大学 学生


AIメディアライターを大募集中!

当メディアは、最新AI技術情報をビジネスマンにも理解できるように「AIをどこよりも分かりやすく!どこよりも身近に!」をコンセプトとした、AI論文翻訳メディアです。

AI関連技術は今、急激な勢いで進化しています。毎日、さまざまな論文が発表され、「最新の手法」が数週間で変わるぐらいその変化は激しいものです。

一方で、AIのビジネス活用の現場には、情報の非対称性が存在します。ビジネスサイドのAI技術に対する理解不足が大きいため、「AIでなんとかなるだろう」という異常な期待値の高さが生まれており、このため、AI事業を目的化してしまい真の課題解決に結びついていません。

新しい技術とそれがもたらす社会の変化を俯瞰的な視点でとらえることは、ビジネスマンのひとつの役割のはずです. しかしことAIに関して言うと、難解なイメージだけが先行してしまし、実態がつかめないと感じる方が多いのではないでしょうか?

このサイトがすこしでもその心理的な障壁を下げ、AIへの理解を深める役割を担えれば幸いです。サイトを眺めながら、この辺が研究トレンドとして熱いんだなとインスピレーションをかきたてるようなサイトになれたらいいなと思っています。

上記のようなメディアを目指して、共に走ってくれるライターを我々は募集しております。
応募対象者は、強い好奇心とAIに関する知見を世の中に広め、AIがより活用される社会を作りたいとビジョンに共感していただいた方すべて受け付けます。

AI-SCHOLARライターに採用されると3つの特典が付きます。
1. ライター同士のコミュニティを運営しており、最新の論文の動向について知ることができます。
2. AI-SCHOLARのライターにのみご紹介されるAI関連の求人案件が多数ございます。
3.講談社が運営するブルーバックスに転載される可能性があり、ライターとしての認知度が向上します。

お名前
必須
ふりがな
必須
生年月日

必須
性別 必須
電話番号 必須
出身校 必須
メールアドレス 必須
ライターとしての意気込み 任意
個人情報のお取扱いについて

ご入力いただいた個人情報は、下記の目的で利用いたします。
・お問合せやご質問に対応するため
・当社が取り扱うサービスのご案内のため

ご入力いただいた情報をシステム上で保管・管理するため、当社の選定基準を満たした事業者に委託する場合がございます。これ以外の場合において、皆様の個人情報をご本人の同意なく第三者に提供することはございません。
ご入力いただいた個人情報に関して、利用目的の通知、個人情報の開示、訂正、追加、削除、利用停止、消去、第三者提供の停止を求めることができます。これらの請求をおこないたい場合は、下記の窓口までご連絡ください。
当社に提供される個人情報の内容は、ご本人様の任意によるものです。 ただし、必要な項目をいただけない場合、適切な対応ができない場合があります。
当社のサービスは、Cookie及びこれに類する技術を利用することがあります。これらの技術は、当社による当社のサービスの利用状況等の把握に役立ち、サービス向上に資するものです。Cookieを無効化されたいユーザーは、ウェブブラウザの設定を変更することによりCookieを無効化することができます。ただし、Cookieを無効化すると、当社のサービスの一部の機能をご利用いただけなくなる場合があります。

【個人情報お問い合わせ窓口】
株式会社wevnal
担当:個人情報保護管理者 CTO 木曽隆
住所:東京都渋谷区渋谷1-11-8 渋谷パークプラザ5F
電話:03-5766-8877