脳活動を機械学習で解析。脳情報通信技術で広がる新たなビジネス

脳情報通信技術の発展と機械学習

脳情報通信技術(下図1)というのは、脳活動データから運動意図や知覚内容・認知状態といった脳情報を抽出して様々な処理機とコミュニケーションしたり、機械を動かしたり、あるいは理想的な脳状態に調整したりすることです。例えばBCI(ブレイン・マシーン・インターフェース)ニューロフィードバック、知覚内容評価などがそれに該当し、電極を使って脳活動を計測したり、電気刺激を用いて脳に介入するイメージです。

脳から情報を取り出し、それを通信することにより、言語に頼ったコミュニケーションにとらわれることなく、より自由で抽象度が高く高度なコミュニケーションを実現することを目指します。極端に言えば、攻殻機動隊やマトリックスなどで描かれているような世界を目指す技術ともいえます。

図1 脳情報通信技術の概念

最近では、米ワシントン大学と米カーネギーメロン大学の研究チームによる、3人の脳をデバイスでつなぎ、直接意思疎通できるようにする「BrainNet」が話題となりました。2人の送信者の脳波をコンピュータが受け取り(Brain-Computer Interface, BCI)、コンピュータが受信者の脳へTMSを介して情報を伝達し受信者の意思決定は脳波測定で送信者へフィードバックされるというシステムです。

このような、「認知状態」を脳の情報から読み取ることが出来るようになったのは、機械学習をはじめとした解析技術の貢献が大きいと言われています。

膨大で多様な脳情報データを特定の目的変数(例:被験者が「右に行きたいと思っている」か「左に行きたいと思っているか」)と関連付けて、モデル化が行えるようになり、そうした機械学習による解析やモデリングは脳科学の世界でも急速に普及しつつあります。人間には理解しきれない多様で膨大な脳活動パターンのデータを、人工の脳の学習機能を用いて理解するというようなアプローチです。

例えば「飲みものを取って口元に運びたい」という脳の運動意図を読み取ってロボットアームを動かすBMI(ブレインマシンインターフェース)や、動画を視聴している人間の脳活動情報から知覚内容を単語として解読することができる脳情報デコーディングも、上述のようなセンシングと機械学習双方の発展により実現されました。

このようにな技術は近年大きく発展していますが、さらに脳情報表現を変化させる介入技術も進んでいます。すでに現時点で、手を動かす運動意図を脳波で読み取り、インターネットを介して遠く離れた人の運動野をTMSで刺激し手を動かすという「脳―脳インターフェース」の開発にも成功しています。

また、AIやロボットを使って脳のメカニズムを解明する研究の第一人者で、脳情報通信総合研究所の所長である川人光男氏によると、機械学習の成果は脳科学にも応用できるとのこと。 人間の脳活動をfMRIで測定すると、視覚に関わる脳の領域にどんな情報があるかが分かりますが、ある特定の方向を表しているような情報(脳活動)がそこに現れたときに、被験者に金銭報酬を与えるとオペラント条件付けが起こり、その脳活動がより一層頻繁に生じるようになります。こうした操作を繰り返していく事で、被験者本人が気付かないまま特定の脳領域の活動を何度も発生させることができ、特定の方位に対する弁別の能力が高まるそう。この手法は『自分は自信がない』という人の自信を高めたり、ゴキブリやヘビといった嫌いな生物に対する恐怖反応を弱める事にも応用できるとの事です。

機械学習を用いた予測モデル

深層学習が流行して比較的すぐの2014年にMITの研究グループによって報告された研究成果では、視覚処理における腹側経路(大脳の視覚野の一部)の高次領域の神経情報表現の予測モデル構築を試みました。畳みこみニューラルネットワーク(CNN)を大脳の視覚領域に似せたアーキテクチャで構成した画像認識モデルは分類精度が最も良かっただけでなく、下側頭葉ニューロンの実際の振る舞いの予測可能性も高く、更にモデルの中間表現レイヤーの情報は、同じく視覚処理の中間に位置するV4野の活動を予測できました。

さらに2018年にDeepMind社のグループが発表したメタ強化学習とよばれる機能を人工のニューラルネットワークに実装した事例では、人間の神経機構をLSTM(時系列データに強みを発揮するニューラルネットワーク)ユニットと報酬予測誤差を運ぶドーパミン系が入出力ゲートを調整するアーキテクチャとして提案しました。このアーキテクチャは既存の強化学習モデルを超えるパフォーマンスを実現し、人間とほぼ相同と表現できる挙動を示しました。

前頭前野ネットワークを模したアーキテクチャによる「(メタ)強化学習」イメージ図

2018年に発表された研究では、画像認識の課題に置いて、純粋な機械学習アルゴリズムに、学習過程で画像を見ている人間の脳情報(fMRIからの知覚解読情報)を加えることによって、かなり精度が上がることが判明しました。CNNのような深層学習のアーキテクチャはそもそも人間の視覚処理と相同であるのは上記の通りですが、限界だと思われていた精度に、更に脳情報を足す事によって更新する可能性を示したという点では非常にインパクトのある研究でした。

 

ビジネスへの応用

ここまで研究の動向を中心に紹介してきましたが、これらの技術はあくまでも基礎研究上の成果ですが、こうした脳情報のリッチさと、機械学習の手軽さを併せ持った技術が実際にビジネスとして実用化され初めています。

これらの応用先としての出口は、BCI(ブレイン・マシン・インターフェース)だけではありません。

これらの技術が変革をもたらす一つの大きな領域としてマーケティング・広告領域が挙げられます。これらの商品・サービスの価値を視覚・聴覚的な入力刺激として表現し、購買行動へ誘なおうという試みは、その中核プロセスの一つですが、これらの過程を科学的・定量的に理解し応用するというのは、従来、困難な課題とされていました。

しかし、身体にある感覚器官を通して入力された情報が、過去の記憶と相互作用した上で、その価値が脳内に表象され、実際の購買場面で財布からお金を出す筋肉運動に変換されるプロセスは、すべて脳内の領域で行われるものです。ここに脳情報通信技術が貢献できる余地があります。

例えば、NTTデータでは、動画視聴中の脳情報を読み取る事により、実際に動画広告評価・改善ソリューションを行うという取り組みを現在進めています。このプロジェクトでは、機械学習を利用して、動画の視聴といった感覚入力による脳内情報表現とその個人特性、また行動出力への影響までを定量的に理解することを目指します。

脳情報通信技術をマーケティングに応用することは多種多様な産業においても同様の価値を持ちうるでしょう。

例えば、本田技術研究所は、車を運転しているドライバーが「楽しい」と感じる脳波と車両のデザインやモデル、周囲の環境情報に着目し、こうしたデータのモデリングによってドライバーの状態推定・介入技術の研究を進めています。こうした技術開発が進めば、自動運転が普及する中でもユーザーにとって本質的な「楽しさ(価値)」を最大化していくことが期待されます。

また、学習への応用も注目されています。日本人は英語のLとRの発音が聞き取りにくいといわれていますが、脳波を計測してみると、意識できないレベルでLとRの聴時の反応は異なっています。このごくわずかな差をニューロフィードバックトレーニングにより、最大化させると、LとRをはっきり聞き分けられるようになるという研究成果があり、こうしたニューロフィードバックによる語学教育ソリューションの本格的な開発もすでに始まっています。脳情報通信技術によるビジネスチャンスがまだまだ広がっているといえるでしょう。