画像を見たときに対する脳細胞の反応をCNNで解析可能に

東京大学の研究チームは、CNNを用いて、目で見た画像に対する視覚野の神経細胞の反応の活動をコンピュータで詳細に解析する手法を開発しました。脳内における複雑な非正線形性を持つ感覚系の処理機構の解明に有用であり、さらには、より人間や動物の振る舞いに近い人工知能の開発につながる可能性も期待できると述べられています。

【論文】Characterisation of nonlinear receptive fields of visual neurons by convolutional neural network

今後、人工知能が自動運転や医療診断など人命に関わりうる領域に活用されるにあたっては、人間を含む動物が目で見た視覚情報をどのように処理しているのかを解明していくことが必要です。神経コードを解読するには、個々のニューロンの刺激反応特性を包括的に理解することが重要ですが、これを達成するための障壁として、神経細胞反応の※非線形性を分析することが困難だということがあります。

※非線形性とは?
入力と出力が比例の関係にならない現象に特有の性質。全体として現れる効果が、原因となる因子の効果の和にならないことをいう。

この研究では、畳み込みニューラルネットワーク(CNN)を組み込むことによって、目で見た画像に対する視覚野の神経細胞の活動(非線形応答特性、特に受容野)を符号化しコンピュータ上で詳細に解析する手法が提案されています。

神経細胞の活動を教師データとして活用

最初に、2200枚のイメージ画像とシミュレートされた細胞の対応する応答を含むデータセットを生成しました。CNNのさまざまな種類の非線形性に対する処理する能力を調べるために、V1単純セル2、V1複雑セルに見られる整流、シフト不変性、面内回転不変性など、さまざまな基本非線形性を組み込んでいます。これらを画像に対する神経細胞の活動を教師信号としてニューラルネットワークを学習させ、画像に対する視覚的反応をCNNで符号化し推定できるかどうかを調べました。

さらに、最大応答を予測的に誘発するような画像を合成することによって(活性化最大化)、このニューラルネットワークの出力を最大化するように入力画像を更新することを繰り返します。

反復的に視覚化された画像を包括的に比較したとき、画像がいくつかのクラスターに分割され得ることを見出しました。これらの画像の相互相関は全体的に高いため、主に平行移動として説明することができたそう。

未知の反応選択性が同定可能に

この手法を、マウスにも適用しました。マウス数千枚の画像を見せた際の、1次視覚野における神経細胞の活動をデータとして適用したところ、高い精度で新規画像を見た時の一次視覚野の反応選択性に対応した画像が生成され、対応する神経細胞の活動を予測できました。本手法をより高次の領域に応用すれば、異なる画像から細胞が反応しやすい画像を作成し、未知の反応選択性が同定されることにも期待できるといいます。

本手法は他の感覚野の解析にも応用可能であり、脳内における複雑な非正線形性を持つ感覚系の処理機構の解明に有用であるとのこと。さらには、脳神経細胞の活動を写し取った深層ニューラルネットワークを用いることで、より人間や動物の振る舞いに近い人工知能の開発につながる可能性も期待できると述べられています。