人工知能はどこまで比喩表現を理解できるのか

自然言語処理を応用したサービスを作るとき、ユーザーが入力したテキストから「ユーザーが何を考えているのか」を読み取ることは、適切な反応を行うために重要です。

しかし、自然言語による表現には様々なバリエーションがあり、ときに機械では処理しきれないようなメッセージが入力されてしまうこともあります。

一般によく使うものの機械が処理しづらい自然言語の表現として、”比喩”はその一つの例と言えます。本論文では比喩検出タスクにニューラルネットワークを導入し、機械が比喩表現をどの程度認識できるのかについて検証しています。ニューラルネットワークを用いたシンプルなシステムは高い精度で比喩表現を検出できる一方で、比喩検出には解決できていない課題が多くあることがわかりました。

 

自然言語における比喩表現

比喩表現とは、字義通りの意味で用いられていない単語の用例を指します。例えば以下のような例です。

ここで、字義通りの意味で用いられている動詞はイタリック体、比喩として用いられている動詞は太字で示されています。

一つ目の文における「examining」は直後の表現を受けて「顕微鏡で調べる」という意味になりますが、実際に国家を顕微鏡で調べることはでないので比喩表現であることがわかります。同様に2つ目の文は字義通り「溺れた学生」を指していますが、三つ目の文は「学生ローンに溺れている」という比喩表現になっています。

こうした言い回しは一般的に使われ、人間にとっては簡単に意味が理解できるものです。しかし、「examining=検査する」や「drowning=溺れる」という意味をそのまま記憶している機械には処理しづらい表現であると言えます。

比喩表現の処理はなぜ重要か

人間同士の会話であれば、比喩表現は日常的に利用されます。もし機械が比喩表現をうまく処理できるようになれば、より人間らしい対話が実現できると考えられます。現在の自然言語処理システムでは比喩を扱うことが難しいため、ユーザーも自ずと比喩表現を避けた入力をしています。しかし今後AIが発展していく中で、ユーザーは自然な対話としてAIに比喩表現の理解を求め、比喩表現を用いたシステムの利用を期待すると考えられます。そうした要求に応えるために、比喩の検出の研究は重要です。