歴史に忘れ去られた過去の古代文字を解読する自然言語処理モデル

論文 2019年07月11日

明確に文法などが分かっていない言語では、その言語の専門家でも翻訳を行うのは簡単ではありません。これまでも、未知の言語解読は、数十年の歳月と辞書ほどのその言語に関する専門知識を必要とします。その上、一つの言語を機械学習によって解析ができたからといって、その技術をそのまま他の言語に利用することはできません。

今回紹介する手法では、ニューラルネットワークを用いることで、解読できてない文字を解読するモデルを提案しています。さらに、今回のモデルは1つのモデルで複数の言語に対応することができます。このモデルの鍵となるのは、”編集距離”という概念を解析に用いてるところです。これにより、正解データが少ない未知言語の解析に対しても精度の向上目指します。