症例の少ない、希少疾患の分類モデルの提案。データの少なさを深層学習でカバー!

症例の少ない、希少疾患の分類モデルの提案。データの少なさを深層学習でカバー!

3つの要点
✔️ データの少ない希少疾患を正確に把握する知識グラフ(KG)による自動分類アルゴリズムを提案
✔️ BoW と KG との間で共有される専門用語に基づいた Bag of Knowledge words を組み合わせた分類モデルを提案   

✔️ サンプリング、DL、特徴量抽出といった手法と比較して、頑健な分類が可能であることを確認(F1スコアで評価)

Improving rare disease classification using imperfect knowledge graph
written by Xuedong Li, Yue Wang, Dongwu Wang, Walter Yuan, Dezhong Peng & Qiaozhu Mei
(Submitted on 05 Dec 2019)

Comments: Published by BMC Medical Informatics and Decision Making volume 19.
Subjects: Machine Learning (cs.LG)

背景

ここでは、本研究で取り扱われている「希少疾患」について概説した後、研究のポイントについて述べていきます。

希少疾患とは?

希少疾患は、一般集団と比べると少数の人々にしか発生しない病気で、欧州・米国では、発症割合が 2000 人に 1 人以下であれば、その疾患が希少であるとされています。特徴として、、数が少ない故に開発治療が進まず、治療の選択肢がない(少ない)こと、また重度で慢性化しやすいこと、進行性・衰弱性のものが多く、30%の患者は5歳未満で亡くなること、また、疾患の80%は遺伝性であることなどが挙げられます。

また、こうした疾患の多くは、既存のガイドラインで判定することができず、未診断疾患として、病名がつく・認定されるまでに時間がかかるケースも多いです。そのため、専門的な治療を受けることのできる患者は全体の10%程度と言われています。そのため、希少疾患では、患者のトリアージ、リスクの層別化、標的療法 を

日本では希少疾患のことを「難病」と呼び、国が指定した難病に対して、研究・治療開発を助成するといった制度も存在します。国際間の比較をしてみると、情報共有のためのプラットフォームの構築といった、先進的な取り組みがフランスをはじめとした欧米にて先進的な取り組みがなされる一方、日本ではまだ確立されたものがない現状があります。また、オーファンドラッグという、希少疾患に対する治療薬の開発が海外では使用されている薬が、日本では開発すら行われていないことも多く、システム整備等の制度面を含め、かなり遅れている状況であることが推察されます。加えて医療従事者の間でも、認知されていない疾患も多く、認知度の向上も早急な課題として挙げられている一方、進んでいないこともあります。こうした状況の中で、希少疾患を判断するための人材・システムが必要とされています。

研究のポイント

本研究では、希少疾患の、診断の難しさ、長時間が必要な問題に対して機械学習を用いた手法を提案しています。希少疾患はその特性上、データ数の少ない中で、どのようにして分類モデルを構築していくのかという点が非常に大切であると考えられます。提案手法では、Web 情で公開されている、既存のデータリソース(知識グラフネットワーク)を用いています。これらの手法は、範囲と精度に限界があるため、提案手法ではこうした問題を改善していくことがポイントになります。

この記事をシェアする