複数の疾病を事前予測!Self-Attentionを用いた疾患予測モデルの提案
3つの要点
✔️ 慢性腎疾患(CKD)に関連のある合併症に注目
✔️ これらの合併症を Self-Attention により推定するモデルを提案
✔️ 10 以上のベースラインで性能および説明可能性について評価
SAVEHR: Self Attention Vector Representations for EHR based Personalized Chronic Disease Onset Prediction and Interpretability
written by Sunil Mallya, Marc Overhage, Sravan Bodapati, Navneet Srivastava, Sahika Genc
(Submitted on 13 Nov 2019)
Comments: Published by NeurIps 2019
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI)
背景
ここでは、本研究で取り扱われている慢性腎疾患(CKD)と、合併症である糖尿病、うっ血性心不全(CHF),腎不全、慢性閉塞性肺疾患(COPD)との関連について概説した後、研究のポイントについて述べていきます。
慢性腎疾患(CKD)と合併症
慢性腎不全(CKD) は、身体における腎臓という器官の機能が慢性的に低下している状態のことです。腎臓は、身体の老廃物を除去する役割があり、この機能が低下すると身体中の老廃物が残余、もしくは必要な物質(タンパク質等)が排泄されてしまうといった現象が発生します。そのため、老廃物が身体中に残る、もしくは必要な物質の流出を阻止しようとする働きで様々な合併症が発生します。
近年、患者数の増えている糖尿病(DM, Diabetes Mellitus) はCKD 発生の最大リスク要因と言われています。糖尿病は、一言で言えば、血液中のブドウ糖(血糖)が過剰に存在している状態です。この状態が続くと、過剰に増えた血糖により、血管内の壁が傷つき、徐々に血管の壁が厚くなっていきます(硬化)。こうした状態が慢性的になると、血管が狭窄していき、血流が不足していきます。血液が不足するということは、本来必要な栄養分が臓器の届けられないことになり、臓器の機能が低下、もしくは喪失していきます。こうした血管の異常により様々病変が発生します。また、COPD は、喫煙によって発生することがほとんどの割合を占めており、喫煙により血管障害が発生することで、合併症が発生します。
上述した糖尿病等で血管障害が発生すると、心不全・腎不全といった合併症が発生します。心不全は「心臓としてのポンプ機能が正常に働かなくなった状態」であり、うっ血性心不全は、「特定の部位に血液が停留し、心臓のポンプ機能が働かなくなった状態」です。CKDでは、血管障害が併発していることが多く、こうした症状が重症化しやすいことが報告されています。また、腎不全は、腎臓の中にある、毛細血管の塊の糸球体への血流が低下し、濾過機能が低下した状態のことです。こうした状態が続くと、血管中の老廃物が増え、心血管疾患・脳血管疾患をはじめとした合併症の発生率が上がります(例えば、心血管疾患の場合、健康な人の8〜15倍発生しやすくなります)。
こうした合併症に関連するCKDを、関連の深いCOPD に関する EHR から事前に予測することが本研究のポイントとなっています。
研究のポイント
本研究では、様々な疾患を電子医療記録(EHR)による Self-Attention を用いて推定する深層学習モデルを提案しています。EHR は近年、日本各地の病院を始め、導入が進んでいるシステムでの電子データ記録で、主にカルテ情報といった診断情報を含んでいます。こうした情報は有用である一方、データにおける統一性はまだ未成熟であり、不均一性、時間依存性、スパース性といった側面も存在しています。EHR でのデータ形式は自然言語で記載されたものが多く、近年、Transformer を始めとした NLP で注目されている Attention を導入することで、EHR の解析からCKDのリスクを予測するモデルを構築することが目的です。
続きを読むには
(4102文字画像7枚)AI-SCHOLARに
登録いただく必要があります。
この記事に関するカテゴリー