腎臓の治療を、AIで判断できるか？臨床データを用いた腎臓代替療法（RRT）の最適な時期を推定せよ！

medical 2021年05月10日

3つの要点
✔️ 慢性腎疾患（Chronic kidney diseases: CKD）に対して、血液透析または腎移植による腎代替療法（Renal replacement treatment: RRT）の最適な時期を事前に把握することは、患者の健康と病状の改善における重要な要因
✔️ 本論文では、台湾の国民健康保険の併存疾患データのみを用いて、CKDと初めて診断されてから3カ月、6カ月、12カ月後にRRTが開始されることを予測する予測モデルを提案
✔️ 8,492人の患者のデータを用いて、CKD診断時から12カ月以内のRRTを予測するための受信者動作特性曲線下面積（AUC）が0.773となりました

Using machine learning models to predict the initiation of renal replacement therapy among chronic kidney disease patients
written by Erik Dovgan , Anton Gradišek, Mitja Luštrek, Mohy Uddin, Aldilas Achmad Nursetyo, Sashi Kiran Annavarajula, Yu-Chuan Li, Shabbir Syed-Abdul
(Submitted on 5 June 2020)
Comments: Accepted to PLoS ONE.
Subjects: RRT, machine learning (ML)

背景

腎臓治療の適切なタイミングを予測することは可能なのでしょうかでしょうか？

この論文は、腎臓代替治療—Renal replacement treatment: RRT—に焦点を当て、機械学習を用いて、適切な時期を推定するモデルの構築を目的とした調査に関する報告です。腎機能低下は、心血管疾患の最大のリスク因子—疾患を引き起こす原因—と指摘され、また、一度悪化すると、改善が困難であるため、適切な治療時期を予測することは、予防を含めた介入を行う上で、重要な意味を持ちます。一方、こうしたRRTに関する最適な時期の推定について、調査した研究は少ないのが現状です。本研究では、臨床現場で、容易に取得可能なデータ—CKDと合併症の診断データ—をもとに、機械学習モデルをベースとした、RRTの最適な治療時期の推定モデルについて、調査をおこないました。モデル構築では、複数の特徴抽出、および特徴選択を対象とした組み合わせを調査し、また、「CKDの合併症—糖尿病・高血圧など—を持つ集団で、RRTの予測精度はより顕著に向上するのではないか」という仮説を立て、糖尿病を持つ患者のサンプルデータをもとに検証しています。この研究では、腎機能代替療法に関する推定の知見を明確化し、今後の医療における予測モデルの研究基盤と様々なアプローチに有用な知見を残しています。

腎臓について

まず初めに、CKDに関連の深い、腎臓について、簡単に述べます。腎臓には痛覚がなく、また、高齢者での疾患が多いため、年代によっては、実際どのような機能を持つ臓器であるのか、あまり知見のない方も多いと思います。そのため、ここでざっくりとした、簡単なイメージを掴んでいただければ幸いです。

腎臓は、血液中の不要物を濾過し、体外に排出する、背中の中央付近にある臓器です。位置としては、背骨を挟んで二つ存在し、血液を通して、体内の必要物・不要物を分け—血液を濾過するイメージです—、尿を生成します。この分離は、毛細血管の集合体—糸球体—にておこなわれ、心臓から送り出される血液の 1/4 が流れ込みます。

より具体的には、濾過機能—糸球体で行われる不要物・必要物の分割—と、再吸収機能——不要と判定されたものの中で、再度必要なものを吸収する機能—の二つがあります。前者では、流入した血液に対して、主に大きな分子—タンパク質、赤血球など—を残すように、ざっくりと濾過されます。その後、濾過された血液を対象に、より細かい分子で体に必要なもの—水分・電解質など—を、尿細管という場所で再吸収する、２段階で構成されます。そのため、一言で、腎臓が悪いと言っても、濾過機能と再吸収機能のどちらが悪いかによって原因が異なるため、これらを特定し、治療を選択する必要があります。

また、腎臓の機能は、一度低下すると、改善することは困難であるとされています—透析治療などは、腎機能の代替に過ぎず、治療ではないという認識が一般的です。こうした体内の濾過機能から尿生成をおこなう臓器は腎臓のみであり、他の臓器で代替する事は困難であるため、身体活動においても、腎機能低下は大きな負担となります—心血管疾患などを引き起こす因子とも言われています。そのため、腎臓の悪化を予防し、食い止めるかが、これらの疾患を防止する上でも、重要だと言われています。こうした背景から、腎機能低下の予防—腎機能の低下をいかに早く予測し、処置を行なっていくか—が、その後の生活の質に大きく関与していきます。

慢性腎疾患（CKD）とは

慢性腎疾患（Chronical kidney diseases: CKD）は、前述した腎臓の機能—濾過機能および再吸収機能—が慢性的に低下し、身体の濾過機能が機能しない、機能不全の状態を起こす疾患・状態です。主に、糖尿病、高血圧、慢性腎炎を代表とする病気の総称を指すこともあります。近年では、患者数の多い生活習慣病—糖尿病、高血圧—による慢性腎疾患の報告が増加しています。この疾患の特徴は、動脈硬化のリスク因子—血糖、LDL-Cなど—の増大による血管障害により、腎機能が低下することが主な原因とされています。前述のように、腎臓の濾過機能は、糸球体—毛細血管の集まり—を通して、おこなわれます。そのため、血管障害により、血管の機能が低下および阻害されると、その影響として、腎臓における機能も、並行して低下することになります。これにより、体内中の不要物が排泄されず、不要物が体内に蓄積するため、浮腫・肩こりから始まり、全身に不用物が蓄積し、敗血症・心血管疾患を引き起こすとされています—実際、CKDは、心血管疾患の最大のリスク因子の一つであると言われ、こうした関係を示した、心腎連関という言葉があるくらいです。

また、CKDは、症状の悪化を自覚する事は困難であり、発見時には進行した状態で発見されるケースが多いとされます。CKDは、初期症状では、ほぼ無症状に近く、また腎臓自体に、痛覚といった、感覚もないため、発見が遅れるケースが多いです。また、前述のように、腎機能は一度悪化すると、再び改善することは困難であり、早い段階で見つけて、治療を開始すること—いかに早く察知し、適切なタイミングで治療するか—が、その後の予後の状態を左右します。

CKDに対する治療

一般的に、CKDが進行に対する治療として、透析・腎移植といった腎臓代替療法（Renal replacement treatment: RRT）がおこなわれる一方、こうした治療をおこなうにあたり、開始が遅れることで、改善効果が減少することが問題視されています。これらの治療は、CKDの進行した状態—末期腎不全（End stage renal diseases: ESRD—に対して、腎機能の代わりとなるような処置を施します。例えば、透析は、体外にて血液を濾過し、体内に戻すといった治療です。前述のように、CKDは、自覚症状がなく、また専門医以外が診断をおこなうことも比較的難しいとされるため、症状が進行した状態で専門医に紹介されることが多いとされます。こうした、専門医への紹介の遅れが、緊急透析—永久的な治療装置（腹膜カテーテルなど）がないときに起こる、緊急状況、生命を脅かす状況の透析—を実施せざるをえない要因になり、症状の深刻化を促進させることが、複数の研究で指摘されています。そのため、透析の必要性を予測する信頼性の高い指標を開発することにより、医師と患者の双方が、こうした治療に対する、より質の高い事前準備をすることができるようになるため、RRTを予測することが重要であると指摘されています。

RRTの予測に関する先行研究

RRTを開始する最適な時期に関しては、現状として、決定的なエビデンスがなく、最適なタイミングを推定する研究が複数報告されています。特に、機械学習を用いた研究として、数か月から1年以内にRRTを開始する予測や，数時間から数日以内にRRTを必要とする急性腎不全の予測に関する調査をおこなった研究が報告されています。一方、こうした既存研究では、RRTの分析と予測に、検査室および人口統計学データを使用しており、常に利用できるデータでないため、普遍性に欠ける問題が指摘されています。

本研究の目的

本研究の目的は、病歴に基づくスクリーニングツールを開発し、CKD診断時に将来的なRRTを予測する機械学習モデルを検証し、さらに、異なる期間におけるRRTの開始を予測するモデルにおける合併疾患—糖尿病など—を明らかにすることです。提案では、合併疾患およびMLモデルを用いて、今後3ヶ月、6ヶ月、12ヶ月において、RRTを必要とするか—透析を開始するか、移植を受けるか—を予測する性能について、調査をおこないます。この手法では、病院のデータベースから、容易に取得可能なデータ—CKDおよび、その合併症に関する診断データ—を使用しており、また、GFRやその他の検査データに依存しないため、普遍性に優れていることが利点としてあります。こうした予測モデルは、政策立案者、病院の管理者、保険会社にとって、疾患の進行の傾向を把握できるため、資源をより適切に配分することができるという点で、大きなメリットがあります—つまり、医師とCKD患者の双方にとって、より良い医療計画と資源管理に有用です。

手法

研究デザイン

本研究のデザインは、レトロスペクティブ—いわゆる、後ろ向きコホート研究—をベースとして、CKD診断後、3カ月、6カ月、12カ月の期間内にRRT—血液透析、腹膜透析、腎移植—をおこなった群と、おこなわなかった対照群をマッチさせます（図1）。初めてCKDと診断された日から、3カ月、6カ月、12カ月間、患者を追跡および観察し、RRのラベル付与をおこないます（図2）。

特徴抽出

今回の提案における、特徴抽出に関する手法として、1. raw data、2. percentage、3. boolean、4. timeの4つの方法を検証しています：1. raw data :各診断で、CKDと診断された時間ごとに、発生回数をカウントします; 2. percentage：各診断について、患者の全受診回数に対するその出現率を計算します; 3. boolean：各診断で、CKDが少なくとも1回以上発生すれば1、発生しなければ0とします; 4. time：観察期間をサブ期間に分割し、各サブ期間について，診断が発生したか（1），発生しなかったか（0）を判断します。さらに、これらの値に対して、新しい期間ほど高い重みを付与し、観測されたすべてのサブ期間について、重み付けされます。このアプローチでは、観察期間を6ヶ月ごとの7つのサブ期間と、CKD診断時からの残りの期間に分けています。これらの期間の重みは、区間インデックスi = 1, ..., 7に対し、i = 1 が最も新しい区間，i = 7 が最も遠い区間となるように計算されます。残りは，最も遠い区間と同じ重みを持ち、結果として、これらの重みの合計は1となります。

特徴量選択および調整

提案手法における特徴選択として、1. 特徴とRRTとの間の相関—0.1よりも低い診断を削除—、2. CKDに関連する診断—つまり、CKDにおける合併疾患—、3. 相互情報量と分類性能に基づく選択、3つのアプローチを調査しています。このうち、2. の合併疾患では、急性糸球体腎炎、慢性糸球体腎炎、糖尿病、本態性高血圧、高脂血症、多嚢胞性腎臓病、腎結石などを含んでいます。また、3. では，クラスとの相互情報量とランダムフォレスト分類器の性能の関連をもとに、分類器の性能向上の上限になるまで、入力データに診断を逐次的に追加していきます。また、主成分分析（Principal Component analysis: PCA）を用いて、診断の特徴量5624個を集約し、10個のComponentsに次元削減しています。また、データセットにおける不均衡性—特に、RRTなしが、12ヶ月の予測期間で87％、6ヶ月では94％、3ヶ月で96％を占める不均衡性—を解消するため、患者ごとの重みを付与し、その重みをデータベース内のクラス頻度に反比例させることで、不均衡性の影響を緩和しています。

モデル設計

本研究では、複数の機械学習に関連した手法—Decision Tree, Bagging Decision Trees, Random Forest, XGBoost, Support Vector Machines, Simple Gradient Descendent, Nearest Neighbors, Gaussian Naive Bayes, Logistic Regression, Neural Network—を検討し、それぞれの性能を調査しています（表１）。ここで言う、Bagging Decision Treesは、Random Forest—Decision tree の特徴量を抽出・統合する Ensemble learningの一種—における特徴の選択を、Decision tree の選択に置き換えた手法です。

検証方法

本論文では、10-fold cross validation でトレーニングセットとテストセットを分割し、各データセットのRRTと非RRTの比率が同じになるように分割しています。性能指標は、AUC（Area Under the Radio Operator Characteristic Curve）を用いて、各段階で得られたAUCの平均値を、結果として示します。AUCは、陽性的中率を加味した指標であるため、今回のような、不均衡性を持つデータセットに対しては、正答率よりもデータセットの特徴を踏まえた指標であることが想定されるため、今回の測定指標として導入しています。加えて、MLモデルの感度と特異度にも言及しています。

結果

3・６・12ヶ月後の予測結果

この評価では、12ヶ月後のRRTを対象として、各機械学習モデルにおける推定性能を明確化する目的で、評価をおこなっています。

AUCを基準にソートした（表2）、また、AUC＞0.7を得たアルゴリズムのデータ処理パラメータ（図3）の結果、今回導入した、前処理—特徴選択なし、フィルタリング、次元削減—のいずれもおこなわない場合に、最も高いAUCが得られました。また、データの均衡性を改善することで、感度と特異度のトレードオフがより明確化することが確認されました。特徴量としては、time で得られた特徴量が最も優れていました。

3・６ヶ月後に関する結果（図４）からも、均一性のお解消感度と特異度のトレードオフが改善され、性能の高いMLモデルは、Logistic RegressionとSGDであったことがわかります。

全患者と糖尿病患者を対象としたモデルの比較

この評価では、CKDの主な合併症である、糖尿病性腎症の影響—糖尿病を持つCKD患者とそうでない患者での予測性能の違い—を明確化するために、おこなわれました。著者は、仮説として、こうした合併症を持つ患者の予測がより容易であると推定し、この仮説を検証するため、2型糖尿病とそれ以外の患者を分割し、評価をおこなっています。

評価の結果（図５）、すべての患者を対象に学習とテストを行った場合に，最も高いAUCが得られ、すべての患者で学習し、糖尿病の患者のみでテストした場合が二番目に、最も低いAUCは、糖尿病患者を対象に学習とテストを行った場合でした。要因として、学習データ数の差が顕著であることを著者は述べています。

考察

腎臓代替治療—RRT—を適切な時期を推定することは、腎機能低下を予防し、ひいては心血管疾患を防止にもつながるため、高精度な性能が求められる一方、こうしたRRT開始に関する最適な時期の推定について調査した研究は少ない。本研究では、臨床現場で容易に取得可能なデータ—CKDおよびその合併症の診断データ—をもとに、機械学習モデルをベースとして、RRTの最適な時期を推定するモデルについて、調査をおこないました。また、調査にあたっては、複数の特徴抽出および特徴選択を対象とした様々な組み合わせを網羅的に調査しています。また、「CKDの合併症—糖尿病・高血圧など—を持つ患者において、RRTの予測精度は向上するのではないか」という仮説を、糖尿病を持つ患者のサンプルデータをもとに検証しています。

評価結果として、著者らが定義した time パターンによる特徴抽出を用いた、Logistic model が最も優れた性能を持つ結果となりました：AUC=0.773。また、合併症に関するデータの検証結果として、糖尿病を含めた、全患者および糖尿病の既往歴のある患者のみを抽出したデータを用いて予測性能を調査しました。その結果として、糖尿病よりも、全患者を含めたデータセットでの性能の方が高い結果となりました—これらは、生物学的因子より、データ数の影響が大きいことを示しています。研究結果として、精度が高いと断定できないため、臨床現場への導入に適用したモデルではないことが推察される一方、医療分野における予測モデルの将来の研究に向けて，治療方針の決定などに寄与する結果となることが期待されます。

本研究の発展として、異なる腎昨日の関連疾患—急性腎疾患（Acute Kidney Injury：AKI）、タンパク尿など—と対象とした推定モデルへの応用が考えられます。これらの疾患の中でも、特に、AKIの推定は、治療を緊急的におこなう必要があるケースが多く、予測する意義が大きいと考えられます（以前Googleによる深層学習の論文が公表されたこともあります）。また、タンパク尿は、その他の腎疾患との関連が強いとされ、CKDにおける、最大の予測因子の一つであると指摘している疫学研究もあります。そのため、今回の論文のように、臨床データのみを用いてこうした疾患を推定できれば、臨床的な意義も大きいと考えられます。

一方で、今回の評価において導入した、RRTおよび非RRTの割合の設定方法の妥当性が挙げられます。上述したように、10-fold cross validation をおこなう際に、これらの割合が同一になるように各データセットを調整しています。一方、本論文でも取り上げられているように、現実のデータセットには不均衡性があるケースが多いと考えられます—つまり、こうした均一な割合なデータセットでの評価が妥当でない可能性が存在します。特に、今回のように、臨床データを用いている場合、不均一性の傾向—RRTが相対的に少ない傾向—がより顕著に合わられると考えられるため、均一なケースに加え、様々な割合で検証した結果を記載する必要があると考えられます。