目の画像から全身の病気がわかる!? 眼底画像を活用した、全身疾患の推定モデルの提案!
3つの要点
✔️ 糖尿病をはじめとする慢性疾患では、発症後の改善が困難なケースが多いため、診断よりも早期発見が重要とされている
✔️ 本研究では、深層学習を用いて、眼底画像・臨床メタデータ—年齢、性別、身長、体重、体格指数、血圧—と組み合わせ、慢性腎臓病—Chronic kidney diseases: CKD—と2型糖尿病—Type 2 diabetes mellitus: T2DM—を識別する学習モデルを構築
✔️ 評価の結果、提案モデルでの推定性能—Area under ROC curve: AUC—が、0.85-0.93を達成した、ことが確認された。
Deep-learning models for the detection and incidence prediction of chronic kidney disease and type 2 diabetes from retinal fundus images
written by Kang Zhang, Xiaohong Liu, Jie Xu, Jin Yuan, Wenjia Cai, Ting Chen, Kai Wang, Yuanxu Gao, Sheng Nie, Xiaodong Xu, Xiaoqi Qin, Yuandong Su, Wenqin Xu, Andrea Olvera, Kanmin Xue, Zhihuan Li, Meixia Zhang, Xiaoxi Zeng, Charlotte L. Zhang, Oulan Li, Edward E. Zhang, Jie Zhu, Yiming Xu, Daniel Kermany, Kaixin Zhou, Ying Pan, Shaoyun Li, Iat Fan Lai, Ying Chi, Changuang Wang, Michelle Pei, Guangxi Zang, Qi Zhang, Johnson Lau, Dennis Lam, Xiaoguang Zou, Aizezi Wumaier, Jianquan Wang, Yin Shen, Fan Fan Hou, Ping Zhang, Tao Xu, Yong Zhou, Guangyu Wang
(Submitted on 1 Jul 2021)
Comments: Nature Biomedical Engineering
本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。
背景
眼底画像から、全身疾患を推定することは可能なのか?
本研究では、眼底画像を活用し、CNNの時系列解析に基づいたCKD・T2DMの予測モデルの構築を目指す。
CKDやT2DMなどの全身性疾患は、がん・心血管疾患とともに死亡リスクとの関連がを強い疾患である—透析・移植を必要とするだけでなく、心血管疾患などの発症や、死亡率との関連が強い。また、これら多くのケースでは、一度発症するとその後の改善が困難である不可逆性を持つことから、早期診断・治療が重要であるとされている。こうしたCKD・T2DMの早期発見・診断・進行予防には、定期的な健診が一般な対策として実施されている;一方、これら健診の実施するためには、特定の技能を持つ測定者などのリソースが必要である—そのため、限られたリソースしかない環境において、健診の代替となるような、早期予防に関する新たな手法が必要とされている。こうした中、体外から血管を直接観察できる、眼底画像に注目が集まっている:目の網膜は、血管、神経、結合組織や、血管の動的な動きを非侵襲的に観察できるため、全身疾患を発症している場合、その特異的な症状が眼底に現れる可能性が高い。他方、これら画像に基づき、CKD・T2DMに関する発症予測や深層学習を活用したCKDの早期診断モデルに関する調査は限られており、現状として推定性能が不明瞭である。
本研究では、眼底画像を解析してCKDとT2DMを検出する学習モデルの構築、を目指す:具体的には、連続値—i.g. estimated Glomerular Filtration Rate: eGFR—を予測する回帰タスク・診断に対する二値分類に対し、深層学習に基づく眼底画像の解析モデルを構築・検証する:検証では、眼底画像を用いて疾患発症を予測・リスク層別化について高い精度を実現できることが示唆された。
慢性腎疾患—chronic kidney diseases: CKD—とは?
初めに解析対象である、CKDについて簡単に解説する。
CKDは、腎機能が慢性的に低下する病気—i.g. 糖尿病、高血圧、慢性腎炎—の総称を指す。特徴として、血糖や LDLコレステロール といった動脈硬化のリスク因子の増加による腎機能の低下がある—つまり、生活習慣による血管機能の低下により、毛細血管の塊である糸球体の機能が低下し、腎機能が低下する。一般に、初期症状では無症状であり、また、一度悪化すると改善が困難であることから、早期発見・治療が重要となる。
手法
提案モデル
ここでは、本研究で活用した提案モデルの概要を示す—下図参照。
提案モデルでは、ResNet-50をベースとして、ImageNetで事前学習をおこない、転移学習によりモデルを構築した:ResNet-50は、1つの畳み込みと4つのブロックを持ち、Skip connection を導入している—これにより、勾配消失を回避しつつ、より深い層での学習をおこなうことができる。連続値予測の回帰タスク—i.g. 空腹時血糖値—では、ResNet-50モデルの最終層とし、出力に1つのスカラーを持つDense 層を定めた。2値分類では、Dense + Softmaxを追加した。再学習では、CNN層に重みを設定し、回帰・二値分類をおこなう層をを初期化している。また、Dense 層には3層MLPを導入した—そのうちの2つの隠れ層では、128ノード・ReLU活性化関数、を保持している。損失関数としては、連続値の予測でMSE損失、2値分類でクロスエントロピー損失を設定した。誤差逆伝播法では、512×512ピクセルにリサイズされた32枚の画像を対象に、50エポックのバッチで、学習率10-3で実施した。最適化関数としては、Adam optimizerを用い、重みの減衰を10-6とした。またデータセットについて、トレーニングを7/8とバリデーションを1/8にランダム分割し、学習をおこなった。臨床データに基づくモデルは、年齢、性別、血圧、身長、体重、BMI、高血圧、T2DMで構成され、複合モデルでは、眼底画像と組み合わせ、進行リスクを予測した。また、初診時のリスクスコアにしたがい、予測リスクスコアとして、上位および下位四分位値から、低リスク、中リスク、高リスクの3群に分類された—リスクスコアは四分位値による、カテゴリー変数として対処している。
CKD・T2DMの発症解析
これら疾患における発症率解析では,ベースラインで CKD 未発症時点のデータを対象とした:ベースライン時に尿検査を受け、陰性であった参加者全員を対象とし、追跡中にCKD—またはadvanced+ CKD—の基準を満たした対象者を、発症として定義した。同様に、T2DMにおいても、初診時にT2DM未発症を対象に、フォローアップで基準を満たした対象者をのT2DM発症を定義した。
結果
このセクションでは、評価について解説する。
CKDの推定精度
眼底画像と臨床データ—i.g. 年齢、性別、身長、体重、血圧—に基づいて、CKDの早期発見、重症化について予測できるか、を検証した:ここでは、臨床データを用いたベースラインモデル—Random forest—と,眼底画像を用いた提案モデル、また、臨床データと眼底画像の両方を活用した学習モデルを構築・検証した。
これらによる学習モデルでの推定性能—AUC—は下記のようになった:Random forest :0.861;眼底画像のみ:0.918;臨床データ・眼底画像を組み合わせ:0.930—下図参照。加えて、これらモデルの汎用性を実証するため、別途、外部コホートで検証したところ、下記のような推定性能—AUC—を確認した:臨床データ:0.842;眼底画像:0.885;臨床データおよび眼底画像の複合モデル:0.898。
T2DM の予測
眼底画像および深層学習モデルを活用しT2DMの検出モデルを構築した。データセットは、下記の割合で分割し学習を実施した—トレーニング:バリデーション:テスト=7:1:2。こうした背景のもと、提案モデルにおける推定性能—AUC—は下記のようになった:臨床データのみ: 0.828;眼底画像のみ:0.923;複合モデル:0.929—下図参照。また、外部テストデータを活用した評価では下記のようになった—臨床データのみ:0.796;眼底画像のみ:0.854;複合モデル:0.871。加えて、スマートフォンのカメラで撮影した画像を用いた外部テストデータの評価は下記のようになった:臨床データのみ:0.762;眼底のみ:0.820;複合モデル:0.845。また、糖尿病性網膜症—DR—を持つT2DM患者は、網膜画像から検出することが容易であることが推察されるため、DRを発症していない患者を対象とした検証もおこなった。:T2DM患者を2つのサブセット—DR・NDR—のサブセットに分割し、評価をおこなった。その結果、DRの有無に関わらず、 T2DMの推定性能はほぼ同等であった:提案モデルの性能が、DRに大きく依存しないことが示唆された;そのため、これら結果から、提案モデルがDRの発症前の眼底画像に基づいて—DRの発症有無に関わらず—、T2DMを検出できることが示唆された。加えて、眼底画像のみから平均血糖値を予測するモデルに対して評価をおこない、眼底画像のみから血糖値を予測・定量化できることが示唆された。
考察
本研究では、眼底画像を活用しCKD・T2DMの発症を予測する推定モデルの構築をおこなった—こうしたデータを活用した推定モデルは、眼底画像専用カメラで撮影したものだけでなく、スマートフォンなどを活用した眼底画像に対しても適用することができる、と推察される。本研究の評価結果から、これらの知見は、CKD・T2DMの早期発見において、非侵襲的・低コストのスクリーニング手法を実現できる可能性が高い。
一方、本研究における課題として、下記のようなものが考えられる:人種によるバイアス;急激な腎疾患を考慮したモデル構築;臨床データの追加。本研究では、中国出身の患者が対多数を占めるデータセットに基づいて訓練・テストをおこなったため、他の人種集団—i.g. 西洋・欧米—における推定性能を導出し、提案モデルの汎用性を検証する必要があることが想定される。本研究では、追加的検証として、新疆ウイグル自治区のカシ—カシュガル—とマカオ—ポルトガル—の別の外部多民族検証コホートにてモデル評価をおこなっており、高い推定性能を達成したことが示されている—論文参照;そのため、より多くの臨床的・人口動態的コホートに対する追加データセットを活用することで、幅広い集団における診断精度・臨床的有用性を拡大させることが可能であることが推察される;2点目は、eGFRの測定に関連した課題である:腎機能が急速に悪化する疾患—i.g. 急性腎不全:AKI—では、病態進行が急激である—通常の緩やかな進行を持つCKDとは異なる挙動である—ため、これら疾患に対する推定性能が低下する可能性が高い。そのため、本研究では、AKIを併発している—または発症確率が高い—患者を除外して評価をおこなっている;第三に、臨床的なメタデータ—i.g. 血圧の推移、喫煙状況、アルコール摂取レベル、家族歴—を追加することで、予測の精度が向上するか、を検討する必要がある。
この記事に関するカテゴリー