最新AI論文をキャッチアップ

術前からがんの状態が予測できる!? 機械学習を用いた卵巣がんを術前に予測するフレームワークの提案

術前からがんの状態が予測できる!? 機械学習を用いた卵巣がんを術前に予測するフレームワークの提案

medical

3つの要点
✔️ 本研究では、教師あり機械学習を用いて、術前血液検査データから、がんの特性を高精度で予測モデル開発
✔️ 予測モデルから得られた知見から、予後と関連する症例の特徴抽出をおこない、進行期がんの分類パターンを調査
✔️ これまでの臨床的な知見では得られなかった、予後と関連する新しい疾患分類が見出された

Application of Artificial Intelligence for Preoperative Diagnostic and Prognostic Prediction in Epithelial Ovarian Cancer Based on Blood Biomarkers
written by Eiryo Kawakami, Junya Tabata, Nozomu Yanaihara, Tetsuo Ishikawa, Keita Koseki, Yasushi Iida, Misato Saito, Hiromi Komazaki, Jason S. Shapiro, Chihiro Goto, Yuka Akiyama, Ryosuke Saito, Motoaki Saito, Hirokuni Takano, Kyosuke Yamada and Aikou Okamoto
(Submitted on 15 May 2019)
Comments: 
Clinical Cancer Research 25(10)

Subjects: Machine Learning (cs.LG); Machine Learning (stat.ML)  

背景

機械学習により、術前に、がんの病態や予後を把握することは可能なのでしょうか?

本研究は、血液検査データなど、術前の情報のみを用いて卵巣がんの特性を予測するアルゴリズムの開発を目的としておこなわれました。卵巣がんは、女性の生殖器腫瘍の中でも予後が悪くなりやすい疾患であるため、治療方針の決定のため、病態の確認が必要となりますが、生検をはじめとする侵襲性の強い検査をおこなう必要があり、術前にこうした状態を把握することは困難とされており、これらの瀬術をおこなう前に、卵巣がんの病態—良性・悪性や進行期、予後などの特性—を把握することが必要とされています。先行研究では、統計的な手法を中心として進行期や組織型を予測する研究がおこなわれていますが、現在のところ有力なバイオマーカーは報告されておりません。本研究では、複数のバイオマーカーと臨床変数に基づき、教師あり機械学習アルゴリズムを用いて、卵巣がんの病態予測に特化したモデルを構築し、EOC患者の臨床病期、組織型、手術結果、予後を治療前に推定するモデルの開発をおこない、高い分類精度が達成されたことを報告しています。加えて、がんの進行期における症例分類において、教師なしクラスタリング手法を用いてプロットから抽出された特徴から、従来の臨床的な知見では得られなかった、卵巣がん予後と関連する新しい疾患分類を、術前の検査データにより獲得したことを報告しています。これらの知見により、その他の疾患での術前予測・個別化医療への応用・発展が期待されます。

卵巣がん(epithelial ovarian cancer:EOC)とは

まず初めに、卵巣がんについて簡単に説明します。

卵巣がんは、女性の生殖器腫瘍の中で最も予後が悪いがんの一つで、近年、この疾患による死亡者数は増加していることから、注目を集めています。この疾患は、組織学的知見に基づき、少なくとも五つの型(高異型度漿液性がん、低異型度漿液性がん、類内膜がん、粘液性がん、明細胞腺がん)に分類することができ、転移の有無などで、早期がん(ステージⅠ、Ⅱ)および進行がん(ステージⅢ、Ⅳ)に分類できます(世界産婦人科連合(FIGO)参照)。また、治療として、手術による腫瘍の切除が第一選択として考えられている一方、その他のがん疾患と比較して、化学療法への反応性も比較的良好であるとされるため、手術前後に化学療法を実施することが、一般的な治療方針となっています。こうした化学療法への反応性は、進行期や組織型により大きく異なることに加え、近年登場した、有効な抗がん剤—PARP阻害薬や抗体医薬—の存在も検討されています。このような背景から、術前に進行期や組織型の予測をおこなうことで、患者ごとに適切な治療戦略を選択することができると考えられます。

先行研究の課題と研究目的

卵巣がんに関する先行研究では、統計的な手法を中心に、予後と進行期や組織型との関連が報告されてきました。その一方、こうした因子を実際の臨床現場にて把握するために、手術や生検とはじめとする、侵襲性の高い施術をおこなう必要があるため、術前の情報だけを用いて卵巣がんの良性・悪性や進行期・予後などの特性を予測し治療戦略を決定することが困難です。また、バイオマーカーと複数の臨床因子による統計学的な予測モデルも提案されていますが、変数間の共線性といった問題から、これらの手法では複数の入力変数を持つ大規模なデータを処理し、適切な特徴量を抽出することが困難であると考えられます。

こうした背景の中、本研究では、複数のバイオマーカーと臨床変数を用いた機械学習アルゴリズムにより、卵巣がんに特化した予測を念頭に、EOC患者の臨床病期、組織型、手術結果、予後を治療前に推定するモデルの構築をおこないました。

手法

データセット

今回の検証では、2010~2017年で収集された、上皮性卵巣がん(EOC)の悪性卵巣腫瘍患者334名と良性卵巣腫瘍患者101名の後ろ向きコホートデータセットを用いて、解析をおこないました。腫瘍はFIGO分類(2014年)に準拠して分類され、診断時の年齢、臨床病期、一次手術後の残存腫瘍サイズ、術前の32種類の末梢血バイオマーカーなどの臨床病理学的パラメータが用いられています。また、すべての変数に関して、有意差(P値≧0.20)がなくなるまで、無作為抽出を繰り返してトレーニングとテストコホートに分割しています。結果として、トレーニングには、EOC患者168人と良性卵巣腫瘍患者51人、テストには、EOC患者166人と良性卵巣腫瘍患者50人が割り当てられました。

学習モデル・評価手法

今回検討したモデルとして、Gradient Boosting Machine(GBM)、Support Vector Machine、Random Forest(RF)、Conditional RF(CRF)、Naïve Bayes、Neural Network、Elastic Netの7つの教師付き機械学習分類器を用いています。また、分類器の学習は,10 fold cross-validationを用いておこない、テストデータセットで分類に関する予測性能を評価しています。

結果

術前の複数の血液マーカーに基づくEOCと良性腫瘍の性能評価

この評価では、卵巣腫瘍特性の予測因子を検討するために、32の末梢血マーカーに基づく多重ロジスティック回帰分析と、各マーカーを用いた単一ロジスティック回帰分析を比較しています(下図参照)。

上述の評価手法を用いた結果、予測性能は、86.7%(正答率)と0.897(AUC)となり、単回帰線形モデルよりも優れていることが確認されました。また、32の末梢血マーカーを含む同じテストデータを用いて、教師付き機械学習を用いてEOCを予測した際、従来の回帰手法をベースとするモデルよりも高い性能であったことを報告しています。具体的には、GBM、RF、CRFなど、決定木を組み合わせたアンサンブル手法において、EOCの予測性能が最も高い結果を示しています:RFによる良性卵巣腫瘍とEOCの分類精度は、92.4%(正答率)と0.968(AUC)でした。

(図1)

予後に関連する機械学習アプローチを用いた教師なしクラスタリング分析 

この解析は、卵巣がんの進行期予測での結果を踏まえ、これらの症例に関する特徴を明確化する目的でおこなっています。

前述した検証結果におけるがんの進行期予測性能では、良性・悪性の鑑別に比べて精度が低い(AUC=0.760)という結果が確認されました。この結果に対し、本論文では、早期卵巣がんと進行卵巣がんで術前血液検査のパターンが近い症例があるのではないか、という仮説をたて、サンプルの類似度を計算するために、教師なしランダムフォレスト法を用いて、教師なし機械学習による検証をおこなっています。

検証にあたり、診断時の年齢および術前血液検査データ32項目に適用し、術前の血液検査のパターンが類似した症例を近くに、パターンが異なる症例を遠くに配置する手法である、多次元尺度法(Multi dimensional scaling:MDS)を用いて、二次元分布のプロットを生成しました。その結果、RF非類似度を入力としたMDSプロットは、良性腫瘍患者と後期EOC患者が明確に分離された一方、早期がんは、良性腫瘍に類似した術前血液検査パターンを示す症例(クラスタ1)、と、進行がんに類似した術前血液検査パターンを示す症例(クラスタ2)、に分かれる結果が報告されています。また、クラスタ1では、再発がほとんどなかったのに対し、クラスタ2では再発率と死亡率が高く、予後との強い関連があることが示されました。加えて、複数の血液マーカーにて、2つのクラスターの早期EOCの間で有意に異なる結果が得られました。この早期卵巣がんのクラスタは、既に知られている進行期(ステージⅠ、Ⅱ)とは異なるものであり、今回の検証で得られた新たな知見であることが報告されています。

 

考察

本研究は、機械学習アルゴリズムを用いて、術前の情報のみから、卵巣がんの状態—良性・悪性など—を予測するモデルの構築を目的としておこないました。構築にあたり、卵巣腫瘍患者(悪性卵巣腫瘍334名、良性卵巣腫瘍101名)の年齢・術前血液検査データ32項目を用いて、教師あり機械学習—Random forest、SVMなど—を用いて、悪性腫瘍と良性腫瘍を高い精度で予測したことを確認しています。また、進行期の卵巣がんに対して、MDSプロットによる教師なしクラスタリング手法を用いた結果、良性腫瘍に類似したクラスタ、と、進行がんに類似したクラスタ2の存在が明らかになりました。これにより、術前血液検査データという患者の全身状態を調査することで、既存の知見では得られなかった、新しい分類が発見されたことを報告しています。本研究を進めることで、侵襲性の高い施術をせず、術前に高い精度で卵巣がんの状態を把握し、予後に関する治療方針の決定に大きな影響を持つことが期待されます。

一方で、課題としては、全体のサンプル数が約400名と小さい点、また、横断的な関連であるためリスク因子として不明瞭である点、といったことが考えられます。こうした課題の解決のため、より多くの患者数を対象とした前向きコホート研究を実施し、時系列解析を含めた解析をおこない、因果関係の明確化を含めた解明をおこなっていく事が望ましいと考えられます。

 

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする