深層学習は医療で有用なのか?オミクスデータで深層学習の性能を評価!

深層学習は医療で有用なのか?オミクスデータで深層学習の性能を評価!

3つの要点
✔️ オミクスデータにおける機械学習・深層学習手法を分類問題を対象に網羅的に評価
✔️ トランスクリプトームとメタボロームを用いて分類タスクに関する手法を比較  

✔️ 様々な評価の中で、MLP が最も精度が高いことを確認

Architectures and accuracy of artificial neural network for disease classification from omics data
written by Hui Yu, David C. Samuels, Ying-yong Zhao & Yan Guo
(Submitted on 04 Mar 2019)

Comments: Published by BMC Genomics volume 20, Article number: 167.
Subjects: Machine Learning (cs.LG); Machine Learning (stat.ML))

背景 

ここでは、本研究で取り扱われている「オミクス (マルチオミクス)」について概説した後、研究のポイントについて述べていきます。

オミクス とは?

オミクス (Omics)とは、人の体に関する生態上を網羅的に週した情報の集合のことを指します。具体的には、遺伝情報を扱う、ゲノミクスやタンパク質の情報を扱うプロテオミクスといったものが挙げられます。元々は、ギリシャ語で「全て」をさす Ome と、「学問」をさす -ics を組み合わせた言葉です。現在では、ゲノミクス(遺伝情報)、トランスクリプトミクス(RNA)、プロテオミクス (タンパク質)、メタボロミクス(代謝物質)、インタラクトミクス(タンパク質の相互作用)と言った種類に分かれており、セントラルドグマに関わる最初の3つが現在の研究における主流とされています。

こうしたオミクスデータの特徴として、複数のレベルをネットワークの視点からに解析することで、各レベルでは得られない新たな知見を得ることができると言われています。特に近年、問題視されている生活習慣病の多くは多因子疾患と呼ばれ、遺伝情報と環境因子によって発症されると言われています。こうした中で、ゲノムや環境因子に近いメタボロームといった、複数の層で疾患を捉えることで、各レベル単体では不明瞭だった相互的作用を明確化することができると期待されています。一方、こうした解析は複雑であることが予想され、機械学習と言った、生態的な解釈以外からのアプローチにも注目が集まっています。 

研究のポイント

本研究では、深層学習だけでなく、分類タスクに関する古典的な機械学習を含めた性能評価を細かく行っています。一般に層が深いほど高い性能を発揮するとされる深層学習ですが、本文でも述べられているように、オミクスデータに関しては、現時点で浅いネットワークのほうが精度がいいとする研究報告もされています。こうした指摘に対して、本研究では、どのような分類モデルが適切であるのかを、パラメータ設定を含め、評価しています。

この記事をシェアする