未来の診断手法:AIが拓くCOVID-19の診断革命
3つの要点
✔️ 磁気呼吸センシング技術 (MRST) と機械学習 (ML) の長所を組み合わせた COVID-19 のリアルタイムモニタリングおよび診断へのアプローチを提案
✔️ COVID-19 患者の複雑な呼吸パターンから特徴抽出
✔️ COVID-19 患者と健常者を 95%以上の精度で分類
Real-Time Magnetic Tracking and Diagnosis of COVID-19 via Machine Learning
writtenby Dang Nguyen, Phat K. Huynh, Vinh Duc An Bui, Kee Young Hwang, Nityanand Jain, Chau Nguyen, Le Huu Nhat Minh, Le Van Truong, Xuan Thanh Nguyen, Dinh Hoang Nguyen, Le Tien Dung, Trung Q. Le, Manh-Huong Phan
(Submitted on 1 Nov 2023)
Comments: Published on arxiv.
Subjects: Machine Learning (cs.LG); Instrumentation and Detectors (physics.ins-det); Medical Physics (physics.med-ph)
code:
本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。
はじめに
呼吸は、人が生きていく上で必要不可欠なものであり、呼吸パターンは人の健康状態を表す重要な指標となります。また、呼吸パターンの異常は、慢性閉塞性肺疾患 (COPD)、閉塞性睡眠時無呼吸症候群 (OSA)、肺炎、嚢胞性線維症、喘息、新型コロナウイルス感染症 (COVID-19) などの呼吸器疾患を示唆することがよくあります。中でも、新型コロナウイルス感染症の症状には、呼吸数の上昇、一回換気量 (一回の呼吸によって気道・肺に出入りする空気量) の減少、不規則な呼吸リズムなどが含まれる場合があります。したがって、呼吸パターンの正確かつ迅速な評価は、新型コロナウイルス感染症 (COVID-19) とその変異体の診断と管理に不可欠です。
本論文では、磁気呼吸センシング技術 (MRST : Magnetic Respiratory Sensing Technology) と機械学習 (ML) を融合し、新型コロナウイルス感染症 (COVID-19) およびその他の呼吸器疾患をリアルタイムで追跡および診断するための診断プラットフォームを作成し、その有効性を実証しています。
方法論
磁気呼吸検出
以下の Fig 1. は、本研究の概要と新型コロナウイルス感染症の診断・監視システムの概略を示しています。
この一連のプロセスは、磁気呼吸モニタリングシステムから始まります (Fig.1a)。このシステムは、ホール効果センサーを使用して、人の胸に取り付けられた小さな永久磁石によって生成される磁場の変化を検出します。これらの変化は呼吸運動によって起こります。これにより、多数の呼吸パターンを非侵襲的かつ正確に追跡することが保証されます。
次に、研究のベースラインを確立するために、呼吸データ収集において呼気検査プロトコルが採用されています (Fig.1b)。このプロトコルには、通常の呼吸、息止め、深呼吸という 3 つの異なる呼吸スタイルが含まれています。これらのさまざまな呼吸法を組み込むことで、広範囲の呼吸活動が確実に捕捉され、その後の分析のための堅牢なデータセットが提供されます。
結果として得られる呼吸データは、信号処理と特徴抽出専用の特殊なアルゴリズムを通じてさらに洗練されます (Fig.1c)。この分析フェーズは、呼吸データ内の診断パターンを特定して分離するのに役立つため、非常に重要となります。
そして最後に、抽出された特徴が ML モデルに入力されます (Fig.1d)。この ML モデルは、指定された呼吸マーカーに基づいて新型コロナウイルス感染症 (COVID-19) を識別および診断できるように調整されています。
被験者とデータ収集
本研究は 2021 年 7 月から 2021 年 10月 までの 3 ヶ月の間に実施されました。この期間、ベトナムでは「ゼロ新型コロナ (Zero COVID)」政策が実施されており、すべての新型コロナウイルス感染症患者を病院または医療キャンプで強制的に集中隔離する必要があった時期でした。
本研究のプロジェクトには、その 3 か月の期間を通じて、ホーチミン市ビンタンの医療キャンプから 33 人の新型コロナウイルス感染症患者と、ホーチミン市在住の健康な参加者 37 人が参加しました。
結果
収集されたデータの概要
以下の Table 1. より、新型コロナウイルス感染症患者の年齢は、平均して健康な被験者よりわずかに高いことが分かります。ただし標準偏差は、両方のグループの年齢層が幅広いことを示しており、データセットの多様性を強調しています。また、両グループの性別分布はほぼバランスが取れており、調査結果における性別中心のバイアスの可能性は最小限に抑えられています。
ここで注目すべきは、新型コロナウイルス感染症患者の平均入院期間が約6日だったという事実で、このグループの病気の重症度が明らかになり、それが呼吸パターンに現れる可能性があることが分かります。体温、血圧、BMIなどの生理学的パラメーターと、新型コロナウイルス感染症の症状を含めることで、参加者の健康状態の包括的なスナップショットが得られます。
特徴抽出
ここでは、照合された呼吸信号データに基づく詳細な特徴抽出分析を詳しく掘り下げています。その目的は、健康な被験者と新型コロナウイルス感染症患者の間の呼吸パターンの顕著な違いを強調することにあります。以下の Fig 2. は、通常の呼吸、息止め、深呼吸という 3 つの呼吸テストにおける両方のグループの呼吸信号のピーク検出とパワースペクトル密度 (PSD) 分析を概略的に示しています。
データを見てみると、健常者と罹患者では、ピークパターンとそれに関連するスペクトル内容に明確な違いがあることが分かります (Fig.2a-2l)。また、時間領域と周波数領域の両方から 4 つの代表的な特徴である、平均呼吸数 (RR)、平均プロミネンス (Prom)、正規化パワースペクトル密度 (NPSD)、支配周波数 (Freq) を記録し、3 つの異なる呼吸条件にわたって、これらの特徴の平均値を比較した結果が、Fig.2m-2o に示されています。これより、健常者と COVID-19 被験者を比較した場合、これらの特徴量に顕著な差があることが明らかになり、この疾患が呼吸動態に著しい影響を与えていることが示唆されました。
続いて、Fig.3 は高度な非線形分析手法である RQA を利用して呼吸信号の動的特徴をカプセル化した結果を示しています。
Fig.3 に示した RQA の結果は、3 つの呼吸条件下における 2 つのグループの特徴的な再帰プロットを強調しています (Fig.3a-3f)。これらのプロットは、COVID-19 患者に見られる複雑な呼吸ダイナミクスを独自に特徴づける「指紋」領域と呼ばれる特定の領域を鮮明に表示しています。またこれらの領域は、決定性 (DET)、エントロピー (ENT)、層状性 (LAM) という 3 つの極めて重要な RQA 指標によってマークされています。両群のこれらの特徴の 3D散布図 (Fig.3g-3i) を見てみると、特に息止めと深呼吸について、よく分離したクラスターが示されていることが分かります。このことは、これらの RQA 指標が強力な識別能力を有することを示唆しています。さらに、両群間で 6 つの RQA 指標を比較した結果が Fig.3j-3l です。これらの RQA 指標を比較した結果は、健常者と COVID-19 患者の呼吸行動に関する重要かつ特徴的なデータを示しています。ただし、COVID-19 が呼吸動態に及ぼす複雑な影響を反映し、すべての指標が各呼吸状態にわたって有意な違いを示すわけではないことを認識することが重要です。したがって、これらの特徴の統計的有意性を定量化することは、MLモデルにおける学習特徴の賢明な選択に不可欠となります。
特徴選択と機械学習モデル
本研究では、呼吸信号の特徴抽出と詳細な分析に続いて、特徴選択段階を通じて最も適切な特徴を絞り込んでいます。これにより、顕著な属性に焦点を当て、データセットの次元を効果的に削減することが可能となります。このプロセスを可視化したものが Fig.4 であり、通常の呼吸、息止め、深呼吸の 3 つの呼吸テストのそれぞれの結果が示されています。
Fig.4a~c は、コルモゴロフ・スミルノフ (KS) 統計量を用いて、時間領域、周波数領域、ピーク分析、RQA の 4 つの特徴グループから、特徴に優先順位をつけた結果を示しています。通常の呼吸では、これらのグループ全体で最も顕著な特徴は、Flux mean、NPSD、Prom std、および ENT でした。息止めでは、Flux BF std、Mean freqAll、Prom AF mean、ENT が最も識別しやすい特徴となりました。深呼吸では、peak2peakAF、PSDAll mean、Prom AF std、LMAX が最も示唆に富む特徴となりました。これらの洞察は、健常者と COVID-19 の患者を区別するための重要な指針となり、予備的な特徴抽出と分析に反映されました。
複雑な特徴空間を多様体学習の t-SNE法によって可視化した結果が Fig.4d-f です。これらの 3D プロット結果は、変換された特徴領域内での健常者と COVID-19 被験者の区別を強調し、選択された特徴の識別能力を強調しています。
特徴選択後、MLモデルで訓練し、COVID-19 症例と健常対照を区別する有効性を評価しました。その結果得られた混同行列 (Fig.4g-i) は、各モデルの分類能力を示すスナップショットであり、2 つのコホートを区別する顕著な精度を示しています。さらに、5分割交差検証を行い、受信者動作特性 (ROC) 曲線をプロットした結果が Fig.4j-l です。ここで、曲線下面積 (AUC) は、各モデルの分類能力を定量的に示すものです。注目すべきは、通常の呼吸では、Fine Gaussian SVM モデルがトップとなり、5分割交差検証で感度 99%、特異度 94.1%、平均ROC曲線面積 (AUC) 0.954 を記録したことです。息止めでは、Bagged Trees モデルが、感度 94.1%、特異度は 90% とやや低下するものの、その AUC値は 0.962 でした。深呼吸に関しては、Coarse Gaussian SVM モデルは、感度 99%、特異度 94.1%、AUC値 0.956 で、最も優れた結果となりました。
複数の呼吸テストと MLモデルにわたるこれらの評価は、本研究における特徴選択の厳密さと、それに続くモデルが COVID-19 患者と健常者を高精度で識別できることを示しています。
まとめ
本論文では、磁気呼吸センシング技術 (MRST) と機械学習 (ML) の長所を組み合わせることで、COVID-19 とその亜種のリアルタイムモニタリングおよび診断への先駆的なアプローチが提案されました。本研究は、COVID-19患者と健常者を区別する上で、呼吸器シグナルの特徴が有効であることを強調するものであり、パンデミックと闘う世界的な取り組みに大きく貢献するものであります。
また本研究は、急成長するデジタルヘルス・ソリューションの質を向上させ、世界的な健康課題に対処するために、健康科学、工学、データ科学を駆使した学際的な試みが持つ大きな可能性を象徴するものであり、今後ヘルスケアのモニタリングと診断ツールの展望を向上させると考えられます。
この記事に関するカテゴリー