
未来的诊断方法:人工智能开创的 COVID-19 诊断革命。
三个要点
✔️ COVID-19 结合磁性呼吸传感技术(MRST)和机器学习(ML)的优势,提出了一种实时监测和诊断方法
✔️COVID-19从患者复杂呼吸模式中提取特征
以高于 95% 的准确率对患者和健康受试者进行分类
Real-Time Magnetic Tracking and Diagnosis of COVID-19 via Machine Learning
writtenby Dang Nguyen, Phat K. Huynh, Vinh Duc An Bui, Kee Young Hwang, Nityanand Jain, Chau Nguyen, Le Huu Nhat Minh, Le Van Truong, Xuan Thanh Nguyen, Dinh Hoang Nguyen, Le Tien Dung, Trung Q. Le, Manh-Huong Phan
(Submitted on 1 Nov 2023)
Comments: Published on arxiv.
Subjects: Machine Learning (cs.LG); Instrumentation and Detectors (physics.ins-det); Medical Physics (physics.med-ph)
code:
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
介绍
呼吸是人类生活的重要组成部分,呼吸模式是衡量一个人健康状况的重要指标。异常的呼吸模式通常也提示呼吸系统疾病,如慢性阻塞性肺病(COPD)、阻塞性睡眠呼吸暂停(OSA)、肺炎、囊性纤维化、哮喘和新型冠状病毒感染(COVID-19)。除其他外,新型冠状病毒感染的症状可能包括呼吸频率升高、单次通气率下降(每次呼吸时进出气道和肺部的空气量)和呼吸节律不规则。因此,准确、快速地评估呼吸模式对于新型冠状病毒感染(COVID-19)及其变种的诊断和管理至关重要。
本文将磁性呼吸传感技术(MRST)与机器学习(ML)相结合,创建了一个用于实时跟踪和诊断新型冠状病毒感染(COVID-19)及其他呼吸道疾病的诊断平台。该平台已经创建并通过验证,可用于新型冠状病毒感染(COVID-19)和其他呼吸道疾病的实时追踪和诊断。
方法论
磁性呼气检测
下图 1 提供了研究概况以及新型冠状病毒感染诊断和监测系统示意图。
这一系列过程从磁性呼吸监测系统开始(图 1a)。该系统使用霍尔效应传感器来检测贴在人胸部的小型永久磁铁所产生的磁场变化。这些变化是由呼吸运动引起的。这样就能确保对多种呼吸模式进行非侵入式的精确跟踪。
接下来,在收集呼吸数据时采用了呼吸测试方案,以建立研究基线(图 1b)。该方案包括三种不同的呼吸方式:正常呼吸、屏气和深呼吸。采用这些不同的呼吸方式可确保采集到广泛的呼吸活动,并为后续分析提供可靠的数据集。
通过专用于信号处理和特征提取的特殊算法(图 1c),进一步完善得到的呼吸数据。这一分析阶段非常重要,因为它有助于识别和分离呼吸数据中的诊断模式。
最后,将提取的特征输入 ML 模型(图 1d)。该 ML 模型是根据指定的呼吸标记物定制的,用于识别和诊断新型冠状病毒感染(COVID-19)。
研究对象和数据收集
研究从 2021 年 7 月至 2021 年 10 月进行,为期三个月。当时越南正在实施 "零新冠状病毒"(Zero COVID)政策,要求医院或医疗营地对所有新感染冠状病毒的患者进行强制强化隔离。
在为期三个月的项目中,胡志明市 Binh Tan 医疗营的 33 名新型冠状病毒感染患者和居住在胡志明市的 37 名健康参与者参与了项目。
结果
收集的数据概览
下表 1 显示,新型冠状病毒感染患者的平均年龄略大于健康受试者。不过,标准偏差显示两组患者的年龄范围都很大,突出了数据集的多样性。此外,两组患者的性别分布基本平衡,最大限度地减少了研究结果中以性别为中心的偏差。
值得注意的是,新型冠状病毒感染患者的平均住院时间约为 6 天,这显示了这一群体病情的严重性,这可能体现在他们的呼吸模式上。将体温、血压和体重指数等生理参数以及新型冠状病毒感染的症状包括在内,可以全面了解参与者的健康状况。
特征提取
在此,我们详细探讨了基于整理的呼吸信号数据的详细特征提取分析。目的是突出健康受试者与新型冠状病毒感染患者在呼吸模式上的明显差异。下图 2 列出了两组患者在正常呼吸、屏气和深呼吸三种呼吸测试中呼吸信号的峰值检测和功率谱密度(PSD)分析。
数据显示,健康受试者和受影响受试者的峰值模式和相关频谱内容存在明显差异(图 2a-2l)。此外,还记录了时域和频域的四个代表性特征:平均呼吸频率 (RR)、平均突出度 (Prom)、归一化功率谱密度 (NPSD) 和主导频率 (Freq)。如图 2m-2o 所示。很明显,在比较正常人和 COVID-19 受试者时,这些特征存在明显差异,这表明该疾病对呼吸动力学有明显影响。
图 3显示了使用先进的非线性分析方法 RQA对呼吸信号的动态特征进行封装的结果。
图 3 所示的 RQA 结果突出显示了两组患者在三种呼吸条件下的特征复现图(图 3a-3f)。这些图生动地显示了被称为 "指纹 "区域的特定区域,它们是 COVID-19 患者复杂呼吸动态的独特特征。这些区域还标有三个关键的 RQA 指标:确定性(DET)、熵(ENT)和层状性(LAM)。两组患者的这些特征的三维散点图(图 3g-3i)显示出高度分离的集群,尤其是在屏气和深呼吸时。这表明这些 RQA 指标具有很强的鉴别力。此外,图 3j-3l 比较了两组的六个 RQA 指标。这些 RQA 指标的比较结果显示了健康受试者和 COVID-19 患者呼吸行为的重要特征数据。然而,我们必须认识到,并非所有指标在每种呼吸状况下都显示出显著差异,这反映了 COVID-19 对呼吸动力学的复杂影响。因此,量化这些特征的统计意义对于在 ML 模型中明智选择研究特征至关重要。
特征选择和机器学习模型
在本研究中,在对呼吸信号进行特征提取和详细分析后,通过特征选择阶段缩小了最相关特征的范围。这样就能将重点放在突出的属性上,并有效降低数据集的维度。图 4 展示了这一过程,图中显示了三种呼吸测试的结果:正常呼吸、屏气和深呼吸。
图 4a-c 显示了使用 Kolmogorov-Smirnov (KS) 统计量对四个特征组的特征进行优先排序的结果:时域、频域、峰值分析和 RQA。对于正常呼吸,这些特征组中最突出的特征是通量平均值、NPSD、Prom std 和 ENT。在憋气时,通量 BF std、平均 freqAll、Prom AF 平均值和 ENT 是最容易识别的特征。在深呼吸中,峰值2峰值AF、PSDAll 平均值、Prom AF std 和 LMAX 是最有提示性的特征。这些见解为区分健康受试者和 COVID-19 患者提供了重要指导,并反映在初步特征提取和分析中。
使用流形学习的 t-SNE 方法对复杂特征空间进行可视化的结果如图 4d-f 所示。这些三维图结果突出了健康受试者和 COVID-19 受试者在转换特征域中的区别,并强调了所选特征的鉴别能力。
选择特征后,在 COVID-19 病例上训练 ML 模型,并评估它们区分 COVID-19 病例和健康对照组的效果。由此产生的混淆矩阵(图 4g-i)是每个模型分类能力的缩影,显示了区分两个队列的显著准确性。此外,还进行了五部分交叉验证,并绘制了接收者操作特征曲线(ROC)(图 4j-l)。这里,曲线下面积(AUC)量化了每个模型的分类能力。值得注意的是,对于正常呼吸,精细高斯 SVM 模型的灵敏度为 99%,特异度为 94.1%,平均 ROC 曲线面积 (AUC) 为 0.954。对于屏气,袋装树模型的灵敏度稍低,为 94.1%,特异性为 90%,但其 AUC 值为 0.962。对于深呼吸,粗高斯 SVM 模型表现最佳,灵敏度为 99%,特异性为 94.1%,AUC 值为 0.956。
这些在多个呼吸测试和多重多重模型中进行的评估表明,本研究中的特征选择非常严格,随后的模型能够高精度地区分 COVID-19 患者和健康受试者。
摘要
本文结合磁性呼吸传感技术(MRST)和机器学习(ML)的优势,提出了一种对 COVID-19 及其变种进行实时监测和诊断的开创性方法。该研究强调了呼吸信号特征在区分 COVID-19 患者和健康人方面的有效性,为全球抗击该流行病做出了重要贡献。
这项研究还体现了跨学科尝试的巨大潜力,即利用健康科学、工程学和数据科学,提高快速发展的数字健康解决方案的质量,应对全球健康挑战,这将改善未来医疗监测和诊断工具的前景。以下是需要解决的一些最重要的问题。
与本文相关的类别