赶上最新的AI论文

使用W&D(广义和深度网络模型)进行医学图像分析

转学

三个要点
✔️利用W&D(广义和深度网络模型)改进前列腺癌的图像分析和诊断技术
✔️实现比现有机器学习模型更准确的图像分类
✔️证明W&D的高通用性

Wide & Deep neural network model for patch aggregation in CNN-based prostate cancer detection systems
written by Lourdes Duran-LopezJuan P. Dominguez-MoralesDaniel Gutierrez-GalanAntonio Rios-NavarroAngel Jimenez-FernandezSaturnino Vicente-DiazAlejandro Linares-Barranco
(Submitted on 20 May 2021)
Comments: Accepted by arXiv

Subjects: Machine Learning (cs.LG)

code:  

首先

在过去的几年里,用于图像识别的人工智能技术已经取得了重大进展。其中一个原因是深度学习(DL)的扩大使用。

本文通过对前列腺癌(PCa)的医学影像诊断,比较了各种医学影像分析模型的诊断准确性,其中重点介绍了W&D(Wide & Deep Network Model),这是一个曾经在推荐中很热门的网络,并将其用于医学影像分析。我将解释关于 "基于CNN的前列腺癌检测系统中补丁聚集的宽深神经网络模型 "的论文。

前列腺癌(PCa)是男性第二大最常被诊断的癌症,也是癌症死亡的第五大原因,在2020年造成141万多人死亡,全球约有37.5万人死亡。

  1. 一般来说,诊断PCa的第一步是进行数字直肠检查(DRE),这是对前列腺进行初步临床评估的主要测试。
  2. 如果发现DRE结果异常,则进行前列腺特异性抗原(PSA)分析,作为肿瘤调查的一种筛选方法。
  3. 如果PSA为阳性,可以考虑经直肠超声引导下的活检。
  4. 前列腺样本在实验室中被采集、处理和扫描,以产生千兆像素分辨率的图像,称为全玻片图像(WSI)。然后由病理学家对这些图像进行分析,最终诊断是否是癌症。

在这个医学图像分析中,学习了前列腺组织的WSI,以分析和检测它是正常的还是恶性的,准确性很高。

这些算法可能发挥重要作用,作为第二意见和筛选方法,协助医生完成特定的图像分析任务。特别是,卷积神经网络(CNN)和其他各种DL机制最近被学习用来分析和检测WSI中的恶性组织,并被广泛用于数字组织病理学。

由于使用CNN获得的结果是在补丁层面上报告的,所以已经提出了不同的技术来结合它们以产生滑动层面的分类结果。这种技术被称为 "补丁聚合"。

在提出的各种研究中,基于循环神经网络(RNN)、随机森林(RF)、其他机器学习(ML)和统计学的各种补丁聚合技术已经被实施,这可以帮助病理学家制定一个准确的导致筛选方法。

数据集和预处理

使用由Virgende Valme医院(西班牙塞维利亚)的病理解剖科提供的一套苏木精和伊红(H&E)染色的幻灯片(158张正常的WSI和174张恶性的WSI)。这些图像通过以下程序对WSIs进行斑块级处理以进行预测

  1. 在一个称为 "读取 "的步骤中,从输入的WSI中提取斑块,并丢弃背景中的相应斑块。
  2. 在评分步骤中,为每个补丁分配一个分数,以放弃对应于不需要的区域的补丁。这个分数是通过考虑三个因素来区分的:斑块中的组织量,落在H&E色调范围内的像素的百分比,以及饱和度和亮度通道的差异。在这一步骤中被丢弃的斑块以红色显示,而通过评分过滤器的斑块则以绿色显示。
  3. 在第三步,称为染色归一化,根据Reinhardt的染色归一化方法对斑块进行颜色归一化,以减少样本之间的颜色变化。
  4. 在预测步骤中,每个补丁都被用作输入到一个名为PROMETEO的CNN,它将它们分类为恶性或正常组织。

PROMETEO是一个基于CNN的计算机辅助诊断系统,用于检测WSI前列腺癌。

恶性(左)和正常(右)样本也在下图中得到了区分。

这个直方图是所有WSIs中归一化补丁频率的平均概率直方图。红色虚线代表最小二乘法回归线。

从直方图来看,在癌症WSI中,被归类为恶性的斑块往往集中在肿瘤区。因此,我们假设被归类为恶性的斑块的分散系数可以成为在滑动水平上分类正常和恶性WSI的另一个输入。这个系数是通过计算恶性连接成分(MCC)的数量得到的。

关于如何根据恶性斑块的中心坐标来计算连接成分的数量,详见算法1。
这个值对应于与补丁的欧氏距离(半径),范围是1到5个补丁距离,考虑到两个补丁之间的距离是100像素(补丁的大小是100×100像素)。相对于每个WSI中的恶性斑块的总数,连接成分的数量被归一化。

算法1:寻找MCC的算法

妇发会

顾名思义,W&D模型有一个宽的部分(宽度)和一个深的部分(深度)。广义组件有效地存储了特征之间的稀疏的相互作用。它可以被定义为学习输出对稀疏输入值的组合如何反应。

另一方面,深度组件对应于前向传播的神经网络,代表泛化,即处理以前从未见过的数据的能力。因此,它将记忆(广义)和概括(深义)两者的优势结合在一个模型中,将记忆(广义)和概括(深义)两者的优势结合在一起

学习和验证

本次验证中使用的W&D网络模型如下

每个隐藏层由300个神经元组成。

输入是

  • WSI的恶性组织比率(MTR
  • 直方图的最小二乘回归线(LSRL)的斜率和Y截距
  • (MCC)被省略了,因为它在上面有详细描述。
  • 恶性肿瘤概率直方图(MPH)从50%到100%,有5%的刻度。

这些输入被用来将WSI分类为恶性(M)或正常(N)。

从这里开始,整个PCa筛选任务的整个处理步骤

首先,我们按照预处理中的相同步骤,在补丁层面上处理WSI。
然后,利用原始WSI中每个过滤补丁的输出分类,我们使用上图所示的W&D模型进行滑动层面的预测。

为了衡量模型的泛化性能,进行了K-fold分层交叉验证(使用分层提取法的K-分层交叉验证)。为了验证该网络,我们使用了不同的评价指标:准确性、敏感性、精确性、F1得分以及F1得分-ROC(接收者操作特性)曲线的AUC。

结果和讨论

K倍分层交叉验证的结果和所有评价指标的平均值被总结为W&D的网络模型的验证结果。

平均结果是准确度94.24%,灵敏度98.87%,精确性90.23%,F1得分94.33%,AUC为0.94。它在这项分类任务所考虑的所有指标中都取得了非常高的分数,特别是在敏感度方面。敏感度在该领域被定义为系统识别PCa的能力,在报告和评估筛查测试的性能方面具有极其重要的意义。这意味着W&D模型是一种可靠的贴片聚集方法,在预测恶性样本时几乎没有错误。

以下是与其他知名机器学习模型相比的结果

从表中可以看出,所提出的W&D模型在准确性、敏感性、F1score和AUC方面取得了最佳结果,但Presicion除外,SVM取得了最高值。

如前所述,在这种情况下,W&D在图像分析方面是最好的,因为Sensibility是在筛选时衡量分类器性能的最相关指标。SVM实现了约99%的Presicion,这被认为非常适用于其他二元或多类分类任务。

摘要

我们发现,W&D模型在多个方面优于其他机器学习模型:准确性、敏感性、F1score和AUC。

这个W&D模型不仅是一个推荐功能,也是图像分析中一个有用的算法,它可能对病理学家分析组织病理学图像作为一种筛选方法和识别正常PCa和恶性PCa的幻灯片非常有用。

然而,需要注意的是,尽管这仍然是一项零散的研究,但我不相信我们还拥有足够的数据量。因此,随着更多数据的加入和数据量的增加,将来有必要与更深的模型进行比较。我认为W&D已经足够好了,这次显示了一种可能性。

  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!
加藤 avatar
AI-SCHOLAR是一个评论媒体,以通俗易懂的方式介绍关于AI(人工智能)的最新文章。 人工智能的作用不仅限于技术创新,日本的科研能力正在下降,政府也在不断削减研究预算。 向世界传达人工智能的技术、应用以及支持人工智能的基础科学的背景,是一个重要的外延,可以极大地影响社会对科学的理解和印象。 AI-SCHOLAR旨在帮助消除普通民众和专家之间对人工智能的理解差距,为人工智能融入社会做出贡献。 另外,我们希望帮助大家把自己的学习和研究经验在媒体上体现出来,在社会上表达出来。 任何人都可以用艰深的词汇来解释高深难懂的事情,但AI-SCHOLAR追求的是"可读性"和"可理解性",充分利用词汇和设计来传递信息,以此为媒介。

如果您对文章内容有任何改进建议等,请通过 "联系我们 "表格与爱学网编辑部联系。
如果您能通过咨询表与我们联系,我们将非常感激。

联系我们