利用深度学习自动判断斜视眼的拟议算法!
三个要点
✔️ 斜视眼--斜视--由于智能手机的广泛使用,越来越多的人获得斜视,并与白内障等严重的眼部疾病和颅神经损伤有关。早期发现对实现预后的改善等非常重要,尤其是在儿童期的发病率很高。
✔️ 在这项研究中,基于眼睛注视的摄影和深度学习算法,构建并验证了用于筛选斜视眼的深度学习-DL-模型。
✔️ 作为评估的结果,ROC曲线下的面积-AUC-约为0.99:达到了94.0%的敏感性和99.3%的特异性。
Detection of Referable Horizontal Strabismus in Children's Primary Gaze Photographs Using Deep Learning
written by Ce ZhengQian YaoJiewei LuXiaolin XieShibin LinZilei WangSiyin WangZhun FanTong Qiao
(Submitted on January 2021)
Comments: Translational Vision Science & Technology
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的。
背景
深度学习能否填补比专科医生更多的经验?
本研究旨在开发一种斜视眼的自动分类算法,由于智能手机的广泛使用,斜视眼正在迅速增加。
斜视--斜视眼--是指双眼错位--右眼和左眼看向不同的方向--被认为是一种特别影响儿童的眼科疾病:在儿童中,它包括内斜视和外斜视。水平斜视是最常见的斜视形式,也是导致儿童弱视的最常见原因。患有明显斜视的儿童也更有可能因视觉和其他问题而产生社会心理后遗症--即自信心不足和自尊心焦虑;另一方面,由于这些斜视情况的诊断需要一定的技能和专业知识能够诊断这些疾病的专家--特别是儿科眼科医生--数量有限。
本研究旨在构建和验证一个深度学习模型,用于从临床评估期间拍摄的主要凝视照片中筛查水平斜视,主要针对儿童。该模型的构建是基于卷积神经网络(CNN),它经常被用于图像分析,并使用外部数据集进行验证。
什么是斜视眼?
首先,描述了斜视眼--斜视--是本研究中分析的对象。
斜视--斜视是一种右眼和左眼看向不同方向的情况--两只眼睛都没有看向正确的目标:向外看,一只眼睛看向正确的方向,而另一只眼睛却向内、向外、向上或向下。右眼和左眼的方向是错误的--两只眼睛都没有看向正确的目标。这种情况--眼睛错位--使双眼难以正确视物:具体而言,难以掌握立体感--双眼功能障碍--一侧的视觉发育受到干扰--斜视弱视--一侧的视觉发育受到干扰。这种情况还可能导致斜视弱视的发展,斜视弱视阻碍了一侧眼睛的视觉发展。这些症状还导致儿童早期视力发展减弱--弱视,看到两个物体--复视,美容问题,疲劳和其他问题。
近年来,智能手机的广泛使用导致了由数字设备使用引起的后天性失眠问题--智能手机失眠。通常情况下,人眼在近距离观察物体时向内转动并聚焦,但当目光从近处移向远处时就会放松。这种情况是由过度使用智能手机造成的,这使人难以控制这种内向的转变。这种因使用数字设备而导致的斜视恶化在年轻人中更为常见--特别是那些年龄小于12岁的人--而且自2018年以来,注意到患者的数量在增加。
技术
数据集
这项研究涵盖了2013-2019年期间总共7530张初级凝视照片--3330张斜视和4200张正常凝视照片--SCH数据集。该研究进行了。每张图像都由三位专业眼科医生进行检查,如果有任何一位眼科医生判断该图像是非梯度性的,则将其从数据集中删除--从视觉上看,斜视是检测不到的。结果,获得了7026张图像--3021名正确视力患者的3829张正面图像和2772名斜视患者的3197张图像。纳入的患者是接受手术的原发性水平斜视儿童和在SCH接受定期屈光检查的视力正常的儿童。斜视还被定义为:稳定的婴儿内斜视(≥40 PD - 瞳孔间距离-),完全远视矫正后残留的适应性远视(>10 PD),以及完全远视矫正后>50%的清醒时间出现的间歇性斜视或间断性斜视。外斜视或小儿斜视(>15 PD)。患有限制性斜视、感觉性斜视、麻痹性斜视、重症肌无力、眼球震颤、杜恩综合症的受试者也被排除在外。所有的照片都是在离被试者1米远的地方用笔式手电筒连着市售的相机(D800;Nikon公司,东京)拍摄的,并且只收集主视线照片。
评估环境
评估分为训练--80%--和验证--20%:整个系统被分为五组,四组用于训练,一组用于验证。训练过程也重复了1000次。该模型的性能也被用于准确性、敏感性、特异性和受检者操作曲线下的面积--ROC曲线下的面积:AUC--。评估还基于277张原生眼照片--JSIEC数据集--133个斜视和144个正常病例作为外部数据集。
拟议模型
建议的模型--见下图--利用了两个阶段的深度学习:首先,检测和识别主要目光,然后将其分为斜视和正常目光。在前者中,兴趣区域(ROI)是用Faster R-CNN提取的,它定义了一个由位置和大小信息组成的边界盒。它是一种物体检测算法,定义了一个由位置和尺寸信息组成的边界框。提取的图像由专家手动检查,必要时进行校正--双眼被调整到水平位置;在第二步,使用ImageNet26提取图像--一个在超过100万张图像上预训练的3架构。基于三个架构的过渡学习--VGG16、Inception-V3和Xception--在ImageNet26上进行了预训练--超过一百万张图像。图像像素被重新缩放为0到1的范围内的值,并插值以填充299×299的矩阵。在训练中,我们使用了亚当优化器--学习率为0.0001--和一个小型批次梯度下降法--大小为32--早期停止为10个epochs。为了更好地可视化算法的学习过程,使用了类激活图--类激活图:CAM--来阐明与DL算法的识别水平相关的图像区域。
一个外部验证数据集也被用于人类专家判断,三名在儿科和斜视方面有至少三年临床经验的见习眼科医生被指示独立判断每个测试图像--在识别斜视眼时,从瞳孔中心的第一个普金杰图像-由于角膜光反射而产生的反射模式 -利用位移的
结果。
本节介绍本研究中的评价。
为了评估,本研究使用了Faster R-CNN处理,只提取了图像上的ROI。在评估中,训练和验证数据集被用来使用五重交叉验证来训练模型--见下表,而外部数据集被用来验证模型的性能--见下表。见下表。
结果显示,利用深度学习的模型的5倍交叉验证的平均AUC如下:inceptionV3:0.993;VGG16:0.993;Xception:0.991和外部验证数据集-基于JSIEC-,分类性能的敏感性为0.94,特异性为0.99-见下表和下图。研究发现,深度学习模型的敏感性和特异性都高于眼科医生的诊断准确性。
被错误分类的图像--见下图--也证实了分类失败的原因,如偏离中心--由于头部的倾斜,孩子的眼睛不能被置于中心位置,以及图像质量差--角膜对光线的反射很弱。经确认,分类失败的原因是偏离中心--由于头部倾斜,图像无法对准儿童的眼睛,以及图像质量差--角膜对光线的反射较弱。
考虑
在这项研究中,构建并验证了一个深度学习模型,该模型可以根据眼睛的照片自动诊断斜视筛查,准确率很高。在斜视眼中,如智能手机内斜视,由于智能手机和其他设备的广泛使用,患者数量迅速增加,临床评估的成本和专业知识一直是一个问题。在这项研究中,在使用原始照片--即用智能手机和其他设备拍摄的照片--的假设下,构建并验证了一个利用深度学习的自动筛选模型。该模型基于一个外部数据集进行了验证,证实该模型取得了比专家诊断系统更高的准确性--AUC:0.997,敏感性:94%,特异性:99.3%。在此背景下,该研究有望为未来斜视检测的DL提供一个基线。
此外,近一半的误判案例--49.1%--是由于偏离中心--由于头部倾斜导致眼睛不在中心--其次是图像质量差。--如角膜的弱光反射;因此,在本评价中出现误判的原因不是所提出的模型的性能,而是摄影中的方法学问题;解决这些问题的方法是对图像进行预处理。例如,平滑滤波--可以作为拟议模型的输入加以利用。
第二,所利用的大部分数据是针对华裔的,所以需要考虑是否可以推广到其他不同的族裔群体;第三,病人在成像时没有戴眼镜--戴眼镜可能会改变斜视的角度--所以需要对戴眼镜的图像的表现进行额外验证。需要对戴眼镜的图像的性能进行额外的验证。
与本文相关的类别