
即使是导致诊断的想法也会被转化为数据!什么是牙科全景X光片数据集 "TDD"?
三个要点
✔️ 塔夫茨牙科数据库(TDD)的牙科全景射线照片介绍
✔️ TDD是世界上第一个结合了牙齿和颌骨位置、病变存在和钙化程度信息的数据集。
✔️ 除了牙科检查结果外,TDD还包括读者的眼动信息和诊断原因的文字数据。
Tufts Dental Database: A Multimodal Panoramic X-ray Dataset for Benchmarking Diagnostic Systems
written by
(Submitted on Oct 4 Oct 2021)
Comments: Published on IEEE J Biomed Health Inform.
本文所使用的图片要么来自论文、介绍性幻灯片,要么是参考这些图片制作的 。
概述
牙科全景射线照片包含大量信息,已被用于各种机器学习应用,如蛀牙检测、肿瘤检测和骨质疏松症风险评估。然而,全景X光片中所包含的大量信息还没有被充分地利用,有些论文用它来检测蛀牙,有些则用来评估牙周病。
作者(塔夫茨大学)创建了塔夫茨牙科数据库(TDD),这是一个由1000张全景X光片组成的数据集,是世界上第一个包含许多牙科研究结果的多模态数据集,如解剖学、病变的位置和范围等。TDD是世界上第一个多模态数据集,包含许多牙科研究结果,如解剖学、位置和病变范围。
牙科中使用的射线照片的例子
本文介绍的三个例子如下
从左到右,(a)根尖周,(b)咬合,(c)全景,指的是所谓的牙科、咬合和全景技术。
全景X光片提供了包括口腔在内的上、下颌的全面视图,并在一张X光片中提供了大量的信息。
围绕牙科人工智能的挑战
该文件解释了为什么人工智能技术在牙科中没有得到充分的利用,具体如下
- 为了保护隐私,不能获取数据。
- 该数据集是复杂和多维的,有发病率和健康方面的偏差。
- 比其他数据集更少。
- 没有明确的黄金标准,需要专家进行注释。
- 没有关于如何或为何作出预测的反馈。
本文提出了一个1000张全景射线照片的数据集,除了牙科的研究结果外,还基于牙科放射科医生通过眼睛追踪和采访诊断的原因而得出的看法。
关于数据集
采集方法和摄影设备
这些照片是从2014年1月至12月期间在塔夫茨大学牙医学院医院获得的全景X光片中随机抽取的。然而,没有模糊或伪影的高质量图像被选中。这1000张图片由一名牙科放射医师和一名四年级的牙科学生(已完成口腔颌面放射学的课程和临床培训并通过考试)进行注释。
使用的设备是OP100口腔镜(Instrumentarimu Imaging / Kavo Kerr)和Plammeca Promax 2D(Henry Schein),图像密度和对比度设置由设备自动决定。
划分的例子
下面的图片显示了全景射线照片的不同掩模。
一张全景射线照片可以包含几个图像:(a)原始射线照片,(b)"异常 "区域,(c)绘制眼球运动的黑白图像,(d)显示眼球运动的彩色图像,(e)牙齿区域,(f)整个上下颌包括口腔。全景X光片可以包含多个图像。
异常现象的分层描述
本文采用了以下对异常发现的分级描述,旨在避免评估者之间在措辞和标准上的歧义。
- 第一层(浅蓝色)描述解剖位置。它被分为四类:根尖周炎、根尖周炎、根尖内炎和与牙齿无关的区域。
- 第二层(绿色)是对异常现象周围区域的描述。有两个层次:清晰或不清晰。
- 第三层(橙色)是放射学发现。这些是渗透性、不透明性和混合隔膜和钙化。
- 第四层(靛蓝)描述了与异常区域相邻的结构。这包括牙齿移位、牙根吸收、骨质变薄和变厚、组织变性和软组织受累。
- 第五层(紫色)是异常情况的分类。这些是良性肿瘤和囊肿、恶性肿瘤、炎症、发育不良、代谢性/系统性、创伤性和发育性生理。
牙科放射科医生和学生之间的差异
下面是一个表格,显示了牙科放射科医生和学生对所指出的异常位置的同意程度。
专家们有更多的异常发现需要指出。相反,学生更有可能找不到异常,而给出 "无 "的评价。或者他们可能在诊断上犯了一个错误。
3.5 眼球跟踪和采访
在评估全景X光片时,我们跟踪了评估者的眼睛运动。看一个区域的时间(固定时间)用一个圆的直径表示,看的时间越长,圆就越大。
(b)是异常区域的分割遮罩,(c)和(d)显示评估者的目光长时间固定在病变区域。
此外,评审员从中听到的决定理由的语音数据会用语音识别转换为文本,并添加到一个json文件。
如何使用该数据集
TDD可在我们的网站上找到,但用户需要提交一份申请表格,以获得下载许可。
数据集的结构如上图所示,共包含1000个案例的9000张图像。这些包括上述的病变分割掩码和牙齿分割掩码,具体如下
TDD使用实例
作者实际上已经用TDD来实现现有的方法。例如,图像增强(为使图像更容易阅读而进行的图像处理)产生了以下图像
AME和LogAME是用来给数据集质量打分的指标,其灵感来自人类的主观评价。AME越小,图像的对比度就越高。这意味着图像很容易看清,不会模糊不清。
牙齿分割的结果显示如下。
PA(像素精度)、IoU(交集大于联合)和Dice系数被用作评价指标。
由于本文的目的是建立一个数据集,而不是提高机器学习模型的性能,所以数字不是很显著,但结果与现有报告相当或更好。
摘要
该论文介绍了塔夫茨牙科数据库,这是一个由1000张牙科全景射线照片组成的数据集,其中包括牙齿分割、病变分割、遮蔽兴趣区、眼球追踪图和诊断的文本原因。TDD包含牙齿分割、病变分割、感兴趣区域的遮蔽、眼球追踪图和诊断原因文本的数据,使其成为开发牙科AI非常有用的数据集。
与本文相关的类别