赶上最新的AI论文

我们能用人工智能对肾脏治疗进行决策吗?利用临床数据估计肾脏替代治疗(RRT)的最佳时间!

医疗

三个要点
✔️
提前了解慢性肾脏疾病(CKD)的肾脏替代治疗(RRT)的最佳时机,无论是血液透析还是肾脏移植,都是改善患者健康和疾病状况的重要因素。
✔️ 在本文中,我们提出了一个预测模型,预测首次诊断CKD后3、6和12个月开始RRT的情况,只使用台湾国民健康保险的合并症数据。
✔️ 利用8492名患者的数据,我们发现预测CKD诊断后12个月内RRT的接受者操作特征曲线下的面积(AUC)为0.773。

Using machine learning models to predict the initiation of renal replacement therapy among chronic kidney disease patients
Written by Erik Dovgan , Anton Gradišek, Mitja Luštrek, Mohy Uddin, Aldilas Achmad Nursetyo, Sashi Kiran Annavarajula, Yu-Chuan Li, Shabbir Syed-Abdul
(Submitted on 5 June 2020)
Comments: Accepted to
PLoS ONE.
Subjects: RRT, machine learning (ML)

背景

是否有可能预测肾脏治疗的适当时机?

本文报告了一项专注于肾脏替代治疗(RRT)的研究,使用机器学习来建立一个模型来估计适当的时机。肾功能减退已被确定为心血管疾病的一个主要风险因素,一旦恶化,就很难改善,因此预测适当的治疗时机对干预措施(包括预防)很重要。另一方面,很少有研究调查估计RRT的最佳时机。在这项研究中,他们研究了一个基于机器学习模型的估计RRT最佳时机的模型,该模型使用了临床上现成的数据--CKD和并发症的诊断数据。为了建立模型,他们研究了多种特征提取和特征选择的组合,并假设在有CKD并发症(如糖尿病和高血压)的人群中,RRT的预测准确性将得到明显改善。糖尿病患者",并在糖尿病患者的样本数据上测试这一假设。这项研究阐明了肾功能替代疗法的估计结果,并为未来医学的研究基础和各种预测模型的方法留下了有益的启示。

关于肾脏

首先,我来简单地谈谈肾脏,这与CKD密切相关。由于肾脏没有痛觉,而且很多疾病发生在老年人身上,所以很多人可能不知道这是一个什么样的器官。因此,我们希望你能在这里得到一个粗糙和简单的理解。

肾脏是位于背部中心附近的器官,负责过滤血液中不需要的物质并将其排出体外。它们存在于横跨脊柱的两个位置,通过血液分离体内必要和不必要的物质--过滤血液的形象--以产生尿液。这种分离发生在肾小球中,它是毛细血管的集合,从心脏泵出的血液有四分之一流入其中。

更具体地说,有两种功能:过滤功能--在肾小球中划分不需要的和必要的物质--以及重吸收功能--在确定为不需要的物质中重吸收必要的物质的功能。在前一种功能中,肾小球吸收流入的液体。在前者中,进入的血液被粗略过滤,因此主要是大分子--蛋白质、红血球等--保留下来。之后,过滤后的血液分两个阶段被重吸收,身体需要的较细的分子--水、电解质等--在一个叫做肾小管的地方被重吸收。因此,即使我们一言以蔽之说肾脏不好,但根据滤过功能或重吸收功能不好,其原因也是不同的,所以有必要识别这些并选择治疗方法。

此外,人们认为,一旦肾脏功能下降,就很难改善--人们普遍认为,透析治疗只是替代肾脏功能,而不是治愈。由于肾脏是人体过滤系统中唯一产生尿液的器官,因此很难用其他器官来替代,而肾脏功能的下降会对身体活动造成很大的负担--这是一个可能导致心血管疾病的因素。因此,为了预防这些疾病,预防和阻止肾脏的恶化非常重要。在这种背景下,预防肾功能下降--如何早期预测肾功能下降以及如何治疗--对以后的生活质量起着重要作用。

什么是慢性肾脏病(CKD)?

慢性肾脏疾病(CKD)是指肾脏的上述功能--滤过和重吸收--长期受损的疾病和状况,导致身体的滤过功能失效,出现功能障碍状态。它有时被称为主要以糖尿病、高血压和慢性肾炎为代表的疾病的总称。近年来,由生活方式相关的疾病--糖尿病和高血压--引起的慢性肾脏病的报告越来越多,这类患者占了很大的比例。这种疾病的主要特点是由于动脉粥样硬化的危险因素--血糖、低密度脂蛋白胆固醇等的增加而引起的血管损伤导致肾功能下降。如上所述,肾脏的过滤功能是通过肾小球--毛细血管的集合进行的。因此,当血管疾病导致血管功能降低或受到抑制时,肾脏的功能也将因此而降低。结果,体内不需要的物质无法排泄,不需要的物质在体内积累,从水肿和肩膀僵硬开始,不需要的物质在全身积累,并引起败血症和心血管疾病--事实上,据说CKD是心血管疾病的最大风险因素之一,而CKD之间的关系事实上,据说CKD是心血管疾病的最大风险因素之一,甚至有一个术语叫做心肾联动,来描述这种关系。

此外,很难意识到CKD症状的恶化,在很多情况下,发现CKD时已经是晚期了。 CKD在早期几乎没有症状,肾脏本身也没有疼痛的感觉,所以发现的时间往往被推迟。此外,如上所述,一旦肾功能恶化,就很难再改善,所以在早期发现疾病并开始治疗--如何早期发现疾病并在正确的时间治疗--将影响之后的预后。

对CKD的治疗

肾脏替代疗法(RRT),如透析和肾脏移植,通常用于治疗晚期CKD,但启动这些治疗的延迟会降低其有效性。这些疗法用于取代晚期CKD病情的肾脏功能--终末期肾病(ESRD)。例如,透析是一种在体外过滤血液并将其送回体内的治疗。如上所述,CKD没有主观症状,非专业人员相对难以诊断,所以病人在病情进展时往往会被转到专家那里。研究表明,这种延迟转诊到专科医生处的情况可能导致紧急透析--在没有永久性治疗设备(如腹膜导管)的情况下发生的一种紧急和危及生命的情况--并可能增加病情的严重性。在一些研究中已经确定了透析的需要。因此,制定可靠的指标来预测透析的需要,已被认为对预测RRT很重要,因为这将使医生和病人都能更好地准备这些治疗。

以前关于预测RRT的研究

目前,关于启动RRT的最佳时间还没有确凿的证据,已经有几项研究报告来估计最佳时间。特别是,已经报道了使用机器学习来预测几个月到一年内启动RRT的研究,以及预测几小时到几天内需要RRT的急性肾衰竭。另一方面,这些现有的研究使用实验室和人口统计学数据来分析和预测RRT,这些数据并不总是可用,因此缺乏普遍性。

本研究的目的

本研究的目的是开发一个基于历史的筛查工具,验证一个机器学习模型,以预测在CKD诊断时未来的RRT,并在模型中确定预测在不同时间点启动RRT的合并症--如糖尿病。该建议是测试一个机器学习模型,在MLD诊断时预测未来的RRT,并在模型中识别预测不同时间点开始RRT的合并症--如糖尿病。该提案将调查合并症和ML模型在预测未来3个月、6个月和12个月对RRT的需求方面的表现--是开始透析还是接受移植。这种方法的优势在于其普遍性,因为它使用了医院数据库中现成的数据--关于CKD及其并发症的诊断数据,而不依赖于GFR或其他实验室数据。这些预测模型可供政策制定者使用。这些预测模型对政策制定者、医院管理者和保险公司都有很大的好处,因为它们能洞察疾病发展的趋势,并能更好地分配资源--对医生和CKD患者都很有用,可以更好地进行健康规划和资源管理。

技术

研究设计

该研究的设计是回顾性的--所谓的后向队列研究--匹配在CKD诊断后3、6或12个月接受RRT--血液透析、腹膜透析或肾移植的患者。在CKD诊断后3、6和12个月内(图1)。从首次诊断CKD之日起,将对患者进行3个月、6个月和12个月的跟踪观察,并标明RR(图2)。

特征提取

在他们的建议中,他们测试了四种特征提取方法:1.原始数据,2.百分比,3.布尔值,4.时间:1.原始数据:对于每个诊断,他们计算每次诊断的CKD发生次数;2.百分比:对于每个诊断,他们计算CKD发生次数占患者总就诊次数的百分比;3.布尔值:对于每个诊断,如果CKD至少发生一次,设为1,否则为0;4。百分比:对于每个诊断,他们根据病人的总就诊次数计算其发生率;3.布尔值:对于每个诊断,如果CKD至少发生一次,他们将其设为1,如果不发生,则设为0;4.时间:他们将观察期划分为子期,对于每个子期,他们确定该诊断是否发生或1)和是否没有发生(0)。此外,对于较新的时期,对这些数值赋予较高的权重,对所有观察到的次时期都赋予了权重。在这种方法中,观察期被分为7个子期,每个子期6个月,剩下的时间从CKD诊断时开始。这些时期的权重是基于区间指数i = 1, ., 7,其中i = 1是最近的区间,i = 7是最远的区间。其余的权重与最远的区间相同,导致这些权重之和为1。

特征选择和调整

拟议方法中的特征选择包括:1.特征与RRT之间的相关性--去除低于0.1的诊断,2.与CKD相关的诊断--即CKD的合并症,以及3.基于相互信息含量和分类性能的选择,研究了三种方法。其中,2.并发症包括急性肾小球肾炎、慢性肾小球肾炎、糖尿病、基本高血压、高脂血症、多囊肾和肾结石。此外,3.根据与类的相互信息量和随机森林分类器的性能之间的关系,将诊断结果依次添加到输入数据中,直到达到分类器的性能改进的上限。他们还使用主成分分析(PCA)来汇总5624个诊断特征,并将其降维为10个成分。为了消除数据集中的不平衡--特别是没有RRT的不平衡占12个月预测期的87%,6个月预测期的94%,3个月预测期的96%--我们给每个病人分配了权重,并将权重与数据库中的类别频率成反比。通过使权重与数据库中的类别频率成反比,不平衡的影响得到了缓解。

模型设计

在这项研究中,几个与机器学习相关的方法--决策树、袋化决策树、随机森林、XGBoost、支持向量机、简单梯度等。后裔、最近的邻居、高斯奈夫贝叶斯、逻辑回归和神经网络--并调查了每一种的性能(表1)。这里,Bagging决策树是一种取代随机森林中特征选择的方法,随机森林是一种提取和整合决策树特征的集合学习。

验证方法

在本文中,他们通过10倍交叉验证来划分训练集和测试集,使每个数据集中的RRT与非RRT的比例相同。性能指标是无线电操作员特征曲线下的面积(AUC),每个阶段得到的AUC的平均值作为结果显示。由于AUC是一个考虑到阳性反应率的指数,它被引入作为具有不平衡性的数据集的测量指数,比如这个数据集,因为它被认为是一个基于数据集的特征而不是阳性反应率的指数。此外,他们还提到了ML模型的敏感性和特异性。

结果

3、6和12个月后的预测结果

本评价的目的是澄清12个月后每个机器学习模型对RRT的估计性能。

按AUC(表2)和AUC>0.7(图3)排序的算法的数据处理参数结果显示,当没有进行本研究中引入的任何预处理--没有特征选择、过滤或降维--时,AUC最高。得到了AUC。此外,通过改善数据的均衡性,证实了灵敏度和特异性之间的权衡变得更加清晰。通过时间获得的特征是最好的特征。

3个月和6个月后的结果(图4)也表明,解决同质性的灵敏度和特异性之间的权衡得到了改善,表现最好的ML模型是Logistic Regression和SGD。

所有患者和糖尿病患者的模型比较

这项评估是为了确定糖尿病肾病(CKD的一个主要并发症)的影响--有糖尿病和没有糖尿病的CKD患者之间预测性能的差异。作者假设,有这些并发症的患者将是更好的预测因素,为了验证这一假设,他们分别评估了2型糖尿病患者和非糖尿病患者。

评估结果(图5)显示,对所有病人进行训练和测试时,AUC最高;对所有病人进行训练,只对糖尿病病人进行测试时,AUC次之;对糖尿病病人进行训练和测试时,AUC最低。作者指出,一个重要的因素是训练数据数量的差异。

考察

估计肾脏替代治疗(RRT)的适当时机有助于防止肾功能下降,并最终防止心血管疾病,因此需要有较高的准确性,但调查RRT启动的最佳时机的研究是然而,很少有研究调查了启动RRT的最佳时机。在这项研究中,我们研究了一个基于机器学习模型的估计RRT最佳时机的模型,使用的数据在临床上很容易获得--CKD及其并发症的诊断数据。在研究中,对多种特征提取和特征选择的各种组合进行了详尽的研究。我们还根据糖尿病患者的样本数据,检验了这样一个假设:对于有CKD并发症的患者,如糖尿病和高血压,RRT的预测准确性可能会提高。

作为评估的结果,使用Logistic模型获得了最佳性能,该模型使用了作者定义的时间模式的特征提取:AUC=0.773。我们还使用从所有患者(包括糖尿病患者)和仅有糖尿病史的患者中提取的数据调查了预测性能。结果显示,包括所有病人的数据集的性能高于糖尿病的性能--这些表明数据的数量比生物因素的影响更大。作为研究的结果,可以推断该模型并不适用于在临床实践中实施,因为它不能被确定为高度准确,但该结果有望促进未来医学领域预测模型的研究,例如确定治疗策略。

这项工作的一个延伸是将估计模型应用于不同的肾脏相关疾病,如急性肾损伤(AKI)和蛋白尿症。在这些疾病中,对AKI的估计特别有意义,因为它往往需要紧急治疗(谷歌的一篇深度学习论文之前已经发表)。此外,蛋白尿与其他肾脏疾病密切相关,一些流行病学研究指出,它是CKD的最大预测因素之一。因此,如果能像本文所示,只用临床数据来估计这类疾病,将具有临床意义。

另一方面,本次评估中引入的设定RRT和非RRT比例的方法的有效性。如上所述,在10倍交叉验证中,每个数据集都被调整,以便这些比例是相同的。另一方面,正如本文所讨论的,现实世界的数据集往往是不平衡的--也就是说,这些统一比例的数据集有可能是无效的。特别是,当使用临床数据时,如本案例中,异质性的倾向--RRT相对较小的倾向--可能会更加明显,因此,除了统一的情况外,有必要包括各种比例的测试结果。

  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!

如果您对文章内容有任何改进建议等,请通过 "联系我们 "表格与爱学网编辑部联系。
如果您能通过咨询表与我们联系,我们将非常感激。

联系我们