《Scientific Reports》:Development and validation of a bacteremia prediction score for adult emergency department patients using hybrid machine learning and regression
编辑推荐:
急诊科(ED)血培养假阳性率高,亟需精准预测工具。本研究旨在开发和验证一种用于改善血培养患者选择的菌血症预测评分。研究人员利用韩国一家三级医院(2014-2019年)的多中心回顾性队列数据,采用结合机器学习与逻辑回归的AutoScore方法,基于初始生命体征和实验室数据构建了包含八个变量(降钙素原[PCT]、乳酸、白细胞计数[WBC]、C反应蛋白[CRP]、血尿素氮[BUN]、体温、血小板计数、总胆红素)的评分模型。该模型在内部测试队列中取得了0.825的受试者工作特征曲线下面积(AUROC),优于PCT、SOFA、MEWS和SIRS等传统评分,并在外部验证中表现良好。该工具可对患者进行低、中、高风险分层,有助于临床决策优化,提高医疗资源使用效率。
菌血症,即细菌侵入血液循环,是一种可能危及生命的严重感染。早期识别和及时给予恰当的抗生素治疗对于改善患者预后至关重要。然而,在急诊科(Emergency Department, ED)这一医疗前线,准确识别哪些患者真正需要血培养检查却是一个临床难题。一方面,漏诊菌血症可能导致治疗延迟,增加死亡风险;另一方面,由于缺乏精准的预测工具,临床医生往往倾向于“广撒网”式地开具血培养,导致了过高的假阳性率和不必要的抗生素使用,这不仅增加了医疗成本,也加剧了细菌耐药性的问题。因此,开发一种能够准确预测急诊患者发生菌血症风险的评分工具,实现患者精准分层,对于优化临床决策、合理配置医疗资源、改善患者结局具有迫切而重要的现实意义。
为此,研究人员开展了一项题为“Development and validation of a bacteremia prediction score for adult emergency department patients using hybrid machine learning and regression”的研究,旨在利用混合机器学习与回归的方法,开发和验证一个专门针对成人急诊患者的菌血症预测评分。该研究成果发表在《Scientific Reports》期刊上。
本研究主要采用了以下几种关键技术方法:
- 1.
研究设计与数据来源:采用了一项多中心回顾性队列研究设计。模型开发和内部验证的数据来源于韩国一家三级教学医院2014年至2019年的急诊科患者数据。外部验证则在另外两家医院(A医院和B医院)2022年的数据中进行。
- 2.
患者队列构建:将总数为24,856名患者的数据集按时间顺序划分为开发队列(17,373人)、验证队列(2,491人)和测试队列(4,992人),以评估模型性能。
- 3.
模型构建方法:核心采用了AutoScore方法,这是一种结合了机器学习(用于变量筛选和权重分配)和逻辑回归(用于最终模型拟合)的混合建模框架,用于生成基于初始生命体征和实验室检查结果的预测评分。
- 4.
模型性能评估:使用受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUROC)作为主要指标,比较新模型与降钙素原(Procalcitonin, PCT)、序贯器官衰竭评分(Sequential Organ Failure Assessment, SOFA)、改良早期预警评分(Modified Early Warning Score, MEWS)、全身炎症反应综合征(Systemic Inflammatory Response Syndrome, SIRS)评分等传统预测工具的表现。
研究结果
模型开发与变量选择
通过AutoScore方法,研究最终确定了一个包含八个临床变量的菌血症预测模型。这八个变量按其在模型中的重要性(权重)依次为:降钙素原(Procalcitonin)、乳酸(Lactate)、白细胞计数(White Blood Cell count, WBC)、C反应蛋白(C-reactive protein, CRP)、血尿素氮(Blood Urea Nitrogen, BUN)、体温(Body Temperature)、血小板计数(Platelet count)和总胆红素(Total Bilirubin)。这些指标均是在患者就诊初期即可快速获取的常规检查项目,保证了模型的临床实用性。
预测模型的性能表现
在内部测试队列中,本研究开发的菌血症预测评分表现优异,其AUROC达到了0.825(95%置信区间[Confidence Interval, CI], 0.808–0.842)。这一性能显著优于单一的生物标志物PCT(AUROC=0.808)以及临床上常用的几种危重病评分系统,包括SOFA评分(0.718)、MEWS评分(0.630)和SIRS评分(0.583)。这表明,整合了多维度信息的混合模型在区分菌血症患者方面具有更高的准确性。
模型的外部验证
为了检验模型的普适性,研究在另外两家独立的医院进行了外部验证。结果显示,该评分在A医院的验证队列中AUROC为0.796(95% CI, 0.773–0.818),在B医院为0.813(95% CI, 0.778–0.848)。尽管性能略有波动,但均保持了良好的判别能力,证明了该模型在不同医疗环境下的稳健性和可推广性。
临床风险分层
基于预测评分,研究将患者划分为低风险、中风险和高风险三个层级。在不同的队列中,各风险层级的实际菌血症发生率呈现出清晰且具有临床意义的梯度:低风险组的发生率为2.6%至3.2%,中风险组为5.2%至9.3%,而高风险组则高达23.7%至30.2%。这种有效的风险分层能力,为临床医生根据风险等级采取差异化的诊疗策略(如决定是否进行血培养或启动经验性抗生素治疗)提供了量化依据。
研究结论与讨论
本研究成功开发并验证了一个用于预测成人急诊患者菌血症风险的评分工具。该模型利用AutoScore这一混合机器学习与逻辑回归的方法,仅基于入院初期的八项常规临床变量构建,兼具良好的预测效能与临床易用性。
与传统的单一生物标志物(如PCT)或综合评分系统(如SOFA、MEWS、SIRS)相比,该模型在内部测试和外部验证中均显示出更优的鉴别能力。更重要的是,它能够将患者明确地划分为不同风险层级,其中高风险患者的菌血症发生率是低风险患者的近十倍。这一特点使其有望成为一个实用的临床决策支持工具。
该研究的意义在于,它为解决急诊科血培养过度使用和菌血症漏诊之间的矛盾提供了一种数据驱动的解决方案。通过应用此评分,临床医生可以更精准地识别出真正需要血培养检查的高危患者,从而避免对低风险患者进行不必要的检查,节约医疗资源,并可能通过更早的干预改善高危患者的预后。尽管该模型基于回顾性数据开发,且未来需要在更广泛的前瞻性研究中进一步验证,但它代表了向精准化、个体化感染管理迈出的重要一步,为急诊医学和感染性疾病的临床实践提供了新的工具和思路。