《Infection Control & Hospital Epidemiology》:Can machine learning support infection control measures by predicting carbapenemase-producing Enterobacterales colonization at admission?
编辑推荐:
背景:产碳青霉烯酶肠杆菌目细菌(Carbapenemase?producing Enterobacterales,CPE)定植的早期识别对感染防控至关重要,但微生物学检测常导致延迟且成本较高。机器学习可增强预测分析能力,有望及时识别高危患者。
方法:研究人员采
背景:产碳青霉烯酶肠杆菌目细菌(Carbapenemase?producing Enterobacterales,CPE)定植的早期识别对感染防控至关重要,但微生物学检测常导致延迟且成本较高。机器学习可增强预测分析能力,有望及时识别高危患者。
方法:研究人员采用决策树(Decision Tree)、随机森林(Random Forest)、梯度提升(Gradient Boosting)及极端梯度提升(XGBoost)四种机器学习模型,利用微生物学与人口统计学数据,预测入院48小时内CPE定植情况。模型性能通过灵敏度、特异度及受试者工作特征曲线下面积(AUROC)评估。采用均匀流形近似与投影(UMAP)分析CPE阳性病例与阴性对照的拓扑可分性。
结果:2015年1月1日至2024年12月31日共提交453?372份粪便标本用于CPE筛查,其中194?917份(43.0%)于入院48小时内采集,包括3?328例CPE阳性(1.7%)与191?589例阴性对照。梯度提升分类器表现最佳,AUROC为0.598,灵敏度54.4%,特异度59.1%。年龄≥75岁、男性、过去一年住院史、已知CPE定植史及入院科室(普通内科与普通外科)在所有模型中均为主要预测因子。UMAP显示CPE阳性与阴性患者分布高度重叠,表明风险谱区分困难。
结论:本研究揭示了利用机器学习预测入院48小时内CPE定植的复杂性。AUROC值较低提示模型难以在个体水平有效预测CPE定植,可能与事件罕见性及风险谱重叠有关。
研究背景与意义
产碳青霉烯酶肠杆菌目细菌(CPE)是全球公共卫生的重要威胁,其在医疗机构与社区中的流行率持续上升。CPE可通过质粒介导的碳青霉烯酶在不同菌株间传播,引发院内暴发并增加侵袭性感染的发病率与死亡率。早期识别CPE定植患者是实施接触隔离、手卫生及分组护理等感染控制措施的前提,但传统微生物培养耗时长、成本高,影响干预时效。近年来,机器学习在医疗预测分析中展现了潜力,可利用既往微生物实验室数据识别CPE定植的风险模式,优化筛查资源分配。然而,其在实际入院筛查中的应用价值仍待验证。该研究由香港玛丽医院团队完成,旨在评估机器学习模型预测入院48小时内CPE定植的可行性,成果发表于《Infection Control》。
关键技术方法
研究为单中心回顾性队列分析,样本来源于香港玛丽医院2015年至2024年的微生物实验室数据。研究人员纳入入院48小时内提交的粪便标本,CPE阳性定义为碳青霉烯耐药肠杆菌经分子检测(Xpert? Carba?R assay或NG?Test CARBA 5)确认产酶;阴性对照为同期阴性标本。输入变量涵盖人口统计学、过去一年住院史、CPE定植史、入院科室、养老机构居住史、内镜操作史、质子泵抑制剂(PPI)及抗菌药物暴露史、慢性合并症等。数据集按8:2比例分层随机抽样分为训练集与测试集,训练集采用合成少数类过采样技术(SMOTE)处理类别不平衡。比较决策树、随机森林、梯度提升、XGBoost与logistic回归模型的性能,评价指标包括AUROC、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)及精确率?召回曲线下面积(AUPRC)。采用SHapley加法解释(SHAP)分析特征重要性,并通过UMAP可视化病例与对照的分布结构。另设时间划分验证,以2017–2022年为训练期,2023–2024年为测试期评估模型稳健性。
研究结果
研究队列选择:共453?372份筛查标本中,194?917份符合入院48小时内采集标准,含3?328例CPE阳性与191?589例阴性对照。排除超过48小时的标本以避免院内获得性定植干扰。
基线特征:CPE入院患病率从2017年的0.37%升至2023–2024年的2.90%。CPE阳性患者中位年龄略低于对照组(65岁 vs 68岁),男性比例相似。CPE阳性者过去一年住院史比例更高(17.3% vs 12.7%),养老机构居住率更低(7.8% vs 9.8%)。抗菌药物暴露(碳青霉烯类、头孢菌素类、氟喹诺酮类)及PPI使用率在CPE阳性组显著升高。已知CPE定植史是最强风险因素(7.5% vs 0.5%)。普通内科与普通外科占CPE病例的主要比例。
机器学习模型性能:在标准随机划分测试中,梯度提升模型AUROC最高(0.598),与logistic回归(0.596)相近,复杂算法未显现优势。时间划分验证中,所有模型AUROC均下降(梯度提升降至0.559),提示风险特征随时间变化。
模型可解释性:SHAP分析显示,普通内科入院、年龄≥75岁、普通外科入院、已知CPE定植史、过去一年住院史及男性是各模型共同的主要预测因子。药物暴露变量在不同模型中重要性不一。UMAP可视化显示CPE阳性与阴性病例分布高度重叠,缺乏明显聚类,印证低AUROC源于现有变量的区分力不足。
讨论与结论
研究人员指出,常规入院人口统计学与临床史变量对CPE定植的个体水平预测能力有限,AUROC仅0.543–0.598,与既往爱尔兰医院的研究结果一致。尽管流行病学关联明确,但这些因素在三级医疗入院人群中普遍存在,难以实现精准区分。低患病率(1.7%)进一步限制了PPV,使得模型更适合用于风险分层而非替代实验室筛查。UMAP结果直观反映了特征空间的重叠性,说明需引入旅行史、湿市场暴露等更全面的流行病学变量以提升预测性能。单中心回顾性设计、诊断方法演变及标签异质性是研究的局限。研究团队曾尝试在临床服务中整合人工智能辅助感染管理,但当前模型尚不能提供可靠的可操作预测,仍需依赖传统微生物检测。
结论翻译:本研究强调了应用机器学习预测入院48小时内CPE定植的挑战,并揭示了现有模型的局限性。较低的AUROC值表明,这些模型可能无法在个体患者层面有效预测CPE定植,原因可能包括事件的罕见性及风险特征的重叠。