机器学习能否通过在入院时预测产碳青霉烯酶肠杆菌目细菌定植以支持感染防控措施？

《Infection Control & Hospital Epidemiology》：Can machine learning support infection control measures by predicting carbapenemase-producing Enterobacterales colonization at admission?

【字体：大中小】 时间：2026年04月22日 来源：Infection Control & Hospital Epidemiology 2.9

编辑推荐：

　　背景：产碳青霉烯酶肠杆菌目细菌（Carbapenemase?producing Enterobacterales，CPE）定植的早期识别对感染防控至关重要，但微生物学检测常导致延迟且成本较高。机器学习可增强预测分析能力，有望及时识别高危患者。方法：研究人员采

背景：产碳青霉烯酶肠杆菌目细菌（Carbapenemase?producing Enterobacterales，CPE）定植的早期识别对感染防控至关重要，但微生物学检测常导致延迟且成本较高。机器学习可增强预测分析能力，有望及时识别高危患者。方法：研究人员采用决策树（Decision Tree）、随机森林（Random Forest）、梯度提升（Gradient Boosting）及极端梯度提升（XGBoost）四种机器学习模型，利用微生物学与人口统计学数据，预测入院48小时内CPE定植情况。模型性能通过灵敏度、特异度及受试者工作特征曲线下面积（AUROC）评估。采用均匀流形近似与投影（UMAP）分析CPE阳性病例与阴性对照的拓扑可分性。结果：2015年1月1日至2024年12月31日共提交453?372份粪便标本用于CPE筛查，其中194?917份（43.0%）于入院48小时内采集，包括3?328例CPE阳性（1.7%）与191?589例阴性对照。梯度提升分类器表现最佳，AUROC为0.598，灵敏度54.4%，特异度59.1%。年龄≥75岁、男性、过去一年住院史、已知CPE定植史及入院科室（普通内科与普通外科）在所有模型中均为主要预测因子。UMAP显示CPE阳性与阴性患者分布高度重叠，表明风险谱区分困难。结论：本研究揭示了利用机器学习预测入院48小时内CPE定植的复杂性。AUROC值较低提示模型难以在个体水平有效预测CPE定植，可能与事件罕见性及风险谱重叠有关。

研究背景与意义

产碳青霉烯酶肠杆菌目细菌（CPE）是全球公共卫生的重要威胁，其在医疗机构与社区中的流行率持续上升。CPE可通过质粒介导的碳青霉烯酶在不同菌株间传播，引发院内暴发并增加侵袭性感染的发病率与死亡率。早期识别CPE定植患者是实施接触隔离、手卫生及分组护理等感染控制措施的前提，但传统微生物培养耗时长、成本高，影响干预时效。近年来，机器学习在医疗预测分析中展现了潜力，可利用既往微生物实验室数据识别CPE定植的风险模式，优化筛查资源分配。然而，其在实际入院筛查中的应用价值仍待验证。该研究由香港玛丽医院团队完成，旨在评估机器学习模型预测入院48小时内CPE定植的可行性，成果发表于《Infection Control》。

关键技术方法

研究为单中心回顾性队列分析，样本来源于香港玛丽医院2015年至2024年的微生物实验室数据。研究人员纳入入院48小时内提交的粪便标本，CPE阳性定义为碳青霉烯耐药肠杆菌经分子检测（Xpert? Carba?R assay或NG?Test CARBA 5）确认产酶；阴性对照为同期阴性标本。输入变量涵盖人口统计学、过去一年住院史、CPE定植史、入院科室、养老机构居住史、内镜操作史、质子泵抑制剂（PPI）及抗菌药物暴露史、慢性合并症等。数据集按8:2比例分层随机抽样分为训练集与测试集，训练集采用合成少数类过采样技术（SMOTE）处理类别不平衡。比较决策树、随机森林、梯度提升、XGBoost与logistic回归模型的性能，评价指标包括AUROC、灵敏度、特异度、阳性预测值（PPV）、阴性预测值（NPV）及精确率?召回曲线下面积（AUPRC）。采用SHapley加法解释（SHAP）分析特征重要性，并通过UMAP可视化病例与对照的分布结构。另设时间划分验证，以2017–2022年为训练期，2023–2024年为测试期评估模型稳健性。

研究结果

研究队列选择：共453?372份筛查标本中，194?917份符合入院48小时内采集标准，含3?328例CPE阳性与191?589例阴性对照。排除超过48小时的标本以避免院内获得性定植干扰。

基线特征：CPE入院患病率从2017年的0.37%升至2023–2024年的2.90%。CPE阳性患者中位年龄略低于对照组（65岁 vs 68岁），男性比例相似。CPE阳性者过去一年住院史比例更高（17.3% vs 12.7%），养老机构居住率更低（7.8% vs 9.8%）。抗菌药物暴露（碳青霉烯类、头孢菌素类、氟喹诺酮类）及PPI使用率在CPE阳性组显著升高。已知CPE定植史是最强风险因素（7.5% vs 0.5%）。普通内科与普通外科占CPE病例的主要比例。

机器学习模型性能：在标准随机划分测试中，梯度提升模型AUROC最高（0.598），与logistic回归（0.596）相近，复杂算法未显现优势。时间划分验证中，所有模型AUROC均下降（梯度提升降至0.559），提示风险特征随时间变化。

模型可解释性：SHAP分析显示，普通内科入院、年龄≥75岁、普通外科入院、已知CPE定植史、过去一年住院史及男性是各模型共同的主要预测因子。药物暴露变量在不同模型中重要性不一。UMAP可视化显示CPE阳性与阴性病例分布高度重叠，缺乏明显聚类，印证低AUROC源于现有变量的区分力不足。

讨论与结论

研究人员指出，常规入院人口统计学与临床史变量对CPE定植的个体水平预测能力有限，AUROC仅0.543–0.598，与既往爱尔兰医院的研究结果一致。尽管流行病学关联明确，但这些因素在三级医疗入院人群中普遍存在，难以实现精准区分。低患病率（1.7%）进一步限制了PPV，使得模型更适合用于风险分层而非替代实验室筛查。UMAP结果直观反映了特征空间的重叠性，说明需引入旅行史、湿市场暴露等更全面的流行病学变量以提升预测性能。单中心回顾性设计、诊断方法演变及标签异质性是研究的局限。研究团队曾尝试在临床服务中整合人工智能辅助感染管理，但当前模型尚不能提供可靠的可操作预测，仍需依赖传统微生物检测。

结论翻译：本研究强调了应用机器学习预测入院48小时内CPE定植的挑战，并揭示了现有模型的局限性。较低的AUROC值表明，这些模型可能无法在个体患者层面有效预测CPE定植，原因可能包括事件的罕见性及风险特征的重叠。

热点排行