《Frontiers in Artificial Intelligence》:Unsupervised and explainable machine learning solutions for last-minute cancelations in pediatric ambulatory and day surgeries in Italy
编辑推荐:
本研究聚焦意大利儿科日间手术末次取消率(3.84%)对医疗效率的影响,采用因子混合数据分析(FAMD)、k?means聚类(k=3)与随机森林(Random Forest)可解释性方法,识别住院类型(特征重要性0.47)与术式类型为核心驱动因素,为优化资源调度、降低取消风险提供数据驱动的精准干预方案。
在儿科医疗体系中,日间手术与门诊手术因其高效、低成本的特点,已成为全球医疗改革的重要方向。然而,“末次取消”(即手术当天临时取消)如同一颗“隐形炸弹”——它不仅打乱医院精密排班,浪费手术室、麻醉团队等稀缺资源,更让患儿家庭陷入焦虑:重新协调工作、安排陪护、应对治疗延迟带来的健康风险。尤其在意大利等公立医疗体系国家,资源紧张与高标准的矛盾下,如何精准预测并减少末次取消,成为提升医疗质量的关键难题。
为此,罗马Bambino Gesù儿童医院的研究团队在《Frontiers in Artificial Intelligence》发表了一项创新研究。他们跳出传统统计分析的局限,首次将无监督机器学习(Unsupervised Machine Learning, ML)与可解释人工智能(Explainable AI, XAI)结合,对4600例儿科手术数据进行深度挖掘——如同为医疗数据绘制“特征地图”,从混杂信息中提炼规律,最终找到降低取消率的精准靶点。
关键技术方法
研究基于2020年1月至2022年3月Bambino Gesù医院的4600例患儿数据(含4417例手术、183例取消病例),纳入年龄、住院类型(门诊/单日/多日)、手术团队、术式等变量。首先用混合数据因子分析(Factor Analysis of Mixed Data, FAMD)降维处理分类与连续型混合数据;再通过霍普金斯统计量(Hopkins statistic)验证数据聚类倾向后,采用k-means算法划分患者群体;最后训练随机森林(Random Forest)分类器提取特征重要性,实现聚类结果的临床可解释性。
研究结果
基础数据与取消特征
末次取消率为3.84%,低于多数同类研究。取消患儿中位等待时间达105天(最短4天、最长757天),提示长等待期可能加剧取消风险;外科医生(85例)与麻醉师(73例)是取消的主要决策者,前者多因“手术指征不明确”,后者则集中于呼吸道感染等麻醉禁忌。
聚类分析揭示三类患者群
FAMD提取的两个主成分共解释100%方差,霍普金斯统计量(0.003)证实数据强聚类倾向。综合轮廓系数(0.696)、戴维斯-布尔丁指数(0.447)等指标,确定最佳聚类数k=3:
- •
Cluster 0(n=2010):以整形颌面外科(765例)、男科(533例)等为主,超88%为门诊手术,反映低复杂度群体的集中模式;
- •
Cluster 1(n=1773):以男科手术(809例)占优,中位手术时长最长(27.01分钟),对应中等复杂度需求;
- •
Cluster 2:手术执行率最高(97.92%),可能是流程标准化程度更高的群体。
三组在年龄(p<0.001)、手术时长(p<0.001)等方面均具显著差异,证明聚类有效捕捉了临床异质性。
可解释AI锁定核心驱动因素
随机森林特征重要性显示:住院类型(Hospitalization Regime,重要性0.47)与术式类型(Procedure Type,重要性0.45)是区分集群的最关键因素,远高于年龄与手术科室。这表明“患者路径”(如门诊vs多日住院)比人口学特征更能预测取消风险——需多次评估的复杂患儿,更易因突发状况导致末次取消。
结论与启示
研究首次将无监督ML与XAI结合应用于意大利儿科手术取消分析,证明住院类型与术式类型是末次取消的核心靶点。这一发现打破“年龄或科室为主导”的传统认知,为医疗管理提供精准抓手:例如为“多日住院路径”的高危患儿设计专属预评估流程,或通过术前远程监测减少感染相关取消。
更重要的是,在意大利国家卫生体系面临成本压力的背景下,该研究为“数据驱动的持续改进”提供了范本——通过ML挖掘电子病历中的隐藏规律,既能优化手术室利用率(目标接近85%饱和率),又能保障患儿安全,实现医疗效率与质量的双赢。尽管存在单中心回顾性数据的局限,但作为欧洲最大儿科医院的首个意大利本土证据,它仍为全球儿科日间手术的精细化管理点亮了智能化的“导航灯”。