《Brain and Spine》:Development and Validation of a Machine Learning Model Utilizing the ACS-NSQIP Database for Predicting Early Postoperative Re-operation in Lumbar Microdiscectomy
编辑推荐:
摘要:引言:腰椎微创椎间盘切除术后因手术部位感染(SSI)导致的早期再手术虽罕见,但会造成显著的病痛负担和医疗资源消耗。研究问题:鉴于传统统计与机器学习(ML)模型在预测该结局时表现不一,本研究旨在开发并验证一个机器学习模型,以准确预测接受腰椎微创椎间盘切除术
摘要:引言:腰椎微创椎间盘切除术后因手术部位感染(SSI)导致的早期再手术虽罕见,但会造成显著的病痛负担和医疗资源消耗。研究问题:鉴于传统统计与机器学习(ML)模型在预测该结局时表现不一,本研究旨在开发并验证一个机器学习模型,以准确预测接受腰椎微创椎间盘切除术患者在SSI后30天内的再手术风险。材料与方法:研究人员从美国外科医师学会国家手术质量改进计划(ACS-NSQIP)数据库中获取了去标识化的患者数据,重点关注接受微创椎间盘切除术的患者。在应用纳入标准后,共分析了79,870例合格病例,其中462例(0.6%)在SSI后经历了再手术。研究人员实施了结合贝叶斯优化的嵌套交叉验证流程,采用极端梯度提升(XGBoost)并结合合成少数类过采样技术(SMOTE),并评估了多个分类阈值。模型可解释性通过SHapley加法解释(SHAP)进行评估,以识别最具影响力的预测因子。结果:最终模型在接收者操作特征曲线下面积(AUROC)上达到了0.996,在不同阈值下准确度稳定在0.993,灵敏度范围为0.924-0.985。特异性维持在0.993,阳性预测值(PPV)波动较小(0.436–0.437),阴性预测值(NPV)为1.000。SHAP分析强调了任何SSI、种族、吸烟状态、糖尿病状态和修订版风险分析指数(RAI-rev)评分是影响再手术风险的主要预测因子。讨论与结论:一种整合了合成数据增强的优化机器学习方法,对腰椎微创椎间盘切除术中这一罕见但关键的并发症展现出高的预测性能。这些发现突显了数据驱动模型在加强围手术期风险分层和支持针对性预防策略方面的潜力。
腰椎微创椎间盘切除术(Lumbar Microdiscectomy)是一种治疗腰椎间盘突出症的常见手术,尽管总体手术风险相对较低,但术后手术部位感染(Surgical Site Infection, SSI)及其可能导致的早期再手术(Re-operation)是一个不容忽视的临床问题。SSI会增加患者痛苦、延长住院时间、升高医疗费用,而再手术则进一步加剧了这些负担。传统的风险评估模型在预测此类罕见但后果严重的并发症时表现不一,且现有研究多集中于风险更高的脊柱融合术。因此,有必要开发一种针对该特定术式的、精准的术后早期再手术风险预测工具,以实现早期识别高危患者并采取干预措施。
为此,研究人员开展了一项利用大规模临床数据库的观察性研究。本研究的主要目标是开发并验证一个机器学习(Machine Learning, ML)预测模型,用于预测因SSI导致的30天内再手术。研究数据来源于美国外科医师学会国家手术质量改进计划(American College of Surgeons National Surgical Quality Improvement Program, ACS-NSQIP)数据库。研究人员应用当前操作术语(Current Procedural Terminology, CPT)代码63030筛选出接受腰椎微创椎间盘切除术的患者,并确保了所需临床变量的完整性。最终,共纳入79,870例患者进行分析,其中462例(0.6%)在术后发生SSI并需要早期再手术,这是一个典型的类别不平衡问题。
为了解决这一问题并构建稳健的预测模型,研究人员采用了几个关键的技术方法。首先,使用嵌套交叉验证(nested cross-validation)框架,内层循环用于通过贝叶斯优化(Bayesian optimization)进行超参数调优和特征选择,外层循环用于无偏性能评估。核心算法选择了极端梯度提升(XGBoost),并为处理数据不平衡问题,结合了合成少数类过采样技术(Synthetic Minority Over-sampling Technique, SMOTE)。最后,通过SHapley加法解释(SHapley Additive Explanations, SHAP)分析模型的可解释性。所有分析均使用Python(版本3.9.6)完成。
**队列特征与基线差异**
研究对79,870例患者的数据进行了分析。与对照组相比,经历SSI后早期再手术的患者群体表现出显著的临床特征差异:女性比例、美洲原住民或阿拉斯加原住民种族、吸烟者比例、美国麻醉医师协会(American Society of Anesthesiologists, ASA)分级3级和4级患者比例、功能完全依赖者比例、合并慢性阻塞性肺疾病(COPD)、需要药物治疗的高血压、类固醇使用史、出血性疾病史、胰岛素依赖型与非胰岛素依赖型糖尿病史、透析史、腹水病史以及更长的手术时间均显著升高。同时,他们的术前实验室指标也存在差异,如白蛋白和红细胞比容(HCT)水平显著更低,碱性磷酸酶和部分凝血活酶时间(PTT)更高,白细胞(WBC)计数增加。术后,再手术组在各类SSI(浅表、深部切口、器官/间隙)、30天总再入院率及SSI相关再入院率方面也显著高于对照组。
**主要预测结果**
经过优化的XGBoost模型在多个分类阈值下均表现出卓越且稳定的预测性能。模型的受试者工作特征曲线下面积(AUROC)高达0.996。在所有评估的阈值下,准确度保持在0.993。灵敏度范围从默认阈值的0.924(95% CI: 0.815–0.989)到MCC优化阈值的0.985(95% CI: 0.959–1.000)。特异性稳定在0.993。阳性预测值(PPV)在0.436至0.437之间轻微波动,而阴性预测值(NPV)在所有阈值下均为1.000。F1分数在0.593至0.605之间,马修斯相关系数(MCC)从0.632提升至0.654。此外,布里尔分数(Brier score)持续保持在较低的0.006。这些结果表明,该模型能极好地区分将发生再手术与不会发生的患者,尤其是其完美的NPV意味着模型能几乎无误地排除低风险患者。
**模型可解释性分析**
SHAP分析用于揭示驱动模型预测的关键特征。结果显示,“任何SSI”是预测再手术风险的最重要因素。其他重要的预测因子还包括:白人种族、吸烟状态、无糖尿病以及修订版风险分析指数(Revised Risk Analysis Index, RAI-rev)评分。这一分析量化了各特征对预测结果的贡献度,为理解患者风险差异提供了透明度。
**讨论与结论**
本研究成功开发并验证了一个机器学习模型,该模型能高度准确地预测腰椎微创椎间盘切除术后因SSI导致的罕见早期再手术事件。研究证实,结合先进特征选择与合成数据增强的优化机器学习方法,即使在高度不平衡的数据集上也能实现卓越的区分能力。SHAP分析识别出的关键预测因子,如已存在的SSI、吸烟和糖尿病状态等,与临床认知一致,但模型的整合与量化评估为风险分层提供了更精确的工具。该研究的局限性包括其回顾性设计可能存在的残余混杂,ACS-NSQIP数据库可能缺乏脊柱手术特有的精细操作细节,以及模型尚需在不同医疗环境中进行外部验证和前瞻性评估。尽管如此,这项工作展示了数据驱动模型在脊柱外科精准风险管理中的巨大应用前景,有助于指导临床决策和个性化干预。研究人员总结认为,该优化的机器学习方法准确预测了腰椎微创椎间盘切除术后因SSI导致的早期再手术这一罕见事件,强调了数据驱动风险分层以改善预后和指导脊柱治疗策略的可行性。