《Frontiers in Neurology》:Machine learning-based triage model for elderly traumatic brain injury patients in Chinese emergency department
编辑推荐:
背景:老年创伤性脑损伤(traumatic brain injury, TBI)患者因复杂的生理状态和合并症,在急诊科分诊中面临挑战。传统分诊方法常漏诊高风险病例,亟需精准模型优化重症监护病房(intensive care unit, ICU)资源配置。
方法
背景:老年创伤性脑损伤(traumatic brain injury, TBI)患者因复杂的生理状态和合并症,在急诊科分诊中面临挑战。传统分诊方法常漏诊高风险病例,亟需精准模型优化重症监护病房(intensive care unit, ICU)资源配置。
方法:研究人员基于莆田大学附属医院2015年至2024年413例≥60岁老年TBI患者的数据,构建了XGBoost分诊模型。纳入特征涵盖症状、CT血肿密度、脑挫伤严重程度、年龄、抗凝药物使用情况及格拉斯哥昏迷评分(Glasgow Coma Scale, GCS)。研究目标为急诊就诊48小时内ICU分诊去向。数据集按80:20划分为训练集与测试集,训练过程中采用合成少数类过采样技术(Synthetic Minority Over-sampling Technique, SMOTE)处理类别不平衡,并通过五折交叉验证评估模型性能,指标包括受试者工作特征曲线下面积(area under the receiver operating characteristic curve, AUC)、召回率、精确率、F1分数及马修斯相关系数(Matthews correlation coefficient, MCC)。本研究属预测性研究而非因果推断,所有模型输出应解释为对历史ICU分诊去向的预测,而非真实ICU需求的证明。模型开发采用完整病例分析,剔除关键变量缺失的记录,并应用沙普利加性解释(SHapley Additive exPlanations, SHAP)提升可解释性。
结果:XGBoost模型AUC达0.93,召回率为0.9288,精确率为0.9274,F1分数为0.9249,MCC为0.7241,优于对比模型。症状、CT血肿密度及脑挫伤严重程度为核心预测因子。决策曲线分析显示,在临床相关阈值范围内,其理论净收益高于“全治疗”和“全不治疗”策略;但该发现不应被直接解释为可减少不必要ICU收治,仍需基于前瞻性结局验证。
结论:该XGBoost模型为预测老年TBI患者ICU分诊去向提供了可解释工具,可辅助而非替代急诊医师决策。鉴于终点为单中心医疗流程替代指标,未来需针对死亡率、神经功能恶化、神经外科干预及功能状态等以患者为中心的结局开展前瞻性、多中心验证。
随着全球老龄化加剧,老年创伤性脑损伤(TBI)的发病率显著上升。老年患者因脑萎缩、血管脆性增加及多种合并症,伤后临床过程复杂且预后异质性显著。在急诊科(ED),快速准确地判断其应入住普通病房或直接转入重症监护病房(ICU)是重大临床挑战。传统分诊依赖医师经验、创伤评分(如格拉斯哥昏迷评分,GCS)及生命体征,但在老年群体中预测效能有限,易导致过度或不足治疗。老年患者常呈现“假性稳定”状态,初期症状轻微却可迅速恶化。在中国,ICU床位比例较低,精准分诊模型对优化资源配置尤为关键。近年来,机器学习(ML)技术在创伤预后预测中展现出超越传统回归方法的优势,可整合电子病历(EMR)、实验室指标及影像学特征实现精准风险分层。然而,专门针对急诊场景老年TBI分诊的ML研究仍较匮乏,现有研究多聚焦一般创伤人群,采用单一模态数据,未能充分结合老年患者生理特点、药物干预(如抗凝治疗)及急诊决策时限。此外,医疗机构间资源配置差异也制约了模型的临床应用。为此,研究人员旨在基于真实世界急诊数据,构建并验证适用于老年TBI患者的智能分诊模型,以历史ICU分诊去向为预测目标,探索影响模型性能的关键特征,为早期管理提供客观量化支持工具。该研究发表于《Frontiers in Neurology》。
研究人员主要采用回顾性队列设计,数据来源于莆田大学附属医院2015年1月至2024年12月的老年TBI患者。初始数据集含413份记录,经完整病例筛选后保留316例患者用于分析。纳入标准为年龄≥60岁、经临床及头部CT确诊TBI、急诊评估及分诊决策在48小时内完成、关键预测变量完整。排除非创伤性脑病变、关键变量缺失超20%、外院转入、分诊超时、非急诊入院及严重多发伤患者。数据预处理包括删除缺失值、分类变量标签编码。数据集按80:20随机分为训练集与独立测试集。针对ICU收治比例低的类别不平衡问题,在五折分层交叉验证的训练折内应用SMOTE生成合成样本。特征选择先通过互信息筛选与目标变量最相关的20个特征,再利用L1正则化逻辑回归及XGBoost特征重要性精炼至最终10个关键变量,并进行Z-score标准化。比较了八种代表性分类器,以五折分层交叉验证评估性能,选用AUC、准确率、F1分数、精确率、召回率及MCC等指标。对最优XGBoost模型采用Optuna进行超参数自动优化。最终在独立测试集上全面评估模型的区分度、校准度、临床效用及决策曲线分析(DCA),并应用SHAP进行模型解释。
人口统计学与基线特征
完整病例分析共纳入316例患者,其中普通病房组275例,ICU组41例。两组在GCS、痴呆患病率、高密度血肿比例、性别构成、年龄、抗凝/抗血小板治疗、Rotterdam CT评分、血肿体积、脑挫伤严重程度、CT密度、血钠水平等方面存在显著差异(p<0.05),而实验室检查指标多无统计学差异。
倾向评分匹配与样本加权
ICU与普通病房比例约为1:6.25,存在显著类别不平衡。倾向评分权重显示了历史分诊组间的明显分离,但仅作为模型开发中的平衡诊断,不解释为真实ICU需求或因果调整。SMOTE过采样显著增加了训练折中的少数类样本,PCA可视化证实合成样本分布与原少数类接近,未引入明显噪声。
特征选择与标准化
互信息筛选出与ICU收治最相关的20个特征,包括症状、CT血肿密度、年龄、脑挫伤严重程度及GCS等。XGBoost特征重要性进一步确定前10位关键特征,其中CT密度与症状最为重要。
初步模型评估
在八种ML模型中,XGBoost取得最高召回率(0.9288,95% CI:0.90–0.95),意味着约93%的历史ICU分诊患者在单中心数据集中被正确识别,显著降低低估风险。CatBoost与LightGBM次之。XGBoost同时具备优异的区分度(AUC 0.9602,95% CI:0.94–0.98)与精确率(0.9274),MCC最高(0.7241,95% CI:0.70–0.75),且跨折AUC变异最小,验证了稳健性。
最优模型训练与价值
超参数优化后,XGBoost模型AUC为0.93。召回率随分类阈值变化,从阈值0.2时的约0.85降至阈值0.8时的约0.38。平均精确率(AP)为0.78。决策曲线分析表明,在特定阈值概率范围内,模型理论净收益高于“全治疗”与“全不治疗”策略。校准曲线显示预测概率与观察分诊率总体吻合良好。临床影响曲线展示了不同阈值下推荐ICU分诊人数与观察到的ICU分诊人数的关系,但此结果不能直接证明可减少不必要ICU使用,需前瞻性结局验证。
SHAP解释
SHAP分析阐明关键特征对ICU收治预测的贡献。核心预测因子包括症状、CT血肿密度、脑挫伤严重程度、年龄、抗凝/抗血小板治疗、GCS及舒张压(DBP)。症状、CT血肿密度与脑挫伤严重程度具有广泛的SHAP值范围,表明其对预测影响最大。个体SHAP力图可展示特定特征如何共同决定单例患者的预测概率。
讨论
本研究开发的XGBoost模型在预测老年TBI患者历史ICU分诊去向方面表现卓越,AUC达0.93,召回率达0.9288,同时保持高精确率与MCC。核心预测因子与既有文献一致并有所拓展,如纳入CT血肿密度与症状提升了特异性。模型应被视为辅助决策支持工具,而非自主分诊规则,可帮助急诊医师识别类似既往ICU分诊特征的老年患者,尤其当症状与CT表现提示稳定性脆弱时。模型特征可在30分钟内获取,利于资源受限的急诊环境部署。研究优势在于聚焦特定人群、采用严格验证策略及SHAP增强透明度。局限性包括:预测终点为医疗流程替代指标,可能反映本地实践模式而非普适ICU需求;单中心回顾性设计限制外推性;完整病例分析可能引入选择偏倚。未来需开展前瞻性、多中心研究,以死亡率、神经功能恶化、神经外科干预及功能状态等患者为中心结局进行验证。
结论
该XGBoost模型为预测老年TBI患者ICU分诊去向提供了可解释的方法,可作为急诊场景的支持工具。其当前作用主要在于生成假设及优化流程,而非最终决策依据。在将模型用于改变ICU分配政策前,必须进行前瞻性、多中心、基于结局的验证。