基于机器学习的中国急诊科老年创伤性脑损伤患者分诊模型

《Frontiers in Neurology》：Machine learning-based triage model for elderly traumatic brain injury patients in Chinese emergency department

【字体：大中小】 时间：2026年05月25日 来源：Frontiers in Neurology 2.8

编辑推荐：

　　背景：老年创伤性脑损伤（traumatic brain injury, TBI）患者因复杂的生理状态和合并症，在急诊科分诊中面临挑战。传统分诊方法常漏诊高风险病例，亟需精准模型优化重症监护病房（intensive care unit, ICU）资源配置。方法

背景：老年创伤性脑损伤（traumatic brain injury, TBI）患者因复杂的生理状态和合并症，在急诊科分诊中面临挑战。传统分诊方法常漏诊高风险病例，亟需精准模型优化重症监护病房（intensive care unit, ICU）资源配置。方法：研究人员基于莆田大学附属医院2015年至2024年413例≥60岁老年TBI患者的数据，构建了XGBoost分诊模型。纳入特征涵盖症状、CT血肿密度、脑挫伤严重程度、年龄、抗凝药物使用情况及格拉斯哥昏迷评分（Glasgow Coma Scale, GCS）。研究目标为急诊就诊48小时内ICU分诊去向。数据集按80:20划分为训练集与测试集，训练过程中采用合成少数类过采样技术（Synthetic Minority Over-sampling Technique, SMOTE）处理类别不平衡，并通过五折交叉验证评估模型性能，指标包括受试者工作特征曲线下面积（area under the receiver operating characteristic curve, AUC）、召回率、精确率、F1分数及马修斯相关系数（Matthews correlation coefficient, MCC）。本研究属预测性研究而非因果推断，所有模型输出应解释为对历史ICU分诊去向的预测，而非真实ICU需求的证明。模型开发采用完整病例分析，剔除关键变量缺失的记录，并应用沙普利加性解释（SHapley Additive exPlanations, SHAP）提升可解释性。结果：XGBoost模型AUC达0.93，召回率为0.9288，精确率为0.9274，F1分数为0.9249，MCC为0.7241，优于对比模型。症状、CT血肿密度及脑挫伤严重程度为核心预测因子。决策曲线分析显示，在临床相关阈值范围内，其理论净收益高于“全治疗”和“全不治疗”策略；但该发现不应被直接解释为可减少不必要ICU收治，仍需基于前瞻性结局验证。结论：该XGBoost模型为预测老年TBI患者ICU分诊去向提供了可解释工具，可辅助而非替代急诊医师决策。鉴于终点为单中心医疗流程替代指标，未来需针对死亡率、神经功能恶化、神经外科干预及功能状态等以患者为中心的结局开展前瞻性、多中心验证。

随着全球老龄化加剧，老年创伤性脑损伤（TBI）的发病率显著上升。老年患者因脑萎缩、血管脆性增加及多种合并症，伤后临床过程复杂且预后异质性显著。在急诊科（ED），快速准确地判断其应入住普通病房或直接转入重症监护病房（ICU）是重大临床挑战。传统分诊依赖医师经验、创伤评分（如格拉斯哥昏迷评分，GCS）及生命体征，但在老年群体中预测效能有限，易导致过度或不足治疗。老年患者常呈现“假性稳定”状态，初期症状轻微却可迅速恶化。在中国，ICU床位比例较低，精准分诊模型对优化资源配置尤为关键。近年来，机器学习（ML）技术在创伤预后预测中展现出超越传统回归方法的优势，可整合电子病历（EMR）、实验室指标及影像学特征实现精准风险分层。然而，专门针对急诊场景老年TBI分诊的ML研究仍较匮乏，现有研究多聚焦一般创伤人群，采用单一模态数据，未能充分结合老年患者生理特点、药物干预（如抗凝治疗）及急诊决策时限。此外，医疗机构间资源配置差异也制约了模型的临床应用。为此，研究人员旨在基于真实世界急诊数据，构建并验证适用于老年TBI患者的智能分诊模型，以历史ICU分诊去向为预测目标，探索影响模型性能的关键特征，为早期管理提供客观量化支持工具。该研究发表于《Frontiers in Neurology》。

研究人员主要采用回顾性队列设计，数据来源于莆田大学附属医院2015年1月至2024年12月的老年TBI患者。初始数据集含413份记录，经完整病例筛选后保留316例患者用于分析。纳入标准为年龄≥60岁、经临床及头部CT确诊TBI、急诊评估及分诊决策在48小时内完成、关键预测变量完整。排除非创伤性脑病变、关键变量缺失超20%、外院转入、分诊超时、非急诊入院及严重多发伤患者。数据预处理包括删除缺失值、分类变量标签编码。数据集按80:20随机分为训练集与独立测试集。针对ICU收治比例低的类别不平衡问题，在五折分层交叉验证的训练折内应用SMOTE生成合成样本。特征选择先通过互信息筛选与目标变量最相关的20个特征，再利用L1正则化逻辑回归及XGBoost特征重要性精炼至最终10个关键变量，并进行Z-score标准化。比较了八种代表性分类器，以五折分层交叉验证评估性能，选用AUC、准确率、F1分数、精确率、召回率及MCC等指标。对最优XGBoost模型采用Optuna进行超参数自动优化。最终在独立测试集上全面评估模型的区分度、校准度、临床效用及决策曲线分析（DCA），并应用SHAP进行模型解释。

人口统计学与基线特征

完整病例分析共纳入316例患者，其中普通病房组275例，ICU组41例。两组在GCS、痴呆患病率、高密度血肿比例、性别构成、年龄、抗凝/抗血小板治疗、Rotterdam CT评分、血肿体积、脑挫伤严重程度、CT密度、血钠水平等方面存在显著差异（p<0.05），而实验室检查指标多无统计学差异。

倾向评分匹配与样本加权

ICU与普通病房比例约为1:6.25，存在显著类别不平衡。倾向评分权重显示了历史分诊组间的明显分离，但仅作为模型开发中的平衡诊断，不解释为真实ICU需求或因果调整。SMOTE过采样显著增加了训练折中的少数类样本，PCA可视化证实合成样本分布与原少数类接近，未引入明显噪声。

特征选择与标准化

互信息筛选出与ICU收治最相关的20个特征，包括症状、CT血肿密度、年龄、脑挫伤严重程度及GCS等。XGBoost特征重要性进一步确定前10位关键特征，其中CT密度与症状最为重要。

初步模型评估

在八种ML模型中，XGBoost取得最高召回率（0.9288，95% CI：0.90–0.95），意味着约93%的历史ICU分诊患者在单中心数据集中被正确识别，显著降低低估风险。CatBoost与LightGBM次之。XGBoost同时具备优异的区分度（AUC 0.9602，95% CI：0.94–0.98）与精确率（0.9274），MCC最高（0.7241，95% CI：0.70–0.75），且跨折AUC变异最小，验证了稳健性。

最优模型训练与价值

超参数优化后，XGBoost模型AUC为0.93。召回率随分类阈值变化，从阈值0.2时的约0.85降至阈值0.8时的约0.38。平均精确率（AP）为0.78。决策曲线分析表明，在特定阈值概率范围内，模型理论净收益高于“全治疗”与“全不治疗”策略。校准曲线显示预测概率与观察分诊率总体吻合良好。临床影响曲线展示了不同阈值下推荐ICU分诊人数与观察到的ICU分诊人数的关系，但此结果不能直接证明可减少不必要ICU使用，需前瞻性结局验证。

SHAP解释

SHAP分析阐明关键特征对ICU收治预测的贡献。核心预测因子包括症状、CT血肿密度、脑挫伤严重程度、年龄、抗凝/抗血小板治疗、GCS及舒张压（DBP）。症状、CT血肿密度与脑挫伤严重程度具有广泛的SHAP值范围，表明其对预测影响最大。个体SHAP力图可展示特定特征如何共同决定单例患者的预测概率。

讨论

本研究开发的XGBoost模型在预测老年TBI患者历史ICU分诊去向方面表现卓越，AUC达0.93，召回率达0.9288，同时保持高精确率与MCC。核心预测因子与既有文献一致并有所拓展，如纳入CT血肿密度与症状提升了特异性。模型应被视为辅助决策支持工具，而非自主分诊规则，可帮助急诊医师识别类似既往ICU分诊特征的老年患者，尤其当症状与CT表现提示稳定性脆弱时。模型特征可在30分钟内获取，利于资源受限的急诊环境部署。研究优势在于聚焦特定人群、采用严格验证策略及SHAP增强透明度。局限性包括：预测终点为医疗流程替代指标，可能反映本地实践模式而非普适ICU需求；单中心回顾性设计限制外推性；完整病例分析可能引入选择偏倚。未来需开展前瞻性、多中心研究，以死亡率、神经功能恶化、神经外科干预及功能状态等患者为中心结局进行验证。

结论

该XGBoost模型为预测老年TBI患者ICU分诊去向提供了可解释的方法，可作为急诊场景的支持工具。其当前作用主要在于生成假设及优化流程，而非最终决策依据。在将模型用于改变ICU分配政策前，必须进行前瞻性、多中心、基于结局的验证。

热点排行