《Frontiers in Neuroscience》:GLOBE: an explainable machine learning platform for preoperative prediction of thromboembolism and neurological deterioration in patients with glioma
编辑推荐:
摘要
背景:胶质瘤患者术后静脉血栓栓塞(venous thromboembolism,VTE)和术后神经功能恶化(postoperative neurological deterioration,PND)的发生风险较高。传统临床评分系统在预测这些围手术期风险
摘要
背景:胶质瘤患者术后静脉血栓栓塞(venous thromboembolism,VTE)和术后神经功能恶化(postoperative neurological deterioration,PND)的发生风险较高。传统临床评分系统在预测这些围手术期风险方面准确性有限。本研究旨在开发并验证机器学习模型,用于对胶质瘤患者术后VTE和PND进行个体化术前预测。
方法:研究纳入427例胶质瘤患者的回顾性队列。采用分层随机抽样按8:2比例将患者随机分为训练集和测试集。研究人员训练并评估了多种机器学习算法。模型性能采用曲线下面积(area under the curve,AUC)、准确率、敏感度、特异度、校准曲线和决策曲线分析进行评估。研究人员还开发了一个在线预测平台,以促进个体化风险评估。
结果:在427例患者中,术后VTE和PND的发生率分别为34%和35%。在VTE预测方面,最终的Top-10随机森林模型优于单独使用Caprini评分,并在独立保留测试集中取得0.815的AUC(95%置信区间confidence interval, CI:0.720–0.910)。在具有临床意义的VTE敏感性分析中,该模型仍保持较强性能(AUC = 0.923;95% CI:0.847–0.998)。SHAP(Shapley Additive Explanations)分析显示,年龄较大、D-二聚体升高、纤维蛋白降解产物(fibrin degradation products,FDP)升高以及血红蛋白水平较低,与预测VTE风险升高相关。在PND预测方面,最终的Top-10逻辑回归模型取得0.741的AUC(95% CI:0.627–0.854)。年龄较大、复发性胶质瘤、更高的Caprini评分、更高的中性粒细胞百分比以及高血压病史,倾向于增加预测PND风险。上述模型已部署至GLOBE网络平台(https://gliomas.shinyapps.io/GLOBE/),用于实时术前风险预测。
结论:研究人员开发了针对胶质瘤患者术后VTE和PND的准确、可解释且具有临床意义的术前预测模型。GLOBE在线预测系统将这些模型转化为个体化围手术期风险分层的实用工具。
该论文发表于《Frontiers in Neuroscience》,围绕胶质瘤围手术期并发症的术前精准预测展开,聚焦于两类对预后影响显著的不良结局,即术后静脉血栓栓塞(venous thromboembolism,VTE)和术后神经功能恶化(postoperative neurological deterioration,PND)。胶质瘤是中枢神经系统常见的原发性恶性肿瘤之一,尽管诊断、手术、放化疗持续进步,但患者总体发病负担和死亡风险仍较高,且不同患者即使接受标准切除和辅助治疗,临床结局仍存在显著异质性。论文指出,围手术期并发症是这种异质性的重要来源之一,而且具有一定可干预性,因此建立准确、可用于术前阶段的风险分层工具具有现实临床价值。
现有临床风险评估工具在神经肿瘤外科场景中存在明显局限。以Caprini评分为代表的传统模型虽然在一般外科人群中应用广泛,但其变量依赖人工预设、权重固定,难以捕捉非线性关系及变量间复杂交互,因此在胶质瘤患者术后VTE预测中的阳性预测价值和可解释性均不理想。另一方面,PND虽与功能独立性下降、辅助治疗延迟及生活质量受损密切相关,但目前基于单纯术前信息进行可靠预测仍较困难,既有模型通常存在特征整合不足和预测性能有限的问题。基于这些临床痛点,研究人员开展本研究,尝试利用机器学习(machine learning,ML)建立可解释、可部署、可实时应用的术前风险预测系统。
在研究设计上,研究人员纳入重庆医科大学附属第一医院于2022年7月1日至2025年9月30日期间接受胶质瘤切除术的成年患者,最终形成427例回顾性队列。研究仅纳入术前可获得的临床和实验室变量,明确排除术中和术后变量,以保证时间顺序合理性并避免治疗后信息泄漏。主要结局为术后30 d内客观证实的VTE,以及术后30 d内经标准化神经系统检查判定的新发或加重意识障碍、失语或运动功能障碍所构成的PND。研究人员分别为VTE和PND建立二分类预测模型,并通过多算法比较筛选最优模型,最终将模型部署为名为GLOBE的在线平台,用于个体化围手术期风险评估。
主要技术方法可概括如下:本研究为单中心回顾性队列研究,样本来源于重庆医科大学附属第一医院427例接受胶质瘤切除术的成年患者。研究采用分层随机抽样按8:2划分训练集与独立测试集;先在训练集中进行单因素逻辑回归筛选候选变量,再用随机森林进行特征重要性排序并构建Top-5、Top-10或Top-13特征集;比较广义线性模型(GLM)、随机森林(RDF)、梯度提升算法(GBA)和径向基核支持向量机(SVM)4类分类算法;利用重复5折交叉验证进行训练和调参,以AUC为主要优化指标,并结合校准曲线、Brier评分、决策曲线分析(DCA)和SHAP解释模型。
3.1 Patient characteristics
研究首先描述了总体人群特征及事件发生情况。427例患者中,按8:2分为342例训练集和85例测试集。VTE术后发生率为34%,PND发生率为35%。VTE最常见部位包括双侧小腿肌间静脉血栓、左侧小腿肌间静脉血栓、左侧胫后静脉血栓、肺栓塞、右侧小腿肌间静脉血栓和右侧腓静脉血栓。任意VTE的术后中位发生时间为5 d,40%的事件在术后3 d内检出,这与研究中心常规开展术后下肢静脉超声筛查有关。具临床意义的VTE在全队列中的发生率为13%,中位发生时间同样为术后5 d。进一步的Kaplan–Meier生存分析显示,VTE和PND均与总体生存(overall survival,OS)显著下降相关,其中无VTE患者生存最好,单纯DVT患者居中,PE患者预后最差;发生PND者的OS亦显著劣于未发生PND者。该部分结果说明,研究所关注的两个结局不仅是围手术期事件,也与长期预后密切相关。
3.2 Performance of VTE prediction models
3.2.1 Discrimination and classification performance
在VTE预测方面,研究人员先在训练集中通过单因素逻辑回归筛得13个与术后VTE显著相关的术前变量。年龄增加、Caprini评分升高、糖尿病病史和高血压病史与VTE风险升高相关;而较高的术前血红蛋白、活化部分凝血活酶时间(activated partial thromboplastin time,APTT)、红细胞计数、白蛋白和钠水平与较低VTE风险相关;术前D-二聚体、FDP和尿酸升高则与风险升高相关。随后,研究比较不同特征集和不同算法的模型表现,发现Top-10或Top-13变量集优于Top-5变量集及单独Caprini评分。独立测试集中AUC最高的是Top-13 GBA模型,为0.816,但Top-10 RDF模型AUC为0.815,且使用变量更少,因此基于判别力与简约性的平衡,被选定为最终VTE模型。在Youden最优阈值0.313下,该模型测试集准确率为0.753,敏感度为0.828,特异度为0.714。
3.2.2 Calibration, clinical utility, and SHAP interpretation of the final VTE model
最终VTE模型的校准曲线显示预测概率与实际事件率具有良好一致性,Brier评分为0.165。决策曲线分析表明,该模型在约0.06至0.80的阈值概率范围内,相较于“全部干预”或“全部不干预”策略均具有更高净获益,提示其具备潜在临床应用价值。SHAP解释进一步揭示,年龄、术前血红蛋白、术前D-二聚体、术前APTT、术前FDP、术前钠、术前白蛋白、术前Caprini评分、糖尿病病史和高血压病史是最具影响力的10个预测因子。方向性分析显示,年龄较大、D-二聚体较高、FDP较高、Caprini评分较高、存在糖尿病或高血压病史,均倾向于提高预测VTE风险;而血红蛋白、钠和APTT较高则倾向于降低风险。为验证模型稳健性,研究还将结局限定为“具有临床意义的VTE”进行敏感性分析。在85例测试集患者中,Top-10 RDF模型AUC升至0.923,提示该模型对临床更重要血栓事件仍具有很强识别能力。
3.3 Performance of PND prediction models
3.3.1 Feature selection and discrimination performance
在PND预测方面,训练集单因素逻辑回归共识别出10个显著相关的术前变量。Caprini评分升高、年龄较大、复发性胶质瘤、区域性肿瘤扩展、更高的中性粒细胞百分比以及高血压病史,均与PND风险增加相关;而较高的淋巴细胞百分比、白蛋白和总蛋白则与较低风险相关。模型比较结果显示,Top-10特征集整体优于Top-5特征集。其中,Top-10 GLM在独立测试集中取得最佳综合判别力,AUC为0.741。在Youden最优阈值0.505下,该模型准确率为0.765,敏感度为0.600,特异度为0.855,因此被确定为最终PND模型。
3.3.2 Calibration, clinical utility, and SHAP interpretation of the final PND model
最终PND模型在测试集中的校准表现可接受,Brier评分为0.195。决策曲线分析显示,该模型在约0.08至0.77的阈值概率范围内具有较好的净获益,提示其有望支持临床决策。SHAP分析表明,年龄、肿瘤扩展范围、复发性胶质瘤、术前Caprini评分、肿瘤部位、中性粒细胞百分比、术前白蛋白、高血压病史、淋巴细胞百分比和总蛋白,是对PND预测贡献最大的变量。方向上,年龄增加、区域性肿瘤扩展、复发性胶质瘤、Caprini评分较高、中性粒细胞百分比较高以及高血压病史,倾向于提升PND预测风险;而较高白蛋白、较高淋巴细胞百分比、较高总蛋白以及较有利的肿瘤部位则与较低风险相关。
3.4 Web-based implementation
在模型转化方面,研究人员将最终VTE与PND模型整合进基于Shiny构建的交互式网络平台GLOBE。该平台分别嵌入Top-10随机森林VTE模型和Top-10广义线性PND模型,临床使用者输入患者个体化术前临床及实验室指标后,即可实时获得两类术后结局的预测概率。论文明确指出,该平台旨在作为围手术期风险分层的决策支持工具,而非独立治疗决策系统。
讨论部分强调,本研究的主要贡献在于,仅利用术前常规可得信息,便建立了针对胶质瘤患者两类关键术后并发症的预测模型,并兼顾判别力、校准度、临床净获益和可解释性。VTE发生率较高,部分原因在于研究中心常规筛查可较早识别无症状或远端血栓事件,但研究人员同时通过临床意义VTE敏感性分析证明模型的结论并非仅由轻微事件驱动。与既往胶质瘤术后VTE列线图研究相比,本研究在方法学上引入多算法比较、重复交叉验证和系统化特征筛选,并严格限定预测变量为术前信息,增强了模型的时间有效性和真实应用场景适配性。对PND而言,研究补充了一个临床上重要但术前预测研究相对稀缺的方向,提示肿瘤复杂程度、复发状态以及营养—炎症相关指标可能共同影响术后神经恢复。
论文同时指出若干局限,包括单中心回顾性设计限制了外部推广性;VTE终点定义受本机构监测框架影响,与其他中心可能存在差异;未纳入IDH突变、MGMT启动子甲基化和TERT突变等分子标志物;PND模型事件数与变量数比例相对较低,仍存在一定过拟合风险。因此,研究结论仍需在多中心前瞻性队列中进行外部验证。
研究结论部分可译为:总之,研究人员利用常规可获得的临床和实验室变量,构建了两个用于预测胶质瘤患者术后VTE和PND的可解释术前预测模型。用于VTE预测的最终随机森林模型和用于PND预测的逻辑回归模型表现良好,并已在GLOBE网络平台中实现应用。这些结果支持个体化围手术期风险分层的潜在价值,但在更广泛临床采用之前,仍需开展外部验证。
总体而言,该研究的意义在于将机器学习预测、模型解释与在线部署三者整合,形成面向胶质瘤围手术期管理的实用化工具。其核心价值不在于替代临床判断,而在于为术前识别高风险患者、加强术后监测、优化血栓预防策略、完善围手术期沟通和康复计划提供定量依据。