胶质母细胞瘤（Glioblastoma）诊断前与COVID-19大流行期间患者生存结局及基于机器学习（Machine Learning, ML）的12个月死亡率预测——一项基于SEER人群的回顾性研究

《Medicina》：Survival Outcomes and Machine Learning-Based Prediction of 12-Month Mortality in Glioblastoma Before and During the COVID-19 Pandemic: A SEER Population-Based Study

【字体：大中小】 时间：2026年06月17日 来源：Medicina 2.4

编辑推荐：

　　背景与目的（Background and Objectives）：COVID-19大流行在全球范围内扰乱了癌症诊断与治疗路径。胶质母细胞瘤（Glioblastoma）是一种需及时接受多模式治疗的侵袭性原发性脑恶性肿瘤。研究人员评估了大流行前与大流行期间确诊的胶

背景与目的（Background and Objectives）：COVID-19大流行在全球范围内扰乱了癌症诊断与治疗路径。胶质母细胞瘤（Glioblastoma）是一种需及时接受多模式治疗的侵袭性原发性脑恶性肿瘤。研究人员评估了大流行前与大流行期间确诊的胶质母细胞瘤患者的生存结局，并构建数据集用于基于机器学习（Machine Learning, ML）的12个月全因死亡率预测。材料与方法（Materials and Methods）：研究人员从SEER（Surveillance, Epidemiology, and End Results）数据库中筛选2018—2021年确诊、年龄≥20岁、ICD-O-3组织学编码9440/3、9441/3、9442/3的胶质母细胞瘤患者，分为大流行前（2018–2019）与大流行期（2020–2021）。采用Kaplan–Meier曲线、log-rank检验及Cox比例风险回归模型评估总生存期（Overall Survival, OS）与癌症特异性生存期（Cancer-Specific Survival, CSS）；利用登记变量构建机器学习模型预测12个月全因死亡率。结果（Results）：最终队列含9914例患者，大流行前4819例、大流行期5095例。大流行前中位OS为11个月，大流行期为10个月；12个月OS率分别为44.3%与41.2%。两时期中位CSS均为11个月；12个月CSS率分别为46.9%与44.1%。大流行期诊断与较差OS（校正风险比 adjusted HR 1.050, 95% CI 1.006–1.095, p = 0.025）及CSS（adjusted HR 1.048, 95% CI 1.003–1.095, p = 0.035）呈弱相关。机器学习模型对12个月死亡率显示出中等判别能力。结论（Conclusions）：常规生存分析显示大流行期诊断的胶质母细胞瘤患者OS与CSS略有降低；但竞争风险分析未显示与癌症特异性死亡存在显著关联。基于登记数据的机器学习模型对12个月死亡率具中等预测价值，支持其在人群水平预后评估中的潜在应用。

论文解读：胶质母细胞瘤大流行前后生存结局及基于SEER数据库的机器学习12个月死亡率预测

本研究发表于《Medicina》。目前关于COVID-19大流行对胶质母细胞瘤（Glioblastoma，成人最常见且最具侵袭性的原发性中枢神经系统恶性肿瘤）诊疗及生存影响的研究结论尚存异质性，部分机构研究显示无显著差异，但缺乏基于大型人群登记数据库的全面评估；此外，利用常规登记变量通过机器学习（Machine Learning, ML）预测胶质母细胞瘤短期死亡率在跨时期稳定性方面亦待探讨。为此，研究人员利用SEER（Surveillance, Epidemiology, and End Results Program，美国国立癌症研究所监测、流行病学和最终结果数据库）数据，比较2018–2019年（大流行前）与2020–2021年（大流行期）确诊成人胶质母细胞瘤患者的OS（Overall Survival，总生存期）与CSS（Cancer-Specific Survival，癌症特异性生存期），并构建ML模型预测12个月全因死亡率。结果显示大流行期诊断与轻微生存劣势相关，ML模型具中等判别力且在跨时期验证中表现略降。该研究为理解大流行对高优先级肿瘤人群生存的细微影响及登记数据驱动的预后建模提供了人群层面证据。

研究人员采用的主要关键技术方法如下：基于SEER 17 Registries数据库提取2018–2021年ICD-O-3编码9440/3、9441/3、9442/3且部位C71.0–C71.9的成人初发胶质母细胞瘤病例，排除年龄＜20岁、仅有死亡证明书/尸检确诊、非首原发及无镜检证实者，按诊断年份分为大流行前（2018–2019）与大流行期（2020–2021）。生存分析采用Kaplan–Meier法估算OS与CSS并做log-rank检验，Cox比例风险模型计算HR（Hazard Ratio，风险比）及95% CI（Confidence Interval，置信区间），Fine–Gray模型做竞争风险敏感性分析。ML部分以12个月全因死亡为二分类终点，纳入人口学、肿瘤特征、社会经济及治疗方式等登记变量，One-hot编码分类变量、"Unknown"保留缺失信息、连续变量标准化（树模型除外），按8∶2分层拆分训练/测试集，选用Logistic Regression（L2正则）、Random Forest（RF）、Gradient Boosting（GB）、Support Vector Machine（SVM, RBF核），5折分层交叉验证调参，用AUC-ROC（Area Under the Receiver Operating Characteristic Curve）、Accuracy、MCC（Matthews Correlation Coefficient，马修斯相关系数）等评估，SHAP（SHapley Additive exPlanations）分析特征贡献，并用大流行前模型预测大流行期做时间外部验证。

3.1. Patient Selection and Baseline Characteristics

初始筛选13151例，经排除标准后最终分析队列9914例（大流行前4819例，大流行期5095例），ML 12个月死亡率预测队列9798例。两组基线性别、种族、婚姻状况、肿瘤部位及组织学无统计学差异；年龄分布（p＝0.034）及手术方式分布（p＝0.018）有差异，大流行期放疗使用率略低（73.4% vs 75.3%, p＝0.038），化疗使用率差异未达显著性（70.3% vs 71.9%, p＝0.087）。

3.2. Survival Outcomes by Diagnosis Period

Kaplan–Meier分析显示大流行期OS（log-rank p＝0.0032）与CSS（log-rank p＝0.0057）均显著差于大流行前。中位OS分别为11个月与10个月，12个月OS率44.3% vs 41.2%（绝对差约3.1%）；中位CSS均为11个月，12个月CSS率46.9% vs 44.1%（绝对差约2.8%）。结论：大流行期诊断患者总体及癌症特异性生存均轻微劣于大流行前。

3.3. Multivariable Cox Regression for Overall Survival

多因素Cox回归显示，校正混杂因素后大流行期诊断仍独立关联较差OS（adjusted HR 1.050, 95% CI 1.006–1.095, p＝0.025）。增龄、男性、胶质肉瘤组织学关联更差OS；接受手术（尤以根治性/全切除 adjusted HR 0.581）、放疗（adjusted HR 0.560）、化疗（adjusted HR 0.525）关联较好OS。结论：大流行期诊断是OS的独立微弱危险因素，治疗因素是强保护因素。

3.4. Multivariable Cox Regression for Cancer-Specific Survival

多因素Cox回归显示大流行期诊断独立关联较差CSS（adjusted HR 1.048, 95% CI 1.003–1.095, p＝0.035）。增龄、男性、胶质肉瘤关联较差CSS；手术（根治性/全切除 adjusted HR 0.573）、放疗（adjusted HR 0.576）、化疗（adjusted HR 0.520）关联较好CSS。结论：大流行期诊断亦是CSS的独立微弱危险因素。

3.5. Sensitivity and Competing-Risk Analyses

剔除术后放化疗变量后大流行期诊断仍关联较差OS（HR 1.053, p＝0.016）与CSS（HR 1.052, p＝0.023）；2020年诊断关联较差OS（HR 1.064, p＝0.017）与CSS（HR 1.057, p＝0.040），2021年无显著性；Fine–Gray竞争风险模型中大流行期诊断与癌症特异性死亡亚分布风险无显著关联（SHR 0.997, 95% CI 0.955–1.042, p＝0.903）。结论：生存差异主要源于2020年初，竞争风险分析提示CSS结果需谨慎解释。

3.6. Machine Learning-Based Prediction of 12-Month All-Cause Mortality

大流行前队列GB模型AUC-ROC最高（0.7824），MCC 0.40–0.42；大流行期各模型AUC-ROC略降（GB最高0.7459），MCC降至0.33–0.35；合并队列训练模型Accuracy约0.69，LR（Logistic Regression）AUC-ROC 0.7717、MCC 0.3870。用大流行前模型预测大流行期表现下降。SHAP分析显示年龄与化疗为最重要预测因子，大流行期化疗相对重要性升高但反映患者选择变化而非疗效改变。结论：基于SEER变量的ML模型对胶质母细胞瘤12个月死亡率具中等判别力，大流行致数据分布变化使跨时期泛化略降。

讨论与结论翻译

讨论指出大流行期诊断关联轻微但具统计学显著性的OS与CSS劣势，HR约1.05，应理解为人群水平微小差异而非大幅度大流行相关生存恶化，且Fine–Gray模型未显示癌症特异性死亡亚分布风险显著升高。治疗中断、就诊延误及医疗系统压力可能共同促成，但SEER缺乏感染状态及具体延误信息。ML结果与其他胶质母细胞瘤生存预测研究相符，SHAP提示年龄及治疗（受选择偏倚影响）为主要预后关联因子。

结论：大流行期确诊的成人胶质母细胞瘤患者在常规生存分析中OS与CSS略差于大流行前，校正后仍显著；但竞争风险分析未显示COVID-period诊断与癌症特异性死亡亚分布风险显著相关。基于登记变量的ML模型对12个月全因死亡率具中等预测能力，大流行期性能略降。提示大流行条件对高优先级恶性肿瘤可产生可测但有限的人群水平生存影响，需结合分子标记、体能状态及详细治疗时序进一步研究。

热点排行