一种经外部验证的机器学习算法：用于预测因SARS-CoV-2重症病毒感染住院后3个月的心理与躯体健康结局

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Brain, Behavior, & Immunity - Health》：An Externally Validated Machine Learning Algorithm for Predicting Mental and Physical Health Outcomes Three Months Post-Hospitalization for Severe Viral Infection with SARS-CoV-2

【字体：大中小】 时间：2026年05月22日 来源：Brain, Behavior, & Immunity - Health 3.7

编辑推荐：

　　许多因重症病毒感染而住院的个体会出现心理和躯体后遗症，而针对高风险人群实施定向干预，可能有助于预防这些后遗症的发生。研究人员的目标是利用常规收集的临床数据，开发并进行外部验证一种算法，以预测SARS-CoV-2住院后出现的心理和躯体症状。研究对象来自德国国家大

许多因重症病毒感染而住院的个体会出现心理和躯体后遗症，而针对高风险人群实施定向干预，可能有助于预防这些后遗症的发生。研究人员的目标是利用常规收集的临床数据，开发并进行外部验证一种算法，以预测SARS-CoV-2住院后出现的心理和躯体症状。研究对象来自德国国家大流行队列网络（NAPKON）的两个独立样本：模型开发样本SUEP（N=451；平均年龄：55.6±15.3；女性占36.2%）和外部验证样本HAP（N=158；平均年龄：55.1±12.1；女性占39.9%）。研究采用机器学习模型，整合入院时采集的人口学、临床及生物学变量，用于预测SARS-CoV-2住院后3个月患者报告结局测量信息系统（PROMIS）的7个维度评分，包括躯体功能、焦虑、抑郁、疲劳、睡眠障碍、参与社会角色和活动的能力以及疼痛。研究进一步采用Shapley加性解释（SHAP）值，以提供关键预测因素的可解释信息。约15%–20%的参与者在住院后3个月时，至少在1个PROMIS维度上报告了中度至重度功能受损。对于心理健康复合评分，表现最佳的模型在SUEP中的均方根误差（RMSE）=1.833±0.341，R²=0.927±0.031；在HAP中的RMSE=3.131，R²=0.893。对于躯体健康复合评分，表现最佳的模型在SUEP中的RMSE=2.908±0.703，R²=0.824±0.052；在HAP中的RMSE=3.019，R²=0.850。此外，这些模型在两个样本的所有PROMIS单项维度评分上均表现出较高预测性能。该研究提供了一种经外部验证的方法学，可准确预测因重症病毒感染住院后出现的心理和躯体症状学。该方法有望促进在住院时点构建简明风险分层工具，从而实现高风险患者的早期识别，提高后续心理与躯体后遗症的预测准确性，并支持及时的预防性干预。

该研究发表于《Brain, Behavior, 》。论文聚焦于重症病毒感染住院患者出院后中短期心理与躯体后遗症的早期识别问题，具体以SARS-CoV-2住院患者为应用场景，旨在建立一种可在临床实际环境中部署的预测工具，用于识别住院后3个月可能出现心理痛苦与躯体功能损害的高风险个体。研究背景在于，重症病毒感染尤其是需要住院治疗的SARS-CoV-2感染，常可导致持续性的感染后后遗症，包括焦虑、抑郁、疲劳、疼痛、睡眠障碍、社会角色参与能力下降及躯体功能受限等，这些症状可共同构成长新冠（Long COVID）或SARS-CoV-2感染后急性后遗症（PASC）的重要表现。现有研究虽已提出若干用于预测住院、死亡率或持续症状的模型，但能够基于常规电子病历（EMR）数据，同时预测多个心理与躯体健康维度并完成独立外部验证的模型仍然不足。因此，开展此项研究的必要性在于：若能在住院早期依托常规临床信息完成风险分层，则有望为后续心理支持、康复干预和随访资源配置提供依据，降低后遗症负担并优化医疗资源使用。

研究人员纳入德国国家大流行队列网络（NAPKON）中两个彼此独立的住院患者队列，分别为模型开发样本SUEP和外部验证样本HAP。研究以住院时即可常规获得的人口学变量、临床指标及生物学指标为预测因子，以感染后3个月的患者报告结局测量信息系统（PROMIS）57量表为结局，评估7个健康维度及心理健康、躯体健康两个复合评分。结果显示，约15%–20%的患者在感染后3个月至少1个PROMIS维度达到中度或重度受损。所构建的机器学习模型在模型开发队列和外部验证队列中均表现出较高的预测精度，尤其对心理健康复合评分和躯体健康复合评分的预测性能稳健，提示住院时的常规临床数据能够较准确地预测后续心理和躯体症状学风险。研究的重要意义在于，该模型不仅实现了跨队列的外部验证，而且强调了基于常规EMR数据进行可扩展风险分层的可行性，为急性住院阶段的早筛、早防和个体化干预提供了方法学依据。

就主要技术方法而言，研究采用NAPKON的两个独立样本队列，SUEP用于模型开发，HAP用于外部验证。数据预处理中，研究仅基于训练折实施缺失值过滤、近零方差过滤及多变量链式方程迭代插补，以避免信息泄露。建模方面，分别对各结局训练梯度提升回归（GBR）、基于直方图的梯度提升树（HistGB）、随机森林回归（Random Forest）和极端随机树回归（ExtraTrees），并通过5折嵌套交叉验证进行超参数优化和性能评估。模型解释采用SHAP分析，评价指标包括RMSE与R²，同时进行校准分析及预设亚组偏倚评估。

研究结果

Descriptive statistics of sample characteristics of the model development sample (SUEP; N=451) and the external validation sample (HAP; N=158)
研究首先比较了模型开发样本与外部验证样本在基线特征上的差异。结果显示，两队列在多项临床和人口学特征上存在显著不同。HAP中伴并发症及危重并发症的病例比例更高，而SUEP中无并发症病例更多；SUEP疫苗接种率显著高于HAP；吸烟状态、呼吸困难发生率及心率在两队列间亦存在显著差异。这一结果表明外部验证样本与开发样本并非高度同质，因而为检验模型的泛化能力提供了更严格条件。

Overall symptom burden three months after infection
研究对感染后3个月PROMIS各维度症状严重程度进行了描述性分析。结果表明，在两个样本中，约15%–20%的患者在至少一个维度上存在中度或重度的心理或躯体后遗症。SUEP中疼痛、疲劳、焦虑、抑郁、睡眠及躯体功能等维度均可见一定比例的功能受损；HAP中躯体功能、躯体健康复合评分、社会角色参与及疼痛受损比例更为突出。该结果说明，即使在住院治疗结束后3个月，仍有相当一部分患者持续承受多维度健康负担。

Predictive performance of machine learning models
研究显示，基于住院时人口学、临床和生物学变量构建的机器学习模型，对3个月后心理和躯体后遗症具有较高预测效能。心理健康复合评分中，表现最佳的是ExtraTrees模型，在SUEP中的RMSE=1.833±0.341，R²=0.927±0.031，在HAP中的RMSE=3.131，R²=0.893。躯体健康复合评分中，HistGB模型表现最佳，在SUEP中的RMSE=2.908±0.703，R²=0.824±0.052，在HAP中的RMSE=3.019，R²=0.850。除复合指标外，各单独PROMIS维度也取得了较高R²与较低RMSE，提示模型不仅能够预测总体心理、躯体健康负担，还能较好区分具体症状领域。

Calibration analyses
校准分析显示，最佳模型预测值与观察值之间具有良好一致性，校准斜率接近1，系统性偏差较小。该结果说明模型不仅具有良好的区分能力，也具有较好的概率与数值预测可靠性，增强了其临床应用潜力。

Variable importance
研究采用SHAP值评估变量重要性，以解释不同特征对模型输出的贡献。综合各结局分析，慢性疾病的存在、呼吸困难、较高肌酐、较高白细胞水平、较高年龄、男性、较高体质指数（BMI）及较低血压，是预测3个月后更严重心理与躯体后遗症的重要因素。不同PROMIS维度的关键特征存在一定差异：抑郁与男性、较低血压、呼吸困难和较高BMI相关；疲劳与较高BMI、慢性肾病、慢性肺病及呼吸困难相关；疼痛与慢性肾病、糖尿病、慢性肺病、风湿/免疫性疾病、男性及较高BMI相关；躯体功能下降与慢性肺病、慢性肾病、风湿/免疫性疾病、较高BMI、较高年龄及呼吸困难相关；睡眠问题与较高BMI、慢性肾病和较高心率相关；焦虑则与较低收缩压、较高白细胞计数及较高肌酐相关。该结果表明，后遗症风险具有多因素驱动特征，且不同症状维度具有一定特异性预测谱。

Subgroup performance and bias assessment
研究还开展了亚组性能与偏倚评估，按性别、疫苗接种状态、吸烟状态、急性感染严重程度及出生国家进行分层分析。结果显示，模型在多数亚组中R²与RMSE总体稳定，平均有符号误差接近0，未见具有临床意义的系统性方向偏倚。仅在当前吸烟者及急性危重感染等样本量较小亚组中，性能波动相对更明显。整体而言，模型在所评估人群中的公平性较好。

讨论部分总结
讨论部分指出，该研究成功开发并外部验证了一种针对SARS-CoV-2重症住院患者的预测模型，能够在入院时基于常规EMR数据，对3个月后心理和躯体后遗症进行准确预测。研究结果与既往长新冠研究相一致，即住院患者中存在可观比例的持续性症状负担。与既往多聚焦单一结局或依赖专门研究数据、多组学数据的模型相比，本研究的突出特点在于：同时覆盖多个PROMIS心理与躯体健康维度；完全依赖临床常规可得数据；并在临床与人口学特征差异显著的独立队列中完成外部验证。研究还强调，较高的预测性能并非简单来源于过拟合，因为模型采用了5折嵌套交叉验证，且在独立异质样本中维持稳健表现。SHAP分析进一步支持，慢性共病、急性期呼吸困难、炎症相关指标、BMI、年龄和性别等因素与后续后遗症风险密切相关。临床上，该模型若整合入EMR系统，可在住院时即完成风险分层，为心理支持、康复训练和随访路径设计提供依据。

同时，论文也明确了局限性。首先，样本来自德国SARS-CoV-2住院患者，因而对其他病毒感染或不同国家人群的推广仍需进一步验证。其次，结局评估时间点限定为住院后3个月，尚需更长期随访数据验证预测稳定性。再次，结局依赖PROMIS自评量表，未纳入更多客观指标。另一个重要限制是模型未纳入感染前心理和躯体基线状态，不过这是出于模型临床可部署性的现实考量，因为感染前精神健康资料在急性住院场景中往往难以系统获取。

研究结论翻译
本研究提出了一种经外部验证的预测模型，用于识别因重症病毒感染住院后有发生心理和躯体后遗症风险的个体。研究结果为长新冠研究领域增添了证据，表明在入院时即可获得的常规临床数据，能够准确预测哪些患者会发展为显著的感染后急性期后心理与躯体症状学。通过利用可常规收集的电子病历（EMR）数据，该模型为急性期风险分层和早期预防性干预提供了切实可行且有效的工具，具有显著改善患者结局并优化医疗资源配置的潜力。未来研究应在更多样化人群及不同病毒感染场景中对模型进行验证和优化，并探索整合客观健康测量指标，以进一步提升其临床实用性。

联系信箱：

粤ICP备09063491号

热点排行