登革热严重程度、住院与死亡预测模型的全球表现:基于146项研究的系统综述与Meta分析

《International Journal of Infectious Diseases》:Global performance of predictive models for dengue severity, hospitalization and mortality: a systematic review and meta-analysis of 146 studies

【字体: 时间:2026年06月18日 来源:International Journal of Infectious Diseases 4.3

编辑推荐:

  摘要目的:预测模型正日益用于支持登革热的临床管理,但其性能在不同场景之间差异较大。本研究旨在评价用于预测登革热严重程度、死亡和住院的多变量预测模型,并总结与这些结局最稳定相关的预测因子。 方法:研究人员检索了5个数据库,纳入开发或验证用于预测登革热人群严重程

  
摘要目的:预测模型正日益用于支持登革热的临床管理,但其性能在不同场景之间差异较大。本研究旨在评价用于预测登革热严重程度、死亡和住院的多变量预测模型,并总结与这些结局最稳定相关的预测因子。

方法:研究人员检索了5个数据库,纳入开发或验证用于预测登革热人群严重程度、住院或死亡的多变量模型研究。由两名评审者独立完成文献筛选和数据提取,并采用预测模型偏倚风险评估工具(PROBAST)评估偏倚风险。研究人员使用双变量模型合并诊断准确性估计值,并采用随机效应Meta分析综合预测因子效应。

结果:共纳入146项研究,其中109项关注严重程度,42项关注死亡,12项关注住院。对于严重程度预测,合并灵敏度为0.85(95%置信区间(CI)0.82–0.87),总体曲线下面积(AUC)为0.93(0.91–0.94);机器学习模型的表现略优于传统回归模型(AUC 0.93 vs 0.90)。PROBAST将146项研究中的112项判定为高偏倚风险。出血、休克和低白蛋白血症是与不良结局最稳定相关的预测因子。

结论:登革热预测模型,尤其是基于机器学习的方法,在严重程度判别方面表现良好,但现有证据受到高偏倚风险和外部验证稀缺的限制。
这篇发表于《International Journal of Infectious Diseases》的论文是一项针对登革热预后预测模型的大规模系统综述与Meta分析,核心目标是评价现有多变量预测模型在重症、住院和死亡结局上的整体表现,并归纳最稳定、最具临床意义的预测因子。研究背景在于,登革热每年影响全球约3.9亿人,流行范围覆盖120多个国家,是最广泛传播的虫媒病毒病之一。其临床谱系从轻型发热性疾病到伴多器官功能障碍的重症登革热不等,而疾病常在发病第5~7天迅速恶化,使临床医生必须在极短时间窗内识别高风险患者。尽管世界卫生组织(WHO)警示征象可用于分诊与住院决策,但其在不同地区和医疗场景中的敏感性与特异性并不稳定,因此需要比单纯临床经验更稳健的预测工具。

研究人员围绕这一问题,系统检索并综合了开发或验证登革热重症、住院或死亡风险模型的研究证据,重点比较传统回归模型与机器学习模型的判别能力、方法学质量及可推广性。论文指出,现有研究数量虽多,但不同模型在研究设计、预测时点、结局定义、变量构成和验证策略方面差异显著,导致实际可比性有限。研究得出的总体结论是:多数模型具有中等至良好的区分能力,尤其是机器学习模型在重症判别上的AUC普遍较高;然而,研究总体偏倚风险较高,外部验证极少,使其临床推广仍受明显限制。该研究的重要意义在于,为登革热风险分层工具的临床应用提供了全球证据图谱,同时指出未来建模工作应优先关注校准(calibration,预测概率与真实风险的一致性)、可解释性和跨队列外部验证,而非继续孤立地开发新模型。

在研究方法上,作者遵循PRISMA 2020规范,并参考TRIPOD-AI与CHARMS建议,检索PubMed、Embase、Scopus、Web of Science和LILACS数据库。纳入对象为成人或成人占多数的疑似或确诊登革热队列中,开发或验证多变量预测模型的研究;儿科和妊娠人群研究被排除。两名研究者独立筛选文献与提取数据,使用PROBAST评估偏倚风险与适用性。对于报告灵敏度和特异度的重症预测研究,采用双变量随机效应模型合并诊断准确性并绘制总结受试者工作特征(SROC)曲线;对于回归研究中常见预测因子,则采用随机效应模型合并比值比(OR)或风险效应值。全部统计分析在R 4.2中完成。

研究结果部分首先体现在纳入研究的总体特征上。共检索到4620条记录,最终纳入146项研究,发表时间中位数为2021年,时间跨度为2003—2025年。研究主要来自印度、新加坡、泰国、中国台湾、马来西亚、巴基斯坦、巴西和越南等登革热高流行地区。样本量差异很大,从44例到22777例不等。109项研究以重症为结局,42项研究以死亡为结局,12项研究以住院为结局,且部分研究同时建模多个结局。大多数研究采用传统统计回归方法,最常见的是Logistic回归;机器学习研究相对较少,主要包括随机森林(Random Forest)、人工神经网络(ANN)、决策树(Decision Tree)、支持向量机(SVM)、XGBoost和梯度提升(Gradient Boosting)等。重症模型中最常见的预测因子为血小板计数、年龄、天冬氨酸氨基转移酶(AST)、红细胞比容(hematocrit)和丙氨酸氨基转移酶(ALT);死亡模型中最常报告的变量为年龄、肌酐(creatinine)、ALT、出血和AST。

在“偏倚风险(Risk of bias)”部分,作者使用PROBAST评估发现,146项研究中有112项为总体高偏倚风险,33项为低风险,1项不明确。偏倚主要集中于分析域(analysis domain),包括有效样本量相对于模型复杂度不足、缺失数据处理不充分、过度依赖单因素筛选变量、校准报告不完整,以及内部或外部验证不足等。这说明尽管多数研究所选人群与临床问题基本匹配,但分析策略普遍不够严谨,容易造成过拟合、夸大判别性能并削弱模型推广性。相比之下,被判定为低偏倚风险的研究更常报告预设建模策略、较合理样本量、更清晰的验证流程和更完整的性能指标。

在“重症预测模型的诊断准确性与敏感性分析(Diagnostic Accuracy and Sensitivity Analysis of Severity Prediction Models)”部分,双变量Meta分析显示:纳入按WHO 1997或2009分类、或等效临床标准定义登革热重症的研究后,模型总体合并灵敏度为0.85,假阳性率(FPR)为0.12,总体AUC为0.93,提示整体区分能力较好。其中,机器学习模型的灵敏度为0.87、FPR为0.12、AUC为0.93;传统回归模型的灵敏度为0.81、FPR为0.13、AUC为0.90,提示机器学习在重症预测方面略占优势。Meta回归进一步显示,建模方法是唯一与灵敏度显著相关的因素,传统回归较机器学习灵敏度更低;国家收入水平、总体偏倚风险和研究设计则未见显著关联。但作者强调,不同研究在预测时点、医疗场景和结局概念上的高度异质性,意味着这些汇总结果更应被视为跨多种临床问题的平均性能,而不是单一可部署模型的真实效果。

在“个体预测因子的Meta分析(Meta-analysis of individual predictors)”部分,作者分别分析了重症、死亡和住院的关键变量。对于重症结局,出血是最稳定的相关因素,合并OR为4.21,其次是ALT升高,OR为1.80;年龄也呈现较稳定但较弱的关联。对于死亡结局,休克是最强预测因子,OR为14.76;其次为出血,OR为14.28;低白蛋白血症(hypoalbuminemia)也与死亡显著相关,OR为5.68,年龄增加同样提示死亡风险上升。对于住院结局,由于仅有少量研究可供合并,估计值应谨慎解释;其中低白蛋白血症的点估计最大,OR为7.28,其次是出血,OR为2.88,老年患者也更可能住院。研究提示,尽管血小板、红细胞比容和转氨酶在大量个体研究中反复出现,但它们在不同研究中的效应稳定性不及出血、休克和低白蛋白血症。

论文讨论部分强调,登革热预测模型无论采用传统回归还是机器学习,均显示出用于识别高风险患者的潜力,特别适用于病例快速增长、医疗系统需在漏诊恶化与过度收治之间寻找平衡的流行期环境。机器学习模型通常具有较高灵敏度和较低至中等假阳性率,适合作为筛查性工具,辅助WHO警示征象用于加强监测、转诊与住院决策;而回归模型因透明度更高、解释性更强,更容易嵌入常规临床流程。论文同时指出,机器学习相较传统回归的优势总体较为有限,是否足以抵消其复杂性与可解释性下降,尤其在资源受限地区,仍需谨慎考量。

讨论中还特别指出,纳入研究最突出的缺陷是外部验证几乎缺失,仅8项研究在独立人群中进行了验证。这一缺口严重限制了模型在不同血清型流行、不同医疗层级、不同基础疾病构成及不同实验室可及性环境下的可迁移性。作者还强调,仅有判别能力并不足以支撑临床阈值设定,未来模型必须同步报告大规模校准、大范围风险区间校准图以及临床决策曲线(decision curve)分析,以确保概率输出可用于真实分诊和收治决策。此外,当前证据在地域分布上明显不均衡,非洲队列几乎缺失,也削弱了结果的全球代表性。

研究结论部分可译为:总体而言,已发表的预测模型能够较好地估计登革热严重程度、住院和死亡风险,但大多数模型建立在较脆弱的方法学基础之上。回归模型具有更强的可解释性和稳定性,而机器学习模型则显示出整合进入实时决策支持系统的潜力。未来工作重点不应是继续产生更多彼此割裂的模型,而应集中于构建校准更充分、解释性更强、并已在多样化队列中完成外部验证的模型,并通过高疾病负担场景中的临床影响研究,确定模型指导路径是否能够改善患者结局并优化暴发期间的资源配置。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号