《International Journal of Infectious Diseases》:Post-Pandemic Forecasting of Pediatric Acute Respiratory Infections with Deep Learning: A Multi-Pathogen, Multi-Time-Horizon Study
编辑推荐:
背景急性呼吸道感染(Acute Respiratory Infections,ARIs)仍然是全球儿童发病和住院的主要原因。在COVID-19大流行后时代,呼吸道病原体的流行病学模式发生了显著变化,给传统的预测方法带来了新的挑战。本研究旨在比较传统统计模型与深
背景急性呼吸道感染(Acute Respiratory Infections,ARIs)仍然是全球儿童发病和住院的主要原因。在COVID-19大流行后时代,呼吸道病原体的流行病学模式发生了显著变化,给传统的预测方法带来了新的挑战。本研究旨在比较传统统计模型与深度学习模型在预测儿童急性呼吸道感染中的性能,并提高预测精度,以支持临床和公共卫生准备。方法研究人员收集了2021年1月至2024年12月期间中国一家大型儿童医院的29,260例儿童住院记录,这些记录包含针对11种呼吸道病原体的多重聚合酶链反应(multiplex polymerase chain reaction,multiplex PCR)筛查结果。由于肺炎衣原体(Chlamydia pneumoniae,C. pneumoniae)阳性病例数较少(n=70),因此在模型拟合前将其排除;因此,预测分析针对10种病原体进行。研究人员评估了13种时间序列预测模型,包括一个基线模型(NaiveSeasonal)、季节自回归综合移动平均(Seasonal AutoRegressive Integrated Moving Average,SARIMA)和11种深度学习模型(DeepAR、BlockRNN、N-BEATS、N-HiTS、时间卷积网络(Temporal Convolutional Network,TCN)、Transformer、时间融合变换器(Temporal Fusion Transformer,TFT)、DLinear、NLinear、TiDE和TSMixer)。预测性能在短期(4周)、中期(12周)和长期(26周)三个时间跨度上,使用平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,sMAPE)进行评估。结果在990次深度学习与SARIMA的比较中(11种深度学习模型 × 10种病原体 × 3个预测跨度 × 3个误差指标),深度学习模型在715次比较(72.2%)中误差值低于SARIMA。在短期预测中,DLinear最常被选为误差最低的模型,尤其是对于人博卡病毒(human bocavirus,HBoV)和人冠状病毒(human coronavirus,HCoV),而TSMixer在长期预测中最常被选为误差最低模型。在中期预测中,没有单一模型表现出一致的优越性。预测性能因病原体类型、预测跨度和误差指标而异。结论基于深度学习的预测模型可能显著增强大流行后时代预测分析中涵盖的10种儿童急性呼吸道感染病原体的监测能力,并支持临床和公共卫生决策。模型选择应针对特定病原体和预测跨度进行调整,以便于及时干预、优化医疗资源配置并改进疫苗接种规划。
### 论文解读:基于深度学习的儿童急性呼吸道感染后大流行预测研究
**研究背景与问题**
急性呼吸道感染(Acute Respiratory Infections,ARIs)是儿童急诊就诊和住院的主要原因,给全球医疗系统和公共卫生带来沉重负担。大多数ARI病原体具有显著的季节性模式,传统上可以利用统计模型预测流行高峰。然而,COVID-19大流行后,广泛实施的非药物干预措施(如隔离、佩戴口罩和社交距离)显著降低了ARI发病率。随着限制措施解除,全球儿童ARI出现反弹,病原体传播动力学发生了根本性改变。经典统计方法,如自回归综合移动平均(AutoRegressive Integrated Moving Average,ARIMA)及其季节性版本(Seasonal ARIMA,SARIMA),长期用于预测ARI趋势,但其线性假设在处理复杂的非线性疫情时表现有限。大流行后突发的流行病学变化进一步降低了传统模型的准确性,亟需自适应方法。深度学习模型能够从大量数据中自动提取复杂的时间和非线性模式,在长期依赖捕获和非线性映射方面表现出色,但其在儿童ARI多病原体预测中的系统评估仍然匮乏。现有研究多针对单一病原体或单一时间尺度,忽略了短期与长期预测在临床和公共卫生决策中的不同价值。
**研究内容与主要结论**
研究人员开展了一项三维设计的研究:(1)模型比较:评估13种时间序列模型,包括1种基线模型(NaiveSeasonal)、1种统计模型(SARIMA)和11种深度学习模型(DeepAR、BlockRNN、N-BEATS、N-HiTS、时间卷积网络(Temporal Convolutional Network,TCN)、Transformer、时间融合变换器(Temporal Fusion Transformer,TFT)、DLinear、NLinear、TiDE和TSMixer);(2)病原体覆盖:在描述性流行病学分析中涵盖11种常见呼吸道病原体,包括人偏肺病毒(Human metapneumovirus,HMPV)、肺炎支原体(Mycoplasma pneumoniae,Mp)、乙型流感病毒(Influenza B,Flu B)、肺炎衣原体(Chlamydia pneumoniae,C. pneumoniae)、人呼吸道合胞病毒(Human respiratory syncytial virus,HRSV)、人腺病毒(Human adenovirus,HAdV)、人博卡病毒(Human bocavirus,HBoV)、人冠状病毒(Human coronavirus,HCoV)、人鼻病毒(Human rhinovirus,HRV)、人副流感病毒(Human parainfluenza virus,HPIV)和甲型流感病毒(Influenza A,Flu A)。由于C. pneumoniae仅检测到70例,模型拟合前将其排除,预测分析针对其余10种病原体进行;(3)时间跨度:短期(4周)、中期(12周)和长期(26周)。通过整合多模型、多病原体、多时间跨度的分析,研究人员旨在为ARI预测识别最优深度学习策略,并为儿科呼吸道监测和公共卫生准备提供精度预警系统。论文发表在《International Journal of Infectious Diseases》。
**关键方法技术**
研究人员使用的主要关键技术方法包括:(1)数据来源:上海市儿童医院(上海交通大学医学院附属)2021年1月至2024年12月期间29,260例儿童ARI住院记录,通过多重聚合酶链反应(multiplex PCR)筛查11种呼吸道病原体。仅保留每次发作的首次阳性结果以避免重复。(2)数据集划分与预测跨度:将每周汇总数据共208个时间点,划分为训练集(156周,2021年1月至2023年12月)和测试集(52周,2024年1月至12月)。设定三个预测跨度:4周(短期)、12周(中期)和26周(长期)。(3)模型实现:所有模型在Python 3.13.7中通过Darts库(版本0.37.1)实现。每周病原体特异性时间序列在模型拟合前进行归一化。深度学习模型使用默认训练设置(n_epochs=100,batch_size=32,Adam优化器,均方误差损失)。对于直接多输出模型,input_chunk_length和output_chunk_length分别设为104和26。(4)评估指标:采用平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,sMAPE)评估预测性能。深度学习模型在同一病原体、预测跨度和指标下误差值低于SARIMA或基线时才计为优胜。
**研究结果**
**描述性分析(Descriptive analysis)**:在29,260名住院儿童中,15,650人(53.49%)至少对11种筛查病原体中的一种检测阳性。HRV(4,587例,15.68%)和Mp(4,278例,14.62%)是最常检测到的病原体,其次是HRSV(2,412例,8.24%)、HAdV(1,586例,5.42%)和HPIV(1,487例,5.08%)。C. pneumoniae检出最少(70例,0.24%),仅保留在描述性表中,后续预测分析排除。总体阳性率在女童(52.75%)和男童(54.09%)中相当。年龄组间差异显著:1-3岁幼儿阳性率最高(59.30%),12-17岁青少年最低(28.86%)。HRSV主要在婴幼儿中检出(<1岁婴儿20.32%),Mp在学龄儿童中达到高峰(26.10%)。HRV在所有年龄组普遍存在,以幼儿中最高(20.27%)。年度变异明显:2021年阳性率52.27%,2022年降至40.43%,2023年和2024年分别升至54.39%和58.37%。HRV在2021年居首,Mp在2023年和2024年占主导,HAdV在2024年显著增加,Flu A在2023年显著上升。
**时间序列预测模型性能比较(Performance Comparison of Time-Series Forecasting Models)**:表2总结了每个病原体的基线、SARIMA和最佳深度学习模型的评估指标。在990次深度学习与SARIMA的比较中,深度学习模型在715次(72.2%)中误差值更低;在896次(90.5%)中比基线模型误差更低。DLinear在短期预测中最常被选为误差最低模型(4个病原体序列),TSMixer在长期预测中最常被选(5个病原体序列)。中期预测中,Transformer、DLinear、TiDE和TSMixer各在2个病原体序列中成为最优模型。TFT模型在任何预测任务中均未获得最优排名。
**短期预测(Short-term forecasting)**:通过4周预测,可视化显示最优深度学习模型紧密跟踪真实值。DLinear在短期中表现主导,对HMPV、HBoV、HCoV和HRV四个序列取得最低误差。例如,DLinear对HBoV的sMAPE为19.58%,优于SARIMA(37.38%)和基线(79.23%)。在指标特定比较中(每指标110个模型-病原体组合),深度学习模型在MAE、RMSE和sMAPE上分别有70.00%、67.27%和62.73%的比较中低于SARIMA。
**中期预测(Medium-term forecasting)**:12周预测显示,最优深度学习模型多数与真实趋势吻合良好。Transformer、DLinear、TiDE和TSMixer各在2个病原体序列中排名第一。例如,TSMixer对HBoV取得最低MAE(1.33),TiDE对HRV取得最低sMAPE(13.00%)。深度学习模型在MAE、RMSE和sMAPE上分别有79.09%、82.73%和70.91%的比较中低于SARIMA。
**长期预测(Long-term forecasting)**:26周预测中,TSMixer成为最频繁的最优模型(5个病原体序列),包括HRSV、HAdV、HBoV、HCoV和HPIV。例如,TSMixer对HCoV取得最低MAE(1.05)和RMSE(1.31),TCN对Mp取得最低sMAPE(15.55%)。深度学习模型在MAE、RMSE和sMAPE上分别有74.55%、75.45%和67.27%的比较中低于SARIMA。
**讨论与结论**
研究人员在讨论中指出,深度学习模型在多数比较中优于SARIMA和基线模型,但性能因模型、病原体、预测跨度和指标而异。DLinear因其线性分解结构在短期动态波动中表现突出,适合需要快速响应的临床预测任务。TSMixer通过保留时间步依赖性和强泛化能力,在长期预测中具有优势。然而,中期预测需要同时处理短期波动和长期依赖,因此没有单一模型显示压倒性优势。TFT模型表现不佳,可能因为ARI时间序列通常只有单一主要变量(病例数),缺乏高质量协变量(如天气、人口流动),且样本有限时易过拟合。研究局限性包括单中心数据、未纳入环境和行为因素(温度、湿度、校历、公共假日等),以及中期预测缺乏一致高性能模型。未来研究应纳入多中心数据集、探索集成模型和自适应学习框架。
研究结论翻译如下:总之,本研究表明,在大流行后时代,深度学习模型在许多模型-病原体-预测跨度-指标比较中能够改善儿童急性呼吸道感染病原体的预测性能。在多种呼吸道病原体和预测跨度中,DLinear和TSMixer等模型通常产生更低的误差值,尤其是在短期和长期预测中。然而,没有单一模型是普遍最优的,预测性能取决于病原体特征、预测跨度和误差指标。这些发现强调了在儿童ARI监测中采用多模型、多病原体、多预测跨度策略的重要性。这种方法可以提高早期预警能力,支持医院资源配置,并增强临床和公共卫生环境中针对特定病原体波动的准备。虽然需要进一步使用多中心数据并纳入环境和行为协变量进行验证,但研究结果提示,基于深度学习的预测框架在推进儿童呼吸道传染病精准监测和决策支持方面具有巨大潜力。