基于物理信息神经网络(PINN)的季节性流感流行病预测(Forecasting seasonal influenza epidemics with physics-informed neural networks)
《Epidemics》:Forecasting seasonal influenza epidemics with physics-informed neural networks
编辑推荐:
准确的流行病预测对公共卫生决策和及时干预至关重要。尽管物理信息神经网络(Physics-Informed Neural Network, PINN)在多个科学领域展现出潜力,但其在实时流行病预测中的应用仍待探索。本研究提出SIR-INN(Susceptible
准确的流行病预测对公共卫生决策和及时干预至关重要。尽管物理信息神经网络(Physics-Informed Neural Network, PINN)在多个科学领域展现出潜力,但其在实时流行病预测中的应用仍待探索。本研究提出SIR-INN(Susceptible-Infectious-Recovered Informed Neural Network),一种将经典易感-感染-恢复(Susceptible-Infectious-Recovered, SIR)仓室模型机理结构融入神经网络架构的混合预测框架。该模型仅在合成流行病场景上训练一次,即可在不同流行病条件下泛化而无需重新训练。基于有限且含噪的观测数据,SIR-INN通过马尔可夫链蒙特卡洛(Markov Chain Monte Carlo, MCMC)推断关键传播参数,生成概率化的短期及长期预测。研究人员利用意大利国家卫生研究院(Istituto Superiore di Sanità, ISS)2023–2024及2024–2025流行季的国家级流感数据对SIR-INN进行验证。该模型性能与当前最先进方法相当,尤其在加权区间评分(Weighted Interval Score, WIS)方面表现突出。SIR-INN在疫情爆发的几乎所有阶段均显示出准确的预测性能,且在2024–2025流感季观测到精度提升。模型始终保持可信的不确定性区间,而覆盖率指标表明不确定性校准仍有改进空间。SIR-INN为流行病预测提供了一种计算高效、透明且具泛化能力的解决方案,恰当地利用了该混合框架的设计优势。其提供疫情动态实时预测及不确定性量化的能力,使其成为具有前景的真实世界流行病预测工具。
论文解读:《Forecasting seasonal influenza epidemics with physics-informed neural networks》发表于《Epidemics》
一、研究背景与动机
传统流行病预测方法包括纯机械(机理)模型(如仓室模型)与纯数据驱动的统计或机器学习方法。现有混合模型虽结合二者优势,但在实时预测中多需随新数据到来重新训练网络,计算成本高且缺乏泛化性;此外多数神经网络方法仅输出确定性轨迹,缺乏对预测过程的不确定性量化(Uncertainty Quantification, UQ),而这对公共卫生决策至关重要。尽管物理信息神经网络(Physics-Informed Neural Network, PINN)能在少量噪声数据下保持物理一致性,其在实时流行病预测中的系统性应用尚属空白。为此,Rama等人提出SIR-INN框架,旨在构建单次训练、无需重训、融合SIR机理并具备参数推断与概率预测能力的混合预测模型。
二、主要关键技术方法
研究人员采用意大利国家级流感样病例(Influenza-Like Illness, ILI)周度发病率数据(ISS RespiVirNet系统,2023–2024及2024–2025季)作为验证队列。关键方法如下:(1) PINN构建:设计含3个隐藏层(结构[3,16,32,16,3],输入为时间t、传播率β、移除率γ,输出为归一化S、I、R分量)的前馈神经网络,将SIR常微分方程组(Ordinary Differential Equation, ODE)残差作为物理约束加入损失函数(L=Ldata+LODE),在合成SIR轨迹(β∈[0.12,0.45], γ∈[1/12,1/2.5]即R0∈(0.75,2.5),时间窗600天)上单次训练;(2) 参数推断:固定网络权重,以每周ILI发病率为观测值,采用延迟拒绝自适应Metropolis(Delayed Rejection Adaptive Metropolis, DRAM)MCMC算法对初始对齐时间τ0、β、γ进行后验采样,似然函数设为泊松(Poisson)分布,先验为均匀分布;(3) 预测:取MCMC后验样本代入预训练PINN评估未来时间窗,转化为发病率并给出分位数区间(50%、90%),以滚动窗口(5周观测+4周或10周预测)逐周更新。
三、研究结果
4.1 Parameters inference results(参数推断结果)
研究人员以5周为滑动窗口对每轮观测运行MCMC(10000次迭代,弃前9000为老化样本,取1000个后验样本)。结果显示推断出的(β?, γ?)中位数两季分别约为(0.30,0.27)和(0.30,0.25),对应基本再生数R0≈1.13–1.14,均在训练参数域内且与季节性流感典型值吻合。有效再生数R?t时序演化符合实际流行曲线——2023–2024季R?t>1持续至第52周,第2周后降至1以下;2024–2025季增长阶段延长至第4周,第5周接近阈值,第6周后低于1。τ?0在各周中保持稳定漂移以对齐观测时间。证明SIR-INN可从少量噪声数据中稳定反推具流行病学意义的SIR参数。
4.2 Forecasting results(预测结果)
4.2.1 Four-weeks-ahead forecasting(4周超前预测)
按Influcast Hub标准做4周超前滚动预测。2023–2024季SIR-INN均值绝对误差(Mean Absolute Error, MAE)=2.28,加权区间评分(Weighted Interval Score, WIS)=1.63,优于基线(MAE=2.68, WIS=1.90);2024–2025季MAE=1.98, WIS=1.36(基线MAE=2.54, WIS=1.71)。与Influcast参赛模型相比,SIR-INN相对MAE=1.03、相对WIS=0.98,优于部分机制与半机制模型,整体处于中上游水平。覆盖率(Coverage)50%为0.11(2023–2024)和0.24(2024–2025),90%为0.39和0.58,低于名义水平说明区间偏窄(过置信),但2024–2025季有所改善。定性显示早流行期与下降期拟合较好,峰值时间能合理预判,峰值幅度略有低估。
4.2.2 Comparison with influcast models(与Influcast模型对比)
在与2023–2024季Influcast Hub各参赛模型横向比较中,SIR-INN的WIS相对值(0.98)略优于基线,排名高于底部三名的Mechanistic-2、Semi-mechanistic-1等模型,证明混合PINN框架具现实竞争力。
4.2.3 Ten-weeks-ahead forecasting(10周超前预测——长期预测)
进行10周超前预测实验。峰值前两周围90%预测区间可包纳后续所有观测,峰值后下降段预测迅速适配且区间较窄。峰值时间预测较真实峰值延迟不超过4周。表明即便在长时域下SIR-INN仍能部分捕捉流行趋势,优于纯数据驱动神经网络的长期外推失效问题。
四、讨论与结论翻译
本研究引入基于PINN的新型流行病预测框架SIR-INN。研究人员将经典具常值转移率的SIR仓室模型先验知识嵌入单神经网络,该网络仅在接近真实流行场景的时间—流行病参数域上的合成数据中训练一次。由此,基于少量含噪观测并通过MCMC推断表征SIR流行动力学的参数后,可用预训练PINN预测未来时段疫情状态。研究人员用意大利国家级季节性流感监测数据(ISS,2023–2024及2024–2025季)验证,确认该混合方法有良好预测能力。两季流感显示相似的传播率与平均感染期流行病学特征,由SIR刻画且R0≈1.135;Rt时序演变符合ILI曲线。4周超前预测在MAE与WIS上优于参考基线,与主流Influcast模型相当,2024–2025季各指标进一步提升。10周预测表明框架在长时域亦能部分捕捉趋势。与纯机理SIR及混合PINN-ODE流程比,SIR-INN在精度与计算成本间取得较好平衡。该框架具简洁性、可解释性及不需重训的泛化能力,通过独立于网络训练的MCMC获参数分布从而实现UQ——这是纯NN预测罕有的。局限为预测区间偏窄(欠覆盖),尤其非峰值期存过置信现象,可作后续校准方向。SIR-INN为实时流行病预测提供高效、透明替代方案,其单次训练—MCMC推断范式可扩展至其他仓室模型或耦合人类行为改变的传染病系统,推进AI与机理模型的深度融合。