考虑可识别性(Identifiability)的基于模拟的推断(Simulation-Based Inference, SBI)方法在具有可识别性考量的传染病模型中的比较研究

《PLOS Computational Biology》:A comparative study of simulation-based inference methods for epidemic models with identifiability considerations

【字体: 时间:2026年06月03日 来源:PLOS Computational Biology 3.6

编辑推荐:

  流行病学模型在经适当校准至流行病学数据后,对于理解传播动力学、生成预测及指导公共卫生干预措施具有关键作用。传统贝叶斯推断(Bayesian inference)依赖似然函数(Likelihood function)依据观测数据更新先验知识,然而对于现实传染病模

  
流行病学模型在经适当校准至流行病学数据后,对于理解传播动力学、生成预测及指导公共卫生干预措施具有关键作用。传统贝叶斯推断(Bayesian inference)依赖似然函数(Likelihood function)依据观测数据更新先验知识,然而对于现实传染病模型,似然函数往往解析不可解或计算代价过高,限制了此类方法的应用。基于模拟的推断(Simulation-Based Inference, SBI)通过前向模拟而非显式似然评估来近似后验分布(Posterior distribution),提供了一种有前景的替代方案。研究人员在此研究中,系统比较了四种方法:近似贝叶斯计算(Approximate Bayesian Computation, ABC)、神经后验估计(Neural Posterior Estimation, NPE)、带时序嵌入(Temporal embedding)的神经方法(NPE-LSTM),以及融合经典与神经网络技术的预条件神经后验估计(Preconditioned Neural Posterior Estimation, PNPE)。这些方法在固定模拟预算(Simulation budget)及不同观测噪声水平下,于复杂度递增的传染病模型中接受评估,并明确关注结构可识别性(Structural identifiability)与实用可识别性(Practical identifiability)。研究结果表明,在受限模拟预算下,神经网络方法总体上较ABC改善了后验保真度(Posterior fidelity)与预测精度(Predictive accuracy);PNPE在若干模拟设定中表现优异,而时序嵌入改善了具复杂流行病动力学模型的推断效果,因其捕捉了序列依赖性(Sequential dependencies)。这些收益伴随重要权衡:PNPE需显著更多计算资源,且不同于完全摊销(Amortized)的NPE类方法,可能需针对每新组观测重新预处理(Preconditioning);相比之下,ABC保持计算高效并提供合理但偏保守的后验估计。总体而言,研究发现揭示了计算效率、后验精度、不确定性校准(Uncertainty calibration)与推断可复用性(Inference reusability)间的权衡,建议方法选择应依模型复杂度、数据质量、可识别性及可用计算资源而定。
论文解读:《PLOS Computational Biology》——考虑可识别性的基于模拟推断方法在传染病模型中的比较研究
本文由研究人员发表于《PLOS Computational Biology》,研究背景如下: mechanistic 传染病模型(如仓室模型 Compartmental models)是理解疾病传播与评估干预措施的重要工具,但其参数推断常受限于似然函数不可解析或计算昂贵的问题。传统似然依赖的贝叶斯方法(如MCMC结合 POMP、粒子 MCMC)虽严谨但计算负担大,尤其在高维或复杂随机系统中难以扩展。基于模拟的推断(Simulation-Based Inference, SBI / Likelihood-Free Inference)通过前向模拟生成合成数据与观测比较来近似后验,规避了显式似然需求,其中 ABC 已被用于复杂传染病拟合,近期神经网络密度估计(Neural Density Estimators / Amortized Inference,如 Neural Posterior Estimation, NPE)也被引入以提升效率。然而现有应用多聚焦单一模型或算法,缺乏在变动可识别性与噪声条件下对多种 SBI 方法的系统比较,且 SBI 文献常忽视结构可识别性(Structural Identifiability,模型方程理论唯一确定参数能力)与实用可识别性(Practical Identifiability,含噪有限数据下参数估计精度)对后验行为的影响。因此研究人员建立了首个纳入可识别性分析的 SBI 基准框架,在 SEIR、Ebola 及 SIRTEM 三种递增复杂度模型上,于固定模拟预算与不同观测噪声下比较 ABC、NPE、NPE-LSTM(带 LSTM 时序嵌入)、PNPE(Preconditioned NPE),并以 MCMC-NUTS 所得后验为参考基线,综合评估后验分布吻合度、预测精度、不确定性校准及计算代价,明确不同 SBI 方法在流行病学推断中的优势、局限与适用场景。
主要关键技术方法
研究人员选用三类确定性仓室模型——经典 SEIR(参数 β、σ、γ,观测量为新增感染数)、含医院感染通道的 Ebola 模型(6 仓室 S-E-I-H-R-D,观测量为新发感染/住院/死亡,可切换结构可识别情形)、高维 SIRTEM 模型(76 仓室含检测、隔离、免疫丧失,观测量为阳性/阴性检测数、住院及死亡)——在 Poisson 与负二项(Negative Binomial, 分散参数 r=50 中等噪声、r=10 高噪声)观测噪声下生成合成数据,部分设定考察初值未知致 SEIR 结构不可识别、Ebola 模型缺死亡观测致部分参数结构不可识别。SBI 方法包括:SMC-ABC(Sequential Monte Carlo ABC)、Amortized NPE 采用 Masked Autoregressive Flow (MAF) 作为条件密度估计器、NPE-LSTM 以双向 LSTM 提取时序嵌入再送 MAF、PNPE 将总模拟预算均分予 SMC-ABC 获近似后验并拟合 KDE 提案分布再训练 NPE-LSTM。以 NUTS (No-U-Turn Sampler) 采 MCMC 参考后验(SEIR、Ebola),DAISY 软件做结构可识别性分析。评价指标含后验预测检验(Posterior Predictive Check, PPC)、MSE、MAE、95% 预测区间覆盖率(Predictive Interval Coverage, PI)、加权区间评分(Weighted Interval Score, WIS)、Maximum Mean Discrepancy (MMD)、Classifier Two-Sample Test (C2ST) 及边际 KL 散度(Information Gain),运行时间按数据生成/训练/推断三阶段分解。真实数据验证采用 1918 年旧金山流感数据集。
研究结果
2.1. Posterior estimation(后验估计)
在 SEIR 模型结构可识别设定下,PNPE 所得后验最集中且贴近真值,MMD(0.01±0.02) 与 C2ST(0.55±0.03) 最接近参考后验,MSE(1011.35±206.34) 与 MAE(18.30±2.06) 最低,WIS(42.08±4.44) 低且 95% PI 覆盖率(96.90%±1.30%) 接近名义水平;ABC 后验更宽、95% PI 偏高(98.40%±1.20%)、WIS 较大(49.41±12.11),但运行时最短(31.08±7.19 s)。随模拟预算增至 100k,PNPE 的 MMD 持续最低,ABC 即使增预算仍远离参考。Ebola 与 SIRTEM 模型中,NPE-LSTM 在复杂动力学下较标准 NPE 表现相当或更优,SIRTEM 中 ABC 与 PNPE 点预测尚可但 WIS 偏高反映不确定量化欠佳。
2.2. Impact of identifiability(可识别性的影响)
SEIR 已知初值时全结构可识别,未知初值则 β 与总人口 N 因 βI/N 耦合而结构不可识别;Ebola 模型全观测量(新发感染+住院+死亡)结构可识别,缺死亡观测时多个传播与住院参数结构不可识别。结构可识别情形下各法信息增益(边际 KL 散度)随模拟预算增大,PNPE 信息增益最高(β:2.91, σ:2.93, γ:2.44 @100k)近参考;结构不可识别下信息增益普遍低且不随预算单调增,表明仅靠增模拟无法克服结构不可识别导致的不唯一恢复。实用可识别性实验中,负二项噪声越强(r 越小)预测区间越宽、性能下降;神经 SBI 方法(NPE/NPE-LSTM/PNPE)WIS 显著低于 ABC(例 r=50 时 ABC WIS=293.94 vs PNPE 63.83),在噪声下仍能较好提取信息。
2.3. Real-data application(真实数据应用)
1918 旧金山流感数据推断显示,ABC 给出最宽 95% PI 致全覆盖但 WIS 大(199.11);NPE-LSTM 与 PNPE 预测区间较窄、MSE 与 WIS 更低但 95% PI 覆盖率降至 86.67%,提示潜在欠覆盖(Undercoverage)与过置信(Overconfident);NPE-LSTM 在精度与 WIS 间较平衡。说明无单一 SBI 方法普适最优,需权衡预测精度与不确定性可靠量化。
讨论与结论翻译(研究结论部分总结)
研究人员指出神经 SBI 在固定模拟预算下较 ABC 改善后验吻合与预测精度,但存校准权衡——ABC 渐近一致但保守宽区间,神经法后验更锐利但真实数据下可欠覆盖。LSTM 嵌入对简单 SEIR 无额外益且或引过参化,对复杂 Ebola/SIRTEM 有益。计算上 ABC 无需训练适合单次推断;NPE/NPE-LSTM 有前期训练成本但可摊销(Amortized)至多观测推断;PNPE 精度好但计算最高且需对新观测重预处理,限制重复推断实用性。结构不可识别时无论方法优劣后验难收窄,实用可识别性受观测噪声影响,信息增益增加不等于准确恢复。研究局限含假设数据完整无缺失、未考虑模型误设(Model Misspecification)、目前聚焦确定性 ODE 未扩展至随机流行病系统。未来方向含混合 ABC 与神经 SBI、提升对模型误设鲁棒性、拓展至真实暴发数据与更大异构系统。最终结论:SBI 为似然难解传染病模型提供灵活推断框架,神经 SBI 在预算受限时可优于 ABC 但需关注不确定性校准;方法选择应依模型复杂度、数据质量、可识别性及计算资源而定;SBI 表现须结合结构与实用可识别性、后验精度、不确定性校准及计算成本综合评判。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号