考虑可识别性(Identifiability)的基于模拟的推断(Simulation-Based Inference, SBI)方法在具有可识别性考量的传染病模型中的比较研究

《PLOS Computational Biology》：A comparative study of simulation-based inference methods for epidemic models with identifiability considerations

【字体：大中小】 时间：2026年06月03日 来源：PLOS Computational Biology 3.6

编辑推荐：

　　流行病学模型在经适当校准至流行病学数据后，对于理解传播动力学、生成预测及指导公共卫生干预措施具有关键作用。传统贝叶斯推断(Bayesian inference)依赖似然函数(Likelihood function)依据观测数据更新先验知识，然而对于现实传染病模

流行病学模型在经适当校准至流行病学数据后，对于理解传播动力学、生成预测及指导公共卫生干预措施具有关键作用。传统贝叶斯推断(Bayesian inference)依赖似然函数(Likelihood function)依据观测数据更新先验知识，然而对于现实传染病模型，似然函数往往解析不可解或计算代价过高，限制了此类方法的应用。基于模拟的推断(Simulation-Based Inference, SBI)通过前向模拟而非显式似然评估来近似后验分布(Posterior distribution)，提供了一种有前景的替代方案。研究人员在此研究中，系统比较了四种方法：近似贝叶斯计算(Approximate Bayesian Computation, ABC)、神经后验估计(Neural Posterior Estimation, NPE)、带时序嵌入(Temporal embedding)的神经方法(NPE-LSTM)，以及融合经典与神经网络技术的预条件神经后验估计(Preconditioned Neural Posterior Estimation, PNPE)。这些方法在固定模拟预算(Simulation budget)及不同观测噪声水平下，于复杂度递增的传染病模型中接受评估，并明确关注结构可识别性(Structural identifiability)与实用可识别性(Practical identifiability)。研究结果表明，在受限模拟预算下，神经网络方法总体上较ABC改善了后验保真度(Posterior fidelity)与预测精度(Predictive accuracy)；PNPE在若干模拟设定中表现优异，而时序嵌入改善了具复杂流行病动力学模型的推断效果，因其捕捉了序列依赖性(Sequential dependencies)。这些收益伴随重要权衡：PNPE需显著更多计算资源，且不同于完全摊销(Amortized)的NPE类方法，可能需针对每新组观测重新预处理(Preconditioning)；相比之下，ABC保持计算高效并提供合理但偏保守的后验估计。总体而言，研究发现揭示了计算效率、后验精度、不确定性校准(Uncertainty calibration)与推断可复用性(Inference reusability)间的权衡，建议方法选择应依模型复杂度、数据质量、可识别性及可用计算资源而定。

论文解读：《PLOS Computational Biology》——考虑可识别性的基于模拟推断方法在传染病模型中的比较研究

本文由研究人员发表于《PLOS Computational Biology》，研究背景如下： mechanistic 传染病模型（如仓室模型 Compartmental models）是理解疾病传播与评估干预措施的重要工具，但其参数推断常受限于似然函数不可解析或计算昂贵的问题。传统似然依赖的贝叶斯方法（如MCMC结合 POMP、粒子 MCMC）虽严谨但计算负担大，尤其在高维或复杂随机系统中难以扩展。基于模拟的推断（Simulation-Based Inference, SBI / Likelihood-Free Inference）通过前向模拟生成合成数据与观测比较来近似后验，规避了显式似然需求，其中 ABC 已被用于复杂传染病拟合，近期神经网络密度估计（Neural Density Estimators / Amortized Inference，如 Neural Posterior Estimation, NPE）也被引入以提升效率。然而现有应用多聚焦单一模型或算法，缺乏在变动可识别性与噪声条件下对多种 SBI 方法的系统比较，且 SBI 文献常忽视结构可识别性（Structural Identifiability，模型方程理论唯一确定参数能力）与实用可识别性（Practical Identifiability，含噪有限数据下参数估计精度）对后验行为的影响。因此研究人员建立了首个纳入可识别性分析的 SBI 基准框架，在 SEIR、Ebola 及 SIRTEM 三种递增复杂度模型上，于固定模拟预算与不同观测噪声下比较 ABC、NPE、NPE-LSTM（带 LSTM 时序嵌入）、PNPE（Preconditioned NPE），并以 MCMC-NUTS 所得后验为参考基线，综合评估后验分布吻合度、预测精度、不确定性校准及计算代价，明确不同 SBI 方法在流行病学推断中的优势、局限与适用场景。

主要关键技术方法

研究人员选用三类确定性仓室模型——经典 SEIR（参数 β、σ、γ，观测量为新增感染数）、含医院感染通道的 Ebola 模型（6 仓室 S-E-I-H-R-D，观测量为新发感染/住院/死亡，可切换结构可识别情形）、高维 SIRTEM 模型（76 仓室含检测、隔离、免疫丧失，观测量为阳性/阴性检测数、住院及死亡）——在 Poisson 与负二项（Negative Binomial, 分散参数 r=50 中等噪声、r=10 高噪声）观测噪声下生成合成数据，部分设定考察初值未知致 SEIR 结构不可识别、Ebola 模型缺死亡观测致部分参数结构不可识别。SBI 方法包括：SMC-ABC（Sequential Monte Carlo ABC）、Amortized NPE 采用 Masked Autoregressive Flow (MAF) 作为条件密度估计器、NPE-LSTM 以双向 LSTM 提取时序嵌入再送 MAF、PNPE 将总模拟预算均分予 SMC-ABC 获近似后验并拟合 KDE 提案分布再训练 NPE-LSTM。以 NUTS (No-U-Turn Sampler) 采 MCMC 参考后验（SEIR、Ebola），DAISY 软件做结构可识别性分析。评价指标含后验预测检验（Posterior Predictive Check, PPC）、MSE、MAE、95% 预测区间覆盖率（Predictive Interval Coverage, PI）、加权区间评分（Weighted Interval Score, WIS）、Maximum Mean Discrepancy (MMD)、Classifier Two-Sample Test (C2ST) 及边际 KL 散度（Information Gain），运行时间按数据生成/训练/推断三阶段分解。真实数据验证采用 1918 年旧金山流感数据集。

研究结果

2.1. Posterior estimation（后验估计）

在 SEIR 模型结构可识别设定下，PNPE 所得后验最集中且贴近真值，MMD(0.01±0.02) 与 C2ST(0.55±0.03) 最接近参考后验，MSE(1011.35±206.34) 与 MAE(18.30±2.06) 最低，WIS(42.08±4.44) 低且 95% PI 覆盖率(96.90%±1.30%) 接近名义水平；ABC 后验更宽、95% PI 偏高(98.40%±1.20%)、WIS 较大(49.41±12.11)，但运行时最短(31.08±7.19 s)。随模拟预算增至 100k，PNPE 的 MMD 持续最低，ABC 即使增预算仍远离参考。Ebola 与 SIRTEM 模型中，NPE-LSTM 在复杂动力学下较标准 NPE 表现相当或更优，SIRTEM 中 ABC 与 PNPE 点预测尚可但 WIS 偏高反映不确定量化欠佳。

2.2. Impact of identifiability（可识别性的影响）

SEIR 已知初值时全结构可识别，未知初值则 β 与总人口 N 因 βI/N 耦合而结构不可识别；Ebola 模型全观测量（新发感染+住院+死亡）结构可识别，缺死亡观测时多个传播与住院参数结构不可识别。结构可识别情形下各法信息增益（边际 KL 散度）随模拟预算增大，PNPE 信息增益最高（β:2.91, σ:2.93, γ:2.44 @100k）近参考；结构不可识别下信息增益普遍低且不随预算单调增，表明仅靠增模拟无法克服结构不可识别导致的不唯一恢复。实用可识别性实验中，负二项噪声越强（r 越小）预测区间越宽、性能下降；神经 SBI 方法（NPE/NPE-LSTM/PNPE）WIS 显著低于 ABC（例 r=50 时 ABC WIS=293.94 vs PNPE 63.83），在噪声下仍能较好提取信息。

2.3. Real-data application（真实数据应用）

1918 旧金山流感数据推断显示，ABC 给出最宽 95% PI 致全覆盖但 WIS 大(199.11)；NPE-LSTM 与 PNPE 预测区间较窄、MSE 与 WIS 更低但 95% PI 覆盖率降至 86.67%，提示潜在欠覆盖(Undercoverage)与过置信(Overconfident)；NPE-LSTM 在精度与 WIS 间较平衡。说明无单一 SBI 方法普适最优，需权衡预测精度与不确定性可靠量化。

讨论与结论翻译（研究结论部分总结）

研究人员指出神经 SBI 在固定模拟预算下较 ABC 改善后验吻合与预测精度，但存校准权衡——ABC 渐近一致但保守宽区间，神经法后验更锐利但真实数据下可欠覆盖。LSTM 嵌入对简单 SEIR 无额外益且或引过参化，对复杂 Ebola/SIRTEM 有益。计算上 ABC 无需训练适合单次推断；NPE/NPE-LSTM 有前期训练成本但可摊销(Amortized)至多观测推断；PNPE 精度好但计算最高且需对新观测重预处理，限制重复推断实用性。结构不可识别时无论方法优劣后验难收窄，实用可识别性受观测噪声影响，信息增益增加不等于准确恢复。研究局限含假设数据完整无缺失、未考虑模型误设(Model Misspecification)、目前聚焦确定性 ODE 未扩展至随机流行病系统。未来方向含混合 ABC 与神经 SBI、提升对模型误设鲁棒性、拓展至真实暴发数据与更大异构系统。最终结论：SBI 为似然难解传染病模型提供灵活推断框架，神经 SBI 在预算受限时可优于 ABC 但需关注不确定性校准；方法选择应依模型复杂度、数据质量、可识别性及计算资源而定；SBI 表现须结合结构与实用可识别性、后验精度、不确定性校准及计算成本综合评判。

热点排行