《Journal of Hydrology》:A Bayesian spatial framework for modeling sub-hourly to daily extreme precipitation in Denmark using SPDE with INLA
编辑推荐:
摘要:研究人员提出一种区域模拟次小时至日尺度极端降水事件的新方法学,旨在生成带不确定性的空间连续重现水平(return level)图。该方法在贝叶斯广义加性模型(Bayesian generalized additive modeling)框架下采用两阶段建
摘要:研究人员提出一种区域模拟次小时至日尺度极端降水事件的新方法学,旨在生成带不确定性的空间连续重现水平(return level)图。该方法在贝叶斯广义加性模型(Bayesian generalized additive modeling)框架下采用两阶段建模流程:第一阶段以负二项分布(Negative Binomial, NB)模拟超过阈值的频次(exceedance frequencies);第二阶段以广义帕累托分布(Generalized Pareto Distribution, GPD)模拟超过阈值的强度(exceedance magnitudes)。两阶段均含被建模为高斯随机场(Gaussian Random Field, GRF)的潜空间随机效应(latent spatial random effects)。贝叶斯推断通过集成嵌套拉普拉斯近似(Integrated Nested Laplace Approximation, INLA)——一种针对潜高斯模型较MCMC更快速准确的替代方法——完成。研究人员将该方法应用于丹麦各地雨量站的次小时降水时间序列数据集,模型捕捉了极端降水频次与量级的时空变化,并生成带不确定性的高分辨率重现水平图。此外,基于合成雨量站网络的敏感性分析表明,研究区域广泛的空间覆盖比站点密度对预测能力更重要,凸显了网络结构与设计在可靠极端降雨建模中的关键作用。该两阶段贝叶斯模型为丹麦现行使用的模型提供了灵活替代方案:对于较长历时(360 min和1440 min),两模型吻合良好;而对于较短历时(30 min和60 min),在空间变异性与不确定性上均出现显著差异。本工作提出的方法可适用于不同极端值研究,并可扩展纳入额外协变量。
论文解读——《基于SPDE-INLA的贝叶斯空间框架模拟丹麦次小时至日尺度极端降水》
一、研究背景与意义
短历时强降水可引发城市内涝,造成显著经济损失与基础设施损坏。根据IPCC第六次评估报告,极端降水事件在全球多地趋于频发且增强。传统极值统计中,年最大值法(Annual Maxima, AM)丢弃大量可用高频数据;峰值超过阈值(Peak-Over-Threshold, POT)法利用超阈值数据更为高效。丹麦国家区域模型(National Regional Model, NRM,最新版NRM32)基于广义最小二乘法(Generalized Least Squares, GLS)结合POT框架,假定年超越次数服从泊松(Poisson)分布且忽略残差空间依赖结构,并用均值年降水量(Mean Annual Precipitation, MAP)与均值极端日降水量(Mean Extreme Daily Precipitation, MEDP)作协变量。既有研究表明丹麦极端降水存在空间异质性,NRM未能充分刻画短时对流性降水的局地空间变异,且泊松假设可能低估过离散(overdispersion)带来的不确定性。为此,研究人员开发了一种基于贝叶斯层次模型(Bayesian hierarchical model)、引入潜空间高斯随机场并通过随机偏微分方程(Stochastic Partial Differential Equation, SPDE)–集成嵌套拉普拉斯近似(Integrated Nested Laplace Approximation, INLA)推断的两阶段框架,以更灵活捕捉空间依赖并量化不确定性,并与NRM32进行系统比较。该文发表于《Journal of Hydrology》。
二、主要关键技术方法
研究人员选用丹麦1979–2019年SVK tipping bucket雨量计与DMI权重雨量计共229站次小时(1 min分辨率)数据,提取30、60、360、1440 min滑动窗最大雨强,按NRM32规定最小独立事件间隔(Minimum Inter-Event Time, MIT)去相关;阈值沿用NRM32经平均剩余寿命图(mean residual life plot)验证。两阶段模型:第一阶段站点年超越次数N(s)~负二项分布(NB(μ(s), θNB)),log(μ(s))=β0NB+β1NB·MAP(s)+ξNB(s);第二阶段超阈值量Y(s)?u|Y(s)>u~广义帕累托分布GPD以中位数ζ0.5(s)及形状参数γ参数化,log(ζ0.5(s))=β0GP+β1GP·MEDP(s)+ξGP(s),γ区域恒定。空间随机效应ξNB(s)、ξGP(s)为零均值Matérn协方差高斯随机场,通过SPDE离散为高斯马尔可夫随机场(Gaussian Markov Random Field, GMRF)并在三角网格上投影;固定效应给零均值弱信息高斯先验,空间场超参数(范围ρ、边际标准差σ)及γ给惩罚复杂度先验(Penalized Complexity prior, PC prior)。推断由R-INLA包完成。对比基准为NRM32(泊松–GPD–GLS框架)。通过合成站点网络重抽样计算连续概率评分(Continuous Ranked Probability Score, CRPS)评估网络设计影响,并以2020–2024独立数据做频率与超阈值均值的平均绝对误差(Mean Absolute Error, MAE)验证。
三、研究结果
3.1 Parameter estimates(参数估计)
MAP对NB阶段超越频次的回归系数各历时均显著为正,且随历时增长(30→1440 min)效应增强,反映长历时锋面降水与MAP关联更紧密;MEDP对GP阶段ζ0.5的影响在30 min和60 min时不显著(95% CI含零),360 min和1440 min时显著且随历时增大。GPD形状参数γ后验均值30 min为0.08、60 min为0.11、360 min为0.14、1440 min为0.11,表明中等历时(1–6 h混合对流–锋面)尾部分布略偏重尾。GP空间随机场范围ρ从30 min的103 km增至360 min的152 km再略降至1440 min的138 km,NB场亦呈类似趋势,说明长历时残差空间相关性更强、平滑度更高。
3.2 Effect of gauge network design(雨量站网设计的影响)
以拟合模型生成合成"真值",分别从稠密、稀疏、聚类(仿SVK50空间聚集)三种网络中抽取站点重拟合并预测全网格,以CRPS衡量。结果显示预测性能依序递减(稠密>稀疏>聚类),聚类网络虽站点数多于稀疏网络但CRPS最高(性能最差),配对Wilcoxon检验两两差异均显著(p<0.05)。表明在SPDE-INLA两阶段极端降雨建模中,广域空间覆盖比单纯增加站点密度更重要。
3.3 Comparison with NRM32(与NRM32的比较)
10年重现水平空间分布:360 min与1440 min两模型相近;30 min与60 min新模型重现水平整体偏低,极值区位于南日德兰(短历时)并向东南日德兰及哥本哈根偏移(较长历时),NRM32短历时模式更接近MAP空间格局(西南日德兰偏高),且NRM32短历时空间变幅较小。新模型不确定性(后验标准差)一般小于NRM32且空间不均——站点密集区不确定性低,稀疏区高,反映贝叶斯框架自然传播信息量差异;NRM32不确定性源自GLS参数方差含局部抽样变异且区间偏宽。NRM32重现水平落入两阶段模型95%后验区间的比例随历时增大、随重现期减小而提高,短历时高重现期差异最大;反之两阶段模型落入NRM32区间几乎全符合(因NRM32区间宽)。NB阶段对比:两阶段模型引入空间随机效应后年期望超越次数在MAP梯度基础上叠加局地偏差(西、南日德兰上调/下调),NRM32仅沿MAP线性无残差修正;两阶段模型用NB处理过离散,NRM32用Poisson。独立测试集MAE:两阶段模型超越频次MAE=0.79 vs NRM32=1.84;超阈值均值MAE分别为2014.02 vs 2018.42,两阶段模型精度更优(训练含更多DMI站可能是部分原因)。残差–年份Spearman相关:NRM32持续正相关(未建模非平稳性),两阶段模型相关散布于?0.1至0.4,暗示未显式纳入时间趋势或气候协变量。
四、讨论与结论翻译
研究人员在本工作中引入了一个两阶段建模框架,将极值理论中的负二项分布与广义帕累托分布同基于潜高斯场描述空间随机效应的灵活贝叶斯层次模型相结合。这使模型能捕捉跨空间的构造成分残差变异,同时每阶段的广义加性结构提供可解释性并可扩展。核心方法具通用性,可易适配其他环境极值应用。基于合成雨量站网络的敏感性分析显示,随站点覆盖变差预测性能下降,聚类网络表现最差尽管站点更多,凸显在INLA-SPDE框架极端降雨建模中广域空间覆盖比高密度集中站点更重要。平均年降水量(MAP)是30–1440 min各历时超越频次显著预测因子,而均值极端日降水量(MEDP)仅对>60 min历时显著。后验平均GPD形状参数γ在0.08–0.11范围,高斯随机场范围ρ约70–150 km(30–1440 min)。与丹麦现行国家模型NRM32比较发现:较长历时(360、1440 min)两模型重现水平及空间格局大体相似;较短历时(30、60 min)观测到空间变异性与不确定性差异。对比两模型各部分表明,纳入空间随机效应并校正过离散可更好表征空间变异。不过两阶段模型与NRM32的差异也可能部分反映各自假设与结构不同及训练数据集差异,而非明确指示低估或高估。