基于广义极值(GEV)分布L-矩与贝叶斯广义最小二乘(BGLS)回归的区域化在新南威尔士州区域洪水频率分析(RFFA)中的应用——固定区域与影响域(ROI)下参数回归法(PRT)与分位数回归法(QRT)的比较
《Water》:Microbiological Risk Assessment of Drinking Water Using Integrated Phenotypic and Molecular Approaches in Guaranda
编辑推荐:
本研究采用L-矩法和贝叶斯广义最小二乘(Bayesian Generalized Least Squares, BGLS)回归对广义极值(Generalized Extreme Value, GEV)分布进行区域化,利用澳大利亚新南威尔士州88个有实测资料的流
本研究采用L-矩法和贝叶斯广义最小二乘(Bayesian Generalized Least Squares, BGLS)回归对广义极值(Generalized Extreme Value, GEV)分布进行区域化,利用澳大利亚新南威尔士州88个有实测资料的流域数据,在固定区域与影响域(Region of Influence, ROI)框架下比较参数回归技术(Parameter Regression Technique, PRT)与分位数回归技术(Quantile Regression Technique, QRT)的表现。结果表明,与固定区域相比,ROI方法能更好地捕捉空间变异性并降低洪水设计频率(Annual Exceedance Probability, AEP)分位数的估计不确定性。固定区域法中PRT的中值相对误差(Relative Error, Rer%)为34–40%,相对均方根误差(Relative Root Mean Square Error, RRMSE%)为59–65%,而QRT的Rer%为40–63%、RRMSE%为59–94%;在ROI框架下两种方法Rer%相近(31–40%),但QRT-ROI的RRMSE略有降低。
论文解读:基于GEV分布L-矩与BGLS回归的新南威尔士州区域洪水频率分析——固定区域与ROI下PRT与QRT的比较
一、研究背景与目的
设计洪水估算是水资源管理与防洪工程规划的核心环节。单站洪水频率分析(Flood Frequency Analysis, FFA)依赖长系列实测资料,但多数流域属无资料或资料短缺地区,为此区域洪水频率分析(Regional Flood Frequency Analysis, RFFA)被广泛采用,通过将有资料流域的信息移植至无资料流域。传统RFFA常采用固定区域划分(如按行政区或气候带),易产生边界效应和不连续偏差;影响域(Region of Influence, ROI)方法则依据水文或地理邻近度动态构建局部区域,可更好反映空间异质性。RFFA中常用分位数回归技术(Quantile Regression Technique, QRT)——直接将设计洪水分位数对流域特征回归,和参数回归技术(Parameter Regression Technique, PRT)——先对洪水频率分布参数(如GEV分布的位置、尺度、形状参数)回归再推算分位数。传统普通最小二乘(Ordinary Least Squares, OLS)回归假定测站间洪峰独立且记录等长,现实中往往不满足,广义最小二乘(Generalized Least Squares, GLS)可考虑测站间相关性与记录长度差异,贝叶斯广义最小二乘(Bayesian Generalized Least Squares, BGLS)进一步通过先验分布量化预测不确定性。以往澳大利亚RFFA多用Log-Pearson Type III(LP3)分布,近期研究表明广义极值(Generalized Extreme Value, GEV)分布在拟合洪水和降雨极值上更具稳健性,尤其结合L-矩法估计时抗离群性强。然而将GEV分布参数通过L-矩在BGLS框架下区域化,并系统比较PRT与QRT在固定区域和ROI两种区域化方案下的表现尚不充分。因此研究人员以新南威尔士州88个自然中小流域为对象,以GEV为理论频率分布,L-矩估计参数,BGLS建立回归关系,系统对比PRT-BGLS与QRT-BGLS在固定区域与ROI框架下的预测精度与不确定性,为无资料流域洪水估算提供方法依据。本文发表于《Water》。
二、主要关键技术方法
研究人员选取新南威尔士州88个受人为干扰小、年最大洪水(Annual Maximum Flood, AMF)记录≥25年、流域面积≤约1000 km2的自然流域为样本队列。选用流域面积(Area)、6小时1-in-2 AEP设计暴雨强度(I6,2)、年平均降雨量(Mean Annual Rainfall, MAR)、形状系数(Shape Factor, SF)、年平均蒸散发(Mean Annual Evapotranspiration, MAE)、河道密度(Stream Density, SDEN)、坡度因子(Slope Factor, S1085)及森林覆盖率(FOREST)共8个流域特征量作为预测变量,取对数并中心化处理后用于BGLS回归。各流域AMF序列用FLIKE软件基于L-矩法拟合GEV分布,得到位置参数μ、尺度参数α、形状参数κ及线性矩比LCV(τ=L-CV=L-coefficient of variation)、LSK(τ?=L-skewness)。PRT将μ(取对数)、LCV、LSK分别对流域特征做BGLS回归得区域方程,再由GEV公式推算各AEP(50%、20%、10%、5%、2%、1%)的设计洪峰;QRT则将各AEP对应的设计洪峰(取对数)直接对流域特征做BGLS回归。固定区域按新南威尔士州既有水文分区划定;ROI对每个目标站点从最近邻10个站点逐步扩大邻域,以模型误差方差(Model Error Variance, MEV)最小为准则确定最优邻域。回归系数与不确定性由BGLS给出,LCV和LSK先验取λ=24的指数分布,均值参数先验λ基于OLS残差逆方差设定。模型筛选综合MEV、伪决定系数(R2GLS)、平均预测方差(Average Variance of Prediction, AVP)、AIC、BIC及贝叶斯合理性值(Bayesian Plausibility Value, BPV)。性能用留一交叉验证(Leave-One-Out Cross Validation, LOO-CV)评估,指标含中值绝对相对误差(REr%)、均方误差(Mean Squared Error, MSE)、相对均方根误差(RRMSE%)、偏差(Bias)与相对偏差(rBIAS%)。
三、研究结果
3.1 先验信息选择与敏感性分析
研究人员对BGLS中LCV和LSK参数先验超参数λ在6至84范围内做敏感性分析,发现MEV、AVP、回归系数及推求洪峰分位数变化极小——λ=24时LSK的MEV为0.008,λ=84时降至0.006,AVP仅降约5%,确认所选λ=24合理且模型对该先验不敏感。
3.2 参数回归技术(PRT)
3.2.1 PRT-BGLS固定区域分析
通过256种预测变量组合筛选,GEV位置参数(均值)最优组合为Area+I6,2+SF+SDEN(组合213,MEV=0.253,R2GLS=82.2%),简化版Area+I6,2+SDEN(组合197)性能接近(MEV=0.250,R2GLS=78.9%)。LCV最优仅含I6,2(组合65,MEV=0.0024,R2GLS=34.78%)。LSK最优亦为I6,2(组合65,MEV=0.0079)或仅常数项。LOO验证表明固定区域PRT最佳模型对各AEP的REr%为34.05%–39.5%,RRMSE%为56.4%–62.2%。
3.2.2 PRT-BGLS影响域(ROI)
ROI框架下均值参数优选Area+I6,2+SDEN(组合197),LCV仍为I6,2,LSK依AEP不同选择:50%–5% AEP用常数项,2%–1% AEP用I6,2。各AEP的REr%为30.85%–38.9%,较固定区域降低。均值参数区域化MEV较固定区域降低34%–41%,标准误差(Standard Error of Prediction, SEP)降低25%–32%,R2GLS提升8%–13%。LCV与LSK因空间变异性低,ROI与固定区域差异小。
3.2.3 固定区域与ROI比较
相同变量组合下,ROI较固定区域显著降低REr%(如20% AEP从58.30%降至33.66%,10% AEP从54.77%降至30.85%),中频洪水RRMSE亦降低(50% AEP从91.74%降至68.62%)。均值参数ROI平均仅需约28个邻近站点(占总数32%),而LCV需约79个、LSK近全数88个,说明LCV/LSK具较低空间异质性需更多站点降采样不确定。
3.3 分位数回归技术(QRT)
3.3.1 QRT-BGLS固定区域
QRT最优预测变量组合恒为Area+I6,2(组合193),各AEP(Q2–Q100)MEV为0.307–0.343,R2GLS为65.6%–73.7%。LOO验证REr%为39.66%–62.73%,RRMSE%为57.25%–93.71%。固定区域下PRT误差普遍低于QRT,尤其中低频AEP。
3.3.2 QRT-BGLS影响域(ROI)
ROI下组合193各AEP的MEV进一步降低(Q2为0.246,Q100为0.214),SEP减小,R2GLS升高(Q5达81.8%)。REr%为31.77%–39.6%,RRMSE%与固定区域相当或略优(Q100从93.71%降至61.57%)。
3.3.3 ROI与固定区域比较及PRT vs QRT
QRT在ROI下全面优于其固定区域版本。固定区域框架PRT整体优于QRT(尤其高频AEP),ROI框架二者精度接近且QRT在极低AEP(1%、2%)略优——ROI-QRT的1% AEP REr%=39.6%、RRMSE%=61.5%,PRT-ROI分别为39%和82.6%。标准化残差Q-Q图显示两法残差近似正态,ROI使残差更集中±2倍标准差内。
四、讨论与结论翻译
讨论指出I6,2(6小时设计暴雨强度)是PRT与QRT共有重要预测因子,印证气候因子对区域洪水变异的解释力。固定区域中PRT较稳健,ROI改善两法表现且QRT在极低AEP略优,可能与GEV上尾估计不确定性和局部建模减轻异质性有关。ROI未在所有AEP降低RRMSE,但普遍降低MEV、SEP、AVP和REr%,表明预测不确定性减小。结果与已有澳洲RFFA文献吻合。研究假设AMF序列平稳,未来可拓展非平稳洪水频率分析及置信区间估算。
结论翻译如下:
本研究通过在贝叶斯广义最小二乘(BGLS)框架内基于L-矩对广义极值(GEV)分布进行区域化,评估新南威尔士州88个有测站流域各年超过概率(Annual Exceedance Probability, AEP)的设计洪峰,比较了参数回归技术(PRT)与分位数回归技术(QRT)在固定区域与影响域(ROI)方法下的表现。关键发现表明ROI框架优于传统固定区域,尤对GEV位置(均值)参数区域化显著降低模型误差方差(MEV)与预测标准误(SEP)并提升伪决定系数(R2GLS),反映ROI借由局部建模处理空间异质性之能力——LCV与LSK因固有空间变异性低,两框架差异微小。洪水设计频率分位数估算显示ROI普遍降低MEV、SEP与中值相对误差(REr%),改善整体预测表现。模型对比显示固定区域中PRT优于QRT(尤其较高AEP),而ROI实施一般改善两法表现,QRT在ROI中对极低AEP(稀有洪水事件)略优,说明方法表现具AEP依赖性。研究表明PRT适于需跨多AEP一致估计并保留概率分布结构的情形,QRT适于特定设计洪峰(尤稀有事件)精确估算;但ROI与固定区域的选择对预测性能影响可能大于PRT与QRT之取舍。本研究为无资料流域洪水估算提供ROI-BGLS框架实证支持,结果可为《Australian Rainfall and Runoff》方法及同类应用完善提供参考。局限含假定年最大洪水序列平稳性及未给出区域预测可信区间,未来可用分离样本检验、扩展全国站点、引入非平稳分析及更完善的不确定数量化。