《Water》:Statistical Evaluation of Observed Precipitation from INMET Meteorological Stations and MERGE Estimates in the Eastern Amazon
Priscila da S. Batista,
Júlio T. da Silva,
Ana Carla dos S. Gomes,
Jéssica A. de J. Corrêa,
Gabriel Brito Costa,
Ant?nio Marcos D. de Andrade,
Carlos T. S. Dias,
Leila S. S. Lisboa and
Lucietta Guerreiro Martorano
编辑推荐:
本文聚焦于亚马逊地区降水观测网络稀疏且分布不均的问题,该问题严重影响了对水文过程的理解及水资源管理。为应对此挑战,研究人员评估了由CPTEC/INPE开发的MERGE(卫星与雨量计数据融合)降水数据集在亚马逊东部的性能。研究将五个INMET气象站20年(1998-2017年)的日降水数据与MERGE估算值进行比较,采用了包括相关性、回归、误差度量、效率指数和聚类分析在内的多指标统计框架。结果显示,观测值与估算值之间具有高度一致性,皮尔逊相关系数介于0.94至0.99之间,纳什-舒特克利夫效率(NSE)在0.87至0.97之间。研究表明,MERGE数据集能有效捕捉亚马逊东部的降水量级和时空变异性,为观测资料稀缺区域的降水监测和水文气候分析提供了可靠的数据支撑。
降水,这个地球上水循环的“心脏”,其准确数据对于理解气候、管理水资源、保护生态环境至关重要,尤其是在地球之肺——亚马逊雨林。然而,这片广袤而偏远的区域,却面临着气象观测站(INMET)稀疏且分布不均的尴尬境地,就像在一张巨大的地图上只点缀了零星几个测量点,难以捕捉到降水“风云变幻”的全貌。地面观测站的建设与维护成本高昂,导致数据存在大片空白,严重制约了该地区的水文与气候研究。幸运的是,随着卫星遥感技术的发展,科学家们找到了“从天空看雨”的新方法。由巴西国家空间研究院(INPE)所属的气候预测与气候研究中心(CPTEC)开发的MERGE数据集,应运而生。它将卫星估算的降水数据与地面雨量计的实测数据相融合,旨在生成更准确、空间覆盖更完整的降水信息。但一个关键问题随之而来:在降水机制极为复杂、以强对流性降雨为主的亚马逊东部地区,MERGE这套“天地结合”的数据,究竟能在多大程度上反映真实的降水情况?其表现是否可靠到足以支持该地区的水文气候分析和环境规划?这正是本文研究者们试图回答的核心问题。
为了解开这个谜题,研究团队在巴西亚马逊东部的帕拉州西部地区,精心选取了五个巴西国家气象局(INMET)的气象站作为“地面真相”的参考。这五个站点(贝尔特拉、蒙特阿莱格里、莫兹港、阿尔塔米拉、伊塔伊图巴)分布在两个不同的中尺度区域,能够代表区域内的不同降水条件。研究的时间跨度长达20年(1998-2017年),确保了分析能够涵盖气候的自然年际波动。核心数据源便是MERGE数据集,其日降水量数据具有约0.25°(约20公里)的空间分辨率。研究采用“像元到点”的验证方法,即将每个气象站点所在网格单元的MERGE估算值,与该站点的实际观测值进行一一对比。面对观测序列中不可避免的少量缺失数据,研究采用了均值填补法进行处理,以保持时间序列的连续性。在具体分析方法上,研究者构建了一个多指标的统计验证框架,可谓“十八般武艺齐上阵”。首先,通过描述性统计(如均值、标准差、偏度、峰度)来刻画降水的基本分布特征。接着,运用皮尔逊相关系数(Pearson correlation)和决定系数(R2)来评估两者之间的线性关系强度和MERGE对观测方差的解释能力。为了衡量估算的误差和性能,研究计算了偏差(Bias)、均方根误差(RMSE)、平均绝对误差(MAE)以及纳什-舒特克利夫效率系数(Nash–Sutcliffe efficiency, NSE)、威尔莫特一致性指数(Willmott concordance index, d)及其改进版(dr)等一系列指标。此外,研究还通过箱线图(Boxplot)分析比较了月降水量的分布,并利用基于相关距离的层次聚类(Hierarchical clustering)方法,来探究观测序列与估算序列在时间结构上的相似性。这些严谨而全面的方法,共同构成了评估MERGE在复杂地区表现的科学基石。
3. 结果
3.1 描述性统计与整体一致性
对观测降水数据的分析显示,所有站点的降水分布均呈正偏态,且具有负峰度值,这反映了亚马逊东部地区降水以中低值为主、但伴有偶发高强度事件的典型特征,也印证了该地区以对流性降水系统为主的特点。总体统计结果表明,INMET气象站观测降水与MERGE估算值之间具有高度一致性。皮尔逊相关系数介于0.94至0.99之间,且全部具有统计显著性。纳什-舒特克利夫效率(NSE)值在0.87至0.97之间,威尔莫特指数也接近1,这些都表明MERGE数据集具有极高的预测性能和一致性。偏差分析显示,MERGE在所有站点均存在系统性的低估,但其幅度相对于区域降水整体变率而言较小。误差指标显示,平均绝对误差(MAE)一般低于30毫米,均方根误差(RMSE)低于约60毫米。
3.2 回归与相关性分析
回归分析进一步证实了这种强关联。决定系数(R2)范围从阿尔塔米拉站的0.8876到贝尔特拉站的0.9786,意味着MERGE能够解释观测降水89%至98%的方差。其中,贝尔特拉站和蒙特阿莱格里站的一致性最高。阿尔塔米拉站的决定系数相对较低,且散点图显示其数据点,特别是降水量高于300毫米时,离散度最大,表明MERGE在该站点的估算与观测值之间存在较大变异性。尽管如此,从整体散点图看,大部分数据点紧密聚集在1:1参考线附近,强有力地证明了观测值与估算值之间的广泛一致性。月度相关性分析也显示,各站点的月相关系数在全年大部分时间都保持在0.85以上的高水平。
3.3 年际变率与序列相似性
对年降水总量的分析表明,观测值与MERGE估算值在各站点间均呈现强相关性,相关系数矩阵图直观地展示了这一点。贝尔特拉和蒙特阿莱格里站的年际变率一致性最高。层次聚类分析的结果更具启发性:对于每一个气象站,其观测降水序列与对应的MERGE估算序列都在聚类树状图中形成了紧密的“配对簇”,这表明MERGE数据集很好地保留了观测降水序列的时间结构。此外,聚类还揭示了站点之间的区域相似性,例如贝尔特拉与蒙特阿莱格里、伊塔伊图巴与莫兹港分别聚为相近的组。
3.4 月分布特征
月降水量箱线图对比清晰展示了所有站点的降水季节性格局:高值集中在1月至5月,低值出现在7月至10月。MERGE估算值紧密跟随观测值的季节循环,其中位数和四分位距都非常接近。差异在降水量较高的月份更为明显,MERGE倾向于低估较高的降水值和极端事件,这一现象在阿尔塔米拉和莫兹港站尤为突出。尽管如此,MERGE数据集始终如一地再现了所有站点降水的集中趋势和整体变异性。
本文的研究结论明确指出,MERGE数据集为亚马逊东部地区的降水变异性提供了稳健且一致的表征。综合各项统计指标,MERGE有效地捕捉了降水的季节性模式,并再现了降雨的时空变率和量级。研究证实,这种融合了卫星与地面观测的数据产品,能够可靠地表征观测网络稀疏地区的降水动态。
在讨论中,作者深入分析了MERGE表现优异及存在局限的原因。高度的统计一致性证明了多卫星降水产品在捕捉热带环境下降水时空变率方面的能力。然而,站点间的差异也凸显了亚马逊流域降水模式强烈的空间异质性。阿尔塔米拉站出现的较大离散度,可能源于局地对流降水变率的影响,这类发生在卫星网格尺度以下的强对流事件,是目前网格化降水产品普遍面临的挑战。月度相关分析显示,在深对流活动加剧的雨季,相关系数有所降低,这同样与卫星算法在捕捉小尺度强降水事件方面的局限有关。此外,“点”(雨量计)与“面”(卫星网格)的空间尺度不匹配,也是导致差异的一个固有因素。
尽管存在对高值降水,特别是对流性极端事件的低估倾向,但MERGE的整体性能依然稳健。该研究的重要意义在于,它确证了像MERGE这样的融合数据产品,可以作为水文监测、气候分析和环境规划领域可靠的工具,尤其是在像亚马逊这样观测覆盖有限、降水变率高的关键区域。这为改善区域水资源管理、农业规划以及增强对气候变化的应对韧性,提供了至关重要的数据基础。