《Frontiers in Climate》:Evaluation of scale-free climate data in comparison to widely used gridded data
编辑推荐:
摘要:准确的气候数据是基于生态建模与森林经营管理以适应气候变化的基础。格网化气候数据集往往难以捕捉局地气候变异性,尤其在地形复杂区域。本研究比较了两种开放数据源:广泛使用的格网化数据集WorldClim,与首次可生成点位特异性(point-specific)气
摘要:准确的气候数据是基于生态建模与森林经营管理以适应气候变化的基础。格网化气候数据集往往难以捕捉局地气候变异性,尤其在地形复杂区域。本研究比较了两种开放数据源:广泛使用的格网化数据集WorldClim,与首次可生成点位特异性(point-specific)气候信息的无尺度(scale-free)数据集ClimateAP。研究人员通过将二者输出结果与中国大陆2340个气象站1961—1990年观测值进行对比来评估其表现。分析表明,ClimateAP在温度与降水变量上均产生更高的调整后判定系数(adjusted R2>0.90)、更低的平均绝对误差(MAE)及更高的回归系数(regression coefficient, β?)。这些改进在复杂地形区及夏季最为显著,ClimateAP预测精度较WorldClim最高提升约15%。研究人员还应用ClimateAP数据,采用随机森林(Random Forest, RF)算法构建杉木(Cunninghamia lanceolata)与马尾松(Pinus massoniana)的气候生态位模型(Climatic Niche Model)。基于ClimateAP数据的模型表现更优,袋外误差率(Out-of-Bag error rate, OOB)更低——杉木为17.70%对19.23%,马尾松为15.67%对17.89%。本研究为生态分析中开放气候数据源的选择提供了定量依据。
论文解读:《Evaluation of scale-free climate data in comparison to widely used gridded data》发表于《Frontiers in Climate》
一、研究背景与目的
气候数据对开发生态模型、评估气候变化对森林生态系统及树种的影响,以及制定减缓和适应气候变化的林业资源管理策略至关重要。气候生态位模型(Climatic Niche Models, CNM)广泛用于评价气候变化对树种及森林生态系统的影响并在未来情景下投影适宜生境。然而生态模型的准确性与可信度高度依赖于所用气候数据的精度。当前常用的全球气候数据集如WorldClim、PRISM、CRU、Daymet、ERA5及北美的ClimateNA多为格网化(gridded)数据,部分仅限北美地区可用。格网化气候数据通常提供格网平均值而非特定点位值,在山区等地形复杂区域,由于海拔、坡向、坡度急剧变化导致同一格网内气候差异显著,格网平均值无法准确代表局地实际条件,从而损害生态建模精度。亚太(Asia-Pacific, AP)地区高质量气候数据稀缺且质量偏低,限制了该地区物种及生态系统气候变化影响评估的准确性。为填补此空白,ClimateAP于2017年开发,应用动态局地下调算(dynamic local downscaling algorithm)生成适用于生态模型(尤指林业)的无尺度(scale-free)点位气候变量,但目前应用仍较少,亚太地区多数研究仍依赖WorldClim。此前尚无研究在中国或亚太地区系统比较ClimateAP无尺度数据与WorldClim格网化数据在生物相关气候变量上的表现。因此,研究人员以中国大陆2340个气象站1961—1990年观测值为基准,系统比较ClimateAP与WorldClim在气候变量预测精度及基于此构建的树种生态位模型表现上的差异,验证三个假设:(1)ClimateAP在点位上产出的数据比常规格网数据源(WorldClim)更准确;(2)在复杂地形区ClimateAP相对30角秒(30″)格网数据的精度提升尤为显著;(3)基于ClimateAP数据构建的生态位模型整体质量优于基于WorldClim数据的模型。
二、主要技术方法概述
研究人员收集了中国2340个气象站(1961—1990年,剔除记录不足10年者)的温度与降水月均值作为观测基准。利用ClimateAP v3.1依据站点经纬度及海拔生成同期30年气候正常值(1961—1990 Normal Period)及逐月时间序列气候数据(无尺度数据);同时依站点坐标提取WorldClim 1.4(30″气候正常值)与WorldClim 2.1(2.5′逐月时序)对应数据(格网化数据)。为检验地形效应,依标准化地形位置指数(Topographic Position Index, TPI)将站点划分为平原(plain)与复杂地形(complex terrain)两类。以普通最小二乘回归(Ordinary Least Squares, OLS)将观测值对两数据源预测值回归,比较调整后判定系数(adjusted R2)、平均绝对误差(Mean Absolute Error, MAE)及回归斜率估计值(β?)。选用杉木(Cunninghamia lanceolata,2906个出现点)与马尾松(Pinus massoniana,16020个出现点)及伪不存在点(pseudo-absence),分别用两数据源30年均值气候变量构建随机森林(Random Forest, RF)气候生态位模型,以袋外误差率(Out-of-Bag error rate, OOB)、受试者工作特征曲线下面积(Area Under the ROC Curve, AUC–ROC)、Kappa统计量、精确度(Precision)及召回率(Recall)评估模型性能。
三、研究结果
3.1 The accuracy of ClimateAP vs. WorldClim(ClimateAP与WorldClim精度比较)
通过对2340个站点1961—1990年30年气候正常值及逐年逐月数据进行OLS回归分析发现:ClimateAP所有变量adjusted R2均>0.95(降水均值0.9805±0.0144,最高温Tmax0.9670±0.0167,最低温Tmin0.9845±0.0043),高于WorldClim(降水0.9078±0.0485,Tmax0.9659±0.0182,Tmin0.9786±0.0060)。ClimateAP各月变量MAE显著低于WorldClim——降水均值3.13±2.02 mm vs. 8.88±5.33 mm;Tmax0.486±0.024℃ vs. 0.587±0.048℃;Tmin0.495±0.065℃ vs. 0.672±0.105℃。回归斜率β? ClimateAP整体更接近1。季节分析显示凉季(11—5月降水,11—3月气温)两数据源精度均较高,但ClimateAP优势在夏季最明显,如7月降水ClimateAP adjusted R2≈0.95、MAE=6.42 mm,WorldClim相应为≈0.81、18.27 mm。逐年逐月回归结果趋势一致,ClimateAP全面优于WorldClim。假设1得证。
3.2 Prediction accuracy by landform(按地貌类型的预测精度)
依TPI将站点分为平原与复杂地形后分别回归:在复杂地形区,ClimateAP较WorldClim平均adjusted R2提升约——Tmax+3%、Tmin+2.5%、降水+9%;MAE降低——温度降40—60%、降水降58—72%;β?全年在±2%单位内,WorldClim偏差可达8%。在平原区,ClimateAP对Tmin及降水MAE仍低于WorldClim(降水MAE低48—68%),但对Tmax(尤其4—8月)WorldClim略优,其余指标混合。假设2得证——ClimateAP在复杂地形中精度提升尤为显著。
3.3 Climate niche model for tree species(树种气候生态位模型)
分别以ClimateAP与WorldClim气候变量构建杉木与马尾松RF模型:杉木ClimateAP模型OOB误差17.70%(WorldClim 19.23%),不存在点误判率21.16% vs. 22.76%,存在点误判率13.89% vs. 15.55%,AUC–ROC 0.8967 vs. 0.8836,Kappa 0.6220 vs. 0.6105,精确度0.8394 vs. 0.8289,召回率相当(0.78);马尾松ClimateAP模型OOB 15.67%(WorldClim 17.89%),AUC–ROC 0.9045 vs. 0.9033,Kappa 0.6558 vs. 0.6487,精确度0.8694 vs. 0.8607。基于ClimateAP的模型各项指标均不劣于且多数优于WorldClim模型。假设3得证。
四、讨论与结论总结
讨论指出,本研究首次在中国地区评估了ClimateAP无尺度气候数据与广泛使用的WorldClim格网数据对比情况,三个假设均获支持。ClimateAP整体优于WorldClim归因于其动态局地下调算可依据邻近格网通过OLS估算局地递减率(lapse rate),生成点位特异性(scale-free)估值而非格网均值,使其在地形复杂区能更好捕捉微气候变异;其降水预测优势还得益于PRISM(Parameter-elevation Relationships on Independent Slopes Model)高质量基线降水数据。平原区由于地形均一,格网插值本身表现尚可,故ClimateAP优势减弱甚至个别月份Tmax略逊。ClimateAP虽使用较低分辨率基线(2.5′)仍超越最高分辨率(30″)WorldClim,暗示若纳入更高分辨率基线可进一步提升。研究局限含部分气象站可能参与过WorldClim或PRISM构建致精度略有高估,但相对比较结论不受影响;另点数据与格网数据本身性质差异使精度提升来源难完全分离。选用杉木与马尾松具经济重要性且数据充足,不同物种敏感性待进一步探究。
结论(翻译浓缩): 本研究为中国地区生态建模中ClimateAP无尺度气候数据相较WorldClim格网数据的准确性与实用性提供了有力证据。通过与气象站观测值及WorldClim系统比较证明,ClimateAP在评估的所有月份与年份均产出高精度温湿估值,此优势在地形复杂区尤为突出,凸显其下调算捕捉格网平均值常遗漏的精细气候变异之价值。此外,ClimateAP更精确的气候数据转化为对物种分布更佳的预测力——两代表性树种基于ClimateAP预测因子的生态位模型较基于WorldClim者具更低误差率与更高精度指标。这表明ClimateAP有潜力提升亚太地区生态评估及气候变化影响预测的质量与可靠性,本研究也为亚太地区气候数据源选择提供了实证支持。