《Canadian Journal of Forest Research》:Can forest management inventory support national forest inventory to improve the municipal-level estimation of timber volume?
编辑推荐:
针对国家森林清查(NFI)在市级小区域估算精度低,而森林管理清查(FMI)存在偏差的问题,研究者整合NFI与FMI样地,结合航拍影像点云及Sentinel-2数据,在619个合成市评估了线性与树提升(XGBoost、GPBoost)模型。结果显示FMI辅助模型未优于周边20 km缓冲区NFI模型,模型辅助估计量可解释NFI均值估计变异的66%–69%,两者结合虽有提升但边际效益不足以抵消数据协调成本。
想象一下,你是一位市长,正致力于推动城市迈向“碳中和”目标。森林作为巨大的碳库,其木材蓄积量(timber volume)直接关系到碳储量的计算。这时候,你急需精准的市级森林资源数据来做决策。然而,现实却给你泼了一盆冷水:国家森林清查(National Forest Inventory, NFI)虽然是大尺度资源监测的“金标准”,能提供无偏的统计资料,但其样地采样密度在面对较小的行政单元(如市、县)时显得捉襟见肘,导致估算精度(precision)大幅降低,像雾里看花。
那么,能不能借力呢?在许多国家(如芬兰),还有一套并行的森林管理清查(Forest Management Inventory, FMI)系统。FMI专注于林分级(stand-level)的精细管理,样地分布密集且针对性强,特别是在活跃经营的林地。听起来是个好帮手?但问题在于,FMI的样地布设并非随机概率抽样,而是偏向经营林分,这导致其统计数据在域级(domain-level)估算时存在固有偏差(biased)。
如何把NFI的“无偏”与FMI的“高密度”结合起来,在不增加过多成本的前提下,精准算出每个市的木材蓄积量?这正是Janne R?ty、Mikko Kukkonen等研究人员在《Canadian Journal of Forest Research》上发表的一项研究的核心动机。他们试图回答:能否利用模型辅助估计(model-assisted estimation)框架,整合NFI和FMI的样地数据,结合遥感辅助信息,来高效且精准地实现市级木材蓄积量的估算?
为了揭开这个谜题,研究团队在芬兰中部约156万公顷的区域内,开展了一系列精密的模拟与实证评估。他们利用了2019-2023年间的第13次芬兰NFI数据(3651个样地)和同期芬兰森林中心公开的FMI数据(3151个样地)。在遥感辅助数据方面,研究采用了国家土地测量局(NLS)的航空影像生成的摄影测量点云(photogrammetric point clouds),以及哨兵2号(Sentinel-2)多光谱卫星影像(包括B2-B8A等波段)。为了模拟真实的行政划分,他们通过区域生长算法(region-growing procedure)生成了911个合成市(最终筛选619个,平均面积983 km2)。
在技术路线上,研究人员提取了固定的9个预测变量(如点云高度标准差zsd、95%分位数z95、不同高度比例p1.3、p5.0、p15.0,以及Sentinel-2波段s2b10、s2b2、s2b3、s2b8A)。他们构建了多种辅助模型(assisting models):包括普通最小二乘线性回归(LM)、线性混合效应模型(LME,引入市作为随机截距)、以及机器学习算法极端梯度提升(XGBoost)和集成随机效应的GPBoost。这些模型分别基于纯NFI样地(取自目标市周围20 km缓冲区)、纯FMI样地(本地或全局)以及两者结合的数据进行拟合。随后,利用模型辅助的差值估计量(difference estimator),结合NFI独立样地残差进行市级均值估计,并采用Grafstr?m–Schelin方差估计量考虑空间自相关,最终通过相对效率(Relative Efficiency, RE)和置信区间(CI)评估性能。
Efficiency gains of multiple regression models(多元回归模型的效率增益)
通过线性回归模型(LM)的评估发现,引入辅助模型显著提升了估算效率。单纯扩展估计量(EXP)的平均方差为110.82 (m3/ha)2,而表现最好的LMNFI,loc(使用市周边20 km缓冲区内NFI样地拟合)将平均方差降至41.34 (m3/ha)2。模型辅助估计量整体解释了基于NFI野外数据均值估计变异的66%–69%。值得注意的是,即便不使用市内样地拟合,仅用周边NFI样地就已超越了使用市内FMI样地拟合的本地模型(LMFMI,loc)。
Efficiency gains of tree-boosting models(树提升模型的效率增益)
将线性模型与树提升模型(XGBoost和GPBoost)对比后发现,虽然在部分市镇中树提升模型改善了精度,且其最大平均效率增益体现在混合效应模型(LMEFMI,mevs GPBFMI,me)的比较中,但树提升模型的总体方差估计值仍高于表现最佳的线性模型。这表明在当前变量集和设置下,复杂的机器学习算法并未带来颠覆性的精度超越。
Feature importance(特征重要性)
对XGBoost模型的特征重要性(Gain指标)排序显示,摄影测量点云衍生的高度指标z95(95%高度分位数)和p15.0(高于15.0 m的点比例)稳居前两位,且不受市均蓄积量等级或模型变体影响。在96–125 m3/ha等级中,这两者占据前两名的比例超过80%,而在154–183 m3/ha等级中降至49%–50%。这说明高度结构信息比光谱信息在蓄积量建模中更为关键,但次要特征的排名随区域有所变化。
Agreement between model-based estimates and design-based confidence intervals(基于模型的估计与设计型置信区间的一致性)
研究发现,使用FMI样地拟合的辅助模型,其调整项(adjustment term,即模型残差均值)偏离零的幅度大于NFI样地模型,这反映了FMI非概率采样的偏差特性。纯基于模型的预估(pixel-counting estimates,即仅用辅助模型预测值聚合)落在模型辅助估计95%置信区间内的比例为77%–87%。其中,使用全局FMI或NFI+FMI组合数据的模型一致性最高(>86%),而线性混合效应模型(LME)最低,再次印证了在相对同质的林区,复杂随机效应结构未必带来更好校准。
在讨论与结论部分,研究明确指出:模型辅助框架结合遥感数据(相对效率RE 2.9–3.2)能有效弥补NFI在小区域的精度短板。然而,试图通过加入FMI样地来“本地化”辅助模型并未显著提高效率,这可能是由于研究区域森林结构的同质性,以及合成市镇并未体现真实行政边界下的经营制度差异。最关键的一点是:虽然同时利用NFI和FMI样地拟合模型能获得少许精度提升,但鉴于FMI样地存在采样偏差,且将两套不同协议、不同目标的清查数据(NFI侧重所有森林类型的概率抽样,FMI侧重经营林分的目的人工布点)进行协调(harmonize)需要大量额外工作,其边际精度的提升完全不足以justify(证明……是值得的)这些成本与努力。
这项研究的意义在于,它为林业统计学家和林业管理部门提供了一个非常务实的参考:在利用遥感辅助信息进行小区域估计时,不必过度追求多源数据的复杂整合,巧妙地利用核心概率抽样数据(NFI)周边的信息,或许才是性价比最高的路径。