森林管理清查（FMI）能否助力国家森林清查（NFI）提升市级木材蓄积量估算精度？——基于模型辅助估计框架的整合评估

《Canadian Journal of Forest Research》：Can forest management inventory support national forest inventory to improve the municipal-level estimation of timber volume?

【字体：大中小】 时间：2026年04月28日 来源：Canadian Journal of Forest Research 1.5

编辑推荐：

　　针对国家森林清查（NFI）在市级小区域估算精度低，而森林管理清查（FMI）存在偏差的问题，研究者整合NFI与FMI样地，结合航拍影像点云及Sentinel-2数据，在619个合成市评估了线性与树提升（XGBoost、GPBoost）模型。结果显示FMI辅助模型未优于周边20 km缓冲区NFI模型，模型辅助估计量可解释NFI均值估计变异的66%–69%，两者结合虽有提升但边际效益不足以抵消数据协调成本。

想象一下，你是一位市长，正致力于推动城市迈向“碳中和”目标。森林作为巨大的碳库，其木材蓄积量（timber volume）直接关系到碳储量的计算。这时候，你急需精准的市级森林资源数据来做决策。然而，现实却给你泼了一盆冷水：国家森林清查（National Forest Inventory, NFI）虽然是大尺度资源监测的“金标准”，能提供无偏的统计资料，但其样地采样密度在面对较小的行政单元（如市、县）时显得捉襟见肘，导致估算精度（precision）大幅降低，像雾里看花。

那么，能不能借力呢？在许多国家（如芬兰），还有一套并行的森林管理清查（Forest Management Inventory, FMI）系统。FMI专注于林分级（stand-level）的精细管理，样地分布密集且针对性强，特别是在活跃经营的林地。听起来是个好帮手？但问题在于，FMI的样地布设并非随机概率抽样，而是偏向经营林分，这导致其统计数据在域级（domain-level）估算时存在固有偏差（biased）。

如何把NFI的“无偏”与FMI的“高密度”结合起来，在不增加过多成本的前提下，精准算出每个市的木材蓄积量？这正是Janne R?ty、Mikko Kukkonen等研究人员在《Canadian Journal of Forest Research》上发表的一项研究的核心动机。他们试图回答：能否利用模型辅助估计（model-assisted estimation）框架，整合NFI和FMI的样地数据，结合遥感辅助信息，来高效且精准地实现市级木材蓄积量的估算？

为了揭开这个谜题，研究团队在芬兰中部约156万公顷的区域内，开展了一系列精密的模拟与实证评估。他们利用了2019-2023年间的第13次芬兰NFI数据（3651个样地）和同期芬兰森林中心公开的FMI数据（3151个样地）。在遥感辅助数据方面，研究采用了国家土地测量局（NLS）的航空影像生成的摄影测量点云（photogrammetric point clouds），以及哨兵2号（Sentinel-2）多光谱卫星影像（包括B2-B8A等波段）。为了模拟真实的行政划分，他们通过区域生长算法（region-growing procedure）生成了911个合成市（最终筛选619个，平均面积983 km2）。

在技术路线上，研究人员提取了固定的9个预测变量（如点云高度标准差zsd、95%分位数z95、不同高度比例p1.3、p5.0、p15.0，以及Sentinel-2波段s2b10、s2b2、s2b3、s2b8A）。他们构建了多种辅助模型（assisting models）：包括普通最小二乘线性回归（LM）、线性混合效应模型（LME，引入市作为随机截距）、以及机器学习算法极端梯度提升（XGBoost）和集成随机效应的GPBoost。这些模型分别基于纯NFI样地（取自目标市周围20 km缓冲区）、纯FMI样地（本地或全局）以及两者结合的数据进行拟合。随后，利用模型辅助的差值估计量（difference estimator），结合NFI独立样地残差进行市级均值估计，并采用Grafstr?m–Schelin方差估计量考虑空间自相关，最终通过相对效率（Relative Efficiency, RE）和置信区间（CI）评估性能。

Efficiency gains of multiple regression models（多元回归模型的效率增益）

通过线性回归模型（LM）的评估发现，引入辅助模型显著提升了估算效率。单纯扩展估计量（EXP）的平均方差为110.82 (m3/ha)2，而表现最好的LM_NFI,loc（使用市周边20 km缓冲区内NFI样地拟合）将平均方差降至41.34 (m3/ha)2。模型辅助估计量整体解释了基于NFI野外数据均值估计变异的66%–69%。值得注意的是，即便不使用市内样地拟合，仅用周边NFI样地就已超越了使用市内FMI样地拟合的本地模型（LM_FMI,loc）。

Efficiency gains of tree-boosting models（树提升模型的效率增益）

将线性模型与树提升模型（XGBoost和GPBoost）对比后发现，虽然在部分市镇中树提升模型改善了精度，且其最大平均效率增益体现在混合效应模型（LME_FMI,mevs GPB_FMI,me）的比较中，但树提升模型的总体方差估计值仍高于表现最佳的线性模型。这表明在当前变量集和设置下，复杂的机器学习算法并未带来颠覆性的精度超越。

Feature importance（特征重要性）

对XGBoost模型的特征重要性（Gain指标）排序显示，摄影测量点云衍生的高度指标z95（95%高度分位数）和p15.0（高于15.0 m的点比例）稳居前两位，且不受市均蓄积量等级或模型变体影响。在96–125 m3/ha等级中，这两者占据前两名的比例超过80%，而在154–183 m3/ha等级中降至49%–50%。这说明高度结构信息比光谱信息在蓄积量建模中更为关键，但次要特征的排名随区域有所变化。

Agreement between model-based estimates and design-based confidence intervals（基于模型的估计与设计型置信区间的一致性）

研究发现，使用FMI样地拟合的辅助模型，其调整项（adjustment term，即模型残差均值）偏离零的幅度大于NFI样地模型，这反映了FMI非概率采样的偏差特性。纯基于模型的预估（pixel-counting estimates，即仅用辅助模型预测值聚合）落在模型辅助估计95%置信区间内的比例为77%–87%。其中，使用全局FMI或NFI+FMI组合数据的模型一致性最高（>86%），而线性混合效应模型（LME）最低，再次印证了在相对同质的林区，复杂随机效应结构未必带来更好校准。

在讨论与结论部分，研究明确指出：模型辅助框架结合遥感数据（相对效率RE 2.9–3.2）能有效弥补NFI在小区域的精度短板。然而，试图通过加入FMI样地来“本地化”辅助模型并未显著提高效率，这可能是由于研究区域森林结构的同质性，以及合成市镇并未体现真实行政边界下的经营制度差异。最关键的一点是：虽然同时利用NFI和FMI样地拟合模型能获得少许精度提升，但鉴于FMI样地存在采样偏差，且将两套不同协议、不同目标的清查数据（NFI侧重所有森林类型的概率抽样，FMI侧重经营林分的目的人工布点）进行协调（harmonize）需要大量额外工作，其边际精度的提升完全不足以justify（证明……是值得的）这些成本与努力。

这项研究的意义在于，它为林业统计学家和林业管理部门提供了一个非常务实的参考：在利用遥感辅助信息进行小区域估计时，不必过度追求多源数据的复杂整合，巧妙地利用核心概率抽样数据（NFI）周边的信息，或许才是性价比最高的路径。

热点排行