《Environmental Modelling & Software》:Optimizing canopy cover evaluation: A machine learning approach using LiDAR data
编辑推荐:
本研究提出一种基于LiDAR数据和机器学习的AI-CanopyMapper框架,通过优化特征工程和并行计算提升植被覆盖预测效率,在加泰罗尼亚地区测试中MAE达6.47%且R2为0.88,相较传统方法显著降低数据需求并实现快速预测。
Pau Ventura | Carles Carrillo | Alejandro Donaire | Eric Sánchez
巴塞罗那自治大学计算机架构与操作系统系,西班牙巴塞罗那
摘要
本文介绍了一个综合框架,该框架利用LiDAR数据和机器学习技术来预测多种生物物理变量。该框架在树冠覆盖度(Canopy Cover)方面进行了明确测试。该方法结合了优化的特征工程、特征选择和可扩展的并行处理,以确保准确性和计算效率。研究表明,AI-CanopyMapper在准确预测树冠覆盖度方面表现出色。完整模型的平均绝对误差(MAE)为6.47%,为0.88。相比之下,仅使用1.3%的可用数据训练的部分模型达到了约15%的MAE,显示出即使在数据有限的情况下也具有很强的泛化能力。这些结果证实,与传统方法相比,AI-CanopyMapper提供了一个快速、可扩展且数据效率高的框架,凸显了其在森林管理和环境监测中的潜在应用。
引言
生物物理变量是量化自然环境不同方面的基本指标。它们包括一系列参数,用于表征生态系统的物理和生物特性。这些变量包括但不限于植被指数、土壤湿度、地表温度和树冠结构(Verrelst等人,2019年)。准确预测和分析生物物理变量对许多社会和环境问题具有重要意义。例如,了解植被动态对于评估碳封存率、识别易发生野火的区域以及可持续管理自然资源至关重要。
在这些变量中,树冠覆盖度(Canopy Cover,CC)是评估植被结构和森林健康的关键指标。CC定义为树冠占据的面积百分比,用于测量树木叶子的密度。这一参数广泛应用于各种环境和生态学应用中,包括森林管理、空气污染缓解、碳储存估算和野火风险评估(Freeman等人,2016年)。尽管其重要性不言而喻,但目前尚无标准化的测量方法。相反,人们使用多种基于地面的技术进行估算。基于地面的方法通常包括目视估计、球形密度计、半球摄影、点计数和线截距法(Fiala等人,2006年)。然而,由于方法差异、观察者主观性和空间限制,这些方法往往会产生不同的结果。
为了克服这些挑战,遥感技术已成为在大范围内更准确地估算树冠覆盖度的有效工具。特别是LiDAR(光检测和测距)技术已成为评估树冠结构的常用方法,能够提供高分辨率的三维树冠结构和分布信息(Nelson等人,2005年)。LiDAR通过向地面发射激光脉冲并测量反射信号返回所需的时间来工作,从而生成高分辨率的三维点云,捕捉该区域的结构特征。这项技术在测量植被结构方面非常有效,尤其是在森林地区(Almeida等人,2019年)。它能够穿透茂密的植被,提供准确的三维树木高度、密度和分布数据。
存在多种处理LiDAR数据的工具,例如Forest Tools R包,可用于检测树顶并构建树冠高度模型(Plowright,2017年),以及Tiffs:Lidar数据过滤和森林研究工具箱,它提供了生成DEM(数字高程模型)、数字表面模型和树冠高度模型的综合功能(Chen,2007年)。然而,目前依赖于LiDAR数据生成树冠覆盖度地图的方法涉及大量的预处理、不准确的假设、手动校准和计算密集型方法。例如,以往的研究集中在依赖昂贵的LiDAR预处理(USGS,2024年)、基于高度的阈值(Narine等人,2023年;Saleh等人,2021年;Posilero等人,2016年;Peter等人,2021年)、特定物种的异速生长方程(加泰罗尼亚制图与地理研究所,2023年),或聚合未优化指标的机器学习模型(Narine等人,2019年)的方法上,每种方法都有其固有的局限性。此外,许多研究还整合了额外的数据,如多光谱影像(Parmehr等人,2016年)、卫星数据(Saleh等人,2021年)或数字半球摄影(Posilero等人,2016年)以提高精度,但这会增加处理时间和复杂性。这最终导致必须在快速但不准确的树冠覆盖度估计与花费5到6年构建精确估计之间做出选择,而由于持续的景观变化(包括季节性变化和环境干扰),数据可能会变得过时。这在该领域是一个持续的挑战:在估算树冠覆盖度的速度和准确性之间找到平衡。
本研究提出了一种新的方法,该方法利用智能算法处理LiDAR数据,高效计算树冠覆盖度并快速准确地生成CC地图。我们的方法整合了一个机器学习模型,可以快速准确地生成预测结果,并在整个流程中实现并行化。通过最小化预处理要求并消除对复杂指标或额外数据的需求,我们的方法显著加快了树冠覆盖度绘图过程,同时保持了高精度水平。这种可扩展的解决方案适用于城市和森林环境,解决了现有方法的关键局限性,实现了高效和及时的树冠覆盖度估算。
研究区域
本研究聚焦于位于西班牙东北部的加泰罗尼亚地区,该地区拥有多样化的景观和植被类型。其地理复杂性体现在高山脉、沿海地区、广阔的森林、开阔的草地、城市中心和农村定居点等方面,为环境分析提供了宝贵的机会。这种异质性为通过整合LiDAR数据来建模生物物理变量(如树冠覆盖度)提供了独特的机会。
预处理
在将数据输入模型之前,进行全面的预处理步骤至关重要,以确保效率、可靠性和可解释性。在我们的方法中,预处理不仅仅是一个准备步骤,而是使我们方法区别于现有研究的关键所在。一个关键的创新在于我们对LiDAR瓦片的优化高度估算,这一过程传统上计算成本较高。通过改进这一过程,我们显著降低了其对
实验研究和结果
本节详细评估了AI-CanopyMapper利用LiDAR数据估算加泰罗尼亚地区树冠覆盖度的能力。分析分为两个互补的部分。第一部分是误差分析,用于评估模型在训练和测试数据集上的数值表现。该评估仅关注完整模型,探讨了误差的空间分布和幅度,识别了模型的优势
结论
树冠覆盖度估算在森林监测和管理中是一个关键方面,为了解生态系统健康、生物多样性和碳储存提供了重要信息。LiDAR数据已成为评估森林结构的强大工具,提供了高分辨率的三维植被信息。然而,由于复杂的数据审查过程、庞大的数据量和复杂性,从LiDAR数据中提取准确的树冠覆盖度值具有挑战性
CRediT作者贡献声明
Pau Ventura:撰写——原始草稿、软件开发、方法论、概念构思。Carles Carrillo:撰写——原始草稿、监督、概念构思。Alejandro Donaire:撰写——原始草稿、方法论、概念构思。Eric Sánchez:撰写——原始草稿、方法论、概念构思。
软件可用性
• 软件名称:GFire-CC-prediction
• 开发者:Pau Ventura和Carles Carrillo
• 联系方式:pau.venturar@autonoma.cat和carles.carrillo@uab.cat
• 首次可用日期:2025年4月5日
• 成本:免费
• 程序语言:Python。所有所需的包都可以在github的env/packages.txt文件中找到。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
我们衷心感谢加泰罗尼亚制图与地理研究所(ICGC)为我们的研究项目提供的重要数据和合作。ICGC致力于推进科学知识的承诺备受赞赏,我们承认他们在丰富研究结果方面发挥了关键作用。