《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》:Benchmarking individual tree segmentation using multispectral airborne laser scanning data: The FGI-EMIT dataset
编辑推荐:
为填补现有大规模、多光谱激光雷达(LiDAR)点云基准数据集的空白,芬兰地理空间研究所的研究人员构建了首个面向个体树分割(ITS)的大型多光谱机载激光扫描(ALS)数据集FGI-EMIT。该研究在包含1561棵人工标注树木的多样化北方针叶林环境中,对四种传统无监督算法和四种深度学习(DL)模型进行了全面性能评估,结果表明ForestFormer3D模型取得了最佳性能(F1-score 73.3%),尤其是在低矮林下层树木的分割中优势显著。该研究为未来算法的开发和对比提供了高质量、多光谱的基准数据支持。
在林业遥感领域,准确、高效地识别和勾勒出森林中的每一棵树木——即“个体树分割(ITS)”,是进行森林资源清查、碳监测、生物多样性评估等诸多重要应用的基础。传统的ITS主要依赖无监督的几何算法,近年来,随着深度学习(DL)的快速发展,研究者们开始转向基于数据驱动的监督学习方法。然而,这两个方向都面临着一个共同的、关键的“瓶颈”:缺乏公开可用、大规模、且标注精确的基准数据集。尤其是在多光谱(MS)激光雷达(LiDAR)数据格式日益普及的今天,虽然有证据表明多光谱反射率信息能够提升ITS的精度,但可供研究和算法训练、评估的此类高质量、大规模数据集却依然寥寥无几。这严重制约了新方法的开发和公正的性能比较,使得该领域的发展步履蹒跚。
为了打破这一困局,由芬兰地理空间研究所(FGI)的研究团队发表于《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》的研究,带来了首个面向ITS的大规模多光谱机载激光扫描(ALS)基准数据集——FGI-EMIT。该研究不仅填补了数据空白,更利用此数据集,对当前主流的无监督算法和深度学习模型进行了一场“全面体检”,旨在为研究社区提供一个可靠的基准,并深入探究多光谱信息在ITS任务中的实际效用。
为了开展这项研究,研究人员主要应用了以下关键技术方法:首先,他们利用配备三台不同波长(532, 905, 1550 nm)激光扫描仪的HeliALS-TW系统,采集了芬兰埃斯波地区(Espoonlahti)的高密度、多光谱ALS点云数据。随后,通过严格的飞行轨迹优化和地理配准,确保了数据的几何精度。在数据标注方面,研究团队在19个圆柱形样地中,对至少3米高的1561棵树进行了全手动、逐点标注的点云实例分割,并特别关注了难以分割的林下层小树。在方法评估阶段,他们系统性地选择了四类经典的无监督ITS算法(如Treeiso)和四类先进的深度学习模型(如ForestFormer3D、Point2Tree等),并对无监督算法采用贝叶斯优化进行超参数调优,对深度学习模型则完全基于FGI-EMIT数据集从头开始训练,以确保比较的公平性。最后,研究引入了包括F1-score在内的3D实例分割标准评价指标,对算法性能进行了量化评估。
数据集与实验设置:FGI-EMIT数据集包含1561棵来自多样化北方针叶林环境、高度在3米以上的手动标注树木,其规模与经典的FOR-Instance数据集相当。该数据集不仅是首个大型多光谱ITS数据集,还是首个包含了建筑物、车辆等人造环境的ITS数据集,从而扩展了其在城市森林中的适用性。研究采用了训练集、验证集和测试集的标准划分,并对无监督算法和深度学习模型分别采用了不同的训练和优化策略。
无监督算法与深度学习模型的性能对比:在所有测试方法中,深度学习模型在整体上显著优于无监督算法。其中,表现最佳的无监督算法是Treeiso,其在测试集上的F1-score为52.7%。而表现最佳的深度学习模型ForestFormer3D的F1-score则达到了73.3%,优势明显。性能差距在林下层树木中尤为突出,ForestFormer3D相比Treeiso的性能高出25.9个百分点。这表明,在处理高密度、结构复杂的ALS数据时,深度学习模型具备更强的特征学习和建模能力。
点密度敏感性分析:研究人员进一步将原始高密度点云(约1660 points/m2)逐步下采样至低密度(10 points/m2),以探究点密度对算法性能的影响。结果表明,在所有测试的点密度下,深度学习方法都持续、显著地优于无监督方法,即使在极低点密度(10 points/m2)下也是如此。这揭示了深度学习模型在提取和利用稀疏点云特征方面同样具备鲁棒性。
多光谱反射率特征的效用分析:通过一项消融研究,研究人员首次深入探讨了多通道反射率信息作为输入特征对深度学习ITS模型的影响。研究发现,在测试的输入配置下,即将多光谱反射率与几何坐标进行简单拼接输入现有模型架构,当前的深度学习模型可能普遍无法有效地利用反射率信息。然而,在某些情况下,特别是对于林下层小树,单独添加单个反射率通道可能会带来微弱的精度提升。总体而言,反射率特征的引入带来的效果从微乎其微到明显有害不等,这暗示可能需要新的特征融合或网络架构来更好地利用多光谱信息。
综上所述,芬兰地理空间研究所的研究团队通过发布FGI-EMIT数据集,为解决个体树分割领域长期存在的数据匮乏和评价标准不一的问题,提供了宝贵的资源。他们的系统性评估清晰地揭示了在利用高密度多光谱ALS数据进行个体树分割时,深度学习模型(特别是ForestFormer3D)相对于传统无监督方法具有显著且稳定的优越性。更为关键的是,该研究首次明确指出,尽管已有证据表明多光谱信息在森林分割任务中具有潜力,但当前主流的深度学习模型架构在利用这些信息方面可能效率不高,这为未来的算法设计指明了重要的改进方向。FGI-EMIT的公开可用将极大地支持该领域的后续基准测试和方法开发,并有望推动更加精准、高效的森林三维数字化技术的发展,从而服务于更广泛的生态和经济应用。