《International Journal of Applied Earth Observation and Geoinformation》:Exploring transfer learning for individual tree species classification by cross-platform point cloud
编辑推荐:
为解决跨平台激光雷达点云在树种分类中因点密度、几何结构和噪声差异大导致的模型泛化难题,本研究提出了一个专注于几何输入、异构点密度和目标域标注数据有限的学习框架。通过紧凑的预处理流程增强几何坐标信息,并结合多阶段迁移学习策略,实现了从多源预训练到新传感器和未见树种的快速适应。实验表明,该框架在未见六树种数据集上总体准确率达到91.9%,均值F1分数为91.9%,且收敛速度最高提升13倍,显著降低了数据收集成本,为森林监测的跨平台点云分析提供了可扩展的解决方案。
准确识别单木树种对于可持续森林管理、生物多样性监测和碳储量估算至关重要。激光雷达作为一种强大的遥感技术,能够提供森林结构精确的三维表示,从而实现对与树种性状密切相关的冠层形态、冠幅体积和高度属性的详细测量。近年来,深度学习的快速发展为激光雷达数据的自动解译开辟了新机遇,深度神经网络能够直接从原始数据中学习复杂的空间和结构模式,已在森林环境的各种任务中展现出显著成功。然而,将现有技术应用于单木树种分类仍面临巨大挑战。现有研究通常针对单一数据源和有限数量的树种设计,这限制了它们对新采集平台和未见树种的泛化能力。不同激光雷达系统在点密度、几何结构和噪声方面存在显著差异,导致跨平台点云的树种分类仍然困难。此外,现有模型性能严重依赖标注可靠性、数据量和训练数据的跨域多样性,手动勾绘和标注单木既费力又耗时,难以建立平衡且具有代表性的数据集。为了应对这些挑战,本研究探索了迁移学习作为跨平台激光雷达树种分类的实用解决方案,旨在使在多源数据上预训练的模型能够以最少的监督有效地适应新传感器和新树种。
本研究采用了一个集成了几何一致预处理、多平台源数据基模型预训练和多阶段迁移学习策略的框架。关键技术方法包括:1. 使用FOR-species20K基准数据集的开发子集作为预训练数据集,该数据集包含来自33个树种的17,707棵单木点云,涵盖地面激光扫描、无人机激光扫描和移动激光扫描等多平台数据;使用一个未见数据集(包含6个未出现在预训练集中的树种,共848棵单木)进行迁移学习评估。2. 设计了一个统一的数据预处理流水线,仅使用几何坐标,并通过提取局部表面法向量和多尺度密度特征来增强输入,采用低密度点采样策略将每棵树统一采样至1024个点。3. 采用属性感知交叉分支变换器作为基模型,该模型具有双分支编码器,可分别提取几何和密度相关特征。4. 实施了一个四阶段的迁移学习方案,包括预训练权重加载、批归一化重新校准、仅分类头微调和具有差异化学习率的全模型微调。
3.1. 预训练基模型性能
预训练基模型在验证集和测试集上的总体准确率分别为89.6%和89.3%,平均精度、召回率和F1分数表明模型具有稳定的泛化能力且未过拟合。针叶树种(如云杉属、松属、落叶松属)通常比阔叶树种表现更好,而某些树种如欧洲白蜡树、欧卫矛和光叶榆分类仍具挑战性。
3.2. 迁移学习以匹配准确率
在未见六树种数据集上,迁移学习模型实现了完美的验证性能(总体准确率100%),并将测试准确率提高到91.9%,而从头开始训练的基线模型测试准确率为90.8%。迁移学习模型在训练早期表现出更陡峭的准确率上升和损失下降,反映出更有效的优化和对目标域更快的适应速度,收敛速度比基线快2.7倍。
3.3. 使用较少数据进行训练
随着每类样本数量的减少,迁移学习模型在数据有限条件下始终优于基线模型。在使用完整训练集时,两者性能相当。但当每类仅使用10个样本时,基线模型的总体准确率降至69.7%,而迁移学习模型则保持在85.4%。在最极端的情况下(每类5个样本),迁移学习模型仍能达到77.8%的总体准确率,而基线仅为45.2%。在收敛效率方面,迁移学习模型在所有配置下都比基线收敛得更快,在固定少样本设置下,训练时间最高可加快13倍。
3.4. 数据预处理的有效性
消融实验证实,用几何描述符丰富原始坐标可显著提高分类性能。仅使用(x, y, z)坐标在Train15分割上获得72.7%的总体准确率,而结合法向量、局部和全局多尺度密度描述符的最佳配置可将总体准确率提升至87.9%。跨传感器语义对齐评估表明,所提出的预处理提高了大多数传感器对之间的检索性能,增强了跨异构激光雷达源的物种相关几何线索的对齐和互操作性。对多尺度密度描述符邻域半径的敏感性分析显示,中小尺度邻域能为跨传感器使用提供更稳定和物种相关的密度线索。
本研究引入的迁移学习框架,通过整合几何一致的数据预处理流水线、多平台预训练和分阶段微调,实现了从多源激光雷达点云进行单木树种分类的稳健跨平台泛化和数据高效学习。该框架在未见六树种数据集上取得了优异的性能,总体准确率达91.9%,平均F1分数为91.9%。与从头训练相比,预训练模型在使用完整训练集时收敛速度快2.7倍,在高度数据受限条件下甚至可加快达13倍。即使每树种仅有五个样本,微调后的模型仍能保持77.8%的总体准确率,显著优于基线模型的45.2%。这些结果表明,迁移学习与几何一致表征设计相结合,为跨平台激光雷达树种分类提供了一个实用且可扩展的解决方案。这项应用导向的探索性研究并未引入新的网络架构,而是着重展示了如何将现有模型有效适配到异构传感器和有限数据场景,为可部署的森林清查和生物多样性监测系统提供了一条可行路径。该研究强调了利用来自大规模多源数据集(如FOR-species20K)的预训练知识,能够快速、准确地将模型适应到新的、未见过的树种,从而大幅降低数据收集成本,并为广泛的森林监测应用提供可扩展的解决方案。未来的工作将进一步扩展跨域数据集,探索自监督或域自适应预训练策略,并研究大规模业务化部署。