AI模型在冷水珊瑚检测与分类中的可迁移性测试

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Ecological Informatics》：Testing the transferability of AI models for cold-water coral detection and classification

【字体：大中小】 时间：2026年04月01日 来源：Ecological Informatics 7.3

编辑推荐：

　　深海成像平台（如拖曳式相机、遥控水下机器人(ROV)和自主水下航行器(AUV))的普及使得单次科考即可产生海量图像数据，导致分析瓶颈——经验丰富的分析人员可能需要数月甚至数年才能完成单次调查所获影像的标注工作。随着海洋观测策略日趋自主化、数据采集速率持续加速，

深海成像平台（如拖曳式相机、遥控水下机器人(ROV)和自主水下航行器(AUV))的普及使得单次科考即可产生海量图像数据，导致分析瓶颈——经验丰富的分析人员可能需要数月甚至数年才能完成单次调查所获影像的标注工作。随着海洋观测策略日趋自主化、数据采集速率持续加速，这一挑战将愈发严峻。在此背景下，深度学习(DL)与计算机视觉(CV)技术正被应用于辅助深海影像标注以缓解分析瓶颈。本研究基于英国JC136航次ROV ISIS采集的已标注影像，训练YOLOv5目标检测模型以识别六种珊瑚形态类群，并通过独立数据集检验模型在不同迁移场景下的表现：以ROV ISIS在加那利群岛附近热带海山(JC142)采集的影像测试空间迁移性；以ROV Holland I在爱尔兰深海(SeaRover项目)采集的影像测试跨ROV平台迁移性。模型在验证集上表现中等，召回率(recall)为60%，但各类群表现存在差异（召回率=44-69%）。然而，当应用独立数据集进行测试时，模型性能显著下降，在各迁移场景中仅能召回23%-34%的人工标注。研究结果表明迁移后模型性能较差，主要原因在于部分形态类群内形态变异度高以及数据集间分类学代表性不足。研究人员讨论了协调化的社区努力如何能够提升模型迁移性并有望解决分析瓶颈问题。

**研究背景与问题**

深海成像技术的快速发展使遥控水下机器人(ROV)、自主水下航行器(AUV)和拖曳式相机等平台得以广泛应用，这些平台对于调查和监测生态重要及敏感区域（如冷水珊瑚分布区）至关重要。然而，单次科考即可产生数万幅图像，形成严重的分析瓶颈——经验丰富的分析人员可能需要数月甚至数年才能完成单次调查所获影像的标注。这一困境将随着海洋观测自主化程度提高和数据采集速率加速而愈发严峻，特别是在气候变化、生物多样性危机、深海矿产开发扩张以及《联合国国家管辖范围以外区域海洋生物多样性(BBNJ)协定》实施等背景下，海洋生态系统状态评估的紧迫性日益凸显。深度学习(DL)作为机器学习的一个子集，利用大型神经网络从原始数据中自动提取模式特征，其中目标检测算法能够在图像中定位并分类对象。尽管已有诸多研究将DL算法应用于海底影像的生物与地质数据标注，但现有模型多针对单一数据集或特定类群训练，其在不同成像平台和地理空间之间的可迁移性(transferability)尚不明确。

目前研究存在的关键问题在于：图像采集平台的差异（相机参数、照明系统、拍摄角度、操作因素等）以及空间分布差异均会影响同一对象在不同影像中的呈现方式，从而影响模型的迁移性能。然而，针对同一模型在空间迁移和跨平台迁移双重方面的测试仍是深海研究领域尚未填补的研究空白。本研究旨在系统地检验目标检测模型在冷水珊瑚调查监测中的实际应用效果，具体包括两种迁移场景：同一成像平台在不同地理空间的应用（空间迁移）、同一地点不同成像平台的应用（跨平台迁移）。

**研究设计、结论与意义**

研究人员基于英国JC136航次ROV ISIS采集的标注影像，采用YOLOv5卷积神经网络(CNN)架构，训练了六种冷水珊瑚形态类群（树形Arborescent、瓶刷形Bottlebrush、三维分枝形Branching-3D、二维扇形Fan-2D、蘑菇形Mushroom、不分枝形Unbranched）的检测模型。模型在JC136数据集上进行训练（Train-JC136，占70%）和验证（Val-JC136，占30%），并通过四个独立数据集测试迁移性能：JC142航次（ROV ISIS，加那利群岛热带海山，测试空间迁移）以及SeaRover项目2017、2018、2019年数据（ROV Holland I，爱尔兰深海，测试跨平台迁移）。研究结论表明：模型在验证集上表现仅为中等水平（召回率0.57、精确率0.67），且独立测试时性能显著下降（召回率0.16-0.33），空间迁移与跨平台迁移场景间无显著性能差异；迁移失败主要源于形态类群内的高形态变异性和数据集间分类学代表性不足。该论文发表于《Ecological Informatics》，其重要意义在于首次在深海研究背景下系统检验了单一模型在空间与跨平台双重维度上的可迁移性，揭示了形态学分类方法在提升模型泛化能力方面的局限性，并为社区协作构建代表性训练数据集提供了方向指引。

**关键技术方法**

研究使用YOLOv5卷积神经网络，基于COCO-2017数据集预训练权重进行迁移学习，在PyTorch框架下通过Google Colab云平台训练。训练图像分辨率设置为960×960像素，训练周期(epoch)250轮，测试了三种批次大小(batch size：8、16、32)。模型评估采用交并比(IoU)阈值0.5，在多种置信度阈值（0.05、0.1、0.3、0.5、0.9）下计算精确率(Pre)、召回率(Re)和F1分数。针对模型预测中人类标注遗漏的珊瑚个体，研究人员从每数据集随机抽取50幅图像进行人工复核，计算假阳性校正率(False Positive Correction Rate)以调整评估指标。统计检验采用Friedman非参数重复测量检验及Wilcoxon事后检验（Holm和Bonferroni校正）比较不同模型间的性能差异。样本队列来源包括：英国自然环境研究委员会资助的Deep-Links项目(JC136)、MarineE-Tech项目(JC142)，以及爱尔兰政府支持的SeaRover项目(2017-2019年三个航次)。

**研究结果**

**模型训练与验证**：三种批次大小的模型（Mod-b8、Mod-b16、Mod-b32）在训练过程中均趋于收敛，验证集上未出现单一模型全面优于其他模型的情况。最优表现为Mod-b16在置信度阈值0.3时，召回率0.57、精确率0.67，表明模型仅能识别约半数珊瑚且预测正确率有限。

**模型测试——基准迁移测试**：采用验证集最优模型-阈值组合（Mod-b16，Conf=0.3）直接应用于独立测试数据集时，性能显著下降。JC142空间迁移场景的召回率降至0.10、精确率0.33；SeaRover跨平台迁移场景的召回率介于0.12-0.30，精确率介于0.33-0.49。

**模型测试——优化迁移测试**：针对各测试数据集重新选择最优模型-阈值组合后，性能有所提升但仍不理想。Friedman检验显示三种模型在精确率上存在显著差异(p=0.04)，但事后检验未达显著性；各数据集最优组合的召回率为0.17-0.33，精确率为0.32-0.44。值得注意的是，批次大小虽对验证集无显著影响，但在独立测试时最多可导致8%的召回率差异。

**人工评估与校正**：模型能够检测出人类标注遗漏的珊瑚个体，各数据集假阳性校正率为5.2%-21.3%。校正后Val-JC136的召回率从0.57提升至0.60，精确率从0.67提升至0.76；但Test-SR17虽校正率达12.6%，调整后性能仍较差（召回率0.18、精确率0.37），表明高校正率并非模型性能良好的充分指标。

**形态类群性能分析**：验证集上各形态类群表现差异显著，蘑菇形召回率最高(0.71)，瓶刷形、三维分枝形和二维扇形最低(0.54)；测试集上各类群性能普遍下降且变异增大。二维扇形在SeaRover数据中召回率表现相对较好(0.38-0.53)，但精确率偏低(0.08-0.20)。混淆矩阵显示三维分枝形与二维扇形之间存在10%-21%的混淆，源于两者形态区分度较低。不分枝类群的分类学组成分析揭示：训练集以Stichopathes gravieri（橙色、厚而卷曲，占71%）为主，而JC142以Stichopathes msp. 1（细长、不卷曲、浅色，占73%）为主，SeaRover则以Stichopathes msp. 2（细长、不卷曲、橙红色，占39%-70%）为主，表明该形态类群并非如假设般具有内在泛化性。

**讨论与结论**

研究人员认为模型验证性能仅达中等、迁移性能较差的原因是多方面的。首先，尽管图像采集因素（相机设置、照明条件、操作参数等）会影响模型表现，但空间迁移与跨平台迁移场景间未呈现系统性差异，表明性能下降更可能与数据集特定因素相关。其次，形态学分类方法的普适性被高估：虽然形态类群在训练集和测试集中均有出现，但类群内部的分类学构成存在显著差异，形成了"分布偏移"(distribution shift)——训练域(source domain)与目标域(target domain)在物种组成上的不匹配导致模型无法有效泛化。此外，类群不平衡虽是深海生态数据的固有问题，但研究发现性能差异不能简单归因于此：蘑菇形虽样本量小( n=138 )但因其形态同质性高而召回率最优；三维分枝形虽样本量大( n=1721 )但因包含众多分类群、形态变异度高而表现逊于预期。

为改善模型性能与应用，研究人员提出：可将模型作为基础模型对新数据进行初筛，再以新增标注数据通过迁移学习优化模型；或针对特定表现较好的类群（如特定场景下的二维扇形、蘑菇形）开发专用工具。更根本的解决路径在于构建社区协作机制：整合多源数据集、统一标注标准与分类体系、建立开放获取的训练数据库。SMarTaR-ID、CATAMI和FathomNet等项目已在此方向做出努力，Challenger 150大型动物影像技术工作组等国际合作网络正在推进标注培训、质量控制、参考图库建设及资金协调等工作。

**研究结论**：本研究训练的冷水珊瑚形态检测模型在验证集上表现中等，但空间迁移和跨平台迁移后性能显著下降，且两种迁移场景间无显著差异。迁移失败除受图像采集因素和模型参数影响外，更主要源于形态类群内的高形态变异性和数据集间分类学代表性不足。为有效缓解图像分析瓶颈，需要社区层面的协调努力以构建具有海洋盆地尺度的代表性训练数据集，进而检验不同分类方案（形态学或分类学）及层级对模型迁移性的影响，从而最大化降低人工标注资源投入，满足海洋生态保护与管理的现实需求。

联系信箱：

粤ICP备09063491号

热点排行