modernization of alpine grassland biodiversity conservation: efficient AI-powered detection of large herbivores in the Qinghai-Tibet Plateau(青藏高原高寒草地生物多样性保护的现代化:基于高效人工智能的大型食草动物检测)

《Global Ecology and Conservation》:Modernizing Alpine Grassland Biodiversity Conservation: Efficient AI-Powered Detection of Large Herbivores in the Qinghai-Tibet Plateau

【字体: 时间:2026年06月12日 来源:Global Ecology and Conservation 3.4

编辑推荐:

  监测高寒草地大型食草动物多样性是生物多样性保护与生态系统管理的基础。传统遥感方法多依赖俯视视角,在复杂环境下往往难以分辨物种水平信息。本研究提出一种同步从单一路面影像流中提取物种出现记录与微生境属性的双网络框架。研究人员利用三江源国家公园样线调查采集的图像,构

  
监测高寒草地大型食草动物多样性是生物多样性保护与生态系统管理的基础。传统遥感方法多依赖俯视视角,在复杂环境下往往难以分辨物种水平信息。本研究提出一种同步从单一路面影像流中提取物种出现记录与微生境属性的双网络框架。研究人员利用三江源国家公园样线调查采集的图像,构建了融合注意力机制与轻量化下采样模块的改进YOLOv10模型。实验结果表明,改进模型参数量降低6.77%,浮点运算量(FLOPs)降低6.09%,同时mAP@50–95提升7.02%;在便携设备上推理速度达47 FPS,较人工判读(平均35 s/幅)效率提升约1645倍,可实现快速"停车–拍摄"调查模式,显著缩短野外采样时间。将模型输出用于种群估算,得到三江源国家公园四种关键食草动物丰度:藏野驴(Equus kiang,1980头)、藏原羚(Procapra picticaudata,896头)、藏羚羊(Pantholops hodgsonii,3321头)及野牦牛(Bos mutus,435头)。此外,研究人员采用EfficientNetV2_S网络从影像中识别生境类型(高寒草甸、高寒草原、水源地、裸地),并将其与动物检测结果整合进行生境质量评估。该集成方法对理解景观异质性对大型食草动物种群分布及生态平衡的影响具有重要意义,为高山生态系统大型食草动物检测与种群监测提供了一种实用且经济高效的地面AI框架,通过融合人工智能与景观生态学分析,为生物多样性监测提供升级工具,并为保护决策与生态研究提供精细尺度数据。
研究背景与意义
三江源国家公园位于青藏高原腹地,被誉为"亚洲水塔",是世界上高海拔生物多样性最集中的区域之一,栖息着藏野驴(Eastern Kiang/Tibetan wild ass, Equus kiang)、藏原羚(Tibetan gazelle, Procapra picticaudata)、藏羚羊(Tibetan antelope, Pantholops hodgsonii)和野牦牛(Wild yak, Bos mutus)等标志性大型食草动物。传统监测手段包括人工样线调查、红外相机陷阱及卫星或无人机遥感,但各有局限:卫星/航拍俯视遥感难以在复杂草地背景下实现可靠的物种级识别与计数;无人机受高原强风影响大且有声学干扰风险;固定红外相机仅能获取点尺度高频数据且空间覆盖有限;人工样线调查耗时且易受调查者疲劳影响导致记录偏差。因此,亟需一种低成本、高效率、可同步获取物种发生信息与近地表微生境特征的地面监测方法。该研究发表于《Global Ecology and Conservation》,旨在建立一套基于改进YOLOv10(You Only Look Once version 10)目标检测算法与EfficientNetV2_S(Efficient Network version 2 Small)生境分类网络的双网络地面调查框架,实现高寒草地大型食草动物的高效自动检测、种群估算及生境质量综合评估。
主要关键技术方法
研究人员于2024年7–8月在三江源国家公园长江源区沿公路以20–30 km/h车速开展地面样线调查(line-transect survey),非侵入性拍摄食草动物及沿途景观,共采集486幅图像,筛选后得422幅有效图像(藏野驴135、藏羚羊25、藏原羚178、野牦牛84幅),按8:1:1划分为训练集、验证集和测试集,训练集经镜像翻转与色彩抖动增强后共1042幅。目标检测采用YOLOv10基线模型,在检测头输出端嵌入卷积块注意力模块(Convolutional Block Attention Module, CBAM)以增强通道与空间维度特征提取,并用YOLOv9中的ADown轻量化下采样模块替换标准卷积下采样层以降低计算复杂度,构建YOLOv10-ADown-CBAM改进模型。生境分类采用EfficientNetV2_S网络,将影像划分为高寒草甸(alpine meadow)、高寒草原(alpine steppe)、水源地(water sources)和裸地(bare ground)四类。种群估算采用千米遇见个体数(Index of Kilometric Abundance, IKA = N/L,N为样线记录总数,L为样线总长km)、样带密度(Dy= ni/s,s = 2×li×Ai,Ai为单侧样带宽设为2 km)及平均密度(Da= N/S,S = 2×L×Ai),结合各物种适宜生境面积推算种群数量。模型性能以精确率(Precision, P)、召回率(Recall, R)、mAP@50(IoU阈值0.5的平均精度)及mAP@50–95(IoU阈值0.50–0.95间平均精度的均值)和参数量(Parameters)、浮点运算量(Floating-Point Operations, FLOPs)评估。
研究结果
3.1. Comparison of detection accuracy with the addition of different attention modules(不同注意力模块对检测精度影响的比较)
研究人员在YOLOv10检测层输出端分别嵌入ECA(Efficient Channel Attention)、CBAM和GAM(Global Attention Mechanism)三种注意力模块进行对比。结果显示YOLOv10-CBAM取得最优性能:精确率0.949、召回率0.920、mAP@50为0.966、mAP@50–95为0.793,较基线YOLOv10分别提升2.26%、4.9%和9.23%(mAP@50–95由0.726升至0.793)。CBAM通过通道与空间双重注意力机制有效抑制背景噪声、强化目标特征,故被选入最终检测头。
3.2. Comparison of detection accuracy with the improved model(改进模型检测精度对比)
在YOLOv10-CBAM基础上引入ADown轻量化下采样模块构成YOLOv10-ADown-CBAM,相较基线YOLOv10:mAP@50–95由0.726提升至0.777(提升7.02% vs原始),参数量由2.69×106降至2.51×106(降低6.77%),FLOPs由8.2×109降至7.7×109(降低6.09%)。训练动态显示改进模型在前50轮epoch收敛更快,验证损失更低且稳定于更高mAP水平,表明其在保持较高检测精度的同时实现了有效轻量化,适于边缘设备部署。
3.3. Population estimation and performance evaluation(种群估算与性能评估)
改进模型在便携设备(NVIDIA RTX 4070 Laptop GPU)上推理速度达47 FPS,单幅图像处理时间0.021 s,较人工判读(平均35 s/幅)效率提升约1645倍。"停车–拍摄"(Stop-and-Capture)模式替代传统"停车–目测计数"(Stop-and-Count),大幅减少驻留时间并建立100%可追溯的数字影像档案。模型对四物种平均识别准确率93.6%(藏野驴94.2%、藏羚羊92.3%、藏原羚95.7%、野牦牛95.1%)。基于样线调查数据(总样线长941.5 km,记录藏野驴179头、藏原羚22头、藏羚羊168头、野牦牛39头)计算得IKA分别为0.215、0.035、0.506、0.099 ind.·km?1,平均密度分别为0.054、0.009、0.127、0.025 ind.·km?2,推估三江源国家公园种群数量为:藏野驴1980头、藏原羚896头、藏羚羊3321头、野牦牛435头。空间分布显示沿河岸与谷底形成明显的生物多样性热点区。
3.4. Habitat landscape quality identification and assessment(生境景观质量识别与评估)
EfficientNetV2_S生境分类结果与动物检测数据整合后显示:高寒草甸总数量180头、物种丰富度4种、相对密度4.74头/幅,为区域生物多样性生态基石,呈弥散分布;高寒草原总数量98头、物种丰富度4种、相对密度5.16头/幅,为重要次级生境;水源地总数量116头、物种丰富度2种、相对密度10.55头/幅最高,是关键的聚集节点("绿洲");裸地总数量10头、物种丰富度2种、相对密度5.00头/幅,反映其作为规避捕食者的临时集聚点的特殊功能。景观异质性明显驱动大型食草动物对不同生境类型的差异化利用。
讨论与结论
讨论部分指出:本研究车辆载地面样线框架作为高机动性近地表观测层级,弥补了俯视遥感无法获取近地表微生境属性及无人机高原作业受限的不足,与现有多尺度监测体系形成互补。改进YOLOv10-ADown-CBAM模型通过CBAM注意力与ADown轻量化实现精度与效率平衡,47 FPS实时推理使"停车–拍摄"模式具备可行性。双网络同步提取物种发生与生境信息,首次在同一地面影像流中完成动物–生境关联分析,量化了水源地等高利用强度微生境的生态功能。研究局限包括样本源于线性样线且总量偏小(未涵盖雪被等不同季节背景)、沿公路采样可能引入边缘效应、有效带宽(ESW)固定为2 km而非基于距离抽样(distance sampling)统计推导的检测函数,未来需扩大样本、引入GAN数据增强、采用规范距离抽样及融合多源遥感(NDVI、NPP、LUCC)开展区域尺度监测。
结论(翻译):本研究成功开发了一种创新的地面AI目标检测框架(YOLOv10-ADown-CBAM),用于青藏高原三江源地区高寒草地大型有蹄类动物高效低成本的监测。通过集成CBAM注意力机制和ADown轻量化下采样模块,模型在保持高检测精度的同时显著降低了计算复杂度和模型尺寸。便携设备(RTX 4070笔记本电脑)部署测试显示实时推理速度达47 FPS,较人工处理效率提升三个数量级。这一技术突破支撑了高效的"停车–拍摄"野外调查模式,在大幅提升作业效率的同时建立了标准化、可审计的影像档案以保障数据质量。应用该框架,研究人员成功估算了三江源国家公园四种关键大型食草动物(藏野驴、藏原羚、藏羚羊、野牦牛)的种群数量。同时,通过集成EfficientNetV2_S网络,实现了近地表生境质量的同步识别与评估。该方法论为人工智能与景观生态学的无缝融合提供了概念验证,建立了能够及时可靠获取野生动物种群规模及其周边景观特征数据的高效工作流程,从而为生物多样性保护决策支持和景观尺度生态研究提供了更具洞察力的地面视角。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号