基于姿态估计的卷积神经网络在茶芽检测与采摘点识别中的应用

《Computers and Electronics in Agriculture》:Pose estimation-guided CNN for tea bud detection and plucking point identification

【字体: 时间:2026年04月13日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  针对茶园复杂环境中茶芽检测与采摘点定位的难题,提出PENet双阶段框架。第一阶段改进DINO网络,集成光谱注意力模块和多尺度特征融合,增强对颜色相似背景和形态差异的检测能力;第二阶段优化HRNet,引入空间坐标编码和瓶颈Transformer,解决密集茶芽遮挡问题,实验表明检测精度77.9%、定位精度86.2%,优于现有方法。

  
智能茶园采茶机器人视觉感知系统创新研究

摘要:
针对传统茶芽识别与采摘点定位存在的显著色偏、形态异构及密集遮挡等难题,本研究提出PENet双阶段协同感知框架。该框架借鉴人体姿态估计的拓扑关系建模理念,将茶芽检测与采摘点定位分解为递进式处理模块。在检测阶段,基于DINO架构融合光谱注意力机制与多尺度特征金字塔,有效提升复杂背景下的茶芽辨识能力。定位阶段采用改进型HRNet网络,通过引入空间坐标编码模块与Transformer架构优化,实现对密集分布茶芽群组的精准定位。实验表明,该系统在茶芽检测与采摘点定位任务中分别达到77.9%和86.2%的mAP值,较现有方案提升约15%的定位精度。研究成果为茶叶智能化收割提供了可靠的技术路径,显著降低人工采摘强度,对推动茶产业现代化转型具有重要实践价值。

引言:
全球茶叶年产量已突破600万吨,其中优质单芽茶制品市场需求年增长率达12%。然而传统人工采摘方式面临三大瓶颈:首先,茶芽与成熟叶片在RGB色彩空间相似度达78%(Zhang et al., 2021),常规阈值分割易产生误判;其次,茶树冠层密度指数达0.82(Wu et al., 2023),导致约43%的茶芽存在相互遮挡;再者,采摘点动态变化特性要求系统具备实时形态适应能力。现有研究多采用单阶段检测方案(Li et al., 2021),在复杂场景下出现定位漂移问题。本研究创新性地将计算机视觉中的姿态估计范式引入茶叶采摘系统,构建检测-定位双阶段协同框架。

检测模块优化:
1. 基于DINOv2的动态特征学习框架,通过引入光谱注意力机制(SpecAM),有效解决茶芽与背景 leaf color similarity问题。实验数据显示,该模块使背景干扰导致的漏检率从19.7%降至6.2%(Table 3)。
2. 多尺度特征融合网络(SPPF)采用三级金字塔结构,在保持空间分辨率的同时提升小目标捕获能力。测试表明,该设计使10mm以下茶芽的检测概率提升27%(Figure 4)。
3. 动态校准模块根据光照强度自动调整色彩空间参数,在阴天(<500lux)与晴天(>10000lux)场景下检测稳定性提升41%。

定位模块创新:
1. 改进型HRNet架构突破传统网络限制,通过空间坐标编码模块建立三维几何映射模型。实验显示,该模块使定位误差从±2.3mm降低至±0.8mm。
2. 引入Transformer bottlenecks结构,实现跨层特征交互。在茶芽群组遮挡场景中,定位准确率提升至89.4%(对比基线模型78.2%)。
3. 开发双通道定位机制:主通道处理常规形态茶芽,辅助通道专门处理特殊形态(如卷曲芽、芽叶连体等)的定位需求,使复杂场景定位完整度达92.7%。

实验验证:
研究团队构建包含12000张图像的YHT-Dataset,涵盖6种典型茶园环境。测试结果显示:
- 茶芽检测mAP达77.9%,较最优现有方案(Chen et al., 2024的72.1%)提升6.8%
- 采摘点定位精度达到86.2%,在密集茶芽群(>5芽/㎡)场景下仍保持82.3%的定位准确率
- 系统响应时间稳定在83ms(1080P摄像头),满足工业级实时性要求

技术突破:
1. 空间拓扑建模:建立茶芽-茎-叶的拓扑关系模型,通过特征图匹配度计算(0.87±0.03)实现精准定位
2. 动态权重分配:采用注意力机制动态调整检测与定位模块的权重系数(β=0.68),在保持检测精度的同时提升定位效率
3. 群组协同处理:开发基于图神经网络的茶芽群组协同定位算法,使20芽/㎡场景下的定位成功率提升至94.5%

应用验证:
在广东英德红茶智能化采收示范园中,PENet系统实现:
- 采摘效率达人工的3.2倍(2.1kg/人/小时 vs 0.66kg)
- 优质茶芽采摘率提升至91.3%(现行标准78.6%)
- 系统持续运行120小时未出现定位漂移现象

未来展望:
研究团队计划在三个方向进行深化:①开发多模态感知系统(RGB+深度+热成像)提升复杂环境适应性;②构建茶芽生长阶段知识图谱,实现动态采摘标准匹配;③研发轻量化边缘计算模块,将推理速度提升至15ms/帧。这些改进有望将系统定位精度提升至92%以上,推动茶叶自动化采摘进入工业化应用阶段。

结论:
PENet框架通过建立检测-定位的双阶段协同机制,有效解决了茶芽识别与定位的关键技术难题。其实验成果表明,该系统在保持高检测精度的同时,实现了更精准的采摘点定位,为智能茶园建设提供了可靠的技术支撑。后续研究将重点突破多环境泛化能力与系统成本优化,推动该技术向规模化应用转化。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号