基于YOLO实例分割的葡萄藤冬季修剪点定位研究

《Agriculture》:Grapevine Winter Pruning Point Localization Using YOLO-Based Instance Segmentation Magdalena Kap?an and Kamil Buczyński

【字体: 时间:2026年04月28日 来源:Agriculture 3.6

编辑推荐:

  本研究旨在解决葡萄藤冬季修剪自动化中切割点精确定位的难题。研究人员通过结合YOLO-based instance segmentation和几何推理方法PCAcutSeg-V,成功开发了一种视觉引导的修剪决策估计管道。该方法在离线图像分析和实时边缘计算中均表现出高有效性,为未来自主修剪系统的开发奠定了重要基础。

  
冬季修剪是葡萄栽培中一项至关重要却又极为费力的管理措施。它不仅直接影响葡萄藤的架构、产量平衡和果实品质,也占据了年劳动力成本的很大一部分。然而,这项操作高度依赖人工经验,选择性识别合适的切割位置一直是限制葡萄园修剪自动化的主要挑战之一。想象一下,在寒冷的冬季,工人们需要手动判断成千上万个枝条的修剪点,这不仅效率低下,也对劳动力的稳定供应提出了挑战。与此同时,气候变化正在重塑全球葡萄栽培的适宜区,传统产区面临挑战,而新的潜在适宜区不断涌现,这使得对可扩展、适应性强的生产技术的需求日益迫切。尽管人工智能和机器人技术在其他领域已取得显著进展,但在葡萄生产这类需要精细选择性决策的农业场景中,自动化水平仍然很低。尤其是在中欧和东欧等冬季寒冷的葡萄种植区,其藤蔓整枝系统和修剪策略与温暖地区差异显著,相关研究更为有限。那么,能否利用先进的机器视觉技术,让机器“学会”像经验丰富的果农一样识别修剪点,从而为自动化修剪机器人的“眼睛”和“大脑”提供关键技术支撑呢?
为了回答这个问题,Magdalena Kap?an 和 Kamil Buczyński 开展了一项研究,旨在开发和评估一种基于视觉的方法,用于估计葡萄藤的修剪点和切割线。他们的研究结合了基于深度学习(Deep Learning)的实例分割(Instance Segmentation)与确定性的几何推理,专门针对寒冷气候葡萄栽培的特点。这项研究的意义在于,它有望为未来适应特定区域训练实践的自主修剪系统提供方法论基础,推动葡萄栽培向更高效、更智能的方向发展。相关研究成果已发表在《Agriculture》期刊上。
为开展此项研究,研究人员主要应用了以下几项关键技术方法:首先,在波兰东南部的Nobilis葡萄园,于冬季休眠期(2025年12月至2026年1月)采集了1500张休眠期葡萄藤的RGB图像数据集,并采用了简化和扩展两种多边形标注策略来定义修剪区域(headingCut和rejectingCut两类)。其次,研究训练并评估了多种YOLO-based实例分割模型(包括YOLOv8, YOLO11, YOLO26的“n”和“s”版本),以检测与修剪相关的结构。最后,基于模型预测的分割掩码,研究团队开发了一种名为PCAcutSeg-V的基于几何的方法,该方法对物体轮廓应用主成分分析(Principal Component Analysis, PCA),来估计类别依赖的切割点和切割线。此外,该方法还在搭载NVIDIA Jetson Orin NX的边缘计算平台上,使用RGB相机进行了实时处理管道的部署与验证。
研究结果
1. 不同YOLO模型的实例分割性能评估
通过对简化标注和扩展标注两种策略下的模型性能进行分析,研究人员得出了以下结论:
  • 模型总体表现:YOLOv8和YOLO11架构在评估的模型中取得了最高的分割性能。YOLOv8模型通常展现出最高的精确度(Precision),意味着其预测更稳定,假阳性检测更少;而YOLO11模型则在召回率(Recall)和F1-分数(F1-score)等反映检测完整性和质量平衡的指标上表现更优或相当。
  • 类别差异:对于headingCut类,YOLOv8模型在精确度、F1-分数和跨多个交并比(Intersection over Union, IoU)阈值的检测质量(mAP)上表现最佳。而对于rejectingCut类,YOLO11架构在反映检测完整性和质量平均的指标上结果更好。
  • 标注策略影响:使用扩展标注策略改变了各YOLO模型的性能分布。虽然YOLOv8n-seg获得了最高精确度,但YOLO11s-seg在其他质量指标上取得了最高值,表明该架构能更有效地利用扩展标签中的附加信息。YOLO26系列模型在所有配置中均表现出最弱的性能。
2. PCAcutSeg-V方法对切割点与切割线的估计效果
基于分割掩码,PCAcutSeg-V方法被用于估计切割几何参数,评估结果如下:
  • 整体有效性:切割点预测的准确率高于切割线预测,表明单点估计对分割掩码的几何不准确性敏感度低于包含倾斜角的完整切割线重建。
  • 标注策略对比:简化标注策略为PCAcutSeg-V方法提供了更稳定的几何输入,与扩展标注方法相比,能够实现更可靠的切割点和切割线估计。在扩展策略下,headingCut类的切割点和切割线估计有效性有所下降,这可能是因为更复杂的标签引入了更大的几何变异性。
  • 错误分析:估计错误的主要来源并非未能检测到修剪区域,而是枝条不规则的空间排列。当枝条明显偏离预期的直立方向时,分割区域的几何结构与PCAcutSeg-V方法的假设一致性降低,从而影响估计准确性,这对切割线估计的影响尤为明显。
3. 实时处理管道性能
研究进一步将最佳模型(基于简化标注策略训练的YOLO11s-seg)与PCAcutSeg-V方法整合,部署在移动边缘计算平台上进行实时评估。
  • 性能保持:实时处理管道保持了高有效性,其结果与离线图像分析获得的结果一致。切割点估计再次显示出比切割线估计略高的准确性。
  • 稳定性验证:该结果证实了PCAcutSeg-V方法中实现的几何推理在实时条件下保持稳定,证明了该方法在未来自主修剪系统中的潜在适用性。
研究结论与讨论
本研究的结论表明,将基于深度学习的实例分割与确定性的几何推理相结合,能够实现葡萄藤修剪位置的准确且可解释的估计。YOLOv8和YOLO11架构在分割葡萄藤冬季修剪区域方面表现出良好的性能平衡,而新颖的PCAcutSeg-V方法则能基于分割掩码实现稳定、类别依赖的修剪几何参数预测。实时实验成功验证了该集成管道在真实场境下的可行性与可靠性。
研究的意义在于方法论上的创新与整合。与许多将感知与决策耦合的端到端方法不同,本研究提出的管道明确地将感知(实例分割)阶段与决策(几何推理)阶段分离。这种设计不仅增加了整个管道的可解释性,也通过基于PCA的稳健几何处理,增强了对分割输入变异的鲁棒性。它为将视觉感知转化为可执行的几何控制指令提供了清晰的路径,弥合了图像理解与物理执行之间的鸿沟,为未来自主修剪机器人提供了关键的“感知-决策”核心。
此外,研究也指出了当前自动化修剪系统走向实际应用所面临的更广阔背景与挑战。例如,完全的自动化需考虑剪后枝条的清理、与现有机械化方案的集成(如先由机械进行大部分非选择性修剪,再由机器人进行精细选择性修剪),甚至将修剪生物质转化为能源的可能性。本研究聚焦于解决选择性切割点定位这一核心感知-决策难题,为构建上述集成化、系统化的未来葡萄园自主管理生态系统奠定了重要的技术基础。当然,研究也存在局限性,如数据集来自单一葡萄园、未在雪盖条件下测试、仅评估了一种几何估计方法等。未来的研究需要整合机械臂进行实际操作验证,并探索适应不同留芽数量的修剪策略,特别是在芽存活率受冬季条件显著影响的寒冷气候葡萄栽培区。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号