基于计算机视觉的甜薯作物中潜叶蝇检测:一种基于深度学习模型的方法

《Frontiers in Plant Science》:Detection of leaf miner in sweet potato crops through image analysis using machine learning-based models

【字体: 时间:2026年06月03日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  潜叶蝇(Liriomyza huidobrensis)对甘薯生产构成严重威胁,其造成的不可逆损伤因传统视觉检查存在主观性强和效率低下的问题而难以有效缓解。本研究旨在通过结合深度学习的图像分析技术实现该害虫的自动化检测。在方法论层面,构建了包含751张图像的“c

  
潜叶蝇(Liriomyza huidobrensis)对甘薯生产构成严重威胁,其造成的不可逆损伤因传统视觉检查存在主观性强和效率低下的问题而难以有效缓解。本研究旨在通过结合深度学习的图像分析技术实现该害虫的自动化检测。在方法论层面,构建了包含751张图像的“camote_minador”数据集,这些图像采集自秘鲁兰巴耶克省的实地田野,并应用动态数据增强技术以确保训练数据的变异性。研究在标准化的超参数配置下,对比评估了YOLOv8s和YOLOv11s架构的性能。结果显示,YOLOv11s模型在技术上具有优越性,其精确度(Precision)达到73.20%,召回率(Recall)为66.72%,50%交并比下的平均精度均值(mAP@50)为71.63%,优于其前代模型,显示出更强的区分害虫轨迹与背景噪声的能力。此外,研究验证了基于TensorFlow Lite构建的中端设备移动原型的操作可行性。结论指出,采用如YOLOv11s等优化架构的实施,为加强农业领域的植物检疫监测提供了一种有效、易用且可扩展的技术解决方案。
农业作为人类生存的基础产业,长期面临着病虫害威胁,这不仅影响农作物的质量和产量,还导致巨大的经济损失。研究表明,全球每年因病虫害造成的损失介于20%至40%之间,严重制约了粮食安全。甘薯(Ipomoea batatas)作为重要的热带块根作物,在拉丁美洲等地区具有极高的营养价值和经济地位。然而,在甘薯种植过程中,潜叶蝇(Liriomyza huidobrensis)等害虫会造成叶片枯死、脱落及光合作用降低,严重影响收获量。目前,潜叶蝇的检测主要依赖人工视觉检查,该方法耗时长、主观性强,且在大面积种植中难以实施,往往导致病虫害在得到有效控制前迅速蔓延。此外,过度依赖化学农药不仅导致害虫抗性增强,还带来环境和健康风险。因此,开发一种快速、准确且低成本的检测技术成为迫切需求。机器学习(Machine Learning, ML)和计算机视觉技术的发展为这一问题的解决提供了新思路,特别是卷积神经网络(Convolutional Neural Networks, CNNs)和YOLO(You Only Look Once)系列目标检测算法,在实时性和准确性上展现出巨大潜力。然而,现有研究多集中于实验室环境或大型设备,缺乏针对中端移动设备优化的轻量化模型,且针对甘薯潜叶蝇这一特定微小特征害虫的研究相对不足。鉴于此,研究人员开展了本研究,旨在利用深度学习模型优化甘薯潜叶蝇的自动检测,并通过移动原型验证其在实际田间应用的可行性,以降低农药使用,提高农业可持续性和生产效率。

为开展本研究,研究人员主要采用了以下关键技术方法:首先,实地采集样本队列,采集自秘鲁兰巴耶克省Chosica del Norte和Callanca两个区域的商业化甘薯田间,涵盖不同生理成熟度的植株,以获取具有自然变异性(如光照、叶密度、灰尘)的图像数据。其次,构建“camote_minador”数据集,通过Label Studio进行边界框标注,并将高分辨率图像裁剪 resized 至1280×1280像素,随后采用分层划分法将数据集分为训练集、验证集和测试集。第三,应用动态数据增强技术,包括Mosaic、Mixup、Copy-Paste以及随机旋转、翻转和HSV颜色空间调整,以增加训练数据的多样性并防止过拟合。第四,选取YOLOv8s和YOLOv11s两种轻量级目标检测架构进行对比训练,配置特定的超参数(如AdamW优化器、余弦退火学习率调度、特定的损失函数权重),并采用早停机制监控验证集性能。最后,将训练好的模型转换为TensorFlow Lite格式,基于MVVM架构开发适用于Android中端设备的移动应用程序原型,以验证其在离线状态下的推理效率。

**研究结果**

**数据集预处理与增强:**
研究人员将采集的350张高分辨率图像处理后得到751张1280×1280像素的图像。通过动态数据增强,模拟了田间复杂的环境变化,有效增加了训练数据的泛化能力,避免了在中等规模数据集上的过拟合。

**模型性能对比:**
在150个epochs的训练中,由于早停机制,YOLOv8s在第79个epoch停止,而YOLOv11s在第97个epoch停止。定量评估显示,YOLOv11s在所有指标上均优于YOLOv8s。YOLOv11s的精确度为73.20%,召回率为66.72%,F1-Score为69.81%,mAP@50为71.63%。相比之下,YOLOv8s的精确度为70.51%,召回率为63.02%。这表明YOLOv11s在减少误报(False Positives)和提高检测敏感性方面表现更佳。

**混淆矩阵分析:**
YOLOv8s表现出较高的背景混淆率,大量将背景噪声误判为潜叶蝇,导致其精确度受限。而YOLOv11s通过引入C3k2模块和C2PSA空间注意力模块,增强了对多尺度特征和关键区域的关注,显著提高了对害虫轨迹与复杂叶脉背景之间的区分能力,减少了误报。

**统计稳健性分析:**
通过5折交叉验证,YOLOv11s在各项指标上表现出更小的标准差和更窄的置信区间,证实了其在不同数据划分下的稳定性和鲁棒性优于YOLOv8s。

**移动端原型验证:**
研究开发了基于TensorFlow Lite的移动应用原型。在Redmi Note 11(中端设备)上的测试表明,YOLOv11s模型的平均推理时间为5.28秒,比YOLOv8s的6.19秒快了约15%,且内存消耗稳定在116MB左右。这证明了该模型能够在不依赖网络连接的中端设备上实现高效、实时的田间诊断。

**讨论与结论**

本研究证实,利用YOLOv11s架构进行图像分析可以有效检测甘薯作物中的潜叶蝇。相较于YOLOv8s,YOLOv11s凭借其在骨干网中集成的C3k2块和在颈部网络中集成的C2PSA空间注意力模块,实现了更稳定的收敛和更优的特征提取能力,特别是在处理占据图像面积较小(<5%)的害虫轨迹时表现突出。尽管其绝对精确度数值(73.20%)低于一些在受控实验室环境下针对整只昆虫或圆形病斑的研究(如ResNet在辣椒病害检测中达到99.67%),但本研究强调了田间环境中背景复杂性带来的挑战,以及轻量化模型在资源受限设备上的实用性。YOLOv11s在保持较低计算负担(参数量减少16%,计算量减少25%)的同时,实现了比前代模型更高效的泛化能力,平衡了检测精度与部署可行性。

结论部分指出,成功构建了“camote_minador”数据集,并验证了动态数据增强对于提升模型在田间复杂条件下识别能力的重要性。研究证实,YOLOv11s在精确度、召回率及F1-Score上均显著优于YOLOv8s,能够更有效地区分害虫损伤与背景噪声。此外,基于TensorFlow Lite开发的移动端原型在中等配置设备上运行良好,推理延迟低,内存占用合理,无需互联网连接即可实现就地诊断。这项研究为甘薯种植者提供了一款经济、易用且可扩展的技术工具,有助于实现精准农业监测,减少不必要的农药使用,从而提升农业生产的安全性与可持续性。该成果发表于《Frontiers in Plant Science》。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号