《Computers and Electronics in Agriculture》:Pyramidal convolution ReX-Net with coordinate bobcat attention networks based anomaly detection and classification for banana leaf diseases
编辑推荐:
自动检测与分类系统用于 banana leaf 病害与营养缺乏诊断,融合 FDCT 提取光照不变特征,PyrReX-CA-Net 实现多尺度上下文感知特征提取,BOA 优化超参数,在两公开数据集上准确率达 99.81% 与 99.02%,显著降低误报并适应复杂环境。
Kalpana R. Sarode | Sandip S. Patil
计算机工程系,贾尔冈政府工程学院,马哈拉施特拉邦425002,印度
摘要
香蕉种植受到叶片疾病、营养缺乏和环境因素的严重影响。人工检查不仅是最昂贵的方法,也是最慢和最不可靠的技术。为了解决这个问题,本研究提出了一种自动检测和分类香蕉叶异常的系统。该系统首先通过异常检测阶段确定并分离出患病或异常的区域,然后进行分类,以识别具体的疾病或营养缺乏类型,从而提高诊断准确性并减少误判。系统从数据预处理和增强开始,以最大化数据集的质量并提高模型的鲁棒性。快速离散小波变换(FDCT)用于提取丰富的全局特征,随后结合金字塔卷积ReX-Net和坐标山猫注意力网络(PyrReX-CA-Net)进行精确的、具有上下文意识的特征提取。使用山猫优化算法(BOA)优化超参数,以确保高效收敛和高分类准确性。该模型在两个公开的香蕉叶数据集上进行了训练和评估。在识别营养缺乏方面,该方法达到了99.81%的准确率和98.9的F1分数;在诊断疾病方面,准确率为99.02%,F1分数为98.79%。这一框架提供了一种可靠、自动化且可扩展的解决方案,有助于可持续的香蕉种植和农业中的快速管理行动。
引言
农业和种植业是全球无数人的基本食物和收入来源,因此是确保粮食安全和商业稳定的主要因素(Shah等人,2024年)。香蕉是一种高价值、全球交易的作物,主要在热带和亚热带生态系统中种植。它们是最重要的农产品之一,年产量估计超过1.2亿吨(Sheikh等人,2025年)。香蕉生产和就业是印度农村经济和劳动部门的重要组成部分,但这些领域极易受到生物压力(如细菌和真菌感染)和非生物压力(如营养和环境不足)的影响。在这些不利条件下,每年高达40-50%的损失足以导致生产力难以维持(Subedi等人,2023年)。
正确识别香蕉叶异常(疾病和营养缺乏)的早期迹象对于有效的干预措施、准确的输入处理和最大化香蕉产量至关重要(Ismaila等人,2023年)。环境及其复杂相互作用决定了香蕉叶表型的变化,特别是温度、相对湿度、降雨/降水量和土壤湿度(Ali等人,2024年)。这些条件改变了病斑的形式、光线在叶片表面的反射方式以及表面的外观和触感,使得图像更难以观察。在印度马哈拉施特拉邦等国家,香蕉作物经常受到严重感染,如香蕉细菌性萎蔫、黄斑病和黑斑病、香蕉丛顶病毒(BBTV)和黄瓜花叶病毒(CMV)(Backiyarani等人,2022年)。气候和人们的耕作方式会影响这些疾病的严重程度。此外,生物疾病和营养失衡(如黄化病、坏死区域、条纹等)的共同症状可能会使使用传统图像分析软件和肉眼检查难以区分它们。
传统的疾病识别依赖于专业人员的视觉检查,这种方法不方便、耗时,且不适用于大规模种植园(Mora等人,2024年)。此外,由于病原体引起的营养缺乏和病斑(如黄化病、坏死斑点等)的出现可能会造成诊断错误。即使是较新的成像和机器学习(ML)算法也存在问题,包括光照不一致、病斑模式重叠以及类别不平衡,这在实际应用中准确性较低。深度学习(DL)技术作为一种有前景的解决方案出现,利用先进的图像表示和模式分析来自动化疾病检测(Wani等人,2022年)。
尽管深度学习在植物疾病诊断方面取得了重大突破,但目前分析香蕉叶的方法仍然存在显著局限性,例如对光照变化的抵抗力低、多尺度病斑的表示不足以及无法区分相似疾病的症状和营养相关缺乏。大多数先前的研究基于RGB图像和单阶段分类,这在健康区域占据主导或症状相似时容易出现误判。此外,对影响疾病表现的环境因素考虑较少。这些限制表明需要一个连贯的框架,首先隔离异常区域,然后在实际田间条件下进行基于上下文的分类。
现有的深度学习方法仍然面临主要挑战,包括在变化光照条件下的光照处理能力差、多尺度特征提取不足、环境参数整合薄弱,以及当疾病和营养压力症状在视觉上重叠时的泛化能力有限。这些限制往往导致检测结果不一致或错误,因为不一致的光照使特征不清晰,隐藏了关于病斑的重要细节。此外,缺乏可靠的多尺度特征表示限制了对结构和生态因素变化的检测,这些因素会影响疾病的显现。非平衡数据集中的模型也存在问题,疾病-缺乏模式可能相似,从而使得准确可靠的诊断变得复杂。本文提出PyrReX-CA-Net框架能够解决这些问题,实现生物背景下大规模香蕉叶异常的稳健检测和分类。这里,异常检测是指识别出那些不正常的叶片,即患病或缺乏足够营养的叶片。分类则是根据它们表现出的疾病类型或缺乏类型将它们分组。该框架利用光照不变的反照率线索、多尺度特征提取和环境知识来简化学习目标,减少误判,并提高类别区分能力。因此,PyrReX-CA-Net能够更好地应对环境变化,在具有挑战性的光照条件下更精确地诊断问题,并适应实际农业操作。本研究的主要贡献包括:
- •
FDCT的整合减少了光照不一致性,改善了传统CNN或基于小波的方法无法捕捉的曲线状病斑边界和细粒度纹理的描绘。这使得在变化的光照条件下对病斑边缘的敏感度更高,分类准确性也更高。
- •
金字塔卷积(PyConv)、ReX-Net和坐标注意力(CA)的结合增强了疾病区域的空间定位和细粒度症状区分能力。与之前的单分支CNN架构相比,双流RGB-反射率融合提供了互补的表示,提高了视觉上重叠的疾病和缺乏症状之间的区分能力,提高了F1分数并减少了误判,而BOA驱动的超参数调整加速了收敛速度,并在平衡和不平衡的数据集中增强了模型的鲁棒性。
- •
多样化的环境嵌入被整合到分类流程中。合成但符合农艺学要求的参数与视觉特征结合,为分类提供了环境背景。这提高了上下文意识,并通过在多种农业气候条件下的可靠检测来提高泛化准确性。
在香蕉作物诊断的实际案例中,初始症状通常是分散和局部的,叶片的大部分是健康的。直接分类方法可能会受到明显背景部分的影响而产生偏见。添加异常检测阶段后,模型可以首先识别异常区域,无论其原因是什么,从而减少误报。进一步的分类则能够更准确地区分疾病和营养缺乏,使诊断过程更加有效,更适合应用于实际农业领域。
本研究的目标如下:
- (i)
在不同光照条件下,提高Retinex引导的FDCT中病斑的可见性和结构特征的可分离性;
- (ii)
利用双流PyConv ReX-Net架构,包括坐标注意力,提高多尺度病斑的区分和定位能力;
- (iii)
通过异常检测和随后的分类,有效区分视觉上相似的疾病和营养缺乏症状,提高诊断的可靠性;
- (iv)
比较基于BOA的超参数优化对平衡和不平衡数据集的收敛性和分类性能的影响;
- (v)
通过嵌入不同农业气候条件下的环境信息来泛化和理解背景。
当疾病和营养缺乏症状有限且稀疏,叶片的大部分看起来健康时,这是实际香蕉作物监测的特点。直接分类策略可能会因为背景的主导模式而产生偏见,从而导致误判。通过添加异常检测步骤,模型可以隔离异常区域,无论其原因是什么,然后仅在生物学相关的区域进行后续分类,从而提高实际田间诊断的可靠性。
研究的结构如下:第2节回顾了相关工作。第3节详细介绍了所提出的框架。第4节提供了实验和分析。第5节总结了研究结果和未来方向。
章节片段
先验研究概述
当前的模型在泛化、适应新情况以及结合来自不同来源的多种特征方面存在困难。这就是我们需要开发更强大的诊断框架的原因。
香蕉叶疾病异常检测和分类的提出方法
开发的系统具有高度先进的深度学习流程,用于检测香蕉叶的缺陷。它通过基于小波、PyConv和ReX-Net的数据预处理和特征提取以及注意力机制来实现这一点。在BOA的帮助下,该模型能够可靠地识别疾病和营养缺乏,即使在环境和图像质量变化的情况下也能保持高准确性。所提出框架的详细视图如图1所示
实验结果和讨论
为了评估所提出框架的性能,在香蕉叶疾病和营养缺乏的数据集上进行了大规模实验。实证评估主要关注模型的分类准确性、对变化条件的适应能力以及在不同视觉症状上的泛化能力。
结论
所提出的框架建立了一种自动检测和分类香蕉叶异常的机制,包括疾病和营养缺乏,这是一种具有生物学背景和计算效率的解决方案。通过多尺度特征提取、方向性纹理增强、空间注意力和环境背景建模的协同作用,该框架达到了高诊断精度和可解释性。广泛的实验
动物和人权声明
- i.
伦理批准:遵循了所有适用的机构和/或国家关于动物护理和使用的指南。
- ii.
知情同意:这种类型的分析不需要正式同意。
CRediT作者贡献声明
Kalpana R. Sarode:概念化。Sandip S. Patil监督。
资助
本研究没有从公共、商业或非营利部门的资助机构获得任何特定资助。
利益冲突声明
作者声明他们没有已知的利益冲突或个人关系可能影响本文报告的工作。