基于计算感知与原型证据的可解释两阶段混合框架GateProtoNet在麦棉叶部病害分类中的应用

《AgriEngineering》:GateProtoNet: A Compute-Aware Two-Stage Hybrid Framework with Prototype Evidence and Faithfulness-Verified Explainability for Wheat and Cotton Leaf Disease Classification Muhammad Irfan Sharif, Yong Zhong, Muhammad Zaheer Sajid and Francesco Marinello

【字体: 时间:2026年04月13日 来源:AgriEngineering 3

编辑推荐:

  在真实农田条件下,小麦叶部病害的准确诊断需要模型兼具高精度、高计算效率和高可解释性,以支持在边缘设备的实际部署。本文提出了GateProtoNet (GPN),一个用于多类叶部病害识别的两阶段、计算感知且可解释的框架。该框架通过超轻量级“健康-病叶”筛查实现早期退出,显著降低平均推理成本;采用创新的混合骨干网络提取特征,并通过原型证据头和保真度验证机制提供可靠、可解释的预测。在多个公开数据集上的评估表明,GPN实现了99.2%的分类准确率,优于现有基线,同时参数量和计算量大幅减少,为资源受限的农业环境提供了实时、可信的现场诊断方案。

  
养活全球约35%人口的小麦,正遭受叶锈病、叶枯病等多种叶部病害的威胁,可导致10%至70%的减产。传统的人工检测方法耗时、主观且易出错,难以满足大规模农业对快速病害识别的需求。近年来,基于深度学习与计算机视觉的自动植物病害检测技术虽展现出潜力,但其在农业真实场景的落地仍面临三重严峻挑战:首先,大多数先进模型需要高昂的计算资源,这与田间常用的智能手机、嵌入式系统等边缘设备有限的算力、内存和电量形成矛盾;其次,田间复杂的光照、背景、遮挡物及病害症状的自然变异,使得在实验室洁净图像上训练出的模型表现常大幅下降;最后,深度学习模型如同“黑箱”,其决策过程缺乏透明解释,这让需要理解并信任模型决策的农学家、植保专家和农民们难以放心采纳。
为此,研究团队在《AgriEngineering》上发表了题为“GateProtoNet: A Compute-Aware Two-Stage Hybrid Framework with Prototype Evidence and Faithfulness-Verified Explainability for Wheat and Cotton Leaf Disease Classification”的研究论文,提出了一种名为GateProtoNet (GPN)的新型框架,旨在同时攻克上述效率、鲁棒性与可解释性难题。该研究为资源受限的农业环境设计了一个统一的两阶段、计算感知且可解释的深度学习系统。
研究方法概要:
研究人员设计并验证了GateProtoNet框架。首先,利用公开的麦棉叶部病害图像数据集进行模型训练与评估。关键技术方法包括:1) 构建两阶段计算感知推理策略,第一阶段使用轻量级筛查网络快速过滤健康叶片;2) 设计频率感知的离散小波变换(DWT)茎干,对输入图像进行多尺度频率子带分解以保留细微病变特征;3) 搭建双路径混合架构,并行集成微病变卷积编码器(用于局部纹理特征)和线性令牌混合器(用于全局上下文建模);4) 引入交叉门控融合模块,自适应整合局部与全局特征;5) 采用基于原型证据的分类头,通过将输入特征与可学习的类原型进行比较来实现可解释分类;6) 在训练中加入基于保真度的可解释性约束,通过评估移除显著区域后的置信度下降来确保解释的可靠性。
研究结果:
  • 1. 整体性能优越
    在四个公开可用的小麦和棉花叶部病害数据集上进行综合评估。GateProtoNet实现了99.2%的分类准确率、99.1%的宏平均F1分数和99.3%的AUC(曲线下面积),显著优于现有的CNN、Transformer及混合基线模型。同时,GPN所需的参数量和浮点运算次数(FLOPs)大幅减少,证明了其高效性。
  • 2. 两阶段策略有效降低计算成本
    通过在第一阶段设置阈值(τs= 0.5)对健康叶片进行早期退出,该策略避免了大多数健康样本进入计算密集的第二阶段。在实际监测中(健康样本占多数),这显著降低了整个系统的平均预期推理计算成本,使得实时、设备端的部署成为可能。
  • 3. 频率感知DWT茎干增强特征提取
    与传统的卷积茎干处理原始RGB图像不同,提出的DWT茎干将图像分解为低频(结构信息)和高频(纹理细节)子带。这种处理有助于在减少空间冗余的同时,保留早期病害症状(如小病斑、颜色和纹理变化)的细粒度特征,从而提升了模型在复杂田间条件下的特征提取质量。
  • 4. 双路径混合架构与自适应融合捕获全面特征
    微病变卷积编码器路径利用小感受野的滤波器,专注于捕获叶片表面的锈病孢子堆、叶枯病病斑等细微纹理模式。同时,线性令牌混合器路径则擅长学习全局特征,关注颜色扩散、叶片形状变化及病害空间分布等大尺度模式。交叉门控融合模块并非简单拼接或相加,而是通过学习门控权重,自适应地从两条路径选择信息。例如,对于锈病和白粉病等纹理型病害,它会更多采用卷积特征;而对于叶枯病和叶斑病等结构型病害,则更多采用令牌混合器特征。这种自适应融合以极低计算开销实现了局部与全局证据的有效整合。
  • 5. 原型证据与保真度验证提供可信解释
    原型证据头将每个病害类别表示为特征空间中的一组可学习原型向量。分类通过计算输入图像特征与这些原型的相似度来完成,为农业专家提供了“输入图像与哪种已知病害模式最相似”的直观、案例式的推理解释。此外,研究中引入的保真度约束机制,通过在训练中强制要求:当根据解释图移除图像中的重要区域时,模型对该病害类别的预测置信度必须下降。这一机制确保了模型生成的可视化解释图(如高亮区域)真实反映了其决策依据,而非虚假关联,从而增强了整个系统的可靠性和可信度。
结论与意义:
本研究成功开发了GateProtoNet,一个针对小麦和棉花叶部病害分类的创新性框架。该工作主要贡献在于:提出了一种计算感知的两阶段早期退出架构,显著提升了边缘设备的部署可行性;引入了频率感知的DWT茎干,改善了细粒度病害特征的提取;设计了结合局部卷积与全局令牌混合器的双路径混合骨干网络,并通过交叉门控进行自适应融合,全面捕捉了病害特征;最后,创新性地将原型学习与保真度验证相结合,为实现可靠、可解释的农业AI诊断提供了新思路。
实验结果表明,GateProtoNet在保持超高分类精度的同时,大幅降低了模型复杂度和计算开销。其两阶段设计尤其适合田间监测场景(健康样本居多),能有效节约计算资源。更重要的是,框架提供的基于原型比较的可视化解释以及经过保真度验证的决策依据,极大地增强了模型对农业领域用户的透明度和可信度,有助于推动深度学习技术在精准农业中的实际应用与专家采纳。该研究为开发下一代高效、鲁棒且可信的植物病害智能诊断系统提供了重要的方法论参考和实践范例。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号