《Smart Agricultural Technology》:Exploring ensemble learning methods with labor-free line-by-line radiometric calibration for classifying the damage types of rice planthopper from hyperspectral images
编辑推荐:
白背飞虱(white-backed planthopper, WBPH)和褐飞虱(brown planthopper, BPH)是水稻上的主要害虫,其共同危害会严重抑制作物生长并造成产量损失。因此,及时且准确地识别受害类型,对于精准施药和高效害虫管理至关重要。
白背飞虱(white-backed planthopper, WBPH)和褐飞虱(brown planthopper, BPH)是水稻上的主要害虫,其共同危害会严重抑制作物生长并造成产量损失。因此,及时且准确地识别受害类型,对于精准施药和高效害虫管理至关重要。本研究评估了基于高光谱图像分类飞虱侵染类型的集成学习方法,并通过室内受控试验探究其作用机制。研究人员提出了一种新型免人工、逐行(line-by-line)辐射校正方法,用于迁移高光谱图像采集过程中由光照不均引起的畸变。研究进一步利用集成学习模型评估了不同校正策略对受害类型分类的影响。此外,结合SHAP(Shapley Additive Explanations)特征贡献分析识别关键影响因子,并阐明其潜在机制。结果表明,所提出的逐行辐射校正可通过降低光照诱导畸变,显著提高水稻高光谱数据的一致性。基于常规定标数据,XGBoost和Stacking方法在飞虱危害类型识别中表现较优,其总体精度(OA)和Kappa系数均分别超过0.564和0.344。采用逐行校正后,其性能提升超过20%,最高OA和Kappa分别达到0.682和0.551。蓝光区域(450–520 nm)和近红外区域(750–900 nm)对该任务的贡献最大。
该文发表于《Smart Agricultural Technology》,聚焦于水稻褐飞虱(brown planthopper, BPH)与白背飞虱(white-backed planthopper, WBPH)共同侵染情境下的危害类型识别问题。研究背景在于,两类飞虱均为水稻生产中的重要刺吸式害虫,不仅共同危害会显著抑制植株生长、降低产量,而且二者在杀虫剂抗性上存在差异,要求防控策略具有更强的针对性。因此,在大规模暴发前实现危害类型的及时、准确识别,是优化农药施用和提升虫害精细化治理能力的关键环节。现有基于RGB图像或机器视觉的方法在一定程度上能够识别虫害,但较依赖可见害虫个体,不适于回溯性调查;而高光谱成像依托“光谱指纹”特性,能够捕获植物在虫害胁迫下的间接光谱响应,因而在复杂环境中更具鲁棒性。然而,现有研究多聚焦单一虫种危害程度评估,对两类飞虱共害条件下的危害类型分类关注不足;同时,室内推扫式(pushbroom)高光谱成像易受光照不均影响,常规辐射定标难以充分消除逐行亮度畸变,导致光谱一致性下降并削弱分类性能。此外,不同水稻品种在冠层结构、茎秆形态和叶片性状上的差异,也会引起虫害敏感性与光谱响应的变化,使基于单一品种构建的模型泛化能力受限。基于此,开展兼顾定标精度、跨品种适应性与模型可解释性的研究具有明确必要性。
为解决上述问题,研究人员构建了室内近地高光谱成像系统,在水稻拔节期采集褐飞虱、白背飞虱、两者共同侵染及健康对照(CK)四类处理下的图像数据,并围绕四项目标展开研究:提出免人工逐行相对辐射定标方法以削弱不均匀光照效应;评估集成学习在危害类型分类中的应用潜力;识别区分不同危害类型的敏感波段;比较不同算法在多水稻品种条件下的表现。研究结论表明:所提出的逐行辐射定标显著改善了光谱均一性与数据可靠性;XGBoost与Stacking在危害类型识别中表现最佳;相较常规定标,逐行定标可使关键模型精度提升超过20%;分类贡献最高的关键波段主要位于蓝光区和近红外区。这些结果说明,结合改进的高光谱辐射校正与集成学习框架,可有效提升水稻飞虱危害类型识别能力,为精准虫害监测与差异化防控提供技术支撑。
在技术方法方面,研究人员选取TN1、Jiahe 247与Chunyou 87三个水稻品种,在人工气候室中开展受控接虫试验,设置CK、BPH危害、WBPH危害及BPH/WBPH共害4类处理。利用FX10高光谱相机获取400–1000 nm图像,提出基于自适应阈值分割、形态学处理、区域质心/面积一致性与Ramer-Douglas-Peucker(RDP)近似规则的免人工标准反射板提取方法,并据此实施逐行相对辐射定标。随后提取纯水稻像元,采用Savitzky–Golay(SG,萨维茨基-戈莱平滑)滤波进行光谱平滑,结合连续投影算法(SPA)与混洗蛙跳算法(SFLA)进行敏感波段筛选;进一步构建随机森林(RF)、极端梯度提升(XGBoost)、轻量梯度提升机(LightGBM)、Stacking和偏最小二乘判别分析(PLS-DA)模型,并以SHAP解析特征贡献。
3.1. Comparison between line-by-line radiometric correction and conventional radiometric correction methods
本节比较了逐行辐射定标与常规辐射定标在图像视觉均一性和光谱一致性方面的差异。研究人员通过真彩色图像以及标准反射板单行像元在单波段上的反射率分布进行分析,发现逐行辐射定标能够有效消除由光照不均造成的反射板亮度变化,使位于明区和暗区的反射板都表现出更加一致的亮度分布,显示出更好的视觉均匀性。进一步与ASD FieldSpec 4实测反射率对比发现,常规定标后的反射板反射率沿列方向呈明显弯曲波动趋势,且与ASD值之间的偏差约为0.08–0.20;而逐行定标后,该偏差降至0.01以下,反射率曲线趋于平直,说明该方法显著提高了辐射校正精度。针对同一植株中处于强光区和弱光区、但生长状态相近的叶片,研究人员比较其光谱曲线后发现,常规定标下两者在多数波段存在明显反射率偏差,最大差异超过30%;相对地,逐行定标后两条曲线在全波段、尤其红边和近红外区域高度重合,表明该方法能够在保留植被典型光谱形态的同时,有效补偿由局部光照差异引起的光谱强度失真。该部分结果证明,免人工逐行定标不仅改善了高光谱图像质量,也为后续敏感特征提取和分类建模提供了更可靠的数据基础。
3.2. Evaluating the performance of different methods for identifying rice planthopper damage types
本节围绕不同特征选择策略和分类模型对飞虱危害类型的识别性能展开评估。基于常规定标数据,研究人员分别以SPA筛选波段、SFLA筛选波段及全波段数据作为输入,建立XGBoost、RF、LightGBM、Stacking和PLS-DA模型。结果表明,基于SPA敏感波段构建的模型整体优于SFLA与全波段方案,OA为0.471–0.537,Kappa为0.186–0.347,较其他输入形式提升超过10%。这说明SPA更能在降低冗余的同时保留与危害类型相关的判别信息,而SFLA筛选结果则可能存在冗余或偏倚,导致泛化能力下降。进一步比较模型性能发现,XGBoost在所有方法中表现最佳,PA、UA、OA与Kappa分别达到0.564、0.537、0.537和0.344;Stacking整体表现与其接近,PA、UA、OA和Kappa分别为0.566、0.535、0.535和0.347,并在区分BPH与CK方面较XGBoost有所改善。相较之下,RF表现较弱,甚至不及PLS-DA,显示其在该高维复杂光谱分类任务中的适应性有限。研究人员进一步比较常规定标与逐行定标下的模型表现,发现逐行定标显著提升了PLS-DA、XGBoost、LightGBM与Stacking的性能,其中最优OA和Kappa分别达到0.682和0.551,表明提升光谱一致性可直接增强危害类型分类效果。唯RF对定标策略变化不敏感,部分指标甚至略有下降。
3.3. Robustness of ensemble learning algorithms in identifying rice planthopper damage types across multiple rice varieties
本节评估集成学习模型在跨水稻品种场景中的稳健性。研究人员以逐行定标后、经SPA筛选的敏感波段为基础,分别使用单一品种以及任意两个品种的数据训练XGBoost和Stacking模型,并在包含全部三个品种的验证集上测试性能。结果显示,仅用单一品种训练的模型在其他品种上的迁移能力较弱,OA和Kappa均低于0.46和0.21,说明不同品种间生理状态和受害响应差异会显著改变高光谱反射特征,进而削弱模型泛化性。随着训练集中品种多样性增加,模型表现显著改善,OA和Kappa均提升至0.52和0.33以上,相当于全品种模型精度的76%–83%。这表明,在训练阶段纳入更丰富的品种类型,可有效降低由品种光谱差异引起的误差,增强模型在多品种条件下的稳定性与适应性。研究还指出,即便训练集中品种数量相同,若其光谱特性差异不同,模型泛化能力仍会出现明显波动,说明样本代表性不仅取决于数量,也与所覆盖的光谱变异范围密切相关。对于BPH与WBPH共害类型,随着训练数据中品种多样性的提高,其PA和UA也持续上升,PA维持在0.72以上,UA超过0.52,提示多品种训练对复杂交互危害类型的判别尤其重要。
3.4. Visual analysis of rice planthopper damage types and shape-based feature importance assessment
本节利用逐行定标后、基于SPA敏感波段构建的XGBoost模型,对飞虱危害类型进行空间可视化识别,并结合SHAP开展特征重要性分析。空间分布图显示,该模型能够较好地刻画单株水稻上不同危害类型的空间分布格局和发生趋势,对CK识别效果最佳,能够较准确地区分未受害像元与受害像元;但仍有部分CK像元被误分为WBPH或BPH/WBPH。对于WBPH与BPH两类单一虫种危害,模型在上部叶片区域的像元级误判较为常见,二者在混淆矩阵中存在明显相互混淆,说明这两类危害在光谱空间中的分离度较低。研究人员指出,这与二者在近红外区和红边区的反射趋势高度相似有关。尽管如此,模型在茎基部等飞虱主要取食区域仍表现出较强的区分能力,说明融合空间位置与局部光谱响应后,仍可实现可接受的危害类型判别。对于BPH/WBPH共害类型,模型识别效果最弱,提示交互危害的特征表达仍有待增强。
在SHAP解释结果中,研究人员基于400–1000 nm全光谱数据对前30个重要波段进行排序。结果显示,不同危害类型对应的关键波段分布存在差异。CK样本对模型决策的贡献最大,敏感波长主要集中在440 nm、490 nm、540 nm与690 nm附近,其中440 nm与690 nm的作用尤为突出;BPH样本贡献次之,关键波段主要位于450 nm、690 nm、850 nm和990 nm附近,其中850 nm最具判别力。WBPH对应的重要波段主要分布在410 nm、710 nm和990 nm附近,但整体贡献低于前两者。共害类型的波段贡献模式与BPH较为接近,反映出其光谱症状上的高度相似性。总体而言,蓝光区(450–520 nm)对模型性能贡献最大,尤其有利于区分CK与BPH受害样本;近红外区(750–900 nm)次之,主要反映植株结构与含水状态变化;绿光区(520–600 nm)和红边区(680–740 nm)重要性相对较低。结合平均光谱分析,研究人员认为飞虱持续吸汁会引发叶绿素降解、茎叶黄化、水分状态改变及叶肉组织受损,从而在蓝光、红边和近红外区产生显著光谱变化,这构成了利用高光谱数据识别飞虱危害类型的生理学基础。
讨论部分表明,本研究的核心贡献在于从数据质量提升与模型决策优化两个层面协同推进水稻飞虱危害类型识别。一方面,推扫式高光谱成像中常见的逐行光照不均问题会显著扭曲反射率信息,而所提出的免人工逐行辐射定标可在无需繁琐人工操作的前提下,显著改善图像亮度一致性和像元光谱均一性;另一方面,集成学习,特别是XGBoost与Stacking,在处理多品种、高维且存在复杂背景差异的高光谱数据时,表现出优于线性模型和部分传统机器学习方法的鲁棒性与泛化能力。研究同时指出,跨品种训练样本的代表性对于提高模型实际应用价值至关重要,而WBPH、BPH及其共害之间仍存在一定光谱混淆,提示后续仍需进一步提升特征表达能力。该研究为高光谱虫害诊断、跨品种模型构建以及精准农业中的差异化防控提供了方法学参考。
研究结论部分可译为:本研究围绕褐飞虱(BPH)与白背飞虱(WBPH)共同侵害条件下危害类型识别难题,采用集成学习方法挖掘高光谱数据特征。研究提出了一种免人工逐行辐射定标方法,以减弱水稻高光谱图像中光照不均的影响,并考察了其对危害类型识别的作用。结果表明:
(1)所提出的逐行校正策略显著提升了水稻像元的光谱均一性,并增强了光谱信息的可靠性;
(2)XGBoost与Stacking集成学习模型较其他模型表现出更强的水稻飞虱危害类型识别能力,其OA和Kappa均分别高于0.564和0.344;
(3)基于所提辐射校正策略建立的模型,相较常规校正方法具有显著性能提升(>20%),最优OA和Kappa分别达到0.682和0.551;
(4)用于危害类型分类的关键光谱波段主要位于蓝光区(450–520 nm)、红边区(680–740 nm)和近红外区(750–900 nm),其中蓝光与近红外波段具有最高判别贡献。尽管结果较为理想,本研究仍是在受控实验条件下完成,且仅涉及有限数量的水稻品种。未来仍需在田间条件和更丰富的水稻品种范围内,进一步评估所提定标策略与建模框架的稳健性及其在精准虫害管理中的实际应用潜力。