基于无人机的深度迁移学习用于提升冬小麦谷物产量预测的时空变异性

《The Plant Phenome Journal》:UAV-based deep transfer learning to improve grain yield prediction in winter wheat across temporal and spatial variability

【字体: 时间:2026年05月29日 来源:The Plant Phenome Journal CS5

编辑推荐:

  谷物产量(GY)的准确预测一直是植物育种中的一个主要挑战,这源于基因型、环境和管理(G × E × M)因素之间复杂的交互作用。配备多光谱传感器的无人机(UAVs)所获取的遥感数据已成为高通量表型分析(HTP)的关键资源。本研究中,研究人员应用了一种深度迁移学

  
谷物产量(GY)的准确预测一直是植物育种中的一个主要挑战,这源于基因型、环境和管理(G × E × M)因素之间复杂的交互作用。配备多光谱传感器的无人机(UAVs)所获取的遥感数据已成为高通量表型分析(HTP)的关键资源。本研究中,研究人员应用了一种深度迁移学习(DTL)方法,利用从冬小麦(Triticum aestivum L.)多个环境和生育阶段获取的无人机光谱和纹理性状来增强GY预测。该模型在年份、地点、苗圃和特定生长阶段的情景下评估了其可迁移性和泛化能力。研究人员采用微调(fine-tuning)策略,即在一个预训练的一维卷积神经网络(1D-CNN)模型上,使用特定情境的目标数据进行重新训练,以提升模型的泛化能力。微调分别使用了目标数据的20%、40%、60%和80%的比例进行测试,以确定模型精度和适应性之间的最佳平衡,并与未经迁移学习(DTL)的1D-CNN基线模型进行了比较。在跨年预测中,基线模型(基于2022年数据)表现不佳(2023年R2 = ?2.9),而DTL在使用20%数据微调后,将预测精度提升至R2 = 0.83,展现了强大的时间适应性。同样,在跨地点情景下,基线模型性能较差(R2范围从?15.3到?0.4),但通过40%数据微调后改善至0.29–0.69。在特定生长阶段预测中,Feekes 10.5和11阶段受益最大,DTL达到了0.78和0.82的R2值,而基线模型的R2值接近0。这些结果表明,DTL提升了模型的可迁移性和泛化能力,增加了预测精度,并为在现代育种项目中加速选择复杂且耗时的性状提供了一种资源高效的工具。
准确且及早地预测复杂性状如谷物产量(GY),对于提高育种流程的效率至关重要。高通量表型分析(HTP)通过快速精准的性状测量,已彻底改变了GY预测。然而,使用HTP数据的机器学习(ML)模型在精度、稀疏数据场景以及可迁移性方面面临挑战,这主要归因于环境和遗传的变异性。在本研究中,研究人员探索整合HTP与深度迁移学习(DTL)以应对这些挑战,重点利用南达科他州立大学(SDSU)冬小麦育种项目2022和2023年的苗圃数据来提升GY预测能力。DTL模型在多种情景下进行了评估,包括跨年、跨地点和跨苗圃预测,利用源领域的知识并通过有限的微调数据将其适配至目标领域。研究背景的核心在于,传统育种依赖于破坏性、高成本的表型测量,且多环境试验(METs)虽必不可少,但其高昂的成本和时间投入限制了育种项目的可扩展性。HTP和UAV技术的出现为非破坏性、高分辨率的性状数据获取提供了可能,但环境、管理和遗传的多样性导致了模型可迁移性的困难。本研究的核心目标是验证DTL是否能克服这些限制,实现更稳健、资源高效的GY预测。研究人员采用了DTL这一核心策略,其关键思想是将在大规模源数据上预训练模型所学到的通用表型模式,迁移并适配到具有不同条件的目标任务上。具体方法是:首先,利用2022年三个地点(Brookings, Brookings; Dakota Lakes, Winner)多个苗圃(ELITE, AYT, PYT)的HTP数据(包含48个植被指数(VIs)和40个纹理特征)预训练一个1D-CNN模型,该模型架构包含卷积层、批归一化(BN)、最大池化、Dropout层和全连接层。然后,在目标领域(如2023年数据或特定地点/苗圃数据)上,冻结预训练模型的卷积特征提取层,仅对最后几个全连接层进行微调,微调比例分别为20%、40%、60%和80%的可用目标数据。模型评估使用R2、RMSE和RMSE%作为指标。此外,研究人员还将DTL与RF、SVR和XGBoost等传统机器学习模型在相同设定下的表现进行了基准比较。研究结果清晰地证明了DTL的有效性。在跨年预测中,不使用迁移学习的基线模型表现极差(R2 = -2.9),而仅用20%的目标年数据微调后,预测精度大幅提升至R2 = 0.83。在跨地点预测中,DTL将原本几乎无预测能力的基线模型(R2为负值)提升至0.29-0.69的范围内。在跨苗圃(从AYT和ELITE迁移至遗传多样性更广的PYT)预测中,DTL同样显著改善了预测性能。在单次飞行数据的跨年预测中,DTL在所有生育阶段都显示出提升,尤其在Feekes 10.5(抽穗期)和11(乳熟期),R2分别达到0.78和0.82,表明后期生长阶段提供的表型信号更强、更稳定。讨论部分总结认为,DTL的成功源于其能够学习到跨域共享的表型模式,并通过微调适应目标域的特定变异性(如年份效应、地点效应)。研究指出,即使有限的目标数据(20%-40%)也足以实现稳健的预测,这极大地降低了获取新领域真实数据的成本。该方法对于处理具有强基因型×环境交互作用的复杂性状具有重要价值,能够加速育种选择过程。最后,结论部分强调,这是首次研究证明DTL方法利用无人机HTP数据(包括光谱和纹理特征)能有效预测冬小麦育种试验的GY。研究结果表明,DTL在跨年、跨地点、跨苗圃和跨生育阶段的评估中均持续优于基线模型,尤其在仅有有限目标数据进行微调时效果显著。这突出了模型学习由时间、空间或发育特征定义的特定情境表型模式的能力。DTL还能够以减少的数据需求实现准确预测,为锁定信息丰富的生长阶段、最小化重复无人机飞行和田间评估提供了实用策略。随着育种项目持续整合HTP与基因组和环境数据,DTL的适应性展现出了作为加速选择、优化资源利用的强大工具的潜力,并为开发小麦产量基础模型的底层原理提供了可行性验证。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号