统一AMMI-GGE(UAG)模型:整合多环境试验中产量稳定性与适应性的连续框架

《Plants》:The Unified AMMI-GGE (UAG) Model: A Continuous Framework for Integrating Yield Stability and Adaptability in Multi-Environment Trials

【字体: 时间:2026年06月11日 来源:Plants 4.1

编辑推荐:

  理解并建模基因型-环境互作(GEI)仍是植物育种的核心问题,直接影响品种推荐和 mega-environment(巨环境)划分。本研究提出的统一AMMI-GGE(UAG)框架将两个广泛使用的GEI模型——加性主效应与乘性互作(AMMI)模型和基因型+基因型-环

  
理解并建模基因型-环境互作(GEI)仍是植物育种的核心问题,直接影响品种推荐和 mega-environment(巨环境)划分。本研究提出的统一AMMI-GGE(UAG)框架将两个广泛使用的GEI模型——加性主效应与乘性互作(AMMI)模型和基因型+基因型-环境互作(GGE)模型——推广为一个由调参α∈[0,1]控制的参数连续体,并在单一奇异值分解(SVD)结构下实现。UAG在保留AMMI推断严谨性的同时恢复了GGE面向决策的可视化能力。多种方案的交叉验证实验确定中间α值(0.1–0.3)与秩K=2为最优,在维持可解释性的同时最小化均方根误差。研究人员利用小黑麦(×Triticosecale Wittmack)多环境产量数据进行实证验证,证明该模型可按适应类型和稳定性对基因型分类。在α=0.3时,基因型G3、G5和G8表现为广适型,而G10和G11在有利环境下具有高产量潜力。UAG的关键新颖性在于在单一SVD结构内形式化了AMMI与GGE之间的连续参数路径,支持交叉验证模型选择而非在两个范式间随意取舍。统一AMMI-GGE指数(UAGI)在不同α值下给出一致的产量-稳定性排序,避免了单独AMMI与GGE指标典型的非一致性。总体而言,UAG在单一分析框架内桥接了可解释性与预测验证,为现代育种项目优化可变环境下的稳定性与生产力提供了灵活、交叉验证且理论一致的工具。
论文《Unified AMMI-GGE (UAG) Model: A Continuous Framework for Integrating Yield Stability and Adaptability in Multi-Environment Trials》发表在期刊《Plants》。该研究针对多环境试验(multi-environment trial, MET)中基因型-环境互作(genotype–environment interaction, GEI)建模长期存在的局限展开:传统上加性主效应与乘性互作(additive main effects and multiplicative interaction, AMMI)模型与基因型+基因型-环境互作(genotype + genotype–environment, GGE)模型被作为平行且独立的工具应用,两者之间的选择往往任意或基于惯例,缺乏统一的参数化联系,也无原则性的交叉验证准则来确定最优中心化程度,导致稳定性排序与基因型分类因模型不同而产生不一致,且无法在同一估计结构内客观评估哪一种表示更适合给定数据集。为填补这一方法论空白,研究人员开展了构建统一AMMI-GGE(unified AMMI-GGE, UAG)框架的研究,在一个单一的加权奇异值分解(singular-value decomposition, SVD)结构内引入连续参数α∈[0,1]来控制加性主效应信息进入乘性项的相对贡献,当α=0时退化为AMMI(双中心纯互作),α=1时恢复经典GGE(仅环境中心,合并基因型主效应与GEI),中间α值定义从可解释性到决策支持的平滑连续体,并通过交叉验证实现预测精度与可视化平衡的数据驱动模型选择。研究人员利用保加利亚Dobrudzha农业研究所2022–2024年三个环境、十六个小黑麦(×Triticosecale Wittmack)基因型(含四个对照品种)、五重复的完全随机区组产量试验数据进行了实证评价,得出如下结论:交叉验证一致表明α=0.1–0.3、双乘性成分秩K=2在最小化均方根误差(root-mean-square error, RMSE)与维持双维几何可解释性间取得最优折衷;在该配置下UAG双成分解释了α变换场中约95.61%的建模方差,残差均方较小且各主成分均显著;生物解释上α=0对应纯交叉GEI识别广适稳定基因型,α=1对应全基因型均值进入乘性项以强调生产力梯度和特定适应性,中间α代表广适与特适间的可调权衡并由数据集方差结构实证决定最优值;对小黑麦数据,α=0.3、K=2时基因型G8稳定性最高(UAG_IPCA_Stability低至0.28),G3、G5也呈广适型,G10、G11、G12为高产量但环境响应强,G4极不稳定仅适合特异环境选育;统一AMMI-GGE指数(unified AMMI-GGE index, UAGI)综合均值产量与稳定性,在不同α下给出一致排序,避免了分离AMMI稳定性与GGE均值指标的不一致;which-won-where(WWW)多边形显示三个环境分属不同扇形区,无单一基因型全局占优,支持环境特异性选择;UAG在α=0、K=2时与因子分析(factor-analytic, FA)混合模型FA(2)在数学上等价(最大重建误差1.30×10?13),但UAG额外提供连续α调参与更直观的双维双plot解释;该框架的重要意义在于首次在单一SVD结构内形式化了AMMI–GGE连续参数路径,以交叉验证替代随意模型选择,桥接了AMMI的推断严谨性与GGE的决策可视化,为育种者提供了可以同时优化稳定性、生产力及环境区分的灵活、数据自适应工具,论文发表于《Plants》。
关键技术方法:研究人员采用保加利亚General Toshevo地区2022–2024年三环境、十六小黑麦基因型、五重复完全随机区组产量试验样本队列;构建统一AMMI-GGE(UAG)模型,定义α∈[0,1]的α变换场Rα=PEY?α·g?wT(PE为去除环境均值的投影,g?w为环境中心后加权基因型均值列向量),在此场上做加权低秩双线性近似,用加权交替最小二乘(weighted alternating least squares, WALS)算法估计秩K=1–3的参数,收敛后对称SVD得基因型与环境得分;模型选择采用留一环境(leave-one-environment-out, LOEO)、留一基因型(leave-one-genotype-out, LOGO)、留一组合(leave-one-combination-out, LOCO)、双向留一(two-way leave-one-out, LOO)四种交叉验证方案,以预测残差平方和(prediction residual sum of squares, PRESS)与交叉验证均方误差(cross-validated mean square error, CV-MSE)在原空间Y与α变换空间Yα同时评估;推导UAG_IPCA_Stability(α变换互作空间中基因型得分的加权欧氏范数)与统一AMMI-GGE指数(UAGI,标准化均值投影与稳定性指标的加权组合)两个综合指标;几何解释上定义平均环境坐标(average environment coordination, AEC)方向做均值-稳定性双plot,用which-won-where多边形做巨环境划分;另对双中心GEI矩阵做因子分析FA(2)以比对等价性,计算基因型因子载荷(communality)与UAG_IPCA_Stability平方的Spearman秩相关,以及环境间GEI Pearson相关;所有数值计算用Python 3.11的NumPy、SciPy实现,绘图用Matplotlib,权重设单位阵(平衡设计),岭罚λ=10?4保数值稳定,收敛阈10?6
研究结果:
2.1 统一AMMI-GGE(UAG)模型的理论推导:研究人员在加权希尔伯特空间内形式定义了UAG变换Rα=(PEY)?α·g?wT,给出加权低秩近似目标函数与WALS更新方程,证明α=0对应双中心纯互作(AMMI),α=1对应仅环境中心的Y?μE场(GGE),中间α为两者仿射路径;推导出对称SVD可得标准双plot坐标,重建原尺度均值矩阵公式,给出α变换场中加权决定系数Rα2(K);建立均值-稳定性几何中AEC方向投影为均值表现、垂直偏差为不稳定性度量的UAG_IPCA_Stability=|projAEC(gk*)|,以及统一选择指数UAGI=w·(均值标准化)?(1?w)·(稳定性标准化);论证α路径线性、SVD连续性保证几何一致,UAG目标分别对基因型和环境得分凸,计算复杂度O((G+E)·K·iter);证明UAG在α=0、K=2时对平衡设计等价于因子分析FA(2),并与混合模型因子分析结构自然衔接;显著性检验采用Gollob λ2检验调整加权自由度df=(G?α(G?1)?1)·(E?1)之类。
2.2 UAG模型的实证评价:研究人员将小黑麦数据先做经典双向ANOVA,环境、基因型、GEI均极显著(p<0.001),环境占SS 77.20%,基因型10.20%,GEI 8.04%,残差4.56%;随后对各α=0.0,0.1,0.3,0.9,1.0与K=2(α=0.3增测K=3)做UAG分解,结果显示α=0.0(AMMI2)PC1、PC2解释互作方差86.47%、13.53%(共100%),α=0.3、K=2解释95.61%(PC1 82.03%,PC2 13.58%),残差均方MSres=238.49较优;α=1.0(GGE2)PC1 77.75%、PC2 17.52%(共95.27%);所有α–K下PC1、PC2均显著;K=3在α=0.3下达100%解释但边际增益极小。
2.2.1 方差划分与模型表现:结论如上UAG ANOVA表显示中间α=0.3、K=2在解释率与残差均方间平衡最好,低α强调稳定性导向AMMI模式,高α强调生产力与巨环境划分GGE模式。
2.2.2 UAG双plot模式与基因型聚类:α=0.0时双plot呈各向同性,基因型绕中心分布,G8、G5、G3近原点(|PC|≤2)为广适稳定型,G4、G10、G11远端(|PC1|=6–11)为强环境响应;α=0.1几何相似仅PC1略拉长;α=0.3、K=2时区分最佳,G3、G5、G8仍近原点,G4、G10、G11、G12大载荷(|PC|≈6–10.6)为高产品环境敏感型,对照中Rakita(R)较中心、AD-7291(A)、Kolorit(K)较外周;K=3仅微改几何;α=0.9、1.0时双plot沿PC1拉长,G2、G8、G5仍近中,G10、G11、G12、G4外周;AEC均值-稳定性双plot中正向AEC轴为增产方向,G10、G11高产量中等稳定性,G3、G5、G12平衡,G2、G8稳定但均值中等,对照均在外围作参照;整体沿α从0到1实现稳定性强调→生产力强调的连续几何过渡。
2.2.3 稳定性与统一选择指数:UAG_IPCA_Stability跨α为0.28–11.5,G8在α=0.0–0.3最低(0.28–0.40)为最稳定,G2在α=0.9–1.0最低(≈1.1),G4全α>10为最不稳定;对照R、Vihren(V)中等稳定,A、K较不稳定;UAGI在α=0(AMMI)时高UAGI为低不稳定性兼较高产量的G11、G12、G8及Kolorit(K);α=0.3、K=2时G8第一(低不稳定性0.28、 above-average产量),随后G12、G6;α=0.3、K=3排名不变;α≥0.9时UAGI偏向产量,G10、G12居前,G8因稳定性仍具竞争力,G4、K低UAGI;UAG_IPCA_Stability vs Yield散点低α呈负相关性(高稳定→中产),高α减弱;UAGI双plot右上为高产稳定(G8、G12),左下为不稳低产(G4、K),中区为稳但中产(G2、G3、G5);研究人员将基因型分为三类:广适稳定型(G8、G2)、高产环境响应型(G10、G11、G12)、不稳型(G4、K)。
2.2.4 Which-Won-Where模式与巨环境识别:α=0.0时WWW多边形宽不规则,三环境E1正PC1侧、E3左上、E2左下,顶点基因型G4、G10、G8、G6等定义扇形,无单基因型统揽所有环境;α=0.1几何保留,E1仍正PC1,E2、E3负PC1但PC2分开;α=0.3、K=2时多边形结构更清晰,三环境分属不同扇形(E1正PC1,E2负PC1下PC2,E3负PC1上PC2),顶点为A、K、G2、G4、G6、G9、G11等,近原点G3、G5、G8稳定;K=3微调边界但不改解释;α=0.9、1.0时多边形沿PC1压缩但环境相对位置不变,顶点仍为G4、G10正侧,G6、G1负侧;结论为三环境分属三个明确扇形(巨环境),基因型表现具强交叉互作,无全局优胜基因型,需环境特异选择,α=0.3提供最平衡扇形划分。
2.2.5 交叉验证与预测表现:四种CV方案热图显示CV-MSE、PRESS均在α≈0.1–0.3、K=2处成明显低谷;LOEO在α≥0.1时RMSE持平≈3474.67,α=0.0较高(4000.58);LOGO最小在α=0.1、K=2(RMSE≈33.5),α=0退化为零保留成分(r=0)属退化非真预测;LOCO最小在α=0.3、K=2(RMSE≈324);双向LOO最低α=0.1、K=2(RMSE=1754.10),α=0.3、K=3略低(1737.34)但饱和;Y与Yα空间误差一致(平衡设计);K=3仅微降PRESS(<3%)但增复杂度;结论为α=0.1–0.3、K=2是广义最优折衷,α≈0.9–1.0更利于环境外推(LOEO平缓),α小更利基因型预测(LOGO),中间α利局部插补(LOCO);α=0.3、K=2为通用高效配置,比α=0降CV-MSE约10–15%。
2.2.6 最优模型参数:综合所有CV准则,α=0.1–0.3、K=2在预测误差、解释力、可解释性、生物合理性间最优;α=0与过低K致r=0退化;K=2足够捕捉主导GEI结构(双成分),K=3不改善预测;育种角度α=0.1–0.3、K=2平衡产量响应与稳定性,复现田间排序可靠。
2.2.7 UAG框架与因子分析混合模型的对应关系:研究人员对双中心GEI矩阵做FA(2)固定效应分解,最大绝对重建误差与UAG(α=0,K=2)为1.30×10?13,证实代数等价;FA(2)因子1解释GEI方差86.47%(S1=343.39),因子2为13.53%(S2=135.82),第三奇异值严格零(S3=0),与交叉验证选K=2一致;FA公因子方差(communality=λ1222)等于UAG_IPCA_Stability2,Spearmanρ=1.000(p<0.001);G8最低communality(43.99对应UAG_IPCA_Stability=6.63),G5次之,G4、K、G11、G10高;双中心GEI环境相关矩阵显示E1与E3强负相关(r=?0.893),E1与E2中等负(r=?0.568),E2与E3近零(r=0.135),量化了WWW中E1与E3对端扇形的交叉互作;结论为UAG在α=0恢复固定效应FA解且不需REML,α连续扩展FA所无的可调中心化权衡。
讨论部分总结:研究人员指出UAG在理论上将AMMI(双中心纯互作,推断严谨、PC检验、纯互作正交性)与GGE(仅环境中心,合并G+GEI,利于品种推荐、巨环境、AEC均值-稳定性分析)统一在单一SVD结构内,由α∈[0,1]连续控制进入乘性项的基因型主效应权重,填补了以往两模型间无参数化连续、无交叉验证选最优中心化的空白;本研究中小黑麦数据最优α=0.1–0.3源于其方差结构(环境主效占77.20%、GEI 8.04%),若其他数据集GEI占比更大则最优α预期更低,环境主效主导则α更高,故α应像正则化系数一样按数据交叉验证确定,不能固定;UAG兼容AMMI稳定性值(AMMI stability value, ASV)等AMMI指标与GGE环境诊断,且统一指数UAGI避免分离AMMI稳定性与GGE均值的不一致;相对于站点回归(site regression, SREG)、因子回归等带协变量的模型牺牲简洁图形,相对于因子分析混合模型(需REML迭代、潜因子不直接对应双plot轴、计算重)UAG保持透明二维几何与低计算成本,α交叉验证提供偏误-方差权衡类似FA隐含收缩但更直观;实证上α=0.1–0.3、K=2为广义最优,双plot清晰分广适型(G8、G2、G5近原点)、高产特适型(G10、G11、G12外周、高AEC投影)、不稳型(G4极大PC振幅);AEC均值-稳定性图、UAGI、WWW多边形结论一致;三环境分三扇形无全局优胜基因型,支持靶标环境选育;FA(2)等价性在α=0、K=2、平衡三环境(rank max=2)下严格成立,一般数据UAGα连续扩展FA;局限是实证仅基于单一种植点三环境小黑麦队列,巨环境划分统计力有限,未来需更多环境、多作物验证α范围普遍性;但理论推导、交叉验证机制、等价性证明、实证内部一致性(ANOVA–UAG-PC–双plot–稳定性指数–WWW–FA比对)均严密;总体结论是UAG桥接AMMI推断与GGE决策可视化,提供连续参数框架以数据驱动选α、K,平衡预测精度、几何可解释性、稳定性与生产力整合,为现代多环境育种提供灵活、交叉验证、理论一致的新工具。
研究结论部分翻译:统一AMMI-GGE(UAG)模型将AMMI的推断优势与GGE的决策导向可视化整合在单一奇异值分解内,形成一个连接加性与乘性GEI成分的参数连续体。交叉验证一致表明α值0.1–0.3与秩K=2在最小化RMSE与维持有意义的基因型和环境排序间取得最佳折衷。该框架在α水平间保持稳定,α=0或过高K时的退化结果反映成分丢失而非真正精度,强调需实证调α和K。UAG在两极端分别对应AMMI与GGE,但超越它们而允许在单一分析系统内连续调整稳定性导向与产量导向视角。实践中G8为最稳定、最广适基因型,G2与G6在可变条件下可靠,G10与G12在有利环境出色,G4显示对胁迫位点特异适应,证明UAG对靶向育种的价值。总体而言,UAG为整合稳定性、生产力与环境响应提供了灵活、实证验证的框架,在现代多环境试验中桥接统计严谨性与育种实践决策。本研究局限包括实证仅基于单地三季小黑麦数据集,虽足以演示α连续体分析行为,但限制了最优α范围的普适性;环境数E=3约束GEI矩阵秩最大为2使FA(2)与UAG(α=0,K=2)代数等价;未来研究应在更大多环境数据集(更多环境、多地、多物种遗传材料)验证UAG框架,稳健确定不同GEI结构下最优α–K配置。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号