美国南部水稻基因库农艺性状的多环境评价与基因组预测

《The Plant Genome》:Multi-environment evaluation and genomic prediction of agronomic traits in the southern US rice genepool

【字体: 时间:2026年03月31日 来源:The Plant Genome 3.8

编辑推荐:

  本文针对美国南部水稻基因库的遗传多样性和农艺性状表现,研究了429个基因型在三种环境下的表现,并比较了单性状与多性状基因组预测(GP)模型的准确性。研究表明,当代南方育种种质高度相关,多性状预测(特别是通过MegaLMM模型)在多个性状上比单性状基因组最佳线性无偏预测(GBLUP)具有更高的预测能力。该数据集与分析为未来美国南部水稻的基因组和表型研究以及应用育种提供了有价值的信息。

  
:根据您的要求,以下是约2000汉字的论文解读文章,所有内容均严格依据【文档内容】,不杜撰任何信息。由于【文档内容】中未提供作者的具体单位信息,仅能根据上下文推断为国外研究机构。)
水稻是全球最重要的粮食作物之一,而在美国,其80%的产量都来自南部的“大米带”。这里出产的稻米,约有一半会出口到世界各地,支撑着从美国到全球无数人的餐桌。然而,面对未来气候变化、市场需求增长以及持续提高产量的压力,育种家们需要更智能、更高效的工具。他们不仅想知道哪些水稻品种“好”,更想提前预测未来品种的“潜力”,从而加速育种进程,优化这个价值数十亿美元的产业。但挑战随之而来:面对复杂的农艺性状(如株高、分蘖数、每穗粒数),遗传背景、生长环境(G × E)以及它们之间错综复杂的交互作用,到底哪个才是决定性状表现的关键?传统的育种方法周期长、成本高,能否借助基因组的力量,实现“未种先知”,精准选育?这就是美国南部水稻研究社区希望通过一项大规模、多环境的合作研究来回答的核心问题。
这项题为“美国南部水稻基因库农艺性状的多环境评价与基因组预测”的研究,发表在《The Plant Genome》期刊上。研究人员集结了429个水稻基因型,它们像是水稻世界的“百家姓”,既包括了从东南亚、日本、马达加斯加等地引入的历史亲本,也涵盖了美国南部阿肯色、路易斯安那、密西西比等州育种项目的当代高级品系。研究团队在2008年将这批“选手”送到了上述三个州的研究站进行“同场竞技”,系统测定了抽穗期、成熟期、株高、分蘖数、每穗粒数、每穗粒重等八个关键农艺性状。同时,他们利用一款专为美国南部水稻基因组预测/选择(GS)优化的单核苷酸多态性(SNP)芯片对这批材料进行了基因分型。通过将基因型与表型数据结合,研究团队不仅绘制了美国南部水稻种质的“遗传家谱”,还像训练AI模型一样,分别用单性状基因组最佳线性无偏预测(GBLUP)和多性状预测模型(MegaLVM),来检验哪种方法能更准确地预测这些性状的育种值。最终,他们发现当代南方育种材料虽然遗传背景相对狭窄,但多性状预测模型展现出了显著的优势,为未来在复杂性状上进行高效、精准的基因组选择铺平了道路。
研究人员为开展这项研究,主要运用了以下几项关键技术方法:首先,构建了一个包含429个基因型的核心群体,涵盖历史品种和当代南方育种品系,并于2008年在路易斯安那、密西西比和阿肯色三个州的研究站进行了多环境田间表型鉴定。其次,使用专为美国南部水稻设计的Agriplex 550 SNP芯片对所有基因型进行高通量基因分型,获取了491个有效SNP标记。在数据分析层面,运用主成分分析(PCA)和K-means聚类解析种群遗传结构;利用TASSEL 5软件进行单性状基因组最佳线性无偏预测(GBLUP);并采用mega-scale线性混合模型(MegaLVM)进行多性状基因组预测,比较了两种预测框架的准确性。
3.1 群体来源
遗传结构分析显示,这429个基因型在遗传空间上可以清晰地分为两个主要类群:A组和B组。其中,绝大多数来自美国南部各州(AR, LA, MS, TX)育种项目的当代品种都属于A组,它们彼此间高度相关,形成了一个紧密的集群。而B组则主要由来自加利福尼亚州的品种、温带或热带粳稻(TEJ/TRJ)的引进材料,以及部分籼稻(indica)材料组成。这表明,美国南部的水稻育种在长期实践中,主要围绕一个相对狭窄但适应本地气候的热带粳稻基因库展开,与加州的温带粳稻及外来的籼稻种质形成了明显区分。同时,PCA图中存在的中间基因型也揭示了不同育种项目间因共享历史亲本和相互引种而产生的遗传渗入现象。
3.2 表型分析
对不同环境下测得的表型数据进行主成分分析发现,第一个主成分(PC1)的分离主要与种植环境相关,而第二个主成分(PC2)则更多反映了基因型本身的差异。具体而言,路易斯安那州的环境与阿肯色、密西西比两州有所区别。在性状关联上,每穗粒数与每穗粒重呈现高度表型相关(相关系数r = 0.919)。此外,从遗传背景划分的A、B两组在性状上也表现出显著差异:A组(代表南部主流种质)的每穗粒数和粒重显著更高,而B组(包含更多籼稻和引进材料)则具有更高的分蘖数。
3.3 单性状基因组预测
使用GBLUP模型进行的单性状预测显示,株高、穗长和每穗粒数在所有三个环境中都表现出最高且最稳定的预测能力,这些性状的遗传方差占比也相对较高。有趣的是,当研究团队仅使用遗传上更为同质的A组群体进行预测时,其预测能力与使用包含所有遗传多样性(A组+B组)的完整群体时没有显著差异。这表明,在未来的基因组选择模型中,纳入更多样的基因型来扩大训练集规模,可能不会对预测准确性造成负面影响,反而可能因样本量增加而获益。
3.4 多性状基因组预测
这是本研究的亮点。研究人员使用MegaLVM模型进行多性状预测,即利用目标性状在其他环境下的数据,或其他相关性状的数据作为辅助信息来预测目标性状。结果显示,对于大多数性状(如每穗粒数、每穗粒重、穗长、株高),多性状预测的准确性显著高于单性状的GBLUP预测。例如,在路易斯安那州,多性状模型对每穗粒重的预测能力达到0.72,而单性状模型为0.58。这证明,利用性状间固有的遗传和表型相关性,可以极大提升预测的精度。不过,对于分蘖数和总粒重这两个性状,多性状预测的优势不明显或没有优势,这可能与它们较高的环境方差占比和较低的遗传相关性有关。
结论与重要意义
这项研究通过对美国南部水稻代表性种质资源的系统性多环境评价和前沿的基因组预测分析,得出了几个关键结论。首先,清晰地描绘了该地区水稻育种基因库的遗传结构,确认了以热带粳稻为主、相对独立的育种格局。其次,验证了基因组预测(GP)在美国南部水稻农艺性状上的高可行性,特别是株高、穗部性状等。最核心的发现是,多性状基因组预测模型(MegaLVM)能够有效整合不同环境和不同性状间的信息,在大多数情况下显著提升预测准确性。 这意味着,育种家未来可以借助此类模型,利用更容易或更早测得的性状(如每穗粒重)来精准预测更难或更晚测得的性状(如每穗粒数),或者利用一个地点的数据来预测品种在未测试地点的表现,从而大幅降低表型成本、缩短育种周期。
该研究提供的429个基因型的高质量基因型和多环境表型数据集,本身就是一个宝贵的资源库。其分析方法和结论为美国乃至全球水稻育种项目提供了清晰的路线图:在推进基因组选择(GS)实践时,应积极考虑采用多性状预测框架,并可以策略性地将历史品种和多样化的种质纳入训练集,以优化模型性能。这项工作不仅是对美国南部水稻育种的一次重要“基因普查”和“能力验证”,也为应对未来粮食安全挑战,实现更智能、更高效、更精准的作物育种提供了有力的方法论支持和数据基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号