大规模小麦数据整合提升基因组预测精度,助力国际育种协作新范式

《Communications Biology》:Large scale wheat data integration improves genomic prediction accuracy with the potential to facilitate international breeding collaborations

【字体: 时间:2026年04月29日 来源:Communications Biology 5.1

编辑推荐:

  为克服个体育种项目在多地测试、预测准确性及资源上的局限,研究人员整合了两个大型小麦育种项目的数据,构建了高效计算模型。该研究将11,609份材料的基因组与环境数据进行同步分析,显著提升了基因组预测的准确性(增幅高达13%)与复杂性状关联的分析能力,为快速培育气候韧性品种、加强全球粮食安全提供了协作框架。

  
在全球气候变化的背景下,保障粮食安全是农业面临的巨大挑战。小麦作为全球主要口粮之一,其产量与适应性的提升至关重要。然而,传统的育种方式常常面临“单打独斗”的困境。想象一下,每个国家的育种项目都像是一座信息孤岛,自己收集数据、自己分析、自己选育,不仅耗费大量时间和金钱,而且由于测试环境有限,难以准确预测一个优良品种在更广阔、更多样化地区的实际表现。这种地理和资源的限制,就像给育种家戴上了“眼罩”,让他们难以看清品种的全貌和潜力,也阻碍了那些能更好抵抗干旱、高温等恶劣气候的“超级品种”的诞生。为了摘下这副“眼罩”,科学家们开始思考:能否将世界各地不同育种项目的数据“拼图”整合起来,形成一个更完整、更强大的数据库,从而更精准地预测品种性能,加速优良品种的培育进程?
针对这一问题,发表在《Communications Biology》上的一项研究给出了肯定的答案。研究人员开展了一项关于大规模小麦数据整合与基因组预测(Genomic Prediction, GP)的国际合作研究。他们意识到,最大化遗传增益(Genetic Gain)并准确预测植物表型,需要有效整合来自不同源头的数据。但单个育种项目往往难以承担在全球多种环境中测试庞大而多样化群体所带来的物流与财务负担。为此,研究人员同步整合了两个全球重要的小麦育种项目的基因组数据,构建了一个包含11,609份小麦种质(accessions)、覆盖79个测试环境的巨型分析平台。更重要的是,他们还开发了一种计算高效的统计模型来处理这些海量数据。这项协同研究不仅显著提升了遗传预测的准确性,还增强了鉴定复杂性状关联的统计效能,为利用现有投资、挖掘更广泛遗传多样性来克服孤立项目的局限提供了实践框架。该框架有望促进国际合作,简化气候韧性品种的开发流程,从而支持更可持续的农业实践,并增强全球粮食安全。
为开展此项研究,研究人员主要采用了以下几个关键技术方法:1) 大规模、多环境表型数据采集:收集了两个主要小麦育种项目共计11,609份种质在79个全球不同环境下的性状评价数据。2) 高通量基因组测序与基因分型:对上述种质资源进行了全基因组范围的基因分型,获取了高质量的基因组数据用于分析。3) 高效计算统计模型开发:针对整合后的超大规模数据集,专门开发了计算效率高的统计模型,以进行基因组预测和全基因组关联分析(Genome-Wide Association Study, GWAS),该模型能显著减少分析所需的时间和计算资源。
研究结果
1. 数据整合显著提升了基因组预测的准确性
通过将两个独立项目的数据集进行整合,研究人员构建了一个统一的分析平台。与使用单个项目数据进行的预测相比,整合模型的预测准确性得到了显著提升,增幅最高可达13%。这一结果表明,跨越项目和地理边界整合数据,能够有效扩大训练群体规模和环境代表性,从而更可靠地预测小麦品种在广泛目标环境中的表现。
2. 协同分析增强了复杂性状遗传解析的统计效能
庞大的整合数据集不仅提高了预测精度,还为解析复杂数量性状的遗传基础提供了更强的统计效力。研究人员利用整合数据平台进行深入分析,证明了该方法能够更有效地检测到与复杂农艺性状(如产量、抗逆性等)相关的数量性状位点(Quantitative Trait Loci, QTL)和遗传标记,提高了关联研究的发现能力。
3. 高效计算模型实现了对海量数据资源的快速分析
面对超过一万份种质、近八十个环境的海量多维度数据,传统的分析方法往往需要巨大的计算开销和时间成本。本研究开发的新型高效统计模型,在保证分析精度的同时,大幅降低了所需的计算资源和运算时间,使得对如此规模数据集的深入、快速分析成为可能,为大数据驱动的育种决策提供了技术保障。
研究结论与讨论
本研究通过整合两个主要国际小麦育种项目的大规模、多环境数据集,并辅以高效的计算模型,建立了一个强大的协同分析平台。该平台成功地将基因组预测的准确性提升了高达13%,并增强了解析复杂性状遗传结构的统计能力。这些发现凸显了集体数据整合在克服单个育种项目资源与地理限制方面的变革性力量。
研究的核心结论在于,通过国际合作与数据共享,可以充分利用现有的种质资源与表型鉴定投资,挖掘更广泛的遗传多样性,从而更高效、更准确地培育作物新品种。本研究提供的实践框架,为革新当前主要依赖独立项目的育种策略指明了方向。它论证了“1+1>2”的合作效应在农业育种中的具体实现路径。
其重要意义深远。首先,该框架为加速开发能够适应气候变化挑战的“气候韧性”小麦品种提供了可操作的方案,直接服务于全球粮食安全的紧迫需求。其次,它通过降低大数据分析的门槛,促进了资源的高效利用,使得规模较小或资源有限的育种项目也能从全球数据资源中受益。最终,这项工作为建立更广泛、更深入的国际育种协作关系奠定了方法论基础,有望推动全球农业研究共同体朝着更加开放、协同和高效的方向发展,共同应对未来粮食生产的挑战。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号