《Frontiers in Genetics》:Accuracy of genomic prediction for milk production traits in Mehsana buffalo
编辑推荐:
摘要:引言:与仅依赖系谱关系相比,基因组信息可以显著提高遗传评估的准确性。因此,本研究的目的是比较使用系谱最佳线性无偏预测(PBLUP)和单步基因组最佳线性无偏预测(ssGBLUP)模型对Mehsana水牛305天产奶量(305DMY)、305天脂肪产量(30
摘要:引言:与仅依赖系谱关系相比,基因组信息可以显著提高遗传评估的准确性。因此,本研究的目的是比较使用系谱最佳线性无偏预测(PBLUP)和单步基因组最佳线性无偏预测(ssGBLUP)模型对Mehsana水牛305天产奶量(305DMY)、305天脂肪产量(305DFY)、305天非脂固体产量(305DSNFY)和305天蛋白质产量(305DPY)性状进行基因组预测的准确性。预测偏倚通过估计校正产量(Yc)对预测育种值(BVs)的回归系数进行评估。方法:表型数据集包括10,897头Mehsana水牛的产奶量测试日记录、10,896头脂肪产量、10,581头非脂固体产量和10,578头蛋白质产量,用于本研究。共收集了4,107份Mehsana水牛血样,并使用BUFFCHIP 54K SNP芯片进行基因分型。经过质量控制后,最终数据集包含3,887头Mehsana水牛和53,292个SNPs。结果:使用PBLUP获得的预测准确性范围为0.078至0.088,而ssGBLUP的预测准确性范围为0.088至0.100。各性状的平均预测准确性为PBLUP 0.083和ssGBLUP 0.093,使用ssGBLUP总体提高了11.37%。各产奶性状的预测回归系数范围为PBLUP 0.44至0.52,ssGBLUP 0.45至0.61。平均回归系数为PBLUP 0.48和ssGBLUP 0.53,表明ssGBLUP模型下预测偏倚减小。结论:对于Mehsana水牛的产奶性状,ssGBLUP比PBLUP提供更准确且偏倚更小的育种值预测。
论文解读文章
**研究背景与问题**
畜牧业在印度经济中占据重要地位,尤其水牛(如Mehsana水牛)因其高产奶潜力、产肉能力和役用价值而备受重视。然而,传统基于表型性能和系谱信息的育种方法(如后裔测定)效率有限,成本高且耗时长。尽管分子遗传学工具(如数量性状位点(QTL)定位和标记辅助选择(MAS))可提升遗传改良,但它们仅解释总遗传方差的一小部分。基因组选择(GS)通过考虑全基因组标记效应,有望缩短世代间隔并加速遗传进展,但其成功依赖于育种值(BVs)预测的准确性。目前,尚未有研究评估PBLUP和ssGBLUP模型在Mehsana水牛产奶性状基因组预测中的表现。因此,本研究旨在比较这两种模型对305天产奶量(305DMY)、305天脂肪产量(305DFY)、305天非脂固体产量(305DSNFY)和305天蛋白质产量(305DPY)的预测准确性和偏倚。
**研究内容与结论**
研究人员利用来自INAPH数据库的2008-2022年月度测试日记录(包括10,897头水牛的产奶量数据等),并采集4,107份血样使用BUFFCHIP 54K SNP芯片基因分型,经质量控制后保留3,887头水牛和53,292个SNPs。通过随机回归模型估计方差组分,采用五折交叉验证比较PBLUP和ssGBLUP模型的预测准确性,并通过回归系数评估偏倚。结论:ssGBLUP模型在预测准确性和减少偏倚方面均优于PBLUP,平均准确性提高11.37%,回归系数更接近1(0.53 vs. 0.48),表明ssGBLUP更适用于Mehsana水牛的产奶性状基因组选择。该论文发表在《Frontiers in Genetics》。
**主要关键技术方法**
研究人员使用了以下关键技术:1)随机回归模型(利用勒让德多项式拟合产奶曲线,考虑固定效应(牛群、泌乳次数、产犊年份和季节)和随机效应(动物加性遗传、永久环境、场-年度-月份等));2)系谱最佳线性无偏预测(PBLUP)和单步基因组最佳线性无偏预测(ssGBLUP)模型(后者结合系谱关系矩阵A和基因组关系矩阵G构建H矩阵);3)五折交叉验证(将参考群体随机分为5份,4份训练、1份验证,计算校正产量Y
c与预测BVs的相关系数作为准确性);4)预测偏倚评估(通过Y
c对BVs的回归系数判断,斜率≠1表示偏倚)。样本队列来源:Mehsana水牛,表型数据来自INAPH数据库,基因型数据来自古吉拉特邦项目“为奶牛和水牛品种建立基因组选择网络”。
**研究结果**
1. **方差组分与遗传力**:305DMY的遗传力最高(0.31),305DFY最低(0.22),与先前研究范围一致(如Murrah水牛0.32,Mehsana水牛0.28)。
2. **育种值可靠性**:ssGBLUP比PBLUP的可靠性提高1.13%–1.61%(例如305DPY提高1.61%),归因于基因组信息整合(与Zhang et al., 2022结果类似)。
3. **预测准确性**:五折交叉验证显示,PBLUP准确性0.078–0.088,ssGBLUP为0.088–0.100;平均准确性从0.083提升至0.093(提高11.37%)。各性状提高幅度为305DMY 6.02%、305DFY 4.70%、305DSNFY 13.64%、305DPY 21.80%。这与Herrera et al.(2021)在菲律宾水牛中7%的提高及Gómez-Carpio et al.(2026)在意大利地中海水牛中3%–12%的提高趋势一致。
4. **预测偏倚**:两种模型的回归系数均<1,表明育种值被高估。平均回归系数PBLUP为0.48,ssGBLUP为0.53(更接近1),提示ssGBLUP偏倚更小。高估程度在PBLUP中更高,与Herrera et al.(2021)结果(PBLUP 0.54,ssGBLUP 0.84)相符。剩余偏倚主要归因于参考群体规模小及G矩阵与A矩阵不相容。
**讨论与结论**
讨论部分指出,ssGBLUP模型通过同时利用系谱、表型和基因组信息,提高了预测准确性,但当前准确性普遍偏低(因基因分型动物数量有限、亲缘关系及模型特征)。偏倚方面,ssGBLUP优于PBLUP,但仍有优化空间。扩大参考群体(系统基因分型)和采用调整的ssGBLUP(优化H
-1矩阵构建参数)可将偏倚降低14%–17%(Mafolo et al., 2026)。结论翻译:本研究确定了使用PBLUP和ssGBLUP模型对Mehsana水牛产奶性状育种值估计的预测准确性和偏倚。结果表明,ssGBLUP模型对所有研究的性状提供比PBLUP模型更准确的预测和更小的偏倚。值得注意的是,ssGBLUP在产奶性状上平均比PBLUP提高11.37%的准确性。此外,ssGBLUP模型的预测偏倚小于PBLUP模型。因此,ssGBLUP可被视为有效提高Mehsana水牛育种值预测准确性的方法。