ADAMTS13基因多态性与冠状动脉疾病风险、长期生存率及危险因素谱 Justyna Wrona, Anna Balcerzyk-Mati?, Katarzyna Mizia-Stec, Artur Filipecki, Jolanta Krauze, Pawe? Niemiec

《Genes》:ADAMTS13 Gene Polymorphisms and Coronary Artery Disease Risk, Long-Term Survival, and Risk Factor Profile Justyna Wrona, Anna Balcerzyk-Mati?, Katarzyna Mizia-Stec, Artur Filipecki, Jolanta Krauze and Pawe? Niemiec

【字体: 时间:2026年04月27日 来源:Genes 2.8

编辑推荐:

  为探究表型测量误差对猪体重遗传分析的影响,本文研究人员通过计算机视觉技术获取图像表型,与常规测量法比较,分析其测量误差的遗传学影响。结果显示,计算机视觉衍生的表型测量误差不具有可遗传性,这表明图像表型在后续遗传分析中具有应用可靠性,为精准畜牧业的发展提供了重要数据支持。

  
在精准畜牧业中,计算机视觉技术正成为获取大量动物表型数据的强大工具。它可以通过摄像头自动、连续地采集动物的图像或视频,从而估算出生长、形态甚至行为等多种性状。这听起来很美妙,对吧?但这里隐藏着一个潜在问题:通过计算机视觉估算出的“图像表型”,与通过传统方法(如电子秤)手工测量的“常规表型”,尽管针对同一个性状,但由于测量方式和原理不同,它们之间不可避免地存在差异,这个差异被称为“性状测量误差”(trait measurement error)。在理想情况下,这个误差应该是随机噪声,不会对后续的遗传分析(比如估算遗传力、寻找相关基因)产生影响。然而,此前在玉米和蜀黍的研究中意外发现,这类测量误差本身竟然也受遗传因素影响,这意味着误差可能是系统性的——某些基因型的个体其图像表型总是被高估,而另一些则总是被低估。如果这种系统性误差在后续分析中被忽视,可能会得出误导性的遗传结论。那么,在畜牧业,尤其是在利用计算机视觉估测猪体重这种关键经济性状时,是否也存在同样的问题?这个误差是否会扭曲我们对其遗传基础的理解?为了回答这个关键问题,本项研究在《Genes》期刊上应运而生。
研究人员开展了一项系统性的比较研究,旨在评估猪体重(BW)性状测量误差对下游遗传分析的影响。他们利用深度传感器摄像头从600多头商品猪中采集了顶视图深度视频,并在不同生长阶段(T1-T4)同步记录了每头猪的实际体重(即“常规表型”)。通过两种主流的计算机视觉方法(自适应阈值分割法和深度学习回归法)从深度图像中提取特征并预测猪的体重,从而得到“图像表型”。接着,研究者将两种表型之间的绝对差值定义为“性状测量误差”,并在此基础上进行了包括基因组遗传力估算、全基因组关联研究(GWAS)在内的全套遗传分析,以探究该测量误差本身是否具有遗传性。这项研究不仅评估了不同计算机视觉算法的准确性,更重要的是,它为图像表型在数量遗传学研究中的可靠性提供了直接证据。
本研究主要采用了以下几种关键技术方法:1. 表型采集:在商业化养殖场,通过安装在单向通道上方的Intel RealSense D435深度传感器,同步采集猪的顶视图深度视频和经校准的电子秤体重数据。2. 图像处理与表型提取:采用了两种计算机视觉方法。其一为自适应阈值分割,该方法利用OpenCV库,从深度图像中分割猪体轮廓,提取背长、腹宽、高度、体积等生物特征,随后通过普通最小二乘法(OLS)或随机森林(RF)模型建立回归方程预测体重。其二为深度学习回归,直接将预处理后的深度灰度图像输入预训练的神经网络(包括MobileViT和ResNet50)进行端到端的体重预测。3. 定量遗传建模:基于约4.6万个单核苷酸多态性(SNP)位点,利用基因组最佳线性无偏预测(GBLUP)模型分别估算常规体重、图像体重及其测量误差的基因组遗传力。同时,通过全基因组关联研究(GWAS)分析,比较了不同表型在遗传标记层面的一致性。
结果
3.1. 表型测量误差的分布
通过表型组学分析发现,基于深度回归的方法能比自适应阈值分割法处理更多的猪只数据。不同猪只、不同时间点的性状测量误差存在差异。有趣的是,有些猪在至少两个时间点都表现出最高的测量误差,而另一些则始终表现出最低的误差。这表明,某些个体可能因其体型结构等因素,导致其图像表型被系统地高估或低估。
3.2. 模型性能评估
四种计算机视觉模型(OLS/RF自适应阈值分割、ResNet50/MobileViT深度回归)预测的体重与实际体重高度吻合。其中,基于随机森林的自适应阈值分割和两种深度学习模型的拟合优度最佳,决定系数(R2)均在0.95以上,平均绝对百分比误差(MAPE)低于2.5%。普通最小二乘法的自适应阈值分割法表现相对较差。在所有模型中,深度学习回归方法产生的平均性状测量误差百分比最低(约1.6%)。
3.3. 遗传参数分析
猪常规体重的基因组遗传力估计值在0.21至0.55之间,这与此前报道的猪体重遗传力范围相符。最关键的结果是,基于计算机视觉获取的图像体重,其基因组遗传力估计值与常规体重的估计值在绝大多数情况下几乎完全一致,特别是深度学习回归方法,两者差异仅在0到0.03之间。这表明,两种表型测量方法所得的遗传推断结果是相同的。更重要的是,对所有模型和所有时间点进行分析,性状测量误差的基因组遗传力估计值始终接近于零,基本可以忽略不计。
3.4. 全基因组关联研究一致性
GWAS分析进一步验证了上述结论。如果图像表型准确无偏,那么在常规体重分析中发现的遗传效应最强的10个基因标记(SNP),也应该出现在图像体重分析结果的前100个基因标记中。结果显示,基于随机森林的自适应阈值分割和深度学习回归方法都能做到这一点。相反,在针对性状测量误差本身进行的GWAS分析中,这10个关键基因标记没有出现在其显著标记列表中。这再次证明,测量误差本身并不与特定的基因组区域存在关联,即误差不具有可遗传性。
结论与讨论
本研究系统探讨了猪体重性状测量误差对下游遗传分析的影响。研究发现,尽管不同计算机视觉方法的预测精度存在差异,但核心结论是清晰一致的:计算机视觉衍生的猪体重图像表型与手工测量的常规表型,在遗传力估计和关键基因标记检测方面具有高度一致性。最关键的是,性状测量误差的基因组遗传力估计值在所有生长阶段、所有计算机视觉方法下都近乎为零,并且GWAS未发现能系统性影响测量误差的遗传位点。这说明,在猪的生长过程中,图像表型与常规表型之间的差异,主要由非遗传的表型测量误差引起,而非由遗传因素导致的系统性偏误。
这项研究的意义在于,它为在嘈杂的、非标准化的商业养殖环境中,大规模应用计算机视觉进行表型采集提供了关键的可靠性保证。研究表明,尽管计算机视觉技术不可避免地会引入测量误差,但只要模型选择得当(如深度学习回归),该误差并不会扭曲我们对目标性状(如体重)遗传基础的理解。这极大地增强了研究者将高通量、自动化图像表型数据直接用于数量遗传学和基因组选择等下游分析的信心。当然,作者也指出,即使手工测量也并非绝对的“金标准”,其本身也存在误差。随着计算机视觉技术的不断进步,其测量精度有望超越人工,为精准畜牧业和动物遗传育种研究开辟更广阔的前景。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号