基于因果推断(Causal Inference)方法量化荷斯坦牛(Holstein Cattle)疾病对泌乳性状(Lactation Features)因果影响的研究

《Journal of Dairy Science》:Quantifying the causal impact of diseases on lactation features in Holstein cattle based on causal inference approaches

【字体: 时间:2026年05月30日 来源:Journal of Dairy Science 4.4

编辑推荐:

  摘要:疾病通过严重损害生产力和动物福利成为牧场可持续性的关键制约因素。以往研究主要关注疾病期间短期的产奶量损失,然而从长期来看,奶牛在临床治愈后仍常无法完全恢复奶产量。因此,本研究的主要目的是利用大规模场内记录和因果推断(Causal Inference)方法

  
摘要:疾病通过严重损害生产力和动物福利成为牧场可持续性的关键制约因素。以往研究主要关注疾病期间短期的产奶量损失,然而从长期来看,奶牛在临床治愈后仍常无法完全恢复奶产量。因此,本研究的主要目的是利用大规模场内记录和因果推断(Causal Inference)方法,量化疾病对奶产量的短期(疾病期间)和长期(临床治愈后)损失,并阐明疾病与泌乳性状(Lactation Features;包括305天产奶量MY305、挤奶时段奶产量变异性Session Milk Yield Variability)之间的因果关系,从而增进对疾病挑战的理解并帮助减轻其负担。研究人员收集了2020年至2024年来自37,246头荷斯坦牛(Holstein Cattle)的高通量单次挤奶产量记录及疾病记录(乳房健康;生殖、代谢和消化障碍;蹄部健康)。采用倾向得分匹配(Propensity Score Matching, PSM)和重叠加权(Overlap Weighting, PSOW)两种因果推断方法评估疾病对MY305及单次挤奶产量变异性的因果效应。总体而言,较高胎次、整体恢复力(Resilience)较低、难产、人工授精次数较多及死胎的奶牛面临更高的疾病风险(风险比Hazard Ratio 1.05~2.40)。遗传分析显示,较高的MY305及较大的单次挤奶产量变异性与疾病发生率呈正向遗传相关(Genetic Correlation)。因果推断揭示临床疾病使每泌乳期305天产奶量显著减少680.81±0.01 kg;该因果影响随泌乳期内发病频次增加而加剧,单次发病损失为646.18±0.01 kg,多次发病损失达920.83±0.04 kg,提示非线性累积负担。各类疾病对MY305的因果效应估计值为代谢性疾病345.76±0.81 kg至生殖障碍511.72±0.04 kg。平均而言,疾病治愈后有7.20%的产奶量完全不可恢复(代谢病4.06%至消化道疾病8.42%)。值得注意的是,表型趋势、因果估计及遗传相关性一致表明,单次挤奶产量变异系数(Coefficient of Variation of Session Milk Yields, CVL)升高是疾病发生的伴随特征——CVL在临床症状出现前约5天急剧上升,代谢病升高30%,消化病最高达58%,凸显其作为奶牛疾病早期指示因子的潜力。综上,本研究提供了疾病与泌乳性状因果关系的新见解,并证明了因果推断方法在推进精准畜牧养殖(Precision Livestock Farming)中的应用潜力。
论文解读:基于因果推断量化荷斯坦牛疾病对泌乳性状的因果影响
该研究由Ao Wang、Luiz F. Brito、Liyun Han、Jia Tian、Hailiang Zhang、Qing Xu及Yachun Wang(中国农业大学动物科学技术学院,动物生物技术育种国家重点实验室等)完成,发表于Journal of Dairy Science
一、研究背景与目的
既往关于奶牛疾病造成产奶量损失的研究多聚焦于疾病发生期间的短期奶量下降(Short-term Milk Loss),且多采用传统混合线性模型仅评估相关性。然而临床观察发现,奶牛即使经临床治愈(Clinical Cure),整个泌乳期305天产奶量(305-d Milk Yield, MY305)仍常低于健康同龄牛,即存在长期不可逆损失(Long-term Effect / Unrecoverable Loss),这部分隐性损失缺乏基于大样本和排除混杂因素(Confounder)的量化证据。此外,单次挤奶(Session Milk Yield)日间内变异性的变化能否作为疾病早期预警信号亦未被深入探讨。为区分疾病与高产、低恢复力、不同胎次等混杂因素的因果关系(Causation vs Correlation),研究人员引入因果推断框架——倾向得分匹配(Propensity Score Matching, PSM)与重叠加权(Overlap Weighting, PSOW)——基于宁夏6个商业化牧场37,246头荷斯坦牛(Holstein Cattle)2020—2024年的近7000万条单次挤奶记录及4万余例疾病确诊记录,量化五大类疾病(乳房健康Udder Health、生殖障碍Reproductive Disorders、代谢障碍Metabolic Disorders、消化障碍Digestive Disorders、蹄部健康Hoof Health)对MY305及单次挤奶产量变异性的短、长期因果效应,并评估CVL(Session Milk Yield Coefficient of Variation, CVL)在疾病前的异常波动特征。
二、主要关键技术方法概述
研究人员构建含57,015个完整泌乳期(DIM 1~305 d,每日3次挤奶)的数据集,对缺失值采用孤立森林(Isolation Forest)检测后用近邻法填补。疾病记录标准化为5大类二分类变量(泌乳期是否患病)。采用Cox比例风险模型(Cox Proportional Hazards Model)分析胎次、产犊难易(Calving Ease, CE)、死胎(Stillbirth, SB)、授精次数(Number of Inseminations, NI)及基于Wood模型估算的预期泌乳曲线(Expected Lactation Curve, ELC)离差的对数标准差(Lnsd2,整体恢复力指标Resilience Indicator)和MY305估计育种值(Estimated Breeding Value, EBV)对发病风险的影响。遗传参数(遗传力Heritability h2、遗传相关Genetic Correlation rG)通过DMU软件重复动物模型(Repeatability Animal Model, AI-REML)估算。因果推断中,以场-产犊年-季、胎次、CE、SB、NI、MY305EBV及Lnsd2 EBV为混杂因素拟合Logistic回归得倾向得分(Propensity Score, PS),PSM采用最近邻1:1匹配(Caliper=20% logit PS SD)并做回归调整,PSOW采用重叠权重最小化加权平均处理效应(Weighted Average Treatment Effect in the Overlap Population),对局部泌乳特征(诊断日前后窗口)采用伪健康群体(Pseudo-healthy Population)重抽样对照,敏感性分析采用sensemakr包评估未观测混杂的稳健性(Robustness Value, RV)。
三、研究结果
Relationships among Lactation Features and Diseases(泌乳性状与疾病间的关系)
通过混合线性模型证实疾病组MY305较健康组平均降低648.55 kg,CVL升高0.10(对数转换后)。日水平局部特征显示,诊断前5~1天日均奶量(Average Daily Milk Yield during disease-related period, AMY)开始下降,同期单次挤奶变异系数(Coefficient of Variation of session milk yields for Different periods, CVD)上升,诊断后1~5天AMY最低。遗传分析得出MY305遗传力h2=0.212,CVL h2=0.131;MY305与乳房疾病呈不利正向遗传相关(rG=0.44±0.13),SDL(Session Milk Yield Standard Deviation averaged over Lactation)及CVL与各疾病组(除生殖障碍外)均呈显著正向遗传相关(rG=0.253~0.555),提示高变异本身具疾病易感性遗传基础。
Causal Effect on Features for Entire Lactation(疾病对全泌乳期泌乳性状的因果效应)
经PSM和PSOW平衡检验(所有混杂因子标准化均值差Standardized Mean Difference, SMD < 0.10),PSOW估计整体疾病使MY305因果降低680.81±0.00 kg/泌乳期;单次发病因果损失646.18 kg,≥2次发病因果损失920.83 kg(非线性累积)。五类疾病因果效应:生殖障碍511.72 kg > 乳房健康461.09 kg > 消化障碍476.94 kg > 蹄病385.74 kg > 代谢障碍345.76 kg。特定病中临床乳腺炎(Clinical Mastitis)单次511.81 kg、多次736.95 kg;指间皮炎致损最高647.93 kg,酮病(Ketosis)最低88.30 kg。除代谢病外,其余四组CVL显著升高(0.0359~0.0913),临床乳腺炎CVL升幅最大(0.0987)。说明传统粗差异低估真实因果损失,且多疾病并发/复发加重负担。
Causal Effect on Local Lactation Features(疾病对局部泌乳特征的因果效应)
以伪健康群体为对照,PSOW显示诊断前5~1天AMY已因果降低(代谢病-9.54 kg最大,乳房健康-3.69 kg最小),诊断后0~15天持续损失(代谢病-10.95 kg)。CVD在诊断前5~1天显著因果上升(消化障碍+0.58,代谢障碍+0.30),诊断当天后短暂回落,之后又逐渐超过基线。逐日因果效应曲线验证CVD在发病前2~3天达峰,符合临界慢化(Critical Slowing Down)理论,提示单次挤奶变异可作为提前5天的早期预警信号。
Alterations of the Relationship among Lactation Features(泌乳性状间关系改变)
患病泌乳期MY305–CVL负相关增强(-0.250 vs 健康-0.166)。发病前5~1天AMY–CVD相关性强于远距窗口(-0.298~-0.229 vs -0.213~-0.163),表明疾病应激下产奶量与波动性耦合关系发生变化。
Causal Impact on Lactation Features after Clinical Cure(临床治愈后对泌乳特征的因果影响)
首次发病期间AMY损失占健康同期均值16.06%,治愈后至DIM 305仍有平均7.20%不可恢复损失(消化障碍8.42%最高,代谢障碍4.06%最低)。复发案例期间损失16.39%,但治愈后额外长期损失仅3.27%(部分重症已淘汰致幸存偏倚)。基于Wood及Wilmink模型拟合预期泌乳曲线(ELC)估算的损失均明显低于因果推断值(整体期间6.10% vs 16.06%;长期2.40% vs 7.20%),佐证传统方法因未控制混杂而低估真实疾病负担。CVL在治愈后各病组仍高于健康基线。
Sensitivity Analyses(敏感性分析)
需未观测混杂解释至少20.89%残差方差方可推翻整体疾病→MY305因果效应;即便假设未观测混杂强度2倍于已纳入协变量(胎次、EBV_MY305、EBV_Lnsd2),效应方向及显著性不变,证明结果对遗漏变量具强稳健性。
四、讨论与结论总结(翻译结论部分)
基于因果推断方法,研究人员评估了各类疾病对泌乳性状的因果关系,并量化了常规方法常低估的显著短期与长期效应。临床治愈后平均7.20%的产奶量完全不可恢复,这为理解奶牛泌乳潜能及产奶量损失提供了新视角。表型趋势、因果估计与遗传相关性一致确定疾病发生前单次挤奶变异系数(CVL)显著波动是疾病预防的早期指征。本研究同时彰显了因果推断方法作为精准畜牧养殖(Precision Livestock Farming)有力工具的价值,可真正厘清变量间关系以优化基于数据的决策制定及牧场生产性能评估。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号