甜瓜中钙缺乏作为产量增长的限制因素:基于叶片组织成分诊断的机器学习分析

《Journal of Soil Science and Plant Nutrition》:Calcium Deficiency as a Saturating Yield Constraint in Melon: A Machine Learning Analysis of Compositional Leaf-Tissue Diagnostics

【字体: 时间:2026年06月24日 来源:Journal of Soil Science and Plant Nutrition 3.6

编辑推荐:

  摘要本研究旨在通过整合诊断与推荐集成系统(DRIS)和成分营养诊断(CND)这两种互补的诊断方法,并结合机器学习技术,识别甜瓜(Cucumis melo L.)生产过程中存在的营养限制问题。同时,运用参数回归和非参数回归方法来分析养分与产量之间的关系特征。研究对106个商业化种植

  

摘要

本研究旨在通过整合诊断与推荐集成系统(DRIS)和成分营养诊断(CND)这两种互补的诊断方法,并结合机器学习技术,识别甜瓜(Cucumis melo L.)生产过程中存在的营养限制问题。同时,运用参数回归和非参数回归方法来分析养分与产量之间的关系特征。研究对106个商业化种植区的叶片组织进行了检测,分析了10种宏量和微量养分,根据产量中位数将样本分为低产组(n?=?53)和高产组(n?=?53)。随后计算了DRIS和CND指数,并通过多元线性回归(MLR)、广义加性模型(GAM)、自然样条、随机森林、梯度提升(GBM)以及极端梯度提升(XGBoost)等方法来预测产量。通过对模型假设进行Shapiro–Wilk、Anderson–Darling、Breusch–Pagan、Durbin–Watson、方差膨胀、Cook’s距离以及DFBETAS等检验,验证了模型的合理性;在报告传统标准误差的同时,还给出了考虑异方差性的HC3稳健标准误差。DRIS分析显示,在低产植株中钙元素是最缺乏的养分(平均DRIS_Ca值為??8.03?±?4.41,而高产组为0?±?7.01;p?<?0.001),而氮元素则是最过量的(平均DRIS_N值為+?7.59?±?5.03,高产组为0?±?6.49;p?<?0.001);CND分析也得出了相同的结论。在六种不同模型中进行十次重复交叉验证后,发现多元线性回归的表现最佳,其CV-R2值为0.88,保留样本外的测试R2值为0.90,且训练集与测试集之间的差异最小(ΔR2=0.07);而树状集成模型(XGBoost、GBM、随机森林)的CV-R2值与之相近,但过拟合现象更为严重(ΔR2=0.19–0.22)。最终的多元线性回归在全部106个样本上的调整后R2值为0.622(F?,?7=22.64,p?<?2.2?×?10?1?),其残差呈正态分布(Shapiro–Wilk p=0.58;Anderson–Darling p=0.59),各变量之间相互独立(Durbin–Watson p=0.255),且不存在多重共线性现象(最大VIF值為2.1)。由于存在轻微但具有统计显著性的异方差性(Breusch–Pagan p=0.001),研究采用了HC3稳健标准误差,此时DRIS_Ca的系数(β=+?0.153,p=0.004)和DRIS_N的系数(β=??0.194,p?<?0.0001)依然是最具解释力的两个因子。单变量GAM分析表明,产量与钙元素之间的关系存在显著的非线性特征(有效自由度为3.6–3.8,p?<?0.001),其响应呈现饱和趋势,这与Mitscherlich–Liebig理论相符:随着钙元素含量的增加,产量会先上升至最优水平,之后趋于稳定,其中DRIS_Ca的单变量线性R2值为0.40,而使用GAM模型后这一数值上升到了0.60。即便去除8个有较大影响的样本后重新进行敏感性分析,所有关键因子的符号和显著性依然保持不变。DRIS、CND以及集成学习方法得出的结果都表明,在锡斯坦平原这种极度干旱且土壤含钙量高的环境中,钙元素是限制甜瓜产量的主要养分。研究还发现,作物的响应呈饱和趋势而非严格的线性关系,这一发现使得成分营养诊断所假设的加性作用机制与Liebig型限制的生物学现实相契合,同时也为栽培管理提供了更准确的指导:只有当植物中的钙元素含量未达到饱和阈值时,补充钙元素才能提升产量,而超过该阈值后则不会再有明显的增产效果。

本研究旨在通过整合诊断与推荐集成系统(DRIS)和成分营养诊断(CND)这两种互补的诊断方法,并结合机器学习技术,识别甜瓜(Cucumis melo L.)生产过程中存在的营养限制问题。同时,运用参数回归和非参数回归方法来分析养分与产量之间的关系特征。研究对106个商业化种植区的叶片组织进行了检测,分析了10种宏量和微量养分,根据产量中位数将样本分为低产组(n?=?53)和高产组(n?=?53)。随后计算了DRIS和CND指数,并通过多元线性回归(MLR)、广义加性模型(GAM)、自然样条、随机森林、梯度提升(GBM)以及极端梯度提升(XGBoost)等方法来预测产量。通过对模型假设进行Shapiro–Wilk、Anderson–Darling、Breusch–Pagan、Durbin–Watson、方差膨胀、Cook’s距离以及DFBETAS等检验,验证了模型的合理性;在报告传统标准误差的同时,还给出了考虑异方差性的HC3稳健标准误差。DRIS分析显示,在低产植株中钙元素是最缺乏的养分(平均DRIS_Ca值為??8.03?±?4.41,而高产组为0?±?7.01;p?<?0.001),而氮元素则是最过量的(平均DRIS_N值為+?7.59?±?5.03,高产组为0?±?6.49;p?<?0.001);CND分析也得出了相同的结论。在六种不同模型中进行十次重复交叉验证后,发现多元线性回归的表现最佳,其CV-R2值为0.88,保留样本外的测试R2值为0.90,且训练集与测试集之间的差异最小(ΔR2=0.07);而树状集成模型(XGBoost、GBM、随机森林)的CV-R2值与之相近,但过拟合现象更为严重(ΔR2=0.19–0.22)。最终的多元线性回归在全部106个样本上的调整后R2值为0.622(F?,?7=22.64,p?<?2.2?×?10?1?),其残差呈正态分布(Shapiro–Wilk p=0.58;Anderson–Darling p=0.59),各变量之间相互独立(Durbin–Watson p=0.255),且不存在多重共线性现象(最大VIF值為2.1)。由于存在轻微但具有统计显著性的异方差性(Breusch–Pagan p=0.001),研究采用了HC3稳健标准误差,此时DRIS_Ca的系数(β=+?0.153,p=0.004)和DRIS_N的系数(β=??0.194,p?<?0.0001)依然是最具解释力的两个因子。单变量GAM分析表明,产量与钙元素之间的关系存在显著的非线性特征(有效自由度为3.6–3.8,p?<?0.001),其响应呈现饱和趋势,这与Mitscherlich–Liebig理论相符:随着钙元素含量的增加,产量会先上升至最优水平,之后趋于稳定,其中DRIS_Ca的单变量线性R2值为0.40,而使用GAM模型后这一数值上升到了0.60。即便去除8个有较大影响的样本后重新进行敏感性分析,所有关键因子的符号和显著性依然保持不变。DRIS、CND以及集成学习方法得出的结果都表明,在锡斯坦平原这种极度干旱且土壤含钙量高的环境中,钙元素是限制甜瓜产量的主要养分。研究还发现,作物的响应呈饱和趋势而非严格的线性关系,这一发现使得成分营养诊断所假设的加性作用机制与Liebig型限制的生物学现实相契合,同时也为栽培管理提供了更准确的指导:只有当植物中的钙元素含量未达到饱和阈值时,补充钙元素才能提升产量,而超过该阈值后则不会再有明显的增产效果。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号