《Agriculture》:Predicting AquaCrop-Simulated Durum Wheat Yield with Machine Learning: Algorithm Comparison and Agronomic Signal Convergence in the Capitanata Plain
Pasquale Garofalo,
Anna Rita Bernadette Cammerino and
Maria Riccardi
编辑推荐:
本文针对地中海地区硬粒小麦生产面临的气候变异性加剧、基于过程的作物模型(如AquaCrop)计算耗时等问题,研究团队开发并评估了五种机器学习(ML)代理模型(LR、MLP、SMOreg、RandomTree、REPTree),以模拟AquaCrop-GIS在意大利南部卡皮塔纳塔平原的产量响应面。研究发现,MLP模型预测精度最高(R = 0.983,RMSE = 0.083 t ha-1),而四种可解释模型性能相近。所有模型在农艺信号上高度一致:标准播期(11月1日)比晚播(11月15日)增产+0.53 t ha-1,补充灌溉增产+0.17 t ha-1,细质地土壤产量更高。该研究为地中海旱作农业系统提供了一种高效、可解释的决策支持工具,有助于区域尺度的农艺管理优化。
在地中海这片古老而丰饶的土地上,硬粒小麦(Triticum durum Desf.)不仅是意大利面、粗麦粉等美食的基石,更是支撑当地农业经济与生态系统的关键作物。然而,这片“面包篮”正面临着日益严峻的挑战:气候变异性加剧,春季气温升高、生长季后期干旱频发、年际降水波动增大,这些变化正不断侵蚀着作物的产量潜力,放大着生产风险。面对广阔的区域和复杂的土壤-气候-管理组合,传统的田间试验难以全面覆盖,而基于过程的作物模型,如联合国粮农组织(FAO)开发的AquaCrop,虽然能提供机理可靠的产量估算,但在筛选海量情景时,其计算成本高昂,耗时费力,成了决策支持的一大瓶颈。
正是在这样的背景下,一项旨在“弯道超车”的研究应运而生。研究人员将目光投向了蓬勃发展的机器学习(ML)。他们的核心思路是:让机器学习模型充当AquaCrop这位“机理大师”的“高效替身”。具体而言,就是利用AquaCrop-GIS模型在意大利南部重要硬粒小麦产区——卡皮塔纳塔平原(Capitanata plain)已生成的模拟数据集,训练一系列ML代理模型(或称为仿真模型)。这些“替身”一旦训练完成,就能在微秒级时间内复现AquaCrop需要数分钟甚至数小时才能算出的长期平均产量,从而为快速评估成千上万种管理情景、探索优化方案打开大门。
但选用什么样的“替身”也有讲究。是追求极致精准但内部如同“黑箱”的复杂神经网络?还是牺牲少许精度但规则透明、更易于农学家和决策者理解和信任的可解释模型?为了回答这个问题,并验证这种“替身”方法的可靠性,Pasquale Garofalo, Anna Rita Bernadette Cammerino 和 Maria Riccardi 开展了一项系统的比较研究。他们的成果发表在《Agriculture》期刊上,不仅比较了模型的预测精度,更深入挖掘了模型输出背后一致的农艺信号,为机器学习在农业中的实际应用提供了兼具效率与可信度的范例。
为了开展这项研究,作者们主要运用了以下几项关键技术方法:首先,研究基于一个已发表的、经过验证的AquaCrop-GIS模拟数据集,该数据集覆盖卡皮塔纳塔平原2014-2023年共10个生长季,空间上包含15个气候网格,结合了25个土壤剖面、3个播期(10月15日,11月1日,11月15日)和2种灌溉处理(雨养、开花期补充灌溉),通过对10年模拟产量取平均,最终构建了包含342个实例的稳定数据集,每个实例代表一个独特的土壤-气候-管理情景。其次,在机器学习建模与比较框架中,研究选取了五种代表性算法:线性回归(LR)、多层感知器(MLP)、支持向量回归(SMOreg)、随机树(RandomTree)和减错剪枝树(REPTree),并在WEKA 3.8.6平台中实现,使用分层10折交叉验证来评估模型的泛化性能。最后,研究通过多模型农艺信号一致性分析,综合利用线性模型的系数、SVM的归一化权重向量以及决策树的分裂重要性等不同算法的内在可解释性组件,来交叉验证和提取稳健的农艺管理启示。
研究结果如下:
3.1. 整体交叉验证性能
所有五种算法都成功捕捉了数据集中产量的主要变异来源。其中,MLP的表现一骑绝尘,取得了近乎完美的预测精度(R = 0.983,R2= 0.966,RMSE = 0.083 t ha-1),其均方根误差仅占模拟产量范围(2.47 t ha-1)的约3.4%。相比之下,其余四种可解释模型(LR, SMOreg, RandomTree, REPTree)的性能则紧密地聚集在一个狭窄的区间内(R = 0.891–0.907,RMSE = 0.192–0.203 t ha-1),彼此差距很小。这表明,对于这个由确定性模型生成的低噪声数据集,复杂的MLP能够极高精度地逼近其响应面,而简单的可解释模型也能以可接受的精度损失捕获其核心规律。
3.2. 线性回归:系数分析
线性回归模型虽然相对简单,但仍解释了约79%的产量方差。其系数提供了最直接的农艺解读。分析显示,管理变量效应最显著:标准播期(11月1日)相对于晚播(11月15日)能带来+0.531 t ha-1的产量优势,早期播期(10月15日)的优势为+0.380 t ha-1。补充灌溉可增产+0.174 t ha-1。在土壤变量中,土壤容重具有最强的负效应(-0.618 t ha-1每 g cm-3),而粉粒含量则呈现正效应。
3.3. 多层感知器
MLP的极高精度确立了本数据集中预测性能的上限。其散点图显示预测值与AquaCrop模拟值紧密分布在1:1线两侧。然而,由于其分布式权重结构,无法直接从中提取单个预测变量的重要性,这凸显了其在可解释性上的局限。
3.4. SMOreg:归一化权重分析
使用线性核的SMOreg模型在可解释模型中精度第二高。其提供的归一化权重向量能够在共同的无量纲尺度上对所有预测变量进行重要性排序。分析揭示了一个关键发现:早期季节(10-11月)的温度变量具有最强的(负)影响力(Tmin_oct_nov: -0.462; Tmax_oct_nov: -0.405)。这反映了AquaCrop内部物候机制的作用——秋季积温过高会加速物候进程,缩短冠层最佳功能期并使灌浆期提前至更易遭受胁迫的阶段,从而同时降低生物量和收获指数。此外,粉粒含量、播期和管理变量也显示出显著的重要性。
3.5. 决策树模型:RandomTree 和 REPTree
两种树模型性能与SMOreg相当。未修剪的RandomTree首次分裂基于粉粒含量(阈值19.5%),而经过剪枝的REPTree首次分裂则基于粘粒含量(阈值18%),两者都指向土壤质地是划分产量潜力的首要因素。播期在树结构中均作为二级分裂变量出现,再次确认了其关键管理因素的地位。REPTree通过剪枝将节点数减少至RandomTree的18%,而精度损失微乎其微(RMSE仅增加0.004 t ha-1),证明了AquaCrop响应面具有较高的可压缩性,用更简单的规则即可有效表达。
3.6. 多模型农艺信号的一致性
这是本研究最核心的发现之一。尽管五种算法在原理和复杂度上差异巨大,但它们得出的主要农艺信号方向高度一致。所有模型都确认:1) 标准播期优于晚播;2) 补充灌溉有增产效果;3) 细质地土壤(高粉粒/粘粒)有利于高产;4) 秋季高温对产量不利。这种跨越线性、核函数和树结构等不同算法架构的信号收敛,构成了一种“算法无关”的验证,极大地增强了从机器学习模型中推导出的管理建议的可靠性和稳健性。
归纳研究结论与讨论:本研究成功开发并评估了五种能高效模拟AquaCrop-GIS硬粒小麦产量响应面的机器学习代理模型。MLP在精度上达到了天花板水平,而四种可解释模型以微小的精度代价(RMSE增加约0.115 t ha-1)提供了清晰的决策规则。这意味着在实际应用中,可以根据场景需求灵活选择模型:高精度空间决策支持工具可选用MLP;而需要向农民、顾问或政策制定者透明解释的咨询或监管场景,则应优先选择LR或REPTree等可解释模型。
研究最重要的科学贡献在于揭示了跨模型农艺信号的一致性。这为地中海卡皮塔纳塔平原及类似环境提供了坚实、算法无关的管理依据:将播期定在11月1日左右,相比11月15日晚播预计可平均增产约0.53 t ha-1;在开花期实施补充灌溉(约50毫米)可带来约0.17 t ha-1的稳健收益;优先选择粉粒或粘粒含量较高的细质地土壤进行种植。此外,研究通过SMOreg权重分析凸显了控制秋季热负荷对于适应气候变化的重要性,这源自AquaCrop的物候机制,而非统计假象。
当然,研究也存在局限,例如模型完全依赖于AquaCrop的模拟输出,需要未来用独立田间观测数据验证;未考虑氮素动态和病虫害;训练数据时间窗口有限等。将此类ML代理模型与未来气候预测情景相结合,是构建气候适应性规划工具的自然延伸方向。
总之,这项工作不仅证明机器学习可以作为强大工具,将机理模型“压缩”成高效、实用的决策支持系统,更重要的是,它通过系统性的多模型比较和信号一致性分析,架起了一座连接机器学习“黑箱”与农业生产者“透明决策”需求之间的桥梁,为智慧农业中可信人工智能的应用提供了有价值的范本。