基于机器学习技术与模拟的阿拉比卡咖啡(Arabica coffee, Coffea arabica L.)果载量非破坏性估算

《Smart Agricultural Technology》:Arabica coffee fruit load non-destructive estimation using machine learning techniques and simulation

【字体: 时间:2026年06月01日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  摘要:现有的咖啡产量估算方法采用昂贵且具有破坏性的采样技术,在描述农业数据变异性方面灵活性有限。本研究旨在探究机器学习(Machine Learning, ML)技术,以开发一种基于非破坏性新梢营养生长测量值预测果载量(fruit load)并结合概率方法进行

  
摘要:现有的咖啡产量估算方法采用昂贵且具有破坏性的采样技术,在描述农业数据变异性方面灵活性有限。本研究旨在探究机器学习(Machine Learning, ML)技术,以开发一种基于非破坏性新梢营养生长测量值预测果载量(fruit load)并结合概率方法进行作物产量模拟的模型。研究对象为播种至成苗连续四年生的Castillo? Centro品种植株。ML建模使用了三个生产年份的新叶形成(foliar formation)、多节侧枝(plagiotropic branch)生长及产量构成因子数据。评估了三种ML技术估算果载量:支持向量回归(Support Vector Regression, SVR)、人工神经网络(Artificial Neural Network, ANN)和随机森林(Random Forest, RF)。基于120株树的概率分布进行单株产量模拟,生成含1200株树的模拟群体。每株树取两个最高产枝条参数化分布,并将ML模型的残差分量直接纳入模拟过程。产量定义为单株产量克(g)。ANN模型表现最佳,解释了95%以上数据变异性(R2 = 0.98),离散度最低(RMSE = 3.64 fruits·branch?1),其中新叶形成对新模型结构贡献达84%。首个收获年模拟产量与观测产量平均值差异不超过300 g/株。结果表明,ML方法与随机过程(stochastic processes)相结合是咖啡产量预测与模拟的稳健方法。
论文解读:《Smart Agricultural Technology》——基于机器学习技术与模拟的阿拉比卡咖啡果载量非破坏性估算
一、研究背景与意义
咖啡(Coffea arabica L.)产量的准确估算对农业规划、资源高效利用及农艺管理决策至关重要。目前常规产量估算方法通常在花芽分化期量化花芽或在收获期实测,这些方法成本高、具破坏性且难以在大面积推广,限制了其对农业数据变异性的灵活描述。尽管机器学习(Machine Learning, ML)在作物估产中展现出优于传统统计模型的精度,并能整合农气象、生理及管理变量,但将ML与随机模拟(stochastic simulation)结合应用于咖啡生产的研究仍较匮乏,多数研究将预测模型与模拟分析分开进行,较少关注将ML衍生的残差变异性和不确定性融入产量模拟中。哥伦比亚作为阿拉比卡咖啡主产国,其微气候差异导致作物物候变化,已有研究表明新叶形成(leaf formation)与多节侧枝(plagiotropic branch)生长同果载量(fruit load)存在相关性。因此,研究人员开展了此项研究,旨在通过非破坏性地上部营养生长测量值结合ML与概率模拟方法,实现咖啡果载量的无损估算及产量模拟,以辅助劳动力安排、采收计划及植保决策。
二、主要关键技术方法
研究人员在哥伦比亚Cenicafé的Naranjal试验站,以120株全光照下种植的Castillo? Centro品种阿拉比卡咖啡为样本队列,定植后连续监测三年生产性数据。于每年6—7月选取每株两个结果最多的多节侧枝,非破坏性测量枝条长(Branch Length, BL)、总节数(Total Number of Nodes per branch, TNN)、总叶数(Total Number of Leaves per branch, TNL)、累计叶面积(Accumulated Leaf Area per branch, ALA,采用Unigarro经验公式ELA=0.99927×[L×(-0.14757+0.60986×W)]加和)、叶果比(Leaf Area-to-Fruit Ratio, LAFR=ALA/FB)、总果节数(Total Number of Fruiting Nodes per branch, TNFN)及单枝果实数(Fruits per Branch, FB)。以BL、TNN、TNL、ALA、LAFR、TNFN为输入变量,分别构建支持向量回归(Support Vector Regression, SVR)、人工神经网络(Artificial Neural Network, ANN,六隐层神经元,反向传播)和随机森林(Random Forest, RF,1000棵树)三种ML模型预测FB,采用嵌套k折交叉验证与超参数寻优评估性能(RMSE、R2)。将最优模型残差拟合偏正态分布(skew-normal distribution)表征未解释变异,结合最富产两枝占总果比(Contribution of the Productive Branches in the Tree, CPBTi,Beta分布)、ML预测枝果数(FBml,Gamma分布)及单果质量(Fruit Mass, FM,Gamma分布)进行蒙特卡洛(Monte Carlo)随机模拟单株产量,并引入校正因子(Correction Factor, CF)修正系统偏差,采用非参数Bootstrap(1200次重复)评估不确定性,所有分析在R 4.2.1中完成。
三、研究结果
3.1. Machine learning model fitting for fruit load estimation with residual error correction(果载量ML模型拟合与残差校正)
通过k折交叉验证对比SVR(R2=0.94, RMSE=9.56 fruits·branch?1)、RF及ANN模型性能。结果显示ANN模型预测效果最优(R2=0.98, RMSE=3.64 fruits·branch?1),SVR次之,RF表现相对较差。将偏正态分布拟合ANN残差并叠加随机扰动,可整合预测不确定性与田间计数误差。变量重要性分析表明累计叶面积(ALA)与叶果比(LAFR)合计贡献约84%的ANN模型解释力,残差部分可解释为这些主导变量估算过程中不确定性的传递。
3.2. Integration of parameter standardization and machine learning for Arabica coffee yield simulation(参数标准化与ML结合进行阿拉比卡咖啡产量模拟)
对CPBTi、FBml及FM进行概率分布拟合。CPBTi符合Beta分布(α=26.04, β=134.79, 均值16.1%)优于Gamma分布;FBml与FM均最符合Gamma分布(FBml: α=9.25, λ=0.081; FM: α=41.33, λ=18.97, 均值2.17 g),经Anderson-Darling检验(p>0.05)不拒绝原假设。蒙特卡洛模拟生成单枝果实数与单果质量乘积得枝产量,按CPBTi扩展至单株,经校正因子调整后首年产模拟均值1462 g/株(观测1171 g/株,差291 g),第二年产模拟均值3156 g/株(观测3926 g/株,差770 g)。Bootstrap重抽样显示模拟产量分布能较好反映观测产量结构,年间偏差源于果实在枝条间分配效率的年际变化及植株内异质性,可通过校正因子调和中心趋势与离散度。
四、讨论与结论总结
讨论指出,ANN较SVR和RF更能灵活表征新梢营养生长与生殖生长间的非线性交互及组合效应,适合果载量估算。Gamma分布因允许正偏态、限定正值及捕捉右尾极端值,较正态与Weibull分布更贴合FBml和FM的生物过程特征;Beta分布因定义域[0,1]及适应不对称形态,适宜模拟CPBTi这类百分比变量。仅取两最富产枝推算全株产量存在系统性高估倾向,反映了植株内枝条生产力不均及气候—管理互作引起的年际差异,此简化方法在本研究条件下有效但推广至不同种植密度或修剪制度时需谨慎调整。引入校正因子并非事后校准而是预定义的对田间系统偏差的统计协调,结合Bootstrap增强了模拟与实证吻合度及外部效度。
结论(Conclusions):将机器学习(Machine Learning, ML)技术与概率方法相结合,可从非破坏性营养生长测量值预测阿拉比卡咖啡果载量并模拟作物产量,所建框架能代表单株水平经验观测范围内的产量变异性。在评估模型中,人工神经网络(Artificial Neural Network, ANN)对Castillo? Centro品种咖啡植株基于地上部新梢营养生长测量的果载量估算及残差校正表现最佳。未来研究应纳入单株及小区尺度的补充信息以细化空间与生产变异性表征,改进校准流程及对田间条件的还原度。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号