一种用于准确预测年度区域作物产量的框架李宣仪（Hsuan-Yi Li）詹姆斯·A·劳伦斯（James A. Lawrence）菲利帕·J·梅森（Philippa J. Mason）理查德·C·盖尔（Richard C. Ghail）

《Remote Sensing》：A Framework for Accurate Annual Regional Crop Yield Prediction Hsuan-Yi Li, James A. Lawrence, Philippa J. Mason and Richard C. Ghail

【字体：大中小】 时间：2026年04月14日 来源：Remote Sensing 4.1

编辑推荐：

　　**亮点** - 主要发现是什么？仅使用开源数据就可以准确预测年度区域作物产量。 - EVI是产量预测框架中最重要的特征。 - 这些主要发现的意义是什么？4月、5月和6月的EVI与冬大麦产量有很强的相关性。 - 4月至6月期间NDMI的高值会降低冬大麦的年产量。 **摘要**

　　**亮点**

- 主要发现是什么？仅使用开源数据就可以准确预测年度区域作物产量。
- EVI是产量预测框架中最重要的特征。
- 这些主要发现的意义是什么？4月、5月和6月的EVI与冬大麦产量有很强的相关性。
- 4月至6月期间NDMI的高值会降低冬大麦的年产量。

**摘要**

由于气候变化和全球环境的影响，粮食安全问题日益严重。因此，了解作物种植计划和监测作物产量已成为决策者的主要任务。以往的研究应用了遥感技术和经验方法来预测产量，并分析光谱指数与历史作物产量数据之间的关系。然而，这些研究的局限性在于它们在测试区域包含多种农田时无法按作物类型提取光谱指数值，这可能导致在研究产量与光谱指数之间的相关性时出现不准确的结果。本研究通过使用Sentinel-2影像进行无监督分类，无需地面真实数据，开发了一个基于历史作物地图的产量预测框架，以获取冬大麦的光谱指数值。提取的光谱指数以及英国诺福克北部的气象和历史产量数据被用于一维卷积神经网络（CNN）、长短期记忆网络（LSTM）和CNN-LSTM模型中，以预测冬大麦的产量。LSTM整体表现优异，最佳结果达到了均方根误差（RMSE）0.406公斤/公顷、均方误差（MSE）0.165公斤/公顷和平均绝对误差（MAE）10.495公斤/公顷。4月、5月和6月的EVI是LSTM模型中最重要的特征，并与冬大麦产量呈强正相关。所开发的框架结合无监督作物分类和LSTM技术，可以使用开源数据集、历史产量、光谱指数和气象数据应用于多种作物类型和不同地区。这些数据集之间的相关性表明，较高的EVI以及发芽和幼苗生长阶段的最高和最低温度及日照小时数可以提高冬大麦的产量；然而，4月至6月期间植物中过高的水分含量（WC）和较高的归一化差异水分指数（NDMI）会导致冬大麦产量下降。

**1. 引言**

气候变化和复杂的地缘政治局势使得确保粮食安全变得更加具有挑战性。粮食作物的生产和分配对于维持粮食安全和可持续性至关重要。稳定的年度粮食作物产量对于稳定的生产和分配是必不可少的。自绿色革命（1966年至2010年）以来的历史产量数据显示，自20世纪90年代以来产量趋于平稳。特别是在东亚（中国、韩国和日本）的高产水稻系统、西北欧（英国、法国、德国、荷兰和丹麦）的小麦系统以及南欧（意大利和法国）的玉米系统中尤为明显[1]。产量停滞的原因包括西欧减少化肥使用的特定政策和管理系统[2]、南亚灌溉用水短缺和土壤质量下降[3]，以及法国谷物作物面临的极端天气条件（如热应激）[4]。温度升高缩短了作物生长期，减少了灌浆期的长度，导致丹麦的产量下降[5,6]。Alston等人（2009）[7]建议增加更具成本效益的投资和农业研究，以支持产量回升，特别是在发展中国家。为了长期保障粮食安全并防止作物产量下降，需要进行全面的农田管理。准确的作物地图和作物产量预测是决策者规划当前和未来农田管理及作物需求的重要工具。因此，本研究提出了一种使用开源数据的精确作物分类和产量预测框架，无需地面真实数据，可在多种场景中广泛应用。该框架生成的精确作物地图上的光谱指数值可用于分析历史作物产量。

作物产量监测和预测依赖于气象数据和作物生产统计，并结合数学分析[8]。基于地理空间和遥感的农业气象模型（GRAMI）[9,10]以及简单产量算法（SAFY）[11]等产量预测模型已利用气象数据、田间测量的作物参数和遥感图像开发出来，并已在多项研究中应用于多种作物类型[12,13,14,15]。这些模型使用固定的作物生长和产量估算输入参数，且严重依赖遥感数据。因此，通过经验建模方法从植被指数（VIs）估算叶面积指数（LAI）的不准确性导致了作物产量预测的不精确[16,17]。为了克服输入参数的局限性，人们使用机器学习（ML）和深度学习（DL）方法构建了作物产量预测模型。ML方法如随机森林（RF）[18,19]、XGBoost[20]和支持向量机（SVM）[21]，以及DL方法如人工神经网络（ANN）[22]、卷积神经网络（CNN）[20,23]、循环神经网络（RNN）[24]和长短期记忆网络（LSTM）[25,26,27]被广泛用于作物产量预测。比较以往研究中ML和DL方法的作物产量预测结果，DL方法因自动特征提取和更优越的性能而更具前景[28]。在捷克共和国，使用ANN（前馈网络）结合产量数据、地区平均海拔和通过遥感图像的光谱带计算的蒸散指标来预测春大麦和冬小麦的产量[22]。该研究中的预测产量通常比实际观测产量高出0.5–1.0吨/公顷，表明产量预测的准确性可以得到提高。其他研究中也发现CNN、RNN和LSTM的产量预测更为准确。对DL方法进行作物产量预测的回顾表明，CNN的表现优于ANN。基于RNN的LSTM被认为是最有效的DL模型，因其具有处理过程中的反馈循环优势[29]。提出了一个结合土壤特性、天气条件和管理实践的CNN-RNN产量预测框架，其在玉米和大豆产量预测上的均方根误差（RMSE）分别为9%和8%。该模型表明天气条件是其中最重要的因素[30]。还开发了一个基于物候学的LSTM模型，该模型结合了气象指数、每日生长积温（GDD）、致死积温（KDD）以及降水数据，以及宽动态范围植被指数（WDRVI），其RMSE达到1.47 Mg/公顷[31]。巴西的大豆产量预测使用了LSTM和气象数据及卫星图像（包括地表温度、降水量、NDVI和EVI）。LSTM模型针对一年中不同日期（DOY，从年初开始计数）的多组数据进行了测试，在DOY64之前的数据下显示出最低的MAE为0.24 Mg/公顷[32]。在美国农业部（USDA）的产量数据、MODIS地表反射率、MODIS地表温度、降水量和蒸汽压数据的基础上，CNN、LSTM和CNN-LSTM被用于大豆产量预测，其中CNN-LSTM在Google Earth Engine（GEE）上的表现最为高效[33]。这些研究表明了DL模型结合作物数据统计、土壤特性、遥感和气象数据的能力。然而，这些研究并未分析作物产量与遥感和气象数据之间的关系。此外，直接将选定研究区域的光谱指数应用于特定作物类型的产量预测可能会导致不准确的结果，因为光谱指数是在包含多种植物类型的区域尺度上提取的，这些值无法代表特定作物的产量。

本研究旨在开发一个广泛适用的严格作物产量预测框架，重点关注冬大麦，并分析光谱指数、气象数据与冬大麦产量之间的关系，主要目标有四个：
- 构建一个基于在线开源数据集的框架，以便在多种条件和多个地区更广泛地使用。
- 通过无监督作物分类自动生成作物地图，并提取冬大麦的光谱指数。
- 比较不同DL模型的预测结果，找出最适合应用于该框架的DL模型。
- 研究DL模型中各变量的重要性，并分析光谱指数、气象数据与冬大麦产量之间的相关性。

**2. 材料与方法**

本研究开发了一个全面的产量预测框架，以提高基于地球观测（EO）数据的产量预测准确性。通过ML模型利用EO数据生成作物地图，并从作物地图中提取冬大麦的光谱指数值，然后与气象数据结合用于预测诺福克北部的冬大麦产量。

**2.1. 产量预测框架**

该框架包括三个主要阶段：作物分类；训练和验证；以及测试（图1）。作物分类使用2017年11月至2023年6月的Sentinel-2图像，图像重采样为每像素60米，并处理成NDVI、SAVI、EVI和NDMI等光谱指数（表1）。这些指数是根据像素计算得出的，距离矩阵通过Fast DTW算法根据像素间的相似性生成。像素通过归一化距离矩阵和层次聚类进行聚类。聚类后的像素被地理参考到相应的簇中，最终生成作物地图。在训练和验证阶段，有两个主要输入数据集和一个预期输出。从2018年至2022年的冬大麦作物地图的像素中提取NDVI、SAVI、EVI和NDMI等光谱指数值。此外，还收集了2018年至2022年11月至6月期间的最低和最高温度、降水量和日照小时数作为输入参数。预期输出是2018年至2022年的冬大麦历史产量数据。这些数据集和预期输出在300个周期内使用CNN、LSTM和CNN-LSTM三个DL模型进行训练和验证，以生成三个产量预测模型。2023年的作物地图和气象数据用于测试产量预测模型。计算了2023年冬大麦产量的RMSE、MSE和MAE以评估模型性能。同时，还计算了DL模型中每个变量的排列特征重要性（PFI）。

**2.2. 作物分类**

为了分类作物物候，通过Copernicus收集了2017年11月至2023年6月的Sentinel-2A大气校正图像[38]。这些图像被重采样为适合诺福克北部地区的60米像素大小[39]。使用Sentinel-2A图像的近红外（NIR）、红光、绿光、蓝光和短波红外（SWIR）光谱带计算每个像素的NDVI、SAVI、EVI和NDMI值。通过FastDTW-HC（结合Fast动态时间弯曲（DTW）和层次聚类（HC）技术，利用这些光谱指数生成2018年至2023年的作物地图[40]。FastDTW-HC已使用包括Sentinel-1和Sentinel-2在内的多组数据进行测试，以生成作物地图。结果表明，使用NDVI、SAVI、EVI和NDMI作为输入的FastDTW-HC生成了最准确的无监督作物地图。因此，在本研究中，结合NDVI、SAVI、EVI和NDMI使用FastDTW-HC生成了区域性的无监督作物地图。通过Fast DTW计算NDVI、SAVI、EVI和NDMI的四个距离矩阵，根据像素间的相似性对像素进行聚类。这些聚类的像素被地理参考到UTM/WGS84坐标系中，以生成2018年至2023年的最终作物地图。FastDTW-HC [40]是一种无监督机器学习模型，它结合了FastDTW算法来计算像素之间的相似性，并利用HC生成的相似性进行像素聚类。FastDTW-HC适用于时间序列数据，能够计算多个时间点上像素之间的相似性（见图2）；这与传统的欧几里得方法不同，后者仅在单个时间点计算像素之间的相似性。随后应用聚类算法（Agglomerative HC，见图3），通过自下而上的方法根据生成的相似性将像素分类到特定的簇中。图2展示了Fast DTW的概念。Fast DTW可以计算时间序列中X和Y像素在多个时间点的值之间的相似性，这与传统的欧几里得方法[41]不同。图3展示了包含五个个体A、B、C、D和E的层次聚类概念。通过计算相似性并分层聚类这五个个体，形成了A、B、C、D和E的树状图[41]。为了验证这种无监督分类方法的有效性，Li等人（2025年）[39]使用FastDTW-HC对2020年和2023年的数据进行了测试，结果显示冬大麦的准确率分别为77%和77%，小麦为77%和77%，冬油菜为97%和77%，春大麦为84%和95%。2020年和2023年冬大麦和冬油菜的F1分数分别为0.71和0.88、0.69和0.6，表明无监督分类在识别作物方面表现良好。

2.3. 产量预测模型
从2018年到2023年的光谱指数值是通过FastDTW-HC生成的作物地图中提取的，并结合气象数据用于产量预测模型。这些数据包括最低和最高温度、降雨量以及日照小时数。英国诺福克北部地区2018年至2023年的历史气象数据来自位于01°43′37.20′′E, 52°28′58.80′′N的Lowestoft Monckton Avenue气象站[42]。根据作物物候期（从11月到6月），每年选择NDVI、SAVI、EVI和NDMI的值以及每月的最低和最高温度、降雨量和日照小时数作为1D CNN、LSTM和1DCNN-LSTM产量预测模型的输入变量。光谱指数的输入值是为冬大麦的三个生长季节计算的，分为不同的生长阶段（GS）：第1阶段（11月和12月——发芽和幼苗生长阶段（GS00-20）；第2阶段（1月、2月和3月——分蘖阶段（GS20-29）；第3阶段（4月、5月和6月——茎秆伸长、开花和灌浆阶段（GS30-89）[43]）。所有输入变量被分为两部分：2018年至2022年用于训练和验证，2023年用于测试。预期输出是2018年至2023年冬大麦的产量数据，这些数据来自英国环境、食品和农村事务部（DEFRA）对英格兰地区的产量调查[44]。2023年测试阶段的产量估计准确性通过RMSE、MSE和MAE来衡量。

2.3.1. 1D CNN
与应用于图像和视频的2D CNN不同，1D CNN专为1D数组数据设计，例如时间序列和文本数据集（见图4）。通过重复的卷积滤波器和最大池化层，1D CNN可以学习提取数据集的特征，这些特征随后被多层感知器（MLP）利用进行分类，特别是全连接密集层。特征提取的输出被展平为1D格式，然后输入到1D密集层中进行预测。特征提取和预测两个主要步骤合并为一个步骤，从而减少了计算处理时间和复杂性[45,46]。

2.3.2. LSTM
LSTM是一种先进的RNN类型，解决了传统RNN在处理长期时间序列数据时可能出现的梯度消失和梯度爆炸问题，这些问题会导致模型不稳定和不准确[47]。图5展示了LSTM的架构，其中包含三个门：遗忘门（forget gate）、输入门（input gate）和输出门（output gate）。遗忘门根据公式（1）决定保留或丢弃来自前一步的记忆单元信息。输入门根据公式（2）-（4）控制添加到记忆单元中的更新信息。输出门根据公式（5）和（6）控制输出记忆单元生成的信息，这些信息来自前一步的记忆单元和更新后的信息[48,49]。我们用以下公式定义LSTM的元素：
- ????=???(????·[????1,????]+????) （1）
- ????=???(????·[????1,????]+????) （2）
- ?????=???????????(????·[????1,????]+????) （3）
- ????=????⊙?????1+????⊙????? （4）
- ????=???(??0·[????1,????]+??0) （5）
- ???=????⊙t?a?n?h?(????) （6）
其中????、????、????和????代表训练得到的权重，????、????、????和????分别是遗忘门、输入门和输出门的偏置；????1是来自前一隐藏层的参数，????是新的输入参数；??和???????是激活函数；?????和????是输入门生成的参数；⊙表示逐元素乘法，???是从隐藏层传递到下一层的参数。

2.3.3. 1D CNN-LSTM
1D CNN-LSTM的架构首先从1D CNN层开始，该层通过卷积滤波器和最大池化层学习提取一般特征。1D CNN层的输出被展平后输入到LSTM层，LSTM层利用三个门（遗忘门、输入门和输出门）提取数据集中的时间特征。LSTM层的输出随后被输入到密集层进行预测，以产生最终结果[50,51]。

2.3.4. 排列特征重要性（Permutation Feature Importance, PFI）
排列特征重要性（PFI）是一种与模型无关的技术，用于衡量模型中每个输入变量的贡献。通过随机打乱拟合模型中每个变量的值，产生新的估计误差，并将其与原始估计误差进行比较，从而得出特征重要性得分[52]。这决定了模型对特定特征的依赖程度，新估计误差增加最大的特征被认为是模型中最重要的特征。

3. 结果
结果以2018年至2023年诺福克北部的作物地图形式呈现。使用RMSE、MSE和MAE评估了三种不同输入参数组合构建的作物产量预测模型的准确性。分析了输入参数、光谱指数值、气象数据与冬大麦产量之间的相关性。

3.1. 2018年至2023年的作物地图
本研究使用Sentinel-2A图像和FastDTW-HC生成了2018年至2023年的作物地图（见图6）。研究区域位于北纬52°46′59.9′′N，东经0°43′07.1′′至52°53′56.7′′N，划分为24个6公里见方的网格，每个网格之间有25%的重叠，以提高边缘区域的分类准确性。冬大麦用橙色表示，冬小麦用蓝色表示，冬油菜用粉色表示，春大麦用紫色表示。从2018年至2023年的作物地图（见图6）可以看出，根据诺福克地区的6至7年现代轮作系统，农场实行轮作制度：2019年、2021年和2023年主要种植冬大麦，而2018年、2020年和2022年主要种植冬小麦。2018年至2023年生成的作物地图用于提取这些年份冬大麦的光谱指数值。

3.2. 产量监测与估算评估
从作物地图（见图6）和2018年至2023年的气象数据中提取的光谱指数值是产量预测模型的输入参数，这些模型采用CNN、LSTM和CNN-LSTM构建。2018年至2022年的数据被用于训练DL模型（CNN、LSTM和CNN-LSTM）。2023年的数据用于在测试阶段生成产量估计，并通过RMSE、MSE和MAE进行统计分析。表2显示，CNN模型的结果最差，而适用于时间序列预测的LSTM模型表现更好，其RMSE、MSE和MAE均接近最佳值。通过将这两种模型结合成CNN-LSTM，虽然它从CNN提取了一般特征，从LSTM提取了时间特征，但准确性略低于LSTM单独使用的结果。表2表明LSTM表现最佳，这与Sun等人（2019年）的先前研究结果一致[33]。LSTM的PFI得分（见图7）显示，4月、5月和6月的EVI是最重要的变量，其次是11月和12月的值。11月和12月以及4月、5月和6月的SAVI的PFI分数为负，表明这三个特征在模型计算中不太有用。

3. 结果分析
结果显示了2018年至2023年诺福克北部的作物地图。使用RMSE、MSE和MAE评估了三种不同输入参数组合构建的作物产量预测模型的准确性，并分析了输入参数、光谱指数值、气象数据与冬大麦产量之间的相关性。

3.1. 2018年至2023年的作物地图
本研究使用Sentinel-2A图像和FastDTW-HC生成了2018年至2023年的作物地图（见图6）。研究区域位于北纬52°46′59.9′′N，东经0°43′07.1′′至52°53′56.7′′N，划分为24个6公里见方的网格，每个网格之间有25%的重叠，以提高网格边缘的分类准确性。冬大麦用橙色表示，冬小麦用蓝色表示，冬油菜用粉色表示，春大麦用紫色表示。根据2018年至2023年的作物地图（见图6），可以看出诺福克地区遵循6至7年的现代轮作制度：2019年、2021年和2023年主要种植冬大麦，而2018年、2020年和2022年主要种植冬小麦。2018年至2023年生成的作物地图用于提取这些年份冬大麦的光谱指数值。

3.2. 产量监测与估算评估
从作物地图（见图6）和2018年至2023年的气象数据中提取的光谱指数值是产量预测模型的输入参数，这些模型采用CNN、LSTM和CNN-LSTM构建。2018年至2022年的数据被用于训练DL模型（CNN、LSTM和CNN-LSTM）。2023年的数据用于在测试阶段生成产量估计，并通过RMSE、MSE和MAE进行统计分析。表2显示，CNN模型的结果最差，而适用于时间序列预测的LSTM模型表现更好，其RMSE、MSE和MAE接近最佳值。尽管CNN-LSTM结合了CNN的一般特征和LSTM的时间特征，但其准确性略低于LSTM单独使用的结果。表2表明LSTM表现最佳，这与Sun等人（2019年）的先前研究结果一致[33]。LSTM的PFI得分（见图7）显示，4月、5月和6月的EVI是该模型中最重要的变量，其次是11月和12月的值。11月和12月以及4月、5月和6月的SAVI的PFI分数为负，表明这三个特征在模型计算中不太有用。

3.3. 产量与气象数据集之间的相关性分析
比较光谱指数和气象数据对DL冬大麦产量预测模型的影响，PFI分析（见图7）显示光谱指数更为重要。大多数季节性光谱指数在PFI得分排名中名列前茅。然而，在气象数据集中，只有11月的降雨量被列为对DL冬大麦产量预测第八重要的因素。因此，为了进一步了解气象数据对产量预测的影响，表5和表6分析了气象数据集与冬大麦产量之间的相关性。表5显示了2018年至2023年每年11月至6月之间的最低和最高温度、降雨量以及日照小时数的平均值及其与冬大麦年产量的相关性。表6显示了这些数据与冬大麦产量之间的相关性。2018年至2023年间，每年11月至6月期间最低和最高温度、降雨量以及日照小时的季节平均值，以及它们与冬大麦年产量之间的相关性。图8A显示，年平均最低温度与冬大麦产量呈正相关，而年平均降雨量与冬大麦产量呈负相关。为了理解季节性气象数据集与冬大麦产量之间的关系，将分析分为冬大麦的三个生长季节，每个季节根据生长阶段（GS）进行划分。图8展示了2018年至2023年的气象数据（橙色，包括最低和最高温度、降雨量及日照小时）以及冬大麦产量（蓝色），并进行了年度（A）和季节性（B–D）分析。结果表明，11月和12月的气象数据与冬大麦产量有很强的正相关性，如图8B和表6所示。11月和12月对应于冬大麦的发芽和幼苗生长阶段，因此这两个月的最低和最高温度平均值及日照小时都与冬大麦产量呈正相关。这表明每年的产量受到11月和12月最低温度、最高温度及日照小时的显著影响。

1月、2月和3月的分蘖阶段，平均降雨量与冬大麦产量呈负相关，如图8C和表6所示。这与多年来的平均NDMI与冬大麦产量之间的高负相关性一致。1月、2月和3月降雨量较高的年份会导致当年冬大麦产量降低。1月、2月和3月的其他气象因素似乎与冬大麦产量没有显著关系。

4月、5月和6月是茎秆伸长、开花和灌浆阶段，这三个月的平均日照小时与多年来的冬大麦产量呈强负相关，如图8D和表6所示。如果平均日照时间高于预期，可能会导致冬大麦产量下降。过高的日照时间不会促进光合作用，反而会抑制作物生长，因为植物DNA可能因长时间暴露在强烈的紫外线辐射下而受损[53]。通过分析气象数据集，我们发现年平均最低温度和降雨量与冬大麦年产量之间的相关性更强。因此，与其他气象因素相比，最低温度和降雨量对冬大麦产量预测更为重要。在季节性分析中，所有气象因素（最低和最高温度、降雨量及日照小时）与冬大麦产量之间的较强相关性出现在第一季（11月和12月）。这意味着第一季的气象数据对冬大麦产量预测更为关键。然而，第二季的平均降雨量和第三季的平均日照时间与冬大麦产量呈强负相关，也是应用于深度学习（DL）产量预测模型的两个关键特征。

本研究直接从英国诺福克北部的历史作物图中提取了四种光谱指数（NDVI、SAVI、EVI和NDMI）的值，并分析了这些光谱指数与冬大麦产量之间的关系。NDVI已被广泛用于预测谷物产量。MODIS-NDVI有效预测了加拿大草原地区的作物产量，且多项研究探讨了NDVI与多种作物产量之间的关系[54]。先前的研究表明，在开花和灌浆阶段，NDVI与作物产量之间的相关性更高[54,55,56]。在捷克共和国和斯洛伐克的研究中，NDVI与作物产量之间的正相关性最强也出现在开花和灌浆阶段；而在德国某些地区则观察到强负相关性[57]。在澳大利亚，当降雨量超过600毫米时，也发现了NDVI与作物产量之间的负相关[58]；在加拿大，MODIS-NDVI与春小麦产量之间也存在负相关[59]。NDVI与产量之间关系不一致的原因可能包括：(1) 不同作物类型的光谱指数（包括NDVI）不同，会影响结果；(2) 以往研究中的MODIS-NDVI是在作物掩膜下计算的，该掩膜将不同作物类型合并在一起[60]。为了避免分析中作物类型的混合影响，本研究提供了准确的历史作物图，这对于分析光谱指数与作物产量之间的相关性非常重要。

研究表明，年度平均NDVI和降雨量与冬大麦产量之间的相关性更强。因此，与其他气象因素相比，最低温度和降雨量对冬大麦产量预测更为重要。进一步分析季节性数据发现，所有气象因素（最低和最高温度、降雨量及日照小时）与冬大麦产量之间的最强相关性出现在第一季（11月和12月）。这意味着第一季的气象数据对冬大麦产量预测更为关键。然而，第二季的平均降雨量和第三季的平均日照时间与冬大麦产量呈强负相关，也是需要应用于深度学习产量预测模型的两个关键特征。

本研究从英国诺福克北部的历史作物图中提取了四种光谱指数（NDVI、SAVI、EVI和NDMI）的值，并分析了这些光谱指数与冬大麦产量之间的关系。NDVI在预测谷物产量方面被广泛使用。MODIS-NDVI有效预测了加拿大草原地区的作物产量，多项研究探讨了NDVI与多种作物产量之间的关系[54]。先前的研究表明，在开花和灌浆阶段，NDVI与作物产量之间的相关性更高[54,55,56]。在捷克共和国和斯洛伐克的研究中，NDVI与作物产量之间的正相关性最强也出现在开花和灌浆阶段；而在德国某些地区则观察到强负相关性[57]。在澳大利亚，当降雨量超过600毫米时，也发现了NDVI与作物产量之间的负相关[58]；在加拿大，MODIS-NDVI与春小麦产量之间也存在负相关[59]。NDVI与产量之间关系不一致的原因可能包括：(1) 不同作物类型的光谱指数（包括NDVI）不同，会影响结果；(2) 以往研究中的MODIS-NDVI是在作物掩膜下计算的，该掩膜将不同作物类型合并在一起[60]。为了避免分析中作物类型的混合影响，本研究提供了准确的历史作物图，这对于分析光谱指数与作物产量之间的相关性非常重要。

研究表明，年度平均NDVI与历史冬大麦产量呈负相关，因此NDVI并非最重要的特征。通过分析图7中的PFI（植物健康指数），本研究将4月、5月和6月的NDVI值排在第七位，11月和12月的NDVI值排在第九位。相比之下，季节性EVI（植被健康指数）是该模型中最重要的特征，4月、5月和6月的EVI值排在第一位，11月和12月的EVI值排在第二位。EVI的计算考虑了减少大气影响的蓝光波段和γ函数，从而去除了冠层背景污染（包括土壤和大气影响），使EVI成为更准确的植被监测指标[61]。

NDMI虽然不是常用的作物产量预测参数，但在农业研究中常用于土壤湿度和植物水分含量的监测和估算[62,63]。本研究显示NDMI与产量呈负相关，这可能与作物水分含量有关，表明在高降雨量的分蘖阶段会导致产量下降。分蘖阶段（1月、2月和3月）降雨量最高的年份，冬大麦产量较低。过多的水分吸收可能对作物健康有害，包括积水或根部疾病[64]。除了降雨量外，我们的分析还表明，在发芽和幼苗生长阶段（11月和12月），温度和日照时间对冬大麦产量的影响最大。Juhász等人的研究也发现了类似的情况[65]，其结果与Li等人（2025年）[40]的研究结果一致。总体而言，根据本研究对天气条件和光谱指数与冬大麦产量的分析，发芽和幼苗生长以及分蘖阶段是影响冬大麦产量的两个关键生长季节。这些发现有助于详细监测和预测季节性作物产量。

本研究利用土壤特性、作物生长信息、作物产量、气象数据和遥感数据集，通过深度学习（DL）方法预测作物产量。本研究应用了最常用的参数，即温度、降雨量和光谱指数。这些数据集都是免费且开源的，便于在不同地区（尤其是偏远和难以到达的地区）实施。本研究开发了一个用于预测作物产量的DL框架，生成了一系列准确的回顾性作物图。主要成果包括：(1) 使用FastDTW-HC方法生成了无需进一步实地调查的精确历史作物图；(2) 直接从冬大麦像素中提取了光谱指数值，提高了数据的准确性，解决了以往研究中直接使用区域平均光谱指数值的问题；(3) 分析表明，4月、5月和6月的EVI是DL产量预测中最重要的特征；(4) LSTM在提取时间特征方面优于CNN和CNN-LSTM，其预测结果最佳（RMSE为0.406公斤/公顷，MSE为0.165公斤/公顷，MAE为10.495公斤/公顷）；(5) 特定时间段的天气条件对产量有显著影响，例如发芽和幼苗生长阶段（11月和12月）的温度和日照时间对产量有显著影响，较高的温度和日照时间有助于提高发芽和幼苗生长，从而提高冬大麦产量；(6) 分蘖阶段（1月、2月和3月）的高降雨量和茎秆伸长、开花及灌浆阶段（4月、5月和6月）的高日照时间会导致冬大麦产量下降。

本研究开发了一个基于开源数据集的区域尺度年度作物产量预测框架，适用于不同地区的各种条件。通过应用该框架，决策者可以管理可耕地种植计划、储存和供应。多年的作物轮作有助于维持生物多样性和土壤健康。作物产量的监测和预测可以帮助农民确保年度生产和利润，并稳定社区内的粮食供应。决策者可以在收获前预测各地区的多种作物年度产量，从而调整年度粮食进出口。光谱指数和季节性气象数据的分析可以为季节性、年度和长期农业规划提供依据，包括水资源、土壤和土地管理。投资者可以利用这些作物统计数据预测股市中的盈利目标。

未来的研究中，可以将本研究开发的框架应用于不同地区的多种作物类型和气象数据及历史产量数据。由于历史产量数据的限制，将具有相似特征的作物分类进行预测是有意义的。例如，冬大麦和春大麦以及冬小麦和春小麦具有相似的物候特性，可以将它们归为一类进行产量和生产预测，以维持粮食可持续性和营养需求。然而，收集更详细的作物产量数据可以更全面地分析光谱指数和气象数据对特定作物类型的影响。可以在产量预测模型中测试更多输入参数，以确定预测特定作物产量的关键因素。

热点排行