融合地表物候与机器学习增强 WorldCereal 作物历

《Ecological Informatics》:Enhancing WorldCereal crop calendars with land surface phenology and machine learning

【字体: 时间:2026年04月01日 来源:Ecological Informatics 7.3

编辑推荐:

  精确的作物历对于理解全球农业物候、绘制作物类型、改进产量预测以及在气候变率背景下应对粮食安全挑战至关重要。本研究在 WorldCereal 系统基础上提出了作物历建模的重要进展:将基于 MODIS AQUA NDVI 时间序列提取的地表物候(Land Surf

  
精确的作物历对于理解全球农业物候、绘制作物类型、改进产量预测以及在气候变率背景下应对粮食安全挑战至关重要。本研究在 WorldCereal 系统基础上提出了作物历建模的重要进展:将基于 MODIS AQUA NDVI 时间序列提取的地表物候(Land Surface Phenology, LSP)指标,与 ERA5-Land 气候参数及机器学习算法,尤其是 XGBoost,进行集成。新方法引入了若干关键增强,包括:对代表性不足区域的训练数据进行加密;对冬季谷物休眠期进行显式建模;协同利用气候与物候预测因子,在不同农业生态区内优化 11 类作物类型的生长季开始(Start of Season, SOS)与生长季结束(End of Season, EOS)估计,其中明确排除了不属于 WorldCereal 项目范围的水稻。模型通过统一化地面真值数据、基于遥感的物候反演结果以及农业监测机构专家评估进行了验证。对于夏季作物,模型获得了 0.94(SOS)和 0.92(EOS)的 R2 值,RMSE 分别为 18 天和 22 天。对于冬季作物,模型达到了 0.90(SOS)和 0.92(EOS)的 R2 值,RMSE 分别为 29 天和 28 天。休眠期建模的纳入显著改善了冬季谷物生长周期的表征,降低了先前在加拿大、北欧和中亚等高纬地区的高估问题。此外,增强的空间分辨率弥补了南美、非洲和亚洲的覆盖缺口,改进了受季风驱动耕作系统中的 SOS 与 EOS 时序。来自巴西国家空间研究院(INPE)、NASA Harvest 和中国科学院等机构的专家验证进一步优化了估计结果,校正了中国和巴西南部的异常,确保结果与观测到的农业周期一致。研究结果表明,将遥感提取的物候信息和气候数据与基于 XGBoost 的机器学习相结合,能够提升作物历精度,优化播种与收获时序,并降低气候变率带来的风险。本研究建立了一种稳健、数据驱动的农业监测工具,可为产量预测和全球粮食安全行动提供支撑。
该文发表于《Ecological Informatics》,聚焦全球尺度作物历精细化建模这一农业遥感与生态信息学交叉领域的重要问题。作物历是农业监测、作物识别、产量预测和粮食安全评估的基础信息层,能够表征播种、返青、休眠和收获等关键农时节点。然而,现有国际主流作物历产品多以国家或次国家行政单元为基本表达尺度,空间分辨率较粗,难以反映局地农业生产的显著异质性;同时,既有产品在冬季作物休眠前后过程刻画不足,在热带季风农业区对多样化耕作节律的适配能力也有限。尤其在 WorldCereal 第一阶段中,尽管已借助 ERA5-Land 再分析数据建立了初步的全球网格化作物历,但仍存在冬季谷物休眠前阶段表达不充分、南美、非洲和亚洲部分区域样本稀缺、局部区域误差偏大的问题。因此,开展融合地表物候(Land Surface Phenology, LSP)与气候驱动信息的全球作物历优化研究,既是提升农业监测精度的现实需求,也是增强全球粮食安全预警能力的重要基础。

针对上述问题,研究人员在 WorldCereal 第二阶段中构建了一个两步式作物历建模框架。首先,基于全球参考作物历、ERA5-Land 气候变量与空间协变量,建立气候驱动作物历初始模型;其次,引入基于 MODIS AQUA MYD09CMG 反射率产品构建的 NDVI 时间序列,提取 LSP 指标,对初始作物历进行物候驱动校正。研究将原先以玉米和冬小麦为核心的框架扩展到 11 类作物,并为适应全球统一建模,将其归并为“夏季作物”和“冬季作物”两大季节类群;在热带区域,则以雨季/旱季主导的物候节律进行对应表达。尤其重要的是,研究对北半球冬季作物的休眠期进行了显式建模,从而弥补了第一阶段模型将冬季作物近似为连续生长所带来的系统偏差。结果显示,融合 LSP 与气候信息后,模型在夏季作物 SOS/EOS 与冬季作物 SOS/EOS 的拟合精度均达到较高水平,其中夏季作物 SOS 的 R2 达 0.94,显著优于单纯气候驱动阶段。研究还通过国际机构专家评议与非洲外部独立数据进行了多重验证,证明该框架在多种农业生态带中具有较好的泛化能力。其意义在于,不仅显著提升了全球作物历的时空连续性和区域适应性,也为作物类型制图、产量预报和气候风险评估提供了更可靠的基础输入。

研究人员采用的主要技术方法包括:整合 GEOGLAM、USDA-FAS、FAO 与 ASAP 等国际作物历资料及专家知识,构建全球参考数据集;利用 WorldCereal 10 m 作物类型图聚合生成 0.05° 作物覆盖比例掩膜;基于 MODIS AQUA MYD09CMG 2020–2021 年 NDVI 时间序列,经 HANTS(Harmonic Analysis of Time Series,时间序列谐波分析)平滑与 CWT(Continuous Wavelet Transform,连续小波变换)峰值检测提取 SOS/EOS;结合 ERA5-Land 1990–2021 年温度、降水和露点温度变量,以 XGBoost 构建两阶段作物历模型;并采用 70/30 或 30% 验证集评估,同时使用撒哈拉以南非洲 LSMS(Living Standards Measurement Study)农业住户调查数据开展外部验证。

3.1.1. Model selection
在模型选择部分,研究人员系统比较了线性回归、Lasso、Ridge、支持向量回归(SVR)、K近邻(KNN)、多层感知机(MLP)、决策树、Extra Trees、LightGBM、CatBoost、随机森林和 XGBoost 等多种算法在冬季与夏季作物 SOS/EOS 预测中的表现。结果表明,XGBoost 在大多数配置下综合性能最佳,尤其在冬季作物上优势更明显。冬季作物方面,XGBoost 对 SOS 的 R2 为 0.88、RMSE 为 35.74 天,对 EOS 的 R2 为 0.92、RMSE 为 27.9 天;夏季作物方面,XGBoost 对 SOS 的表现优于随机森林,而 EOS 虽略逊于随机森林,但总体跨季节、跨指标的平均性能仍最稳定。因此研究最终选定 XGBoost 作为全球作物历反演的核心模型。特征重要性分析显示,纬度是最关键的控制因子,降水与露点温度等水热条件对物候时序也具有显著影响。

3.1.2. First iteration map
第一阶段结果为基于气候驱动的全球作物历初始图。研究人员使用 ERA5-Land 气候变量和空间预测因子,构建了夏季作物与冬季作物的 SOS/EOS 空间分布图,并通过 3 × 3 移动窗口平滑降低空间噪声。该阶段结果主要反映大尺度气候梯度和地理位置控制下的全球作物季节性格局,为后续 LSP 精化提供基准框架。

3.2. Land surface phenology crop calendar retrieval
在 LSP 提取部分,研究人员仅保留作物信号超过 50% 的像元,利用 MODIS AQUA NDVI 日尺度序列,经 HANTS 平滑后,结合 CWT 峰值检测识别多个潜在物候转折点,并按季节振幅 10% 阈值提取 SOS 和 EOS。对冬季作物,还识别休眠期内活跃生长阶段之间的 NDVI 谷值,以刻画休眠转折。这一部分形成了基于遥感观测的全球 LSP 物候图,为模型提供更加贴近实际植被动态的经验性约束。

3.2.1. Summer crops
夏季作物结果显示,不同大洲的 SOS/EOS 受温度、降水季节性及农业管理方式共同影响。亚洲季风区如印度和巴基斯坦,播种多发生于雨季开始后的 5 月下旬至 6 月上旬,收获集中于 10 月末至 11 月;欧洲温带区如德国和法国,播种约在 3 月下旬,收获在 10 月中下旬;非洲撒哈拉以南地区的作物时序更紧密受降水控制;美洲中,美国夏季作物呈典型温带单峰周期,而巴西中部和阿根廷北部则呈现热带或亚热带延长生长期。研究通过 HANTS 平滑 NDVI 曲线揭示了返青、旺盛生长和衰老过程的时序特征。

3.2.2. Winter crops
冬季作物结果表明,休眠及返青过程是高纬和温带区物候识别的关键。亚洲北部如阿富汗和吉尔吉斯斯坦,冬季作物通常于 11 月中旬播种、翌年 6 月底收获,NDVI 序列表现出明显的春季返青信号;南亚较温暖地区如印度和巴基斯坦,冬季生长周期较短,返青较早。欧洲大部分国家冬季作物播种集中于 8 月中旬左右,次年夏季收获;北非与南非则分别体现北半球与南半球相反的季节节律。美洲中,美国和阿根廷的冬季作物均表现出清晰的休眠后生长恢复特征。

3.3.1. Second iteration performance
第二阶段通过将 LSP 指标与气候变量共同输入 XGBoost,对作物历进行协同精化。验证结果显示,该阶段性能显著提升:夏季作物 SOS 的 R2 为 0.94、RMSE 为 18.58 天,EOS 的 R2 为 0.92、RMSE 为 22.27 天;冬季作物 SOS 的 R2 为 0.90、RMSE 为 29.58 天,EOS 的 R2 为 0.92、RMSE 为 28.41 天。SHAP 分析表明,在第二阶段中,气候参数的重要性进一步增强,其中冬季最低温、露点季节变化和降水波动等因子对物候时序具有主要解释力,说明 LSP 数据加密后削弱了模型对纯空间邻近关系的依赖,增强了对真实气候驱动机制的刻画能力。

3.3.2. Second iteration map
第二阶段全球作物历图展示了精化后的 SOS/EOS 空间分布,与 USDA-FAS 等作物历在主要农业国上表现出较高一致性。印度的夏季与冬季作物时序均较好地覆盖主要农时窗口;美国冬季作物季节与官方资料高度吻合,夏季作物亦能反映主要重叠月份;尼日利亚、中国和俄罗斯等区域也呈现较高一致度,仅在个别作物或季节上存在 1–2 个月的偏移。整体上,该结果证明模型能够在全球尺度上生成与国家级农业知识相协调的连续网格化作物历产品。

3.3.3. Overlaps and gaps between seasons
重叠与空档分析显示,相较 Phase I,Phase II 显著减少了季节间不合理空档和过度重叠。热带地区原先大于 200 天的空档在老挝、越南、柬埔寨、台湾、菲律宾和孟加拉国等地得到明显缓解;亚马孙盆地、南美安第斯、埃塞俄比亚和印度等地区先前超过 90 天的季节重叠现象也有所减弱。北半球欧洲、北美和俄罗斯等地的季节空档减少可达约 90 天,说明休眠期建模与 LSP 校正有效提高了季节衔接的连贯性。

3.3.4. External evaluation in Africa countries
在非洲外部验证中,研究人员利用 Mali、Malawi、Niger、Nigeria 等国的独立地理参考数据,对模型输出进行评估。结果显示,SOS 的 R2 为 0.88,EOS 的 R2 为 0.76,整体与参考数据具有较强一致性。残差空间分布表明,参考点密度较低和耕地破碎化区域的偏差较大,反映出当前分辨率与多熟制、小农经营格局之间仍存在适配限制。但总体而言,模型已能较好反映不同农业生态区的季节性作物分布。

3.3.5. Overlaps and gaps between seasons
多年份分析部分基于美国 2008–2020 年 USDA CDL(Cropland Data Layer)年度作物类型掩膜开展。结果显示,夏季和冬季作物的 SOS/EOS 在多年尺度上表现出较强稳定性:夏季作物 SOS 多集中于 3 月下旬至 4 月上旬,EOS 多位于 10 月下旬至 11 月上旬,年际波动小于两周;冬季作物 SOS 稳定在 9 月中旬至 10 月上旬,EOS 多在次年 7 月下旬,标准差仅 3–5 天。与标准化 Tahiti–Darwin ENSO 指数的相关分析未发现统计显著关系,说明大陆尺度作物历时序对 ENSO 年际振荡的响应较弱,支持月尺度作物历产品在长期监测中的稳健性。

讨论部分指出,本研究相较 WorldCereal Phase I 的主要进步体现在三方面。其一,方法学上通过两阶段框架实现了气候驱动与遥感物候驱动的协同融合,形成了隐含消融设计,证明 LSP 能显著提升作物历时间精度,尤其改善夏季作物 SOS 预测。其二,数据层面通过参考样本加密和 10 m 作物类型图聚合,显著提高了南美、非洲、亚洲等欠代表区域的空间覆盖,并通过显式休眠建模纠正了俄罗斯、乌克兰、北欧等高纬冬季谷物播种时间误判问题。其三,应用层面依托 INPE、NASA Harvest、中国科学院等机构的专家反馈,对中国北方、巴西南部等地异常进行了后处理修正,强化了产品与区域农业实践的一致性。文章同时强调,模型在热带持续云覆盖区、作物破碎化地貌以及油菜等花期明显作物上仍存在不确定性;此外,当前“夏季/冬季”二元命名体系对热带多熟制仍属近似表达。未来工作将依托 WorldCereal 年度 10 m 全球作物类型图,实现作物历的动态年度更新,并进一步融合更高空间分辨率卫星数据与多模态学习框架。

结论部分表明,本研究通过融合地表物候(LSP)数据、ERA5-Land 气候参数和机器学习方法,显著推进了全球作物历的发展,系统解决了早期 WorldCereal 作物历在冬季休眠期表达不足、热带区域误差较大及空间覆盖不均衡等问题。基于 MODIS AQUA NDVI 时间序列提取的关键物候事件,结合 ERA5-Land 对休眠过程进行建模,使加拿大、北欧和中亚等高纬地区冬季作物的 SOS 和 EOS 估计更符合实际。研究还通过提高南美、非洲和亚洲的样本密度,改进了季风驱动作物系统及欠代表区域的时序表达。验证结果显示,模型在夏季和冬季作物 SOS/EOS 预测中的 R2 均超过 0.90,且偏差与 RMSE 较低,表明该方法具有较强可靠性与稳健性。来自 INPE、NASA Harvest 和中国科学院等机构的专家参与,对关键区域异常修正和整体一致性确认发挥了重要作用。总体而言,本研究证明,融合 LSP、气候驱动参数与机器学习,不仅能够提升 WorldCereal 框架下作物类型制图和产量预测的输入质量,也为全球农业监测、粮食安全评估和气候适应型农业管理提供了坚实的数据基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号