气候变化、人口增长、城市扩张以及自然资源的枯竭对全球粮食安全构成了重大威胁(Maja & Ayano, 2021; Malhi et al., 2021; Arora, 2019)。随着城市区域的扩大和全球人口的增长,对食物的需求不断增加,这就需要采用更加可持续的农业实践。花卉种植涉及开花植物的栽培,在农业部门中发挥着重要作用,它不仅带来经济效益,还美化城市景观,支持当地社区的生态完整性和生计。识别花卉种植区对于可持续发展和生物多样性保护至关重要,有效管理农业资源对于确保可持续生产、减少资源开发以及缓解气候变化的不利影响至关重要(Anderson et al., 2020; Tariq et al., 2022)。识别作物类型可以提供有关农业用地模式和种植强度的宝贵信息,这些信息与土壤性质、养分水平和整体土壤健康状况密切相关。这些因素共同影响作物健康,并促进环境可持续的农业实践(Viaud et al., 2018; Yang et al., 2020)。因此,准确识别开花作物对于有效的农业管理、促进可持续农业产业的发展以及改善当地社区的生计至关重要(Usha and Singh, 2013; Sáiz-Rubio et al., 2020)。
传统的作物田间数据收集方法往往劳动密集且成本高昂,尤其是在大规模区域(Wang et al., 2021)。然而,卫星数据和分类技术的最新进展显著提高了作物类型信息的准确性、可靠性和及时性(Fan et al., 2021; Orynbaikyzy et al., 2019; Wang et al., 2022)。多项研究利用MODIS、AVHRR和SPOT-5等多传感器数据集进行作物分类,这些数据集具有较高的时间重访能力(Chen et al., 2018; Konduri et al., 2020)。相比之下,Landsat和Sentinel-2数据提供了更准确的不同作物空间信息(Khan et al., 2022; Hunt et al., 2019)。然而,这些数据集在区域尺度上提供及时和精确的作物分类的能力有限,尤其是在多云天气条件下。最近,合成孔径雷达(SAR)数据(如Sentinel-1)在作物识别方面受到研究人员的青睐,因为雷达传感器能够穿透云层(Son et al., 2021; Wang et al., 2020)。此外,许多研究人员使用超高光谱图像来识别多种作物类型(Kokaly et al., 2009; Liu et al., 2021; Lu et al., 2020; Rivera et al., 2022; Sahoo et al., 2015; Thenkabail, 2001)。这项技术还可以检测叶片中的化学浓度,由于其高光谱分辨率,能够精确识别各种作物类型(Zhong et al., 2020)。近几十年来,技术的持续改进促使一些研究人员采用基于无人机的超高光谱传感器(Caballero et al., 2020; Prins & Van Niekerk, 2020; Salas et al., 2020; Zhong et al., 2020)。这些系统可以同时获取高空间(约厘米级)和高光谱(约纳米级)分辨率的图像。基于无人机的超高光谱图像在农业中得到广泛应用,因为它具有许多优势,包括操作灵活性、实时数据采集能力和捕捉高精度图像的能力。
以往的研究主要集中在单一数据集上,利用各种光谱指数或时间序列分析来分析作物物候,以区分不同作物类型(Son et al., 2020; Zheng et al., 2015; Zhong et al., 2019)。只有少数研究整合了多个卫星图像来源以提高分类准确性(Adrian et al., 2021; Griffiths et al., 2019; Maponya et al., 2020; Prins & Van Niekerk, 2020)。数据融合的概念已被开发出来,用于从免费提供的高分辨率数据集中提取高度可靠的信息(Orynbaikyzy et al., 2019)。光谱指数结合两个或多个数据集,以减少由时间和气象变化引起的反射率变化(Huete et al., 2002; Sousa & Small, 2023)。这种方法不仅降低了数据的维度,还减少了土壤背景的影响,同时增强了植被信号(Moharana et al., 2018)。植被指数(如归一化差异植被指数NDVI)在从作物中提取特定信息方面被证明特别有效,常用于时间序列植被监测和作物区分(Panda et al., 2010; Huete et al., 2002; Xie et al., 2016; Xing et al., 2021)。基于作物日历和生长模式的物候分类方法已被证明在识别和绘制作物类型方面有效(Son et al., 2021; Wang et al., 2020; Zhong et al., 2011)。各种算法,包括决策树、最大似然和k-最近邻,已被广泛用于作物类型映射(Chen et al., 2018; Maponya et al., 2020; Myburgh & Niekerk, 2013; Pan et al., 2021)。
近几十年来,机器学习技术(如决策树(DT)、支持向量机(SVM)、随机森林(RF)和k-最近邻(KNN)在研究中越来越受欢迎,因为它们在处理复杂和大规模数据集方面效率很高,适合用于大规模映射(Rodriguez-Galiano et al., 2012)。然而,一些分类技术,特别是神经网络,由于可调参数众多,使用起来可能较为复杂,并且可能会遇到过拟合训练数据的挑战(Ahmed et al., 2012; Rodriguez-Galiano et al., 2012; Sicre et al., 2020)。相比之下,SVM算法在高维数据集上表现良好,即使在训练样本有限的情况下也有效,而RF算法在处理噪声数据集方面表现出色,并已被证明适用于植被类型映射(Chen et al., 2021; Khosravi & Alavipanah, 2019; Wang et al., 2019)。除此之外,先进的深度学习技术(如卷积神经网络(CNN)和深度神经网络(DNN)也越来越用于区分植被物种,因为它们能够处理复杂数据并实现高精度(Lin et al., 2024; Shanmuga et al., 2024; Yang et al., 2023)。
超高光谱图像为机器学习应用提供了极好的机会,因为它能够在多个光谱带提供丰富的信息(Sahadevan, 2021; Zhong et al., 2020)。PRISMA卫星数据以其广泛的空间变异性和重访能力而闻名,特别适用于在本地和全球范围内表征植被(Hamzeh et al., 2023)。此外,最近推出的PlanetScope多光谱数据集具有3米的空间分辨率和每日时间更新,已被证明对作物分类特别有价值(Aneece et al., 2021; Rao et al., 2021)。尽管有这些进展,但比较PRISMA、PlanetScope及其融合数据集潜力的研究仍然有限。在小型、高度异质的花卉种植区,特定区域的作物识别挑战尤为突出。基于此背景,本研究旨在进行比较分析,探讨先进的机器学习算法(特别是随机森林(RF)和支持向量机(SVM)以及深度学习方法(包括深度神经网络(DNN)和卷积神经网络(CNN)的潜力。本研究将评估高分辨率PlanetScope SuperDove数据集、超高光谱PRISMA数据集及其融合在准确识别花卉和园艺农场方面的有效性。通过实现这一目标,本研究旨在加深我们对作物识别方法的理解,并改进农业监测实践。