精准果园管理越来越依赖于准确、及时且可扩展的感知系统,以支持树木级别监控、产量估算和数据驱动的田间作业(El-Ansary, 2025; Sishodia et al., 2020; Zhang et al., 2024)。在果树中,柑橘果园由于树冠密集、枝条结构复杂以及果实可见性高度变化,代表了一个特别具有挑战性的生产环境。这些特点使得柑橘果园成为在真实世界条件下评估下一代果园感知系统的理想试验场(Costa et al., 2021; Dian et al., 2023; Tang et al., 2023)。最近在感知硬件和人工智能(AI)方面的进展使得使用基于视觉的(Bulanon et al., 2019; Longchamps et al., 2022)和边缘计算平台(Jiao et al., 2024; Rui et al., 2024)收集和分析大量果园数据成为可能,为精准农业应用创造了新的机会。
尽管取得了这些进展,但在果园规模上的有效部署仍然具有挑战性。果园中的视觉感知受到遮挡(Lu and Sang, 2015)、光照变化(Choi et al., 2016)、运动引起的模糊(Huang et al., 2025)以及树木和行之间的空间差异(Perry et al., 2010)的影响。在传统的柑橘果园中,这些挑战因复杂的三维树冠结构而进一步加剧,这使得侧视图观测在田间条件下本质上是片面的。这些因素对感知系统提出了严格要求,系统不仅必须达到可接受的准确性,还必须在非结构化的户外环境中可靠、高效且持续运行(Lacerda et al., 2025; Trentin and Ampatzidis, 2024)。因此,当系统在真实果园中部署时,其在受控实验环境中的表现往往会下降,这凸显了算法开发与实际应用之间的差距(Liu et al., 2025)。
现有研究主要集中在果园感知和分析流程的各个单独组件上。代表性研究包括使用基于深度学习的对象检测模型进行果实检测(Zhang et al., 2022; Chen et al., 2021)、基于图像或视频的果实计数(Wang et al., 2018; Gan et al., 2018; Malik et al., 2016),以及树木或地块级别的产量估算(Dorj et al., 2017; Trentin et al., 2024; Vijayakumar et al., 2023),还有用于精准喷洒等果园作业的传感器驱动或视觉引导系统(Partel et al., 2021; Khot et al., 2012)。虽然这些方法在各自的范围内取得了有希望的结果,但超过70%的研究通常作为仅针对果园感知流程的一个或两个组件的独立解决方案进行开发,而不是整体监控。感知、推理和下游部署之间的缺乏整合限制了它们的可扩展性,阻碍了其在实际果园环境中的应用(Liu and Ampatzidis, 2026; Rial-Lovera, 2018)。
从系统角度来看,有效的果园管理需要的不仅仅是孤立的算法改进。实际部署需要一个统一的框架,能够支持连续感知、在树木级别聚合信息,并与下游的决策和执行过程接口。在这样的系统中,感知模块必须生成可靠且可解释的输出,以便被更高层次的推理组件使用,同时满足实时约束和由野外可部署感知平台施加的硬件限制(Duckett et al., 2018; Oliveira et al., 2021)。这些要求推动了一个模块化且可扩展的系统设计,明确地连接了算法开发和实际果园部署。
为了满足这些需求,本研究的主要目标是开发和评估下一代农业感知系统(Agrosense v2),这是一个基于人工智能的、可部署在野外的感知系统,它将感知、推理和空间聚合整合到一个统一的实时框架中,用于树木级别的果园监控。具体来说,本研究旨在:(1)在真实果园条件下支持可靠的果园特征感知,包括树木计数、树冠密度分类和可见果实检测;(2)通过在田间行走过程中稳定识别树木并聚合帧级观测结果来实现树木级别推理;(3)生成用于果园监控和管理的地理参考树木级别表示。虽然一个完整的果园自动化流程还包括执行部分,但本研究侧重于感知和推理作为可扩展、数据驱动的果园决策的关键基础。据我们目前所知,本研究介绍了第一个使用侧视移动平台的柑橘果园感知系统,该系统能够在单一框架内同时实时收集多种形式的树木级别、实际可操作的信息。这里的统一框架指的是一个集成了数据采集、预处理和推理的感知流程,无需单独的感知系统或离线后处理。这些目标直接源于实际的果园管理需求。稳定的树木级别识别支持果园库存和纵向监控,树冠密度分类有助于评估树木状况和结构,果实检测有助于产量相关评估,地理参考聚合则能够实现果园变化的空间检查。
在早期果园感知工作的基础上(Zhou et al., 2025),Agrosense v2将之前的工作扩展为一个更加集成化的果园感知框架。与主要依赖帧级输出且未整合果实计数或实时树木级别可视化的Agrosense v1相比,Agrosense v2引入了四个关键改进:(1)跨帧的稳定树木识别时间跟踪;(2)基于序列的树冠密度推理而非单帧分类;(3)集成果实检测,并在树木和地面果实观测结果上进行树木级别聚合;(4)一个用户友好的地理参考可视化工作流程,用于实时树木级别果园监控。该系统明确考虑了部分树冠可见性、视角变化以及移动果园感知平台固有的操作限制(Azizi et al., 2024; Mena et al., 2024; Porwollik et al., 2017)。通过在一个统一的实时系统中整合多种树木级别测量,Agrosense v2超越了以算法为中心的评估,展示了一个直接支持果园规模情境感知和精准管理的实用感知框架。本文介绍了Agrosense v2的系统设计和核心感知模块,然后评估了该系统在真实柑橘果园中的性能,并最终讨论了当前研究的局限性和未来果园部署的方向。图1展示了Agrosense v2的整体工作流程。