《Information Processing in Agriculture》:Towards a socio-technical framework for sustainable plant factories: A review of multi-modal sensing, hybrid modeling, and intelligent control
编辑推荐:
本文系统回顾了植物工厂(PFAL)向闭环智能系统发展的前沿进展,聚焦多模态感知、预测性生长建模与智能环境控制三大技术支柱。文章指出当前研究在数据整合、标准化和模型迁移性方面存在挑战,并提出了一个整合技术、经济、政策维度的社会技术框架,为构建可持续、可扩展的未来植物工厂指明了发展路径。
引言
面对日益加剧的城市化、人口增长和环境退化,全球粮食系统的韧性与可持续性面临严峻挑战。受控环境农业(CEA),特别是人工光型植物工厂(PFAL),被视为一种独立于气候与地理条件的稳定食物生产方式,其先进的形态正成为农业生产中的颠覆性系统。在可控的环境条件下,植物工厂中的蔬菜可以分层垂直密集种植,种植密度比传统方法提高约30%。然而,高效生产伴随高能耗的挑战,其中用于照明和环境控制的电费估计占植物工厂可变成本的91%。这导致植物工厂的盈利能力高度依赖蔬菜销售价格和电力成本。因此,通过优化能源消耗和提高生产价值来提升整体经济可行性,是PFAL产业面临的核心挑战。
概念模型:一个闭环智能控制系统
为应对PFALs的高能耗挑战,我们提出了一个集成的闭环智能控制系统架构。该系统将五个关键子系统连接起来:作为大脑的AI驱动计算系统、用于仿真和预测的数字孪生模块、用户交互前端、能耗监测模块以及带有传感器和执行器的物理植物环境。该架构的设计遵循三大原则:首先,明确集成了能耗监测模块,将实时电费数据输入决策循环,使“能耗”从被动统计量转变为可计算的优化变量。其次,控制流程设计了冗余和灵活性,支持AI辅助策略、人工干预和预设策略共存,确保人类操作员在维护和紧急情况下拥有最终权限。最后,通过数字孪生模块和用户友好前端的集成,降低了操作员的认知负荷,使系统的“黑箱”决策变得透明和可解释。
该系统的核心智能位于计算系统中,其内部数据流和逻辑架构可分为三个渐进模块:多模态数据感知与特征提取、预测性生长建模,以及基于强化学习的控制优化。系统首先通过边缘传感器获取实时的环境和表型数据,并利用卷积神经网络(CNN)和长短期记忆网络(LSTM)等深度学习模型提取空间和时序特征。提取的特征被整合到基于深度学习的植物生长模型中,以预测作物未来的发育状态。这些预测结果作为决策模块的正向奖励,反映了特定环境策略的预期农学效益。AI辅助驾驶(AI Copilot)则采用强化学习算法,通过迭代学习来优化环境控制策略。其奖励函数被精心定义为预测植物生长与能耗成本之间的权衡,例如在每个时间步t的奖励Rt可表述为加权和:Rt= wg·ΔGt- we·Et,其中ΔGt代表预测的生长增量(正向奖励),Et是该时间段消耗的能量(负向奖励),wg和we是可调系数。通过持续反馈,AI Copilot探索并优化光照强度、光周期、温度、湿度和CO2浓度等关键环境因子的设定值,然后由物理环境中的执行器执行。同时,数字孪生平台同步数据流和控制策略,动态模拟和可视化作物生长状态及环境条件,为管理员和研究人员提供了监控系统状态、解释模型决策并在必要时进行人工干预的透明界面。
精准表型的多模态感知:从点光谱到3D视觉
成功实施智能控制系统的前提是准确感知植物状态及其环境。本节评估了从“点”、“面”到“体”的渐进式传感技术。
一维(1D)光谱数据(“点”感知)可提供植物生理生化状态的高分辨率洞察,常用于推断全株状况。但其核心优势——高分辨率的“点”测量——也是其根本局限。该方法本质上是空间盲区,无法描述胁迫在叶片上的分布或植物的整体形态。在需要可扩展性和空间背景的高密度PFAL环境中,单个点测量难以代表整株植物。
二维(2D)成像技术(“面”感知)能够同时获取空间和形态信息。这包括适用于提取叶面积和形状等形态特征的低成本RGB成像,以及为症状前胁迫和质量评估提供深层生理洞察的多光谱/高光谱(MSI/HSI)成像。用于分析这些2D图像的方法经历了从手动特征工程到自动深度学习的范式转变。早期研究依赖于手工特征提取和基于规则的算法,而现代机器学习(ML),特别是深度学习(DL),已克服了这些缺点,在处理复杂表型性状时展现出更强的建模能力和适应性。例如,卷积神经网络(CNN)和分割网络(如U-Net、Mask R-CNN变体)可应用于RGB和多光谱/高光谱图像。然而,在PFALs中应用这些先进的2D成像技术仍面临显著挑战,包括人工补光对图像分割的干扰、高密度种植和叶片严重遮挡导致精度下降,以及镜头畸变和难以在长生长周期内获取大量多样化数据集导致的模型过拟合和迁移性差。
三维(3D)视觉技术(“体”感知)通过捕捉植物的体积和结构特征,解决了2D成像的根本局限。通过生成植物冠层的3D点云,这些方法克服了叶片遮挡的关键问题,并能够直接、无损地测量植物体积、生物量和冠层结构等复杂性状。3D视觉技术包括双目立体成像、结构光、多视角重建和激光雷达(LiDAR)。这些技术在成本、复杂性和精度之间存在不同的权衡。尽管3D视觉在性状保真度和完整性方面具有显著优势,但它在PFALs中的应用仍面临实际挑战,包括邻近植物的遮挡、人工光照的干扰、物理安装限制以及对高通量数据处理的需求。尽管如此,3D成像为高分辨率、几何感知的植物建模奠定了关键基础。当与光谱传感和叶绿素荧光成像结合时,它能够支持开发多模态数字孪生,从而实现更好的生长预测、胁迫检测和智能环境控制。
预测性生长建模:机理与数据驱动范式的融合
植物生长建模为基于产量估计和控制策略的决策提供了定量基础。创建这些模型的关键挑战在于植物生长的巨大复杂性,它受从微观到宏观多个尺度的大量输入控制。面对这种复杂性,追求精确生长建模在历史上分为两个不同的动态系统建模范式:试图模拟底层生物过程的机理性、理论性“白盒”模型,以及旨在直接从历史数据中学习统计模式、绕过复杂机制的实验性、数据驱动性“黑盒”模型。
机理模型基于阐明植物生长过程的不同层次和目的,可分为两类:基于过程的模型(PBM)和功能结构植物模型(FSPM)。PBM通过模拟光合作用、呼吸作用和生物量分配等生理过程来模拟作物水平的生长。FSPM则将3D结构信息与生理动力学相结合,在器官水平模拟生长。这些“白盒”模型的核心优势在于其机理透明性和生物学基础,但代价是高参数化、跨品种和环境的迁移性差以及可扩展性有限。
随着机器学习(ML)和深度学习(DL)的进步,数据驱动方法已成为机理植物生长模型的强大替代方案。经典的机器学习模型,如支持向量回归(SVR)和随机森林回归(RFR),是捕获结构化数据中统计模式并做出可靠预测的有效工具。与经典机器学习相比,深度学习模型引入了卷积神经网络(CNN)、循环神经网络(RNN)和Transformer等网络架构,由于其具有适用于空间(CNN中)或序列(RNN中)模式的归纳偏差,更适合处理高维、时间序列和图像数据。这些能力使DL在植物工厂的预测建模任务中特别强大。
机器学习、深度学习技术与PBM和FSPM的集成日益用于增强这两种模型,从而挑战了过程级和结构级建模之间的传统界限。这种集成在学术和生产领域都是一种有前景的解决方案。混合模型利用机理模型的可解释性和领域知识来指导学习,提高泛化能力,并减少过拟合——特别是在数据受限的情况下。Zhang等人的研究进一步将混合方法分为三个主要范式:模型约束学习、参数估计和合成数据增强。在深度学习前沿,物理信息神经网络(PINN)代表了一种尖端的混合建模范式。PINN不是将物理定律和数据模式视为独立的实体,而是通过添加惩罚已知控制方程偏差的惩罚项,将物理约束直接嵌入损失函数中。
智能环境控制:从基于模型的优化到学习型智能体
优化环境控制策略对于PFALs的可持续性和经济可行性至关重要。作为一个高度集约和完全可控的信息物理系统,其核心运营挑战是动态平衡昂贵的能源输入(主要用于照明、温度和气候调节)与作物产量和质量方面的宝贵产出。最终目标不仅是最大化生长,而且是最大化整体投入产出效率。实现这种优化需要驾驭一个复杂的、相互作用的约束网络,从植物生理极限到错综复杂的经济权衡。环境控制优化本质上是一个平衡竞争目标的问题:在最大化作物产量和质量的同时,最小化运营成本(主要是能耗)。这种优化必须在植物的严格生理耐受范围内进行,其中光照、温度和气流等因素呈现出复杂的、相互依存的权衡。虽然控制系统包含大量相互作用的变量,但本节将重点讨论能耗和环境控制的三个主要驱动因素:照明、温度和通风。
在PFALs中,经典优化方法通常将环境策略选择表述为一个受约束的控制问题,其中植物生长模型定义了系统动力学。一个经典结构结合了长期轨迹规划和短期实时调整。前者基于使用生长模型进行离线优化以勾勒理想的发育路径,而后者则响应实时传感器数据以补偿环境偏差或建模不准确性。一些研究进一步将经济参数(如电价和作物市场价值)纳入目标函数,以使优化目标与现实生产环境保持一致。其他研究探索了通过基于图的方法对变量依赖性进行建模。也提出了结合专家系统与启发式优化算法的混合方法。然而,经典方法的一个核心局限在于它们对精确、完整生长模型的依赖。即使模型架构得到扩展,这些方法也常常无法捕获PFALs中典型的高维、非线性和时间依赖性相互作用。
强化学习(RL)提供了一种独特的、基于交互的范式,由奖励反馈引导。其基本的试错机制类似于农业中的经验决策。随着深度强化学习(DRL)的引入,RL获得了处理高维、序列或视觉数据的能力——这些是PFAL系统中常见的属性。训练RL智能体通常需要一个交互式仿真环境。在操作PFALs中进行实时控制成本高昂,仿真环境提供了可扩展的替代方案。已经开发了几个RL训练平台,允许操纵光照强度和方向等环境参数以观察模拟的植物响应。尽管具有可扩展性,但当前的仿真器在生物真实性方面仍然有限,无法完全捕捉长期生长过程中复杂的、多因素的植物响应。为了减少对实时实验的依赖,离线RL已成为一种实用的方法。它在预先收集的数据集上进行训练。这种方法通常使用机理模型生成训练数据,其本身代表了一种连接理论知识和数据驱动策略学习的混合策略。在实际应用中,RL方法仍受数据质量限制。学习到的策略性能高度依赖于训练环境反映真实世界植物响应的准确程度。为了解决这个问题,模型无关的RL直接与运行的PFAL系统交互,可以减少偏差但样本效率低。一个有前景的方向是将离线历史训练与在线自适应精炼相结合,利用长短期优化概念来平衡学习效率与现实世界的相关性。
除了方法论考量,RL的工业部署还面临着以仿真与生物现实之间差距为核心的关键障碍。主要瓶颈是仿真到现实的差距(Sim-to-Real gap),在简化仿真器中训练的策略由于未建模的随机性(例如,烧尖的发生或个体差异)而无法泛化,导致性能下降。另一个挑战是样本效率低下;深度RL算法需要数百万步才能收敛,但考虑到植物缓慢的生理时间常数(数周至数月),纯粹在现实世界中训练在时间上是不可行的。此外,安全约束构成了一个根本性障碍:标准的试错探索在商业环境中具有不可接受的风险,不安全的行动可能导致不可逆的作物损害。这些限制促使了“安全RL”框架的开发,该框架在不扼杀学习过程的情况下强制执行严格的状态-动作约束。
可持续PFALs的社会技术框架:整合AIoT、数字孪生与可持续性原则
为了实现所评述的感知、建模和控制技术的全部潜力,整体的、系统级的集成至关重要。然而,构建这样的系统不仅仅是连接硬件和软件的技术工作。一个真正先进的框架必须由一个明确的、首要的目标所引导。虽然所讨论的优化技术可以实现显著的能耗降低,但减少能源使用本身并不等同于可持续性。对于食品生产系统,可持续性是一个涵盖经济、环境和社会维度的多层面概念。因此,本节概述了设计此类系统的社会技术框架。
在智能农业系统框架内,物联网(IoT)技术与人工智能(AI)技术的融合是实现智能化农业生产的关键。物联网技术通过传感器网络实现对植物生长环境的全面感知和控制,而人工智能技术则通过数据分析和模型构建从原始数据中提取有意义的知识和模式。在植物工厂中,AIoT系统可以实时监测植物生长环境的温度、湿度和光照强度等各种参数。此外,借助先进的植物可穿戴传感器技术,可以实时监测茎和叶液流等关键微观生理指标。海量数据一方面推动了数字孪生技术的应用,即交互性和可视化的提升;另一方面也使得边缘计算技术成为必要,以实现实时数据处理和快速响应。因此,AIoT系统连接了植物工厂的所有环节,包括植物生长分析、环境监测、优化控制,甚至更直观的人机交互。这样的系统同时满足了植物生长和节能的需求,从而最终实现植物工厂的可持续发展。
在此框架内,边缘计算构成了分布式智能层,其部署在靠近数据源的位置,以管理来自传感器的巨大、高频数据流。通过在边缘设备本地执行数据处理和AI推理,它实现了低延迟和闭环控制,这对于即时胁迫检测或快速环境调整等任务至关重要。这种本地处理减少了对云的依赖,并确保了快速的操作响应。云则对于计算密集型的非实时任务(如训练大规模生长模型或强化学习策略)仍然至关重要。这个分布式边缘层持续不断地向架构的核心仿真平台——数字孪生——输送高质量的预处理数据。数字孪生是物理工厂的高保真虚拟副本,它集成多源数据以模拟和预测系统的行为。我们区分“监控孪生”(优先考虑人类监督的视觉保真度)和“决策级孪生”(专注于AI控制的生理保真度和低延迟同步)。虽然前者作为用户界面,但后者作为需要针对物理传感器数据进行严格实时验证以最小化“仿真到现实”差距的计算测试平台。然而,实现真正数字孪生的一个主要瓶颈在于系统互操作性。这一挑战超越了统一异构硬件;它还需要标准化的数据格式、通信协议和语义模型以确保无缝集成。没有这样的标准,数字孪生有被降级为碎片化可视化工具的风险,从而削弱其作为整体仿真、预测和假设分析决策级平台的作用。
虽然优化能源效率是一个主要技术目标,但技术先进的系统本身并不具有可持续性。其设计和目标必须受到涵盖经济、环境和社会维度的多方面可持续性理解的指导。这意味着系统的核心优化目标不能是像每千瓦时产量这样的简单指标。相反,它必须是一个适应现实世界背景的动态的社会技术目标函数。
首先,系统必须具备地理感知能力,以确保经济和环境可行性。研究表明,当地气候条件显著影响供暖或制冷的能耗。因此,一个真正智能的系统必须不仅基于内部状态,还要基于外部地理因素和当地能源成本来优化其控制策略,使其操作适应不同地点。
其次,系统必须具备市场感知能力,以实现社会接受度和盈利能力。消费者习惯、价格敏感性以及对“非自然”种植方式的担忧直接影响植物工厂的成功。因此,系统的目标应从最大化原始产量转向最大化市场价值。这涉及优化满足特定区域需求的高附加值产品,并生产可验证的质量性状,以证明溢价合理。此外,通过提供关于种植实践的透明、可验证数据,系统本身可以成为教育和培养消费者习惯的工具,建立长期市场可持续性所需的信任。
最后,系统必须具备政策感知能力,以确保长期发展。