通过模型增强实现增量式在线学习，以辅助基于人工智能的建筑冷却系统优化

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Energy》：Incremental online learning with model augmentation for AI-enabled optimization of building cooling systems

【字体：大中小】 时间：2026年06月12日 来源：Energy 9.4

编辑推荐：

　　谢凌云| 山奎| 唐红| 李航新| 王胜伟建筑环境与能源工程系 **摘要** 随着人工智能（AI）驱动的优化技术在建筑冷却系统中的广泛应用，在组件性能下降的情况下，在线学习方法被广泛探索以提升模型适应性。然而，由于在线数据有限、测量质量以及灾难性遗忘的风险，其在实

　　谢凌云| 山奎| 唐红| 李航新| 王胜伟
建筑环境与能源工程系

**摘要**
随着人工智能（AI）驱动的优化技术在建筑冷却系统中的广泛应用，在组件性能下降的情况下，在线学习方法被广泛探索以提升模型适应性。然而，由于在线数据有限、测量质量以及灾难性遗忘的风险，其在实时控制中的实际部署仍然具有挑战性。本研究提出了一种基于残差增强替代模型的增量在线学习策略，以实现模型适应性的鲁棒性和稳定性。该策略结合了预训练的混合替代模型和残差学习分支，在运行过程中仅更新残差参数，从而保留先前学习到的知识，同时允许逐步适应不断变化的条件。采用保守的学习率Adam优化器来确保参数更新的稳定性。通过在物理智能控制站上的硬件在环（HIL）测试验证，所提出的策略在组件性能下降的情况下恢复了模型精度，R2值从大约0.4提高到了0.9以上。代表性误差指标也显著降低，相对误差从6.77%降至0.95%。这种改进提升了优化性能，节能率从1.12%提高到了5.77%，同时在测量噪声下也增强了系统的鲁棒性。

**引言**
在全球能源节约和碳减排的背景下，建筑能耗已成为一个关键问题。在所有建筑子系统中，冷却系统占总能耗的40%以上[1]，使其成为提高效率的主要目标。随着人工智能（AI）技术的快速发展[2][3]，智能控制策略被越来越多地用于实时优化冷却系统的性能[4][5]。

针对冷却系统的AI优化方法大致分为两类：无模型方法和基于模型的方法[6][7]。无模型方法（如强化学习）无需系统建模，并在不确定动态下表现出灵活性[8]。例如，陈等人[9]提出了一种无模型的冷水机组排序策略，利用概率负载预测和自适应阈值调整，在实际应用中减少了56.5%的日切换次数并节省了3945.1千瓦时的能源。同样，戴等人[10]提出了一种基于Q学习的无模型迭代学习控制策略，用于优化空调系统的启动过程，实现了高达17.8%的能源节省，而无需依赖建筑热模型。然而，这些方法通常涉及大量的探索或与系统的重复交互，限制了它们在安全关键或实时控制场景中的适用性。

相比之下，基于模型的控制优化利用数学或数据驱动的模型来预测系统行为并指导决策[11]。这些方法通常具有更高的样本效率，并在控制优化场景中被广泛采用。AI的最新进展进一步增强了基于模型策略的有效性。例如，Senapati等人[12][13]采用元启发式优化算法来提升可再生能源系统的控制性能。他们提出的MAJO和IMIWO-PID策略与传统基于优化的控制器相比，实现了更快的收敛速度和更高的鲁棒性。丁等人[14]开发了一种基于模型的深度强化学习框架，用于多区域暖通空调（HVAC）控制，该框架利用环境条件化的神经网络集合学习系统动态，并通过模型预测路径积分控制（Model Predictive Path Integral control）优化动作，与最先进方法相比，实现了8.2%的能源节省和10倍的数据效率提升。Ajagekar等人[15]提出了一个结合了鲁棒优化和深度强化学习的基于模型的HVAC控制框架，在半封闭温室中显著降低了能源使用量，同时确保了室内气候调节的稳定性。Aruta等人[16]开发了一个基于ANN的辅助模型预测控制框架，用于住宅空间冷却，其中神经网络复制建筑动态以实现快速的多目标优化，实现了高达49%的冷却成本降低，而不会牺牲热舒适度。

尽管AI技术可以简化复杂的物理模型、提高预测精度并加速优化的收敛速度，但其有效性取决于模型能否准确反映真实系统行为。然而，在实际应用中一个持续存在且经常被忽视的挑战是组件性能的下降[17]。组件老化、传感器漂移和环境变化等因素逐渐削弱了优化模型与实际系统行为之间的匹配度。因此，基于AI的优化策略的有效性会下降，常常导致系统性能不佳或不稳定。

为应对这些挑战，在线学习作为一种有前景的方法出现，用于减少模型预测与实际系统行为之间的差异。通过用新观测数据逐步更新模型参数，在线学习使AI模型能够实时适应系统变化。Sha等人[18]开发了一种基于在线学习的增强型数据驱动MPC框架，用于HVAC系统，其中编码器-解码器LSTM模型不断更新以提高预测精度，与基线策略相比，实现了高达10.2%的能源节省和23.2%的室内二氧化碳浓度降低。Zhang等人[19]提出了一种考虑不确定性的在线学习框架，用于数据中心的动态热控制，其中深度学习模型不断更新以适应变化的热动态，与默认控制器相比，实现了高达6%的能源节省和80%的热违规减少。Elgalhud等人[20]引入了一种联邦在线学习框架，用于自适应负载预测，其中本地LSTM模型从流式数据中进行在线更新，实现持续学习，并在保护数据隐私的同时达到与在线集中式模型相当的准确性。虽然这些最新研究突显了在线学习在提高控制系统适应性和性能方面的潜力，但目前的研究领域仍存在几个重要空白：

- 许多现有方法依赖于大量数据或频繁的重新训练，这对于建筑能源系统的实时控制优化来说往往不切实际。
- 在噪声较大或异构操作条件下的鲁棒性不足，缺乏在局部适应的同时保留通用知识的结构化机制。
- 新更新覆盖先前学习到的知识（灾难性遗忘）的风险仍然是长期模型稳定性的关键挑战。

为了解决上述挑战，本研究提出了一种增量在线学习策略，以提高组件性能下降情况下建筑冷却系统AI驱动优化的鲁棒性和长期有效性。所提出的方法旨在在数据可用性和测量不确定性有限的情况下实现连续的模型适应，同时避免离线训练知识的灾难性遗忘。本研究的主要贡献总结如下：
- 提出了一种带有模型结构增强的增量在线学习策略。在该框架中，模型的预训练主干被明确冻结，仅在在线学习过程中更新轻量级的残差分支。这种结构化的约束设计允许逐步适应不断变化的系统动态，同时保留先前学习到的知识，从而提供了一种有效的机制来减轻灾难性遗忘。
- 开发了一种混合替代建模结构作为在线适应的基础。通过结合物理信息子系统和数据驱动的表示，所提出的模型捕捉了系统的基本行为，并为在实时数据有限的情况下的增量学习提供了稳定可靠的基础。
- 建立了一种以稳定性为导向的在线更新机制。采用具有保守学习率的Adam优化器，以确保残差分支内的参数更新稳定且逐步进行。这种设计降低了参数过度漂移的风险，并增强了在线适应过程中的抗测量噪声能力。

**策略概述**
所提出的策略利用预训练的替代模型来捕捉系统的基本动态，并在实时数据有限时降低过拟合的风险。采用具有保守学习率的Adam优化器来促进稳定和逐步的在线更新。如图1所示，所提出的策略包括以下关键步骤：
1) 初始模型构建和离线预训练：进行全面的仿真以生成大量数据集

**测试平台和布置**
在本研究中，选择了位于香港西九龙的一个大型海水冷却冷水机组系统进行优化控制。其物理模型在Dymola中建立，以准确模拟控制过程中的参数变化。所提出的优化算法在单板计算机智能控制站中实现，用于硬件在环测试。本节详细描述了测试平台和布置。

**组件性能下降对系统运行的影响**
图8显示了在基本非优化控制方案下，组件性能下降前后冷却系统的运行和能耗情况。如图8(a)所示，性能下降后，换热器的传热效率降低，限制了每单位海水流量所能提供的冷却能力。因此，需要更高的海水流量来满足相同的冷却需求，导致运行中的海水泵数量增加。

**结论**
本研究提出了一种增量在线学习策略，用于解决建筑冷却系统AI驱动优化控制中常见的组件性能下降问题。所提出的方法在物理智能控制站上实现，并通过硬件在环测试进行了验证。主要发现总结如下：
- 冷却系统的组件性能下降对优化效果有显著影响。

**作者贡献声明**
山奎：撰写——审阅与编辑、验证、概念化。
唐红：撰写——审阅与编辑、可视化。
谢凌云：撰写——原始草稿、软件、方法论、调查、概念化。
李航新：撰写——审阅与编辑、监督。
王胜伟：撰写——审阅与编辑、监督、资金获取、概念化。

**利益冲突声明**
? 作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。

**致谢**
本文的研究得到了香港特别行政区研究资助委员会（RGC）的一般研究基金（编号15222323）和Sun Hung Kai Properties的合作研究资助的支持。

联系信箱：

粤ICP备09063491号

热点排行