一种基于物理知识的BiLSTM模型，用于区域供热变电站的热负荷预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Building Engineering》：A physics-informed BiLSTM for heat load forecasting at district heating substations

【字体：大中小】 时间：2026年04月21日 来源：Journal of Building Engineering 7.4

编辑推荐：

　　区域供暖变电站热负荷预测中，提出融合热力学原理的PLSTM算法。通过引入对数平均温差（LMTD）和热效率（η）构建物理特征，设计基于LMTD和η的注意力机制提取多尺度特征，在双向LSTM的门控机制中嵌入热惯性和能量平衡约束，结合物理信息损失函数和分位数回归实现多时间尺度预测。实验表明PLSTM较现有方法MAE降低1.6%-8.3%，验证了物理指导模型的有效性。

张志毅|张莉|高新勇|金静

上海科技大学能源与动力工程学院，上海，200093，中国

摘要

在区域供热变电站进行准确的热负荷预测对于提高系统运行效率至关重要。由于存在众多变量和复杂的相互依赖关系，这项任务具有挑战性。然而，现有研究通常在特征提取和预测过程中忽略了领域知识，导致预测结果不现实。为此，本文提出了一种基于物理知识的双向长短期记忆（BiLSTM）算法，称为PLSTM，用于热负荷预测。首先，通过添加两个具有热力学意义的变量——对数平均温差（LMTD）和传热效率（

η

），来丰富输入数据，从而为样本添加物理感知属性。然后，利用这些变量设计一种基于物理的特征提取机制，为预测器提供物理上一致的输入。接下来，训练一个基于BiLSTM的预测器，该预测器在其门控机制中融入了热惯性，并在单元状态更新中强制执行能量平衡约束。采用基于物理知识的损失函数来规范训练过程，从而获得物理上一致且现实的热负荷预测结果。此外，还引入了尺度通道注意力机制，以自适应地重新加权多尺度时间模式和输入变量。最后，结合分位数回归生成概率预测区间和点预测值。在三个真实世界数据集上的实验结果表明，PLSTM在1小时、6小时和24小时的预测范围内始终优于六种最先进的算法。具体而言，PLSTM在每个预测任务中的平均绝对误差降低了1.6%–8.3%。这些结果表明，所提出的基于物理知识的框架为热负荷预测提供了一种有前景的方法。

引言

区域供热变电站是区域供热网络与建筑物之间的关键接口，负责实时向最终用户提供稳定的热能[1]，[2]。然而，这些变电站的热负荷会随着天气条件、建筑物占用模式和运营策略的变化而波动，从而增加了及时调整的复杂性，并可能导致供需不平衡。准确的热负荷预测可以支持最佳调度并降低运营成本[3]。此外，基于预测的调度有助于避免过度供热，从而减少区域供热系统的燃料消耗和相关碳排放[4]。最近，用于预测变电站热负荷的先进方法在学术界和工业界受到了越来越多的关注。

由于影响因素众多及其复杂的耦合关系，区域供热变电站的热负荷预测面临重大挑战，尤其是在运行条件突然变化的情况下。目前，已经提出了许多热负荷预测方法，这些方法大致可以分为三类[5]：白箱模型、黑箱模型和灰箱模型。第一类利用热力学方程提供可解释的预测结果，但需要大量的系统参数化和深厚的领域专业知识；第二类采用纯数据驱动的技术，具有通用性和灵活性，但在训练数据有限时可能会产生物理上不合理的预测结果；第三类将数据驱动方法与物理原理相结合，以产生更准确且物理上合理的预测结果。例如，Wang等人展示了基于集总热容单元的低阶灰箱模型通过结合热力学变量有效预测了供暖需求[6]。Abtahi等人进一步开发了嵌入在预测控制工作流中的原型灰箱电阻-电容（RC）模型，用于热负荷管理，显示出较低的参数化负担和稳健的预测结果[7]。然而，传统的灰箱模型受到其固定结构的限制，限制了物理知识和数据驱动学习的灵活整合。

为了克服这些限制，出现了基于物理知识的深度学习方法，为整合领域知识提供了更灵活的框架。这些方法将物理原理融入神经架构[8]、损失函数[9]或训练约束[10]中，从而在保持热力学一致性的同时实现自适应学习。Boussaid等人提出了一种基于物理知识的时空图神经网络替代模型，用于区域供热瞬态分析，该模型在保持准确性的同时将模拟时间减少了约99%[11]。Zheng等人进一步发展了一种多尺度物理知识框架，用于城市区域供热网络，将网络级热力学约束与混合智能控制相结合，展示了基于物理知识的方法在系统级优化方面的潜力[12]。Wang等人开发了一种基于物理知识的LSTM，将热机制嵌入损失函数中，用于建筑物热负荷预测，与标准LSTM相比，平均绝对百分比误差降低了0.08–1.8%[13]。除了以神经网络为中心的方法外，融合基于机制的先验与深度学习的混合框架也受到了越来越多的关注。例如，Yang等人提出了一种堆叠集成策略，将物理原理与数据驱动模型相结合，用于区域供热变电站的预测，提高了在不同运行条件下的预测稳健性[14]。从训练优化的角度来看，Tan等人开发了一种基于多阶段分解和动态自适应损失函数的混合预测模型，以稳定训练并减少误差累积[15]。这些研究表明，对于具有多个强耦合变量和显著热惯性的系统，设计结合领域知识的专用神经网络架构可以提高预测性能。然而，现有的预测模型主要在预测器中应用物理定律，而在特征提取阶段缺乏机制知识的整合，导致输入数据中固有的热力学信息未能得到充分利用。此外，现有的基于物理知识的预测器通常通过损失项或参数约束来强制执行物理定律，这些方法虽然可以调节输出，但对内部动态演变提供的指导有限。

鉴于此，本文提出了一种用于区域供热变电站热负荷预测的基于物理知识的BiLSTM算法。首先，从原始测量数据中计算出两个热力学特征，即LMTD和

η

，分别表征热交换驱动力和系统效率。然后，设计了一种结合LMTD和

η

的注意力机制来进行特征提取。接着，利用提取的特征训练一个基于BiLSTM的预测器，同时采用尺度通道注意力机制来调整权重。最后，使用分位数回归获得多个分位数水平的预测区间。本研究的主要贡献如下：

(1) 提出了一种用于区域供热变电站热负荷预测的基于物理知识的多时段预测模型。热力学原理贯穿预测过程的多个阶段，从而生成与实际运行条件相符的预测结果。这种方法提高了预测精度并增强了结果的可靠性。

(2) 通过引入热力学变量和基于LMTD及

η

的注意力机制，开发了一种基于物理的特征提取机制。一方面，计算LMTD和

η

以丰富特征空间中的热力学意义表示；另一方面，将基于LMTD和

η

的注意力机制集成到TimeMixer中，有助于减少虚假相关性，并为下游预测提供有信息量的特征。此外，这种方法在保持模型灵活性的同时整合了热力学知识。

(3) 提出了一种包含领域知识的基于物理的BiLSTM预测器。具体来说，该预测器包括考虑热惯性的门控机制、由能量平衡原理指导的状态校正以及受热力学约束的损失函数。它从历史数据中学习，同时考虑基本物理过程，从而产生准确且物理上合理的预测结果。

本文的其余部分结构如下：第2节回顾相关工作，第3节详细描述所提出的算法，第4节展示实验和分析结果，第5节提出结论。

部分片段

特征提取

特征提取将原始时间序列测量数据转换为有信息量的表示，以捕捉显著的时间模式和依赖关系。特征提取方法大致可以分为统计特征工程、独立深度学习架构和混合深度学习框架。

统计特征工程依赖于手动设计特征，从原始数据中提取时间模式。González等人应用统计回归方法进行分解

PLSTM原理

所提出的PLSTM用于热负荷预测的总体框架如图1所示，包括三个阶段。第1阶段实施基于物理知识的特征提取，以识别关键变量并生成预测器的训练数据。第2阶段开发具有时间预测能力的基于物理辅助的热负荷预测器。第3阶段使用分位数回归估计预测分布。通过将物理约束纳入PLSTM中，

实验与讨论

本节评估了所提出的PLSTM与六种基线算法在三个数据集上的表现，从五个指标进行比较。所有算法都在相同的计算平台上进行评估：Intel Core i7-13700H处理器、16 GB RAM内存和NVIDIA GeForce RTX 4070显卡。

结论

在区域供热变电站进行准确的热负荷预测对于优化能源系统运行至关重要。然而，现有的热负荷预测方法往往未能充分利用热力学原理，特别是在特征提取和预测阶段，导致预测结果可能与实际运行条件不符。为了解决这些限制，本文提出了PLSTM，这是一种用于多时段热负荷预测的基于物理知识的BiLSTM算法。

CRediT作者贡献声明

张志毅：撰写——原始草稿、验证、软件开发、方法论设计、研究实施、概念化。张莉：资源获取、数据管理。高新勇：可视化处理、形式分析。金静：撰写——审稿与编辑、监督、项目管理、资金筹措。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本项工作得到了上海市科学技术委员会研究计划项目（项目编号：23010503500）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言