一种新型的自适应动态滞后LSTM模型,用于智能能源系统中的短期负荷预测
《Journal of Computational Science》:A Novel Adaptive Dynamic Lagged LSTM for Short-term Load Forecasting in Smart Energy Systems
【字体:
大
中
小
】
时间:2026年04月12日
来源:Journal of Computational Science 3.7
编辑推荐:
短时负荷预测面临非线性与动态时滞耦合挑战,本文提出ADL-LSTM模型,通过动态时间卷积模块、时滞感知特征提取器及局部增强LSTM机制,显式建模多变量时滞依赖,实验验证其准确性及鲁棒性优于现有方法。
徐阳|李东泽|张涛|高原世航|涂然
教育部工业过程知识自动化重点实验室,北京科技大学自动化与电气工程学院,北京100083,中国
摘要
随着可再生能源的大规模整合以及灵活负载的日益增加,短期负荷预测(STLF)面临重大挑战,因为多变量数据中存在强烈的非线性和动态耦合的时滞依赖性。为了解决这些挑战,本文提出了一种自适应动态滞后长短期记忆(ADL-LSTM)网络。该框架结合了一个动态时滞卷积(DTLC)模块,该模块具有可学习的偏移量,可以动态调整卷积采样位置,从而能够明确建模使用传统方法难以捕捉的不对称和耦合的时间依赖性。进一步设计了一个时滞特征提取器(TLFE),通过时滞感知加权来提高对特定变量滞后模式的敏感性。此外,还开发了一种局部增强注意力LSTM(LE-LSTM),通过集成基于Hadamard的时间注意力和错误感知的幽灵头机制来改善局部波动的建模。在真实世界建筑群数据集和GEFCom2014-E数据集上的实验结果表明,所提出的模型在预测准确性和鲁棒性方面始终优于现有方法。结果表明,该框架能够有效捕捉复杂的时间滞后结构和局部变化,为智能能源系统的运行和调度提供了可靠的工具。
引言
在全球能源转型和“双碳”目标的推动下,传统的以化石燃料为基础的集中式电力系统正在向高比例的可再生能源和更加多样化的结构范式转变[1]。随着风能和光伏(PV)电力的大规模并网,可再生能源的份额稳步增加。然而,它们的固有随机性和间歇性对电力系统的稳定可靠运行构成了重大挑战。此外,电动汽车和虚拟电厂等灵活负载的出现为负荷数据引入了多尺度耦合和非线性特性[2]。因此,准确的负荷预测已成为确保电力系统稳定性和实现供需可靠平衡的关键前提。
负荷预测可以根据不同的时间尺度分为长期负荷预测(LTLF)、中期负荷预测(MTLF)、短期负荷预测(STLF)和超短期负荷预测(USTLF)[3]。STLF专注于预测未来24小时内的负荷需求,对于现代电力系统的有效调度和稳定运行至关重要[4]。
已经进行了大量研究来提高负荷预测的准确性。目前主流方法大致可以分为三类:基于物理的模型[5]、统计回归模型[6]和基于人工智能(AI)的模型[7]。基于物理的模型利用历史数据,通过结合热力学方程和设备的运行特性来构建预测模型,但它们严重依赖于专家知识和稳态假设[8]、[9]。统计回归方法,如多元线性回归(MLR)[10]和自回归积分滑动平均(ARIMA)[11],可以提高在不同场景下的泛化能力。然而,这些方法假设负荷数据是线性的,这与现实世界负荷数据固有的非平稳和非线性特性相矛盾,从而限制了它们的预测性能[12]、[13]。近年来,基于AI的技术展示了出色的非线性建模能力,并已广泛应用于故障诊断[14]、图像处理[15]和负荷预测[16]。典型模型包括支持向量机(SVM)[17]、Elman神经网络(ENN)[18]、Prophet[19]、神经基础扩展分析(N-BEATS)[20]和长短期记忆(LSTM)网络[21],其中LSTM网络在建模多变量时间序列的时间依赖性方面表现出很强的优势。除了标准的LSTM之外,还提出了一些先进的序列模型,包括双阶段注意力循环神经网络(DA-RNNs)[22]和基于注意力的序列到序列(Seq2Seq)[23]编码器-解码器架构。通过集成输入级和时间注意力机制,这些模型能够动态突出信息性时间步骤和外源变量,并在短期负荷预测中表现出强大的性能。当它们被纳入混合建模策略时,其有效性进一步提高[24]。
近年来,先进的深度学习架构已广泛应用于负荷预测。时间卷积网络(TCNs)[25]通过扩张卷积展示了强大的长距离依赖性建模能力,而基于变压器的模型,如Informer[26]和时间融合变压器(TFT)[27],在捕捉全局时间关系和处理长序列预测任务方面取得了卓越的性能。此外,还开发了集成卷积、循环和注意力机制的混合模型,以进一步增强特征提取和时间表示学习。尽管取得了这些进展,大多数现有方法仍然依赖于固定的时间对齐或隐式学习的依赖性,因此无法明确捕捉多变量系统中连续和特定变量的时滞关系。在具有频繁波动的短期负荷预测场景中,忽略这种变量间的时滞效应可能导致预测负荷峰值与实际负荷峰值之间的时间不匹配,从而降低预测准确性并增加运营风险[28]。因此,这些方法仍然难以完全建模现实世界能源系统中常见的动态耦合和演变的时间滞后结构,这突显了需要更有效的时滞感知建模框架。
其他研究探索了时间对齐和因果推断方法。动态时间规整(DTW)及其变体,如导数DTW(DDTW)[29]和基于极值的形状DTW(ESDTW)[30],已被广泛用于测量具有滞后效应的时间序列的相似性和对齐[31]。格兰杰因果关系是一种统计方法,用于确定一个变量的历史信息是否可以改善另一个变量的预测,从而识别因果关系[32]。在[33]中,提出了一种新的耦合格兰杰因果关系(CGC)方法,用于量化变量之间的动态时滞效应。然而,这些方法是在假设任何两个变量之间的滞后关系是局部独立的情况下使用的。在真实的预测场景中,这一假设并不成立,因为多个变量可能会相互耦合。因此,迫切需要新的建模框架,能够有效捕捉负荷数据中的动态耦合时滞效应,这对于提高负荷预测的准确性至关重要。
考虑到上述研究的局限性,本文提出了一种新的短期负荷预测方法——自适应动态滞后长短期记忆网络(ADL-LSTM),该方法能够建模多变量数据中固有的动态耦合时滞效应。该方法结合了几项关键创新。首先,将可学习的偏移量引入传统的卷积操作中,以便动态调整核采样位置。其次,构建了一个时滞特征提取器(TLFE),并嵌入了时滞感知加权机制,以提高对多变量时滞依赖性的敏感性。最后,设计了局部增强LSTM(LE-LSTM),以提高预测模型捕捉峰谷负荷曲线波动的能力。本文的主要贡献如下:
(1)提出了一种用于短期负荷预测的新颖自适应动态滞后长短期记忆网络(ADL-LSTM),它明确建模了多变量输入数据之间的潜在时滞依赖性。它克服了传统方法仅基于时间相似性的静态对齐的局限性。
(2)开发了一个动态时滞卷积(DTLC)模块,用于在训练期间动态调整卷积核采样位置。它解决了传统卷积操作中由于固定位置采样导致的信息损失问题。
(3)为了减轻LSTM网络在捕捉局部特征方面的能力限制,我们设计了一种局部增强LSTM(LE-LSTM),它在时间域中集成Hadamard乘积操作,并应用了错误感知的幽灵头机制。它显著提高了预测模型拟合负荷曲线峰谷波动的准确性。
本文的其余部分组织如下。第2节简要介绍了LSTM网络和注意力机制。第3节详细描述了用于短期负荷预测的ADL-LSTM模型,并详细分析了它们与现有方法的差异。第4节通过与主流预测方法的实验比较来验证所提出方法的有效性。最后,第5节总结了本文并概述了未来的工作方向。
部分摘录
LSTM
长短期记忆(LSTM)网络是传统循环神经网络(RNN)的改进架构,它可以通过由输入门、遗忘门和输出门组成的门机制有效控制信息流。LSTM既能学习短期依赖性,又能捕捉长期时间关联,有效缓解了RNN在长序列训练中常见的梯度消失和爆炸问题。
ADL-LSTM模型框架
本文提出了一种用于短期负荷预测的新型自适应动态滞后长短期记忆(ADL-LSTM)网络。该模型通过可学习的动态滞后偏移量捕捉多变量变量之间的时滞依赖性,这些偏移量通过基于梯度的反向传播进行优化。如图3所示,整个框架包括四个阶段:输入数据、时滞信息提取、序列建模和预测输出。
实验与分析
在本节中,我们通过与几种先进的短期负荷预测模型进行比较实验来验证所提出方法的有效性。结果表明,所提出的ADL-LSTM模型表现出卓越的性能。
结论
本文提出了一种新颖的自适应动态滞后LSTM(ADL-LSTM)框架,用于明确建模多变量时滞依赖性并提高短期负荷预测性能。基于这项工作,主要结论如下:
(1)ADL-LSTM模型有效地提取和处理了输入特征中的时滞信息,从而解决了传统负荷预测方法的性能限制,这些方法通常假设变量之间没有时滞依赖性。
CRediT作者贡献声明
涂然:监督、概念化。徐阳:撰写——原始草稿、数据整理、概念化。李东泽:验证、方法论。张涛:撰写——审阅与编辑、监督。高原世航:可视化、监督、调查。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。
致谢
本工作部分得到了中国国家自然科学基金(项目编号62373012)、北京科技大学优秀青年团队项目(中央高校基本科研业务费)(项目编号FRF-EYIT-23-06)以及沙钢集团教师奖学金的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号