基于概率扩散模型与自学习动态通道注意力辅助的扩展长短期记忆网络用于锂离子电池健康状态估计

《Engineering Applications of Artificial Intelligence》:State-of-health estimation of lithium-ion batteries based on probabilistic diffusion models and self-learning dynamic channel attention assisted extended long short-term memory

【字体: 时间:2026年06月13日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  焦国苗|谢继龙|黄淼|马文生|李兆飞|朴长豪 中国重庆400065,重庆邮电大学自动化学院 摘要 电池健康状态评估对于确保锂离子电池的安全可靠运行至关重要。然而,数据量有限以及时空特征表示不足往往限制了模型的性能。为解决这些问题,我们提出了一种新的电池健康状态评估方

  焦国苗|谢继龙|黄淼|马文生|李兆飞|朴长豪
中国重庆400065,重庆邮电大学自动化学院

摘要
电池健康状态评估对于确保锂离子电池的安全可靠运行至关重要。然而,数据量有限以及时空特征表示不足往往限制了模型的性能。为解决这些问题,我们提出了一种新的电池健康状态评估方法,该方法整合了数据增强、时间建模和特征注意力机制。首先,采用去噪扩散概率模型生成电池的多维时间健康特征,从而提升训练数据的数量和多样性。随后,设计了一种自学习动态通道注意力机制,通过动态卷积核自适应地建模跨通道特征之间的相关性,使模型在预测时能够聚焦于更具信息量的特征。最后,构建了一种名为SDCA辅助扩展长短期记忆网络的创新评估框架,该框架利用扩展长短期记忆结构更好地捕捉序列数据中的长期依赖关系。在两个电池数据集上的实验表明,所提方法的电池健康状态评估性能优于多种现有先进方法。

引言
作为核心能源载体,锂离子电池在电动汽车、智能电子设备以及大规模储能系统中发挥着关键作用。它们的性能直接影响这些应用的安全性、可靠性及可持续性(He等人,2022;Sun,2022)。然而,锂离子电池在长期使用过程中不可避免地会逐渐退化,导致容量下降并存在潜在安全风险(Voronov等人,2018)。为解决这些问题,电池管理系统被设计用于监测、控制并维护电池的运行状态与性能。在电池管理系统中,准确评估电池健康状态具有至关重要的意义,因为它能够为电池的老化过程及剩余使用寿命提供重要依据(Yang等人,2020)。因此,开发高效可靠的电池健康状态评估方法对于确保锂离子电池的长期安全稳定运行至关重要。

近年来,出现了多种电池健康状态评估方法,这些方法大致可分为直接测量法、基于模型的方法以及数据驱动方法。直接测量法通常仅适用于离线操作,无法满足实时在线监测的需求(Lee和Won,2023;Obregon等人,2023;Xu等人,2022)。基于模型的方法则依赖于根据锂离子电池的内部和外部特性构建电化学模型或等效电路模型,常采用卡尔曼滤波或粒子滤波等技术进行健康状态评估(Wang等人,2021;Song等人,2020)。不过,这些方法需要针对特定电池类型构建模型,导致其在不同电池类型间的泛化能力较差。相比之下,数据驱动方法无需事先了解电池复杂的内部电化学机制,而是直接从传感器数据中构建健康状态评估模型,因而具备更强的鲁棒性及更好的预测性能。根据不同的建模范式,数据驱动方法可进一步分为传统机器学习方法和深度学习方法(Yan等人,2022)。传统机器学习算法包括决策树、支持向量机、高斯过程回归以及随机森林回归等。尽管传统机器学习方法相对简单,但在处理电池高度非线性、多尺度耦合的退化特性时,其表征能力仍显不足。

与传统方法相比,深度学习具备强大的非线性建模能力和分层架构,擅长自动提取多尺度特征并捕捉复杂时间序列数据中的长期依赖关系。随着计算资源与算法技术的不断发展,深度学习已成为锂离子电池健康状态评估领域的核心技术(Nie等人,2023a;X. Zhang等人,2023)。在常用的深度学习模型中,卷积神经网络在学习空间特征方面表现尤为出色,但其在捕捉序列数据中的长距离时间依赖关系方面存在局限(Zhu等人,2023)。循环神经网络则更适用于时间建模任务,能够学习序列的动态演化规律。不过,传统循环神经网络在训练过程中容易出现梯度消失或爆炸问题。为克服这些缺陷,人们提出了长短期记忆网络和门控循环单元等变体,这类模型通过引入门控机制提升了捕捉长期依赖关系的能力,并在复杂序列预测任务中取得了良好效果。但需要注意的是,当面对超长充放电序列以及高度非线性、强耦合的退化过程时,这类带门控的模型仍会出现性能饱和问题,难以有效保留数百次循环过程中的早期退化信息,从而导致其对复杂老化序列的建模能力不足。近年来,基于自注意力机制的Transformer架构以及扩展长短期记忆网络受到了广泛关注。得益于自注意力机制和位置编码,这些方法能够高效捕捉全局依赖关系,提升序列建模精度。不过,自注意力机制的计算复杂度随序列长度呈二次方增长,这限制了其在高维度长序列场景下的适用性。而扩展长短期记忆网络则通过提升内存容量并优化梯度流动,增强了长期依赖关系的建模能力,为捕捉电池系统中的复杂退化行为提供了更为有效的解决方案。

在基于深度学习的建模任务中,注意力机制作为一种强大的工具,可用于突出重要特征并抑制冗余特征,从而提升模型性能(Lv等人,2022;Niu等人,2021)。不过,不同的注意力机制在建模特性上存在显著差异。自注意力机制能够通过动态计算不同时间步之间的依赖关系,实现高效的全局上下文建模(Vaswani等人,2017)。同时,也有多种通道注意力机制被提出,用以以更低的计算复杂度建模跨通道依赖关系。挤压激励机制通过平均池化捕捉全局通道统计信息,并通过全连接层建立它们之间的关系。高效通道注意力机制则通过用局部一维卷积替代密集层,进一步降低计算复杂度,同时在保持效率的同时有效捕捉邻近通道之间的相关性。此外,还有诸如卷积块注意力模块和坐标注意力机制等较新的设计,它们将注意力建模扩展到空间域,以捕捉通道与位置之间的相互作用。尽管这些方法在图像相关任务中表现良好,但在电池健康状态评估的多通道序列建模任务中,由于空间语义的重要性较低,其性能会有所下降。虽然这些方法在图像相关任务中取得了不错性能,但它们仍难以完全建模电池健康状态评估任务中多通道退化特征之间的复杂交互关系,从而限制了其性能。此外,像高效通道注意力机制这样的轻量级模块,仍然缺乏对异构且长距离跨通道交互关系的明确建模,这限制了它们捕捉电池退化过程中复杂耦合关系的能力。因此,开发一种既能高效建模局部及长距离跨通道依赖关系,又能保持低计算复杂度的注意力机制,仍是提升电池健康状态预测性能的关键挑战。

尽管深度学习模型以及高效的注意力机制在序列建模和特征提取方面取得了显著进展,但它们的性能仍高度依赖于大量高质量训练数据。在数据匮乏的情况下,这些模型容易出现过拟合现象(Szlobodnyik和Farkas,2021)。丰富且易于获取的数据集对于开发准确的电池健康状态评估模型至关重要。然而,收集此类数据既耗时又昂贵。为解决这一难题,数据增强技术被广泛用于提升电池健康状态预测模型的有效性及泛化能力。通过合成新样本或扩展现有数据集,这些方法不仅能增加数据量,还能提升数据的多样性。时间序列数据增强方法大致可分为三类:(1)时间域、频率域或时频域中的基本变换;(2)诸如经验模态分解和小波包重构等高级统计技术;(3)基于深度学习的生成方法,包括生成模型、潜空间重采样以及自动增强策略等(Wen等人,2020)。其中,深度生成模型在近似复杂数据分布方面尤为有效,在数据有限的条件下具有独特优势。生成对抗网络作为最早用于高质量样本生成的框架之一,依靠生成器与判别器之间的对抗训练来逼近真实数据分布。不过,生成对抗网络常常面临训练不稳定和模式崩溃的问题。为克服这些缺陷,去噪扩散概率模型作为一种有前景的替代方案应运而生。该模型通过逐步向数据中添加高斯噪声并学习逆向重建过程,从而实现稳定且连续的采样。与生成对抗网络相比,去噪扩散概率模型具有更稳定的训练过程以及更优质的样本质量。

为应对上述挑战,本研究提出了一种锂离子电池健康状态评估方法,该方法将去噪扩散概率模型与经过自学习动态通道注意力机制增强的扩展长短期记忆网络相结合。具体而言,首先采用基于去噪扩散概率模型的数据增强策略,通过稳定的正向扩散与逆向去噪过程生成高质量的合成退化数据,从而缓解数据匮乏带来的负面影响。其次,构建基于扩展长短期记忆网络的核心结构,利用其指数型门控机制及优化的记忆结构来捕捉电池监测序列中的长期依赖关系。最后,引入所提出的自学习动态通道注意力机制,通过动态调整各通道的感受野,自适应地建模局部及长距离跨通道特征依赖关系。这种设计突破了传统注意力机制仅关注局部通道区域或依赖固定感受野的局限,使得模型能够更有效地聚焦于关键特征。本研究的主要贡献如下:
(1)提出了一种新型的自学习动态通道注意力机制。与SE、ECA和CBAM等采用固定卷积核或全连接层的静态注意力机制不同,该机制通过一个轻量级分支自适应地学习动态的卷积采样偏移量,从而使各通道的感受野能够根据输入特征的分布动态调整。由此,所提出的机制在保持计算效率的同时,显著提升了跨通道特征依赖关系的建模能力。
(2)引入去噪扩散概率模型,以增强电池多维退化特征的表征能力,进而缓解因训练数据量不足且多样性低而导致的过拟合问题。与基于生成对抗网络的方法或其他简单的噪声注入方法相比,去噪扩散概率模型通过稳定的扩散过程生成高质量合成样本,而且所生成的样本是根据相似度进行筛选的,这不仅增加了训练样本的数量和多样性,还提升了电池健康状态预测的性能。
(3)提出了一种SDCA辅助的扩展长短期记忆网络模型。该模型以扩展长短期记忆网络的指数型门控机制及优化后的记忆结构作为核心,用于捕捉长序列中的多尺度退化动态。同时,集成SDCA模块以自适应地聚焦于关键的时间特征。通过这种全局-局部协同的特征提取策略,该模型能够为锂离子电池的健康状态评估提供更准确、更可靠的预测结果。

片段摘录
去噪扩散概率模型
去噪扩散概率模型是一种基于马尔可夫过程的深度生成模型。其核心思想是逐步将数据扰动为高斯噪声分布,然后学习一条逆向重建路径,将噪声重新映射回原始数据分布。该模型受到非平衡热力学扩散过程的启发,主要包括正向扩散过程和逆向去噪过程两个阶段(Ho等人,2020)。在正向过程中,高斯噪声会逐步添加到数据中……

数据描述
为验证所提方法的有效性,本研究采用了马里兰大学先进生命周期工程中心提供的公开锂离子电池数据集进行实验评估(Fu等人,2024)。该数据集包含了四节锂离子电池的充放电循环数据,分别记为CS2_35、CS2_36、CS2_37和CS2_38,每节电池都使用了LIBs进行监测。这些数据子集的详细特性在数据描述部分进行了总结。

为进一步验证所提方法的有效性与稳健性,本研究还使用了美国国家航空航天局艾姆斯研究中心的预测卓越中心提供的电池数据集进行了实验测试(Wei和Wu,2024)。NASA锂离子电池的详细规格如表11所示,该表涵盖了四种电池(B0005、B0006、B0007和B0018),它们在室温下三种不同条件下运行。结论为了解决锂离子电池健康状态估算的精确性问题,本研究提出了一种名为SDCA-xLSTM的新深度学习框架。该框架利用DDPM来学习真实退化数据的分布,并通过基于相关性的特征筛选选出与原始数据分布一致的生成样本,从而在数据量有限的情况下实现有效的数据增强,进一步提升估算精度。基于此,还建立了SDCA机制。CRediT作者贡献声明:苗建国:概念设计、资金获取、初稿撰写、审稿与编辑。谢继龙:研究调查、软件应用、验证、可视化、初稿撰写。黄淼:数据整理、研究调查。马文生:形式分析、验证。李照飞:软件应用、可视化。朴长豪:研究调查、监督指导、审稿与编辑。利益冲突声明:作者声明没有已知的财务利益或个人关系可能影响本文所报告的工作。致谢:本研究得到了重庆市教育委员会科技研究计划[项目编号KJQN202300640、KJZD-K202300611]、中国博士后科学基金会[项目编号2024MD764041]、重庆市技术创新与应用发展专项计划[项目编号CSTB2025TIAD-qykjggX0441]以及重庆市科技创新重点研发计划[项目编号CSTB2023TIAD-STX0028]的资助。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号