《Batteries》:Data-Driven Thermal Runaway Warning for Batteries: Research Progress and Prospects of Machine Learning Approaches
随着锂离子电池的广泛部署,热失控(TR)带来严重的安全风险,使得早期且准确的预警系统至关重要。虽然机器学习(ML)推进了数据驱动的TR预测,但在模型可解释性、未知条件下的泛化能力以及实时部署方面仍存在挑战。本综述评估了ML驱动的TR预警技术的最新进展,超越了对算法的简单汇编,提供了该领域的系统化综合。作为关键贡献,研究人员批判性地分析了向物理信息机器学习的范式转变,展示了将电化学和热力学原理嵌入神经网络如何将预测误差降低40–60%,同时增强鲁棒性。此外,研究人员综合了一个电池数字孪生(BDT)框架,该框架集成了物联网(IoT)、云计算和车载主BMS以实现闭环协作,有效平衡了低延迟控制与高精度健康评估。最后,研究人员概述了未来突破的战略路径:推进物理信息跨尺度建模、优化云边架构以及建立开放获取基准数据库。通过呼吁制定标准化评估协议以打破数据孤岛,本综述提供了全面的路线图和可行的见解,以加速下一代智能电池安全管理的工业实施。
**2. Machine Learning Workflow**
**2.1. Datasets and Multimodal Signals**
**2.1.1. Public Datasets**
在电池安全研究中,系统选取了多个权威公共数据集,包括NASA电池数据集、艾姆斯研究中心(ARC)数据集及综合滥用基准数据集。这些数据覆盖锂离子和固态电池在机械挤压、内外部短路(ESC)、过充过放及高温热冲击等滥用工况下的关键响应参数。数据包含电信号(电压、电流、内阻、容量)、热信号(温度及热成像数据)、气体信号(CO、H
2、碳氢化合物等成分及浓度)以及声发射(AE)信号,用于反映高频声学事件中的结构变形和隔膜破裂等动态机械失效。统计验证明确了电池在滥用条件下向TR演化的多物理场耦合失效机制,为电池信息学研究建立了基准。
**2.1.2. Electrical Signals**
电信号的优势源于其与TR链式反应前驱过程的直接电化学耦合。内部短路(ISC)是最关键的早期事件,可导致电压和温度变化。电信号可提前2-5分钟响应微短路和电化学副反应,但对局部热异常敏感性较低。特征提取方法包括捕捉微小电压波动、监控直流内阻(DCIR),以及利用差分电压分析(DVA)或增量容量分析(ICA)观察特征曲线变化。样本熵可用于检测电压序列复杂性增加,而弛豫电压曲线可用于估计极化电阻变化。电信号兼具高实时性和抗干扰能力,但需与其他信号融合以实现全周期高可靠预警。
**2.1.3. Thermal Signals**
温升速率(dT/dt)被定义为核心特征参数,可直接反映发热与散热速率差,比绝对温度更灵敏。计算方法包括直接差分法、滑动窗口线性拟合法及基于滤波的状态估计法。传统固定温度阈值方法无法捕捉早期轻微热异常。通过将多维时空热数据导入集成预丢弃技术的改进长短期记忆网络(LSTM),结合数字孪生(DT)概念和云数据处理,实现了高精度热状态估计,可提前发出预警。
**2.1.4. Gas Signals**
气体信号的核心原理是直接捕捉电池内部材料初始热分解阶段的产物。气体释放始于固态电解质界面(SEI)膜分解(约80–120°C),可提供10-60分钟的超早期预警窗口,比电信号监测早5-15分钟,比传统BMS阈值法早10-30分钟。特征提取包括时域(响应值、浓度变化率d[CO]/dt、积分面积)、频域和相关域(如乙烯与乙烷浓度比C
2H
4/C
2H
6)。挥发性有机物(VOCs)是电解质分解的最灵敏标记物,CO是主要持续产物,H
2突增标志着TR进入不可逆爆炸阶段。机器学习(ML)通过卷积神经网络-长短期记忆网络(CNN-LSTM)和支持向量机等模型,实现了混合气体浓度预测、TR阶段识别及故障溯源。
**2.1.5. AE Signals**
声发射(AE)信号通过压电传感器收集瞬态弹性应力波,典型采样频率为500 kHz–10 MHz。AE信号在捕捉锂枝晶生长和隔膜破裂这两个关键TR前驱体方面具有不可替代的优势,可提前数十分钟检测到这些微观机械事件。特征提取包括参数分析(幅度、能量、事件计数)和波形分析。与传统监测参数相比,AE信号能提供与机械失效直接相关的证据,为TR的物理触发提供原位监测依据。
**2.1.6. Matching Between Signal Types and TR Warning Tasks**
不同信号模态在TR预警中各有优劣:电信号适合早期ISC检测和分钟级预警,但动态噪声下误报率高;热信号稳定且成本低,但常规阈值下预警窗口一般不足一分钟;气体信号能实现超早期预警(10-60分钟),但需昂贵传感器阵列且存在交叉敏感性和扩散延迟;AE信号适合机械故障超早期预警,但需要高频采样且易受振动干扰。电热信号因低成本易集成而适用于实时BMS部署,而气体和AE信号更适合高安全需求场景。
**2.2. Feature Engineering and Early Feature Extraction**
**2.2.1. Traditional Feature Engineering: Differential Curve Analysis Based on Electrochemical Mechanisms**
传统方法依赖ICA或差分电压分析从恒流充放电曲线中提取特征,这些特征与锂库存损失(LLI)和活性材料损失(LAM)相关。然而,在实际动态工况(高倍率脉冲、变负载)下,极化效应会扭曲电压曲线,导致特征模糊甚至消失。微分过程还会放大测量噪声,掩盖TR早期微弱异常信号。因此,传统微分曲线方法难以直接应用于在线实时TR预警,需开发数据驱动或物理信息方法。
**2.2.2. ML-Driven Automatic Feature Extraction**
ML驱动的自动特征提取技术通过端到端方式从原始数据中自动学习高维抽象特征。卷积神经网络(CNN)能捕捉局部相关性和时序模式,例如1D-CNN和深度卷积神经网络(DCNN)在电池老化数据集上的容量估计均方根误差(RMSE)低至1.503%。长短期记忆网络(LSTM)通过门控机制有效建模长时依赖关系,捕捉容量退化轨迹和容量再生等复杂动态。混合架构(如CNN-LSTM)可同时学习空间特征和时间演化。自编码器通过重构误差实现无监督异常检测,无需故障标签即可识别早期ISC。这些方法形成多层次自动特征提取框架。
**2.2.3. Method Comparison and Integrated Development Trends**
传统特征工程具有明确的物理可解释性,但受限于理想化应用条件;ML驱动方法适应性强,但存在黑箱特性和数据依赖。物理信息机器学习(Physics-informed ML)将物理定律(如电化学方程)嵌入深度学习框架,作为软约束或硬约束,兼具鲁棒性和机制约束,为解决动态噪声条件下的早期TR检测提供了可行路径。
**2.3. Core ML Models and Training Strategies**
**2.3.1. Model Architectures and General Workflow**
随机森林可识别故障电池,准确率超过94%;CNN在检测ISC和定位热源方面表现高精度;LSTM适用于检测电压异常和时序预测。图5展示了一般ML建模流程,包括定义输入输出、准备数据、选择算法和性能评估。概率ML管线(如高斯过程回归、贝叶斯神经网络)能够量化预测不确定性,这对TR预警中降低漏报风险至关重要。然而,其计算开销限制了在车载BMS中的部署,需采用域专有简化或混合云边架构。
**2.3.2. Advanced Training Strategies**
迁移学习通过从数据丰富的源域(如实验室数据)将知识迁移到目标域(如实际车辆数据),解决了数据稀缺问题。多源域迁移学习与少样本学习(MDTL-FSL)模型结合对抗学习和元学习,提高了TR预警准确性。域自适应Transformer(DAT)框架结合CNN-Transformer混合骨干,高效估计不同化学体系下的健康状况(SOH)和剩余使用寿命(RUL
SEI)。物理信息ML通过将电化学-热耦合方程作为损失函数中的正则化项,约束模型预测符合物理规律,显著改善外推能力和可信度,缓解数据稀缺和噪声导致的性能瓶颈。
**2.3.3. Comparative Analysis of Model–Task Suitability**
不同ML模型在预警提前时间、计算成本和部署可行性之间存在权衡。在诱因阶段(超早期预警)中,LSTM及其变体和自编码器表现出色;在全周期健康诊断中,混合架构(如CNN-LSTM)和强化学习更为适用。系统性挑战包括:预警提前时间与误报率的权衡、模型精度与泛化能力(域偏移)的矛盾、模型复杂度与车载计算资源的冲突、多传感器需求与成本可靠性的平衡,以及数据稀缺与数据驱动模型对大量标签数据需求的根本矛盾。未来系统应基于预警任务层级、可用数据模态和硬件约束选择或组合模型。
**3. Application Scenarios of ML in TR Warning**
**3.1. Early Warning of TR Based on Multimodal Signals**
**3.1.1. Early Warning Based on Electrical and Thermal Signals**
基于BMS常规采集的电压和温度数据,ML驱动的预警取得了显著进展。Ma等人采用时频域注意力机制深度学习方法,构建了电压-温度耦合热失控预警框架,可实现电动车辆动力电池8-13分钟的提前预警,电压和温度预测的组合相对误差仅为0.28%。Sun等人改进的LSTM-隐马尔可夫模型(HMM)框架增强了实时响应能力。Daniels等人利用随机森林分类算法优化温度传感器布局,在风冷圆柱形锂离子电池模块中实现了毫秒级的高精度故障检测和定位。小时级预警则依赖于短期高密度电热时序数据,采用LSTM和相关向量机(RVM)等中等复杂度模型。
**3.1.2. Ultra-Early Warning of TR Based on Gas Signals**
气体信号是电池TR的最早前驱体,源于80-120°C的SEI膜分解。在慢速热斜坡条件(如加速量热仪(ARC)测试)下可提供10-60分钟的超早期预警窗口,但在快速滥用(如高速针刺)下窗口压缩至2-5分钟。对于不同化学体系,三元(NCM)电池在多种工况下可实现稳定10-15分钟预警,而磷酸铁锂(LFP)电池气体生成较晚且较少。ML通过CNN-LSTM、SACNN-Mamba等模型处理传感器阵列的低信噪比和交叉灵敏度问题,准确预测关键气体(CO、VOCs、H
2)浓度并重建产气谱。随机森林、支持向量机等算法用于学习不同TR阶段的气体指纹特征(早期高CO
2/CO比,后期H
2/VOCs激增),实现定量分期和故障溯源。
**3.1.3. Micro Fault Detection Based on AE Signals**
AE信号可捕捉锂枝晶生长和隔膜破裂等内部微观机械故障,比热、电和气体信号提前数十分钟。CNN自动提取AE信号的时频域特征,LSTM建模其时序演化,实现锂枝晶成核和隔膜微裂纹的精确识别。自编码器模型通过无监督异常检测,能够检测无故障标签下的微短路和隔膜失效。AE信号可直接定位隔膜破裂这一TR的核心物理触发事件,提供超早期干预窗口。
**3.1.4. Multimodal Signal Fusion for High-Precision Intelligent Early Warning**
ML在电、热、气体和AE信号的多模态融合中发挥核心作用,通过提取弱特征和抑制干扰,实现不同粒度的早期、超早期和微故障预警。多模态融合进一步提高了预警精度并延长了预警窗口,弥补了单模态信号的局限性。
**3.2. Prediction and Mitigation of TR Propagation**
基于ML的方法通过数据驱动建模预测TR在电池模组内的传播路径和速度,能够捕捉电池结构、热物性与TR传播规律之间的复杂非线性关系。Daniels等人将传感器布局优化视为高维空间中的特征选择问题:构建候选位置池,利用预训练的LSTM模型模拟各位置在故障场景下的温度数据,计算信息熵,通过贪心算法迭代选择信息增益最大的位置,直至预测精度达到90%或传感器数量低于预算。优化布局相比均匀布局可提高40%的监测覆盖率并提前2秒检测传播趋势。在风险分级隔离决策中,ML模型根据传播速度(低风险<0.3 cells/min,高风险>0.8 cells/min)分类,当预测五秒内将全模组传播时,可在两秒内部署陶瓷纤维绝缘板实现物理隔离,同时切断对应区域供电电路以支持故障反演。
**3.3. High-Precision Detection of ISCs**
ML方法在ISC检测中展现出灵活性和高精度。Qiao等人提出的方法结合动态时间规整(DTW)和梯度提升决策树(GBDT)。DTW有效解决时序数据的时间轴扭曲问题,通过比较正常电池与测试电池的电压和温度曲线相似度,一旦偏差超过阈值即识别早期ISC。GBDT通过迭代构建决策树校正前序模型残差,高效处理高维特征并评估特征重要性,减少冗余信息干扰。两者互补实现了对早期ISC微弱故障特征的准确提取和精确分类。
**4. Summary and Outlook**
尽管BMS在电动车辆和储能系统中广泛应用,但在状态估计、均衡控制、标准化和安全预警方面仍存在关键局限。ML的深度融合正推动TR预警从传统阈值依赖的被动响应向基于多模态数据挖掘的主动预测性健康管理转变,将预警窗口从不足1分钟延长至8-13分钟,预测精度从约75%提升至95%以上。然而,技术向大规模应用过渡面临数据稀缺且分布偏移、模型可解释性与可靠性权衡、以及工程部署中复杂模型与车载计算资源矛盾三大挑战。未来研究应聚焦三个方向:第一,发展物理信息ML,将电化学和热力学原理嵌入神经网络,约束预测并增强可解释性,相关研究证实可将预测误差降低40-60%;第二,构建包含物联网(IoT)、云和车载主BMS的电池数字孪生(BDT)闭环协作框架,平衡实时响应与高精度健康评估;第三,推动开放科学和标准化评估基准,学术界和工业界应共建基准数据库和统一评估协议,打破数据孤岛,加速工业应用。实现真正智能可靠的电池安全管理需要电化学、材料科学、数据科学和控制工程等多学科深度交叉协作。