基于多源数据融合与k-Shape聚类(k-Shape Clustering)的充电基础设施参数辨识与溯源方法

《World Electric Vehicle Journal》:A Method for Identifying and Tracing Parameters of Charging Infrastructure Based on Multi-Source Data Fusion and k-Shape Clustering

【字体: 时间:2026年06月10日 来源:World Electric Vehicle Journal 2.6

编辑推荐:

  鉴于电动汽车充电基础设施在海量订单量下运行工况复杂且存在潜在故障,传统基于阈值或单一统计量的监测方法难以检测动态时变异常。本文提出一种基于k-shape时间序列聚类算法的充电设施运行状态辨识与溯源方法。该方法直接以充电电流时间序列为研究对象,省去了繁琐的人工特

  
鉴于电动汽车充电基础设施在海量订单量下运行工况复杂且存在潜在故障,传统基于阈值或单一统计量的监测方法难以检测动态时变异常。本文提出一种基于k-shape时间序列聚类算法的充电设施运行状态辨识与溯源方法。该方法直接以充电电流时间序列为研究对象,省去了繁琐的人工特征提取过程;通过采用基于形状的距(SBD, Shape-Based Distance)度量策略,克服了时间序列数据中常见的相位偏移(phase shifts)和幅值缩放(amplitude scaling)问题,同时保留了时间维度的完整性。通过迭代计算簇质心(cluster centroids),算法成功地将海量数据自适应地分类为"标准充电""深度振荡"及"限功率"等典型簇。基于聚类结果,本文进一步构建了"形态-工况"(shape-operating condition)映射机制,结合贝叶斯后验概率(Bayesian posterior probability)模型,实现了与异常波形存在统计关联的高风险"车辆-充电机"组合的定位。实证研究表明,该方法能有效识别波形微观层面的设备性能退化,并为充电网络智能运维提供优先巡检线索。
基于多源数据融合与k-Shape聚类的电动汽车充电基础设施参数辨识与溯源方法研究解读
研究背景与意义
随着新能源汽车数量增长,Vehicle-to-Grid (V2G) 场景下的充电基础设施成为交通与电网的关键纽带,需具备智能监控、状态评估及异常检测能力。传统运维方法面对海量异构数据及复杂环境难以满足需求,且现有研究存在三方面局限:一是数据融合深度不足,车端与桩端存在"数据孤岛";二是异常检测依赖标注数据,难以发现以曲线形态渐变为特征的"软故障(soft faults)";三是缺乏系统性溯源机制以锁定高风险检查目标。针对充电过程中车辆BMS与充电机控制器闭环控制导致的波形畸变、持续供需偏差或限功率等未被单阈值越界捕获的隐性异常,本研究开展了一项无需人工标注的无监督学习诊断方法研究,成果发表于《World Electric Vehicle Journal》。
主要关键技术方法
研究人员采用2025年7月至8月浙江衢州地区充电基础设施运营数据(含8万余条有效静态订单及10万+高频时序数据点),经清洗对齐构建多源融合数据集。关键技术方法包括:(1)基于Pearson相关系数的14维特征相关性分析,筛选充电电流为反映车-桩交互控制逻辑的核心敏感观测变量(弹性变量);(2)采用k-Shape聚类算法,基于归一化互相关系数(NCC, Normalized Cross-Correlation Coefficient)定义形状距离(SBD, Shape-Based Distance),以SOC变化率作横坐标对齐不等长序列并进行Z-score标准化,通过肘部法则(Elbow Method)确定最优簇数k,迭代优化获取簇质心;(3)基于各簇提取平均电流、功率及效率特征绘制箱线图进行工况量化验证;(4)构建基于条件概率(Conditional Probability)的后验溯源模型,计算特定车型组(VIN前缀分组)-充电桩组合在异常簇中的出现概率偏离先验概率的程度,定位高风险车-桩交互组合。
研究结果
3.1 基于相关性分析的关键特征识别(Key Feature Recognition Based on Correlation Analysis)
研究人员对14维参数(含需求/输出电流电压功率、电池容量、SOC、车型组标识等)进行Pearson相关分析。结果显示需求电流与需求功率强正相关,输出侧严格跟随需求侧指令,系统呈"车辆主导"控制特征;电池容量与需求电压、电流显著正相关。最终确认充电电流随时间的变化(电流时序)是反映车-桩交互动态最敏感的弹性变量,实现从高维数据到核心时序特征的降维。
3.2 基于k-Shape聚类算法的单体充电曲线分类与辨识(Classification and Identification of Individual Charging Curves Using the k-Shape Clustering Algorithm)
将各订单电流时序按SOC变化率映射到统一坐标系并标准化后,应用肘部法则确定最佳聚类数k=3。使用k-Shape算法基于SBD距离聚类88条标记完整充电过程,获得三类形态:簇1(参考工况,64.8%)呈标准CC-CV(恒流-恒压)模式,需求与输出电流重合度高;簇2(振荡工况,26.1%)恒流段存在高频非线性振荡;簇3(退化工况,9.1%)输出电流长期显著低于需求电流,存在明显供需缺口。聚类结果经多初值稳定性检验及多变量物理形态区分验证具可信度。
3.3 基于关键特征箱线图的运行工况定量验证(Quantitative Validation of Operating Conditions Based on Box Plots of Key Features)
从各簇提取平均需求电流、平均充电功率及充电效率绘制箱线图。参考组平均电流约220 A,效率85%–100%;振荡组电流170–250 A,效率92%–100%,归为调节扰动无能量传递失败;退化(故障)组电流降至100–150 A,功率仅32–60 kW(低于桩额定80 kW),效率普遍低于90%。k-Shape的Z-score预处理掩盖了绝对值信息,箱线图验证弥补了该局限并赋予聚类结果明确物理含义。
3.4 基于条件概率的车-桩匹配异常参数回溯(Parameter Traceback for Vehicle-Pole Matching Anomalies Based on Conditional Probability)
针对异常簇(簇3)构建条件概率模型计算P(异常|车型组C∩充电桩S)=N异常次数/N总充电次数,对比全局先验概率。设定最小总观察数和最小复现次数阈值(N≥5且异常数≥3)防止小样本概率过拟合。计算最大输出功率Pmax_out=max(V(t)×I(t))及输出能力ηcap=Pmax_out/Prated×100%用于辅助判断。
4.3 基于k-Shape算法的时间序列模式聚类与异常检测(Time-Series Pattern Clustering and Anomaly Detection Based on the k-Shape Algorithm)
实证聚类结果与3.2节一致,多变量特征验证显示簇3需求电流、输出电流、平均功率及效率显著偏低,支持其解释为功率受限退化工况;簇2具更高SOC增益与充电时长,为长时高能充电而非严重故障。固定标签验证指标中SBD轮廓系数略提升(0.059→0.073)、Davies–Bouldin指数略降(2.854→2.686),Calinski–Harabasz得分略降(15.00→11.07),确认电流波形为首选主聚类变量,其余变量作后验验证。
4.4 异常归因:基于关键特征的定量根因分析(Anomaly Attribution: Quantitative Root Cause Analysis Based on Key Features)
故障组具"低功率、低效率、高供需偏差"特征,同种车辆在其它站正常、同站其它车正常,排除电池退化与电网波动,逻辑推导指向车-桩互操作性(Vehicle-Charger Interoperability)问题——特定车型组与特定充电桩通信协议兼容不匹配或硬件输出能力降额,握手阶段未正确识别最大功率能力或运行中模块降额/保护致充电机进入安全降级模式。
4.5 典型故障场景复现与高风险组合识别(Reproduction of Typical Failure Scenarios and Identification of High-Risk Combinations)
构建"VIN前缀车型组–充电桩ID–地理位置"三维张量追溯异常订单。龙丽温高速岭溪服务区(温州方向)080号充电桩(额定80 kW),15次充电中14次批次最大输出功率低于50 kW;VIN前缀LRWYGCFJ车型组在该桩11次充电均满足低功率标准(复发率100%)。该桩低功率批次最大输出功率为42.41 kW(占额定53.0%),中位40.42 kW(50.5%),但有1次达86.40 kW,说明为间歇性/工况相关限功率而非永久性容量丧失。历史记录显示该桩7月存通信故障及控制器超时事件,但无直接关联冷却系统或过温降额维护结论。此方法输出为潜藏限功率模式的运维溯源证据,需结合充电机控制器日志、协议层记录及维护工单做最终物理确认。
讨论与结论翻译(Conclusions)
本研究开发并验证了一种基于多源数据融合与k-shape聚类(k-Shape Clustering)的电动汽车充电基础设施隐性退化识别与高风险交互模式溯源方法,预期目标在三方面达成:第一,相关性分析将观测对象从多维运行记录缩减至电流时间序列,在保留车-桩动态交互过程的同时降低冗余特征干扰;第二,k-shape聚类程序将88条标记完整充电周期划分为三种可解释的运营模式——参考运行、振荡运行及功率受限退化运行;第三,条件概率溯源定位了高风险充电机场景:080号充电机15次充电会话中14次批次最大输出功率低于50 kW,且VIN前缀组LRWYGCFJ的11次会话均满足此低功率判据。结果表明,识别不当车-桩交互除诊断外可提供实用指导:对充电网络运营商,该方法可优先安排充电机容量测试、冷却系统检查、功率模块更换、协议握手校验及固件或控制参数升级;对充电服务平台,可将输出转化为运营规则,如规避已知高风险车-桩组合、推荐邻近替代充电桩或在高速出行前驾驶员选站时发出预警。本案例研究依托可提供订单级记录与动态时序测量的区域充电网络,方法迁移至其它充电桩或网络需运营商或资产所有者提供同等数据访问权限;推断原因应视为统计溯源线索而非最终物理确认。未来工作将把诊断结果与充电机控制器日志、冷却系统状态、功率模块告警、协议协商记录及维护工单关联,并评估车型专属运行模式是否能进一步减少重复限功率事件。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号