综述:用于非侵入式负载监测的卷积神经网络:关键分析及未来发展方向
《Applied Energy》:Convolutional neural networks for non-intrusive load monitoring: a critical analysis and future directions
【字体:
大
中
小
】
时间:2026年06月08日
来源:Applied Energy 11
编辑推荐:
Md Mahadi Hasan Imran | Muhamad Zalani Daud | Shahrizan Jamaludin | Md Meherullah | Ahmad Faisal Mohamad Ayob | Hussain Shareef | Nurafnida
Md Mahadi Hasan Imran | Muhamad Zalani Daud | Shahrizan Jamaludin | Md Meherullah | Ahmad Faisal Mohamad Ayob | Hussain Shareef | Nurafnida Binti Afrizal | Zulkifli Bin Mohd Yusop | Mukrimah Binti Nawir | Aji Akbar Firdaus
马来西亚登嘉楼大学海洋工程技术学院,21030 Kuala Nerus,登嘉楼州,马来西亚
**摘要**
卷积神经网络(CNN)已成为非侵入式负载监测(NILM)领域的主要深度学习方法,因为它们能够直接从汇总信号中学习设备特征。尽管基于CNN的NILM取得了快速进展,但现有的综述通常将CNN视为更广泛深度学习框架中的一个组成部分,或者仅涵盖了一小部分CNN设计;因此,对架构、数据集、采样设置和性能趋势的最新比较对于指导研究人员和行业专家在模型选择和实施决策方面仍然至关重要。本综述整合了2018年至2025年间发表的165项基于CNN的NILM研究的结果,这些研究被分为纯CNN、基于信号的CNN、混合CNN架构和高级优化CNN框架。在所审查的研究中,UK-DALE和REDD是最常用的数据集(分别占研究的约37.8%和31.4%),并且高频率传感受到强烈偏好,49.2%的实验使用了10-100 kHz的采样率(几乎占报告研究的一半)。在各个类别中,混合CNN模型通过结合卷积特征提取和时间序列建模,始终能够提供最强的分解结果,使得具有重叠特征的低功耗和多状态设备的F1分数提高了大约20-30个百分点。因此,本综述为开发更具通用性和可部署性的NILM系统提供了实用指导。
**引言**
非侵入式负载监测(NILM)已成为现代能源管理的重要组成部分[1] [2],因为它能够仅使用汇总的电气测量数据将家庭或建筑物的总电力消耗分解为设备级别的使用情况[3]。这一概念最早由Hart在20世纪90年代初提出[4]。从那时起,NILM已经从一个早期的信号分析问题发展成为一个越来越依赖机器学习和深度学习技术的数据驱动研究领域[5] [6] [7]。早期的NILM研究主要依赖于隐马尔可夫模型(HMM)和因子隐马尔可夫模型(FHMM)等统计模型,以及需要大量手动特征工程的信号处理流程[5] [8]。Ruano等人[8]进一步表明,经典NILM中的特征设计在很大程度上取决于采样方案和提取的电气特征类型。随着智能电表和传感技术的改进,更大规模的数据集、更广泛的设备覆盖范围和更高的采样率变得可用。这使得支持向量机(SVM)、随机森林(RF)和k-最近邻(k-NN)等机器学习模型能够更有效地学习设备特性[9] [10] [11]。然而,这些传统的机器学习方法仍然主要依赖于手工制作的特征,这限制了它们的灵活性、可扩展性和跨设备和家庭的迁移能力[1] [5] [12]。
随着深度学习的采用,该领域发生了重大变化。Huber等人[13]强调了NILM如何越来越多地转向能够直接从汇总测量数据中学习的端到端模型,而Kaselimi等人[31]和Papageorgiou等人[2]进一步表明,深度学习已成为现代NILM研究的主要方向之一。在这些模型中,卷积神经网络(CNN)成为使用最广泛且始终有效的方法之一[14] [15]。它们的主要优势在于能够直接从原始或最小处理的信号中学习局部时间模式,包括切换瞬变、短时事件和重复波形结构[15] [16] [17]。这种能力使CNN非常适合设备分解,特别是与依赖手动特征构建或较弱局部模式提取的早期方法相比。这一发展中的一个重要里程碑是Zhang等人[18]引入的序列到点(seq2point)框架,该框架证明卷积滤波器可以比早期的基于序列的深度模型和HMM风格的基线更有效地估计目标时间点的设备功率。
随着基于CNN的NILM的不断发展,研究人员将CNN的应用范围扩展到了不仅仅是简单的一维回归[19]。一个重要的方向是将一维电气信号转换为二维表示,如频谱图、递归图和电压-电流(V-I)轨迹图像,以便CNN能够利用其强大的空间特征学习能力[19] [20]。Liu等人[19]表明,V-I图像编码结合迁移学习可以提高设备识别能力,而Yang等人[20]证明基于图像的CNN结构即使在多负载运行条件下也能保持有效性。这些转换输入的方法后来通过更丰富的信号表示和领域知识特征设计得到了加强。例如,Chen等人[21]使用增强的Gramian编码和双流CNN学习来提高对更复杂设备模式的鲁棒性,而Zhang等人[22]提出V-I轨迹来增强具有相似传统V-I特征的设备之间的可区分性。这些发展表明,基于图像的CNN方法不仅仅是重新格式化信号以用于视觉学习,还引入了将物理电气行为嵌入模型输入的新方法[21] [22]。
同时,研究人员越来越认识到,仅靠卷积不足以捕捉长距离依赖性、多阶段设备周期和负载之间的持续重叠[23]。这一限制促使开发了将卷积层与长短期记忆(LSTM)、门控循环单元(GRU)、注意力机制或基于Transformer的组件相结合的混合CNN架构[24] [25]。Belguermi等人[24]表明,CNN-LSTM组合可以显著提高分解性能,相对于简单的序列模型而言,而Cheng和Zhong[25]证明,即使监测设备数量增加,增强型Transformer的CNN仍然有效。这些混合模型对于具有长操作周期和多状态行为的设备尤为重要,因为仅靠短期的局部模式不足以支持可靠的推断[26]。最近,研究进一步朝着先进和优化的CNN框架发展,包括时间卷积网络(TCNs)、轻量级CNN、基于剪枝的架构、联邦CNN系统和Transformer-CNN混合体[27] [28]。总体而言,这些研究表明,基于CNN的NILM不再局限于单一的架构模式,而是扩展到了包括效率导向、隐私保护和部署意识在内的广泛方法论领域。
鉴于这种快速扩展,近年来出现了多种NILM综述论文,如表1所示。这些综述涵盖了广泛的方法论和时间跨度。例如,Hosseini等人[29]和Abubakar等人[30]讨论了基于概率和早期机器学习的NILM方法,而Ruano等人[8]和Gopinath等人[10]提供了结合经典机器学习和早期深度学习技术的更广泛概述。后来的综述如Huber等人[13]、Kaselimi等人[31]和Tanoni等人[32]将范围扩展到包括CNN、LSTM、GRU、自动编码器和Transformer模型等深度神经网络,从而提供了对整体NILM发展趋势的宝贵见解。然而,这些综述将CNN视为众多深度学习模型之一,并对其内部机制、架构创新和跨数据集的比较性能进行了有限的讨论。即使是最新的Huzzat等人[33]和Cruz-Rangel等人[34]的综述也考虑了CNN以及各种生成式、基于注意力和混合方法,但没有特别关注CNN相关的进展。
尽管这些全面的综述提供了宝贵的概述,但它们的广泛范围限制了对任何单一方法论流的分析深度。大多数综述涵盖了很长的出版时间窗口,通常超过十年,并在单一综述中检查了多个算法家族。因此,如图像转换策略、混合架构集成和针对边缘部署的优化等特定于CNN的发展没有得到充分详细的研究。此外,尽管CNN是NILM中使用最广泛和性能最好的架构之一[33] [46],但之前的综述都没有提供专门针对基于CNN的NILM研究的重点批判性分析。为了填补这一空白,本文提供了专门针对CNN在NILM中应用的批判性综述。它旨在深入理解CNN如何塑造了NILM的发展,并指导研究人员和行业专家开发更高效、通用和可解释的基于CNN的分解系统。
本文的其余部分组织如下。第1节介绍了NILM并阐述了需要专注于CNN的综述的必要性。第2节解释了研究选择过程、筛选程序和描述性分析。第3节展示了四个CNN类别的主要发现。第4节讨论了基于CNN的NILM的实际部署和面向行业的模型选择。第5节提出了关键挑战和未来研究方向。最后,第6节总结了综述。
**研究选择标准和筛选程序**
进行了结构化的文献搜索,以识别关于基于CNN的非侵入式负载监测(NILM)的同行评审研究。搜索在三个主要学术资源中进行:Web of Science、Scopus和Google Scholar。为了确保对NILM和人工智能领域的广泛覆盖,查询策略结合了NILM术语和AI及CNN特定术语,使用了布尔运算符。关键词集中在诸如“非侵入式负载监测”OR “NILM”之类的组合上。
**基于纯CNN的NILM模型**
深度学习在NILM中的早期应用展示了卷积神经网络(CNN)的潜力,但也揭示了后续工作试图克服的局限性。Kelly和Knottenbelt[47]提出的序列到序列模型是最早的有影响力的方法之一,它训练DNN将汇总数据的窗口映射到设备功率序列。然而,重叠窗口预测导致了平滑和序列边界处的较大误差。后来,Zhang等人[48]解决了这个问题。
**基于CNN的NILM在实际应用中的价值**
基于CNN的NILM在现实应用中的价值不仅取决于预测性能,还取决于所选模型是否与目标环境的传感条件、设备特性和操作目标相匹配[28] [49] [72] [114] [115]。从这个意义上说,实际部署需要从以架构为中心的比较转向以部署为导向的模型选择。第2节和第3节中回顾的证据表明,基于CNN的NILM并不是单一的……
**泛化和领域迁移**
基于CNN的NILM模型往往难以泛化到它们训练的具体家庭和设备之外[69] [75] [100] [112] [114] [115]。例如,纯1D-CNN模型在小型、同质的数据集上表现出色,但往往无法泛化到另一个家庭的数据[64] [69] [72] [112] [114]。布线、噪声、设备品牌和用户行为的差异会显著降低纯CNN的性能。基于图像的CNN同样倾向于过拟合局部数据:
**结论**
本综述表明,基于CNN的方法已成为NILM研究的核心,从2018年的少数研究发展到2023年的几十项研究。在分析的165篇论文中,确定了四种CNN模型流:纯CNN、基于图像的CNN、混合CNN和高级优化CNN,每种都做出了独特的贡献。纯CNN模型通过超越早期的机器学习方法,证明了端到端的一维卷积可以……
**作者贡献声明**
Md Mahadi Hasan Imran:撰写——审阅与编辑、撰写——原始草稿、可视化、验证、方法论、调查、形式分析、概念化。
Muhamad Zalani Daud:撰写——审阅与编辑、监督。
Shahrizan Jamaludin:撰写——审阅与编辑。
Md Meherullah:撰写——审阅与编辑、可视化、验证。
Ahmad Faisal Mohamad Ayob:撰写——审阅与编辑。
Hussain Shareef:撰写——审阅与编辑。
Nurafnida Binti Afrizal:撰写——审阅与编辑。
**关于写作过程中生成式AI和AI辅助技术的声明**
在准备本手稿的过程中,作者使用了ChatGPT来提高语言清晰度和可读性。该工具未用于生成原始内容、起草实质性文本或创建参考文献。所有修订后的文本都经过作者的仔细审阅和编辑,作者对出版物的内容负全责。
**利益冲突声明**
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
**致谢**
我们感谢马来西亚高等教育部(MOHE)通过基础研究资助计划(FRGS/1/2024/TK07/UMT/02/1)提供的财政支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号