《Engineering Applications of Artificial Intelligence》:Multi fault detection and root cause analysis of wind turbine using Multivariate time series data based on autoencoder
编辑推荐:
本文提出一种结合自动编码器和核密度估计的多故障检测方法,有效处理风电机组SCADA数据中的噪声和缺失问题,实验显示其准确率达94%,召回率93%,并成功检测超过95%的齿轮箱和发电机故障。
作者:Manisha Galphade、Valmik Nikam、Biplab Banerjee、Nilkamal More、Arvind W. Kiwelekar、Priyanka Sharma
机构:印度马哈拉施特拉邦浦那市Loni的MIT艺术设计和技术大学计算学院,邮编412201
摘要
风力涡轮机是可再生能源基础设施的重要组成部分,需要强大的故障检测技术来确保最佳性能并防止昂贵的停机时间。噪声的存在、数据缺失以及不同故障特征的重叠使得精确识别特定故障变得复杂。此外,区分正常运行异常和实际故障,以及创建适用于不同类型涡轮机和环境条件的模型也面临重大挑战。风力涡轮机监控控制和数据采集(SCADA)系统中故障数量的有限性是多故障检测的一个显著障碍。本文提出了一种新的方法,用于识别风力涡轮机中的多种故障并确定其根本原因。该方法利用多变量时间序列数据和基于自动编码器的模型。多变量核密度估计(KDE)通过检测和消除异常数据点来净化数据,仅保留“正常”数据。KDE有助于识别异常值或异常情况,从而选择符合规范模式的数据进行后续分析。自动编码器通过分析历史数据来专门了解风力涡轮机的标准运行模式,通过降低数据的维度并重新构建数据来发现可能的异常。所提出的方法实现了94%的精确度、93%的召回率和5%的假阳性率,优于传统技术。在SCADA数据上,该方法检测到了超过95%的关键风力涡轮机故障,包括齿轮箱和发电机问题。
引言
近年来,风能发展迅速,已成为全球范围内不断扩大的可再生能源来源(世界风能协会2024年)。这一增长部分归功于显著的技术进步,这些进步大幅降低了与风力涡轮机相关的总体成本。然而,随着全球对风能需求的增加,提高风力涡轮机的可靠性、减少运营和维护(O&M)成本以及停机时间变得至关重要(Costa等人,2021年)。这一领域作为新兴的研究方向越来越受到关注。值得注意的是,海上风电场的O&M活动比陆上风电场要昂贵和复杂得多,因此开发经济高效的策略尤为重要。
风力涡轮机由多个关键部件共同工作以利用风能发电。这些部件的故障率和停机时间受多种因素影响,如部件类型、维护质量、涡轮机年龄和环境条件。图1快速概述了一些关键风力涡轮机部件的故障率和停机时间(Chen等人,2015年)。齿轮箱故障相对常见,年故障率在1%到5%之间,具体取决于涡轮机设计和运行条件。这可能导致从几天到几周不等的长时间停机以进行更换或维修。发电机故障较为罕见,年故障率约为0.5%到1%。发电机更换或维修的停机时间可能很长,通常需要几周到几个月。功率转换器故障也很常见,年故障率为1%到2%。
状态监测是行业中的常见做法,旨在及时识别潜在问题和故障。风力涡轮机中异常检测的主要目标是实现低假阳性和高真阳性率。风力涡轮机的状态监测(Fischer和Coronado,2015年)是指持续远程检查涡轮机内部各个部件的性能和健康状况,以实时检测异常和潜在故障。它结合了传感器、数据分析等技术来监测温度、振动、风速等参数。目的是识别与标准运行环境的不同之处,并采取预防或纠正措施以减少停机时间和维护成本。目前的风力涡轮机维护策略分为三类(Alhmoud和Wang,2018年):反应性维护(Fischer和Coronado,2015年)、预防性维护(Maldonado-Correa等人,2020年)和预测性维护(Rinaldi等人,2021年)。
反应性维护(Fischer和Coronado,2015年)也称为纠正性或故障发生后的维护。这种策略仅在部件发生故障或出现明显退化迹象时才进行维修或更换。这种方法是在问题出现时作出响应,可能会导致意外的维修成本和停机时间。当成本考虑或部件的紧迫性允许一定程度的不可预测性时,通常采用这种策略。预防性维护是一种在预定义的时间间隔内维护或更换风力涡轮机部件的策略,无论其当前状态如何,以防止故障。这种方法涉及频繁的检查和按计划进行的维护操作,根据日历或使用情况安排更换部件或提供服务。其目标是降低意外故障和停机风险,但如果优化不当,可能会产生更高的维护成本。预测性维护(Rinaldi等人,2021年)是一种基于实时传感器数据进行分析的方法,旨在根据涡轮机部件的当前状态预测何时需要维护。它侧重于延长部件寿命并减少停机时间。持续监测风力涡轮机部件的状态可以及时安排维护活动,从而优化部件寿命和O&M成本(Turnbull和Carroll,2021年)。风力行业中的三种维护策略的成本取决于多种因素,包括风力涡轮机的类型和大小、维护的具体部件以及风电场的位置和环境条件。
风力涡轮机中异常检测的主要目标是实现低假阳性和高真阳性率,从而提高性能。为此,提高预测模型的整体准确性至关重要。这将帮助风能提供商进行有洞察力的诊断,并进一步安排和维护风力涡轮机。本文提出了一种用于风力涡轮机齿轮箱和发电机多故障检测的分类方法(Bagnall等人,2020年;Ismail Fawaz等人,2019年)。所提出的方法主要利用齿轮箱和发电机相关特征以及天气参数。实验结果表明,使用正常数据可以有效检测风力涡轮机时间序列信号中的异常。本研究的主要贡献包括:(1)提出了一种结合自动编码器和核密度估计(KDE)的混合模型,利用多变量时间序列数据增强风力涡轮机中多种故障的检测;(2)通过应用KDE,模型有效识别并过滤掉异常值,确保仅使用正常数据训练自动编码器,从而提高模型的准确性和故障检测的可靠性;(3)除了故障检测外,该模型还提供了根本原因分析的机制,为维护和运营决策提供了有关检测到的故障的根本原因的见解。
本文的结构如下:第2节回顾了现有的故障检测方法,指出了当前模型的局限性以及需要更强大的解决方案。第3节讨论了监控控制和数据采集(SCADA)数据集和KDE的准备工作。第4节介绍了自动编码器的概念及其在故障检测中的应用,引出了第5节,其中详细阐述了结合自动编码器和KDE的混合模型。第6节讨论了实验结果分析、实验设置以及用于评估模型性能的评估指标。最后,第7节总结了本文。
部分摘录
现状
本综述重点介绍了使用机器学习进行风力涡轮机状态监测的方法。我们收集了近期研究的重要见解,包括针对这些标准故障模式的研究列表以及每种情况下使用的具体机器学习技术的详细信息。“每年每台涡轮机的故障次数”和“每次故障的停机时间”图表提供了风电场内风力涡轮机可靠性和运行效率的全面视图,如图2所示。
数据预处理
本节解释了数据预处理技术,该技术将原始数据转换为干净且可用的格式,以便输入机器学习模型或进行分析。这一步骤至关重要,因为它确保了数据的质量并有助于提高模型的性能。
理论背景
本节深入探讨了人工智能及其核心组成部分——机器学习的基础,揭示了它们在革新风力涡轮机系统异常检测中的作用。人工智能使风力涡轮机系统能够分析传感器和运行日志产生的大量数据。这些算法可以揭示复杂的关系,识别细微的模式,并识别可能表明涡轮机行为异常的不规则性。
提出的架构
本节首先介绍了我们打算研究的主题。接下来,我们全面解释了基于自动编码器的多变量无监督异常检测(MVUAD)方法。我们的目标是基于长度为L的多变量时间序列数据(表示为X ∈ R^n × L),其中n和L分别为数据点的数量和序列长度,完成以下两个目标:
- 1. 识别在特定时间间隔后发生的异常事件。
- 2. ……
实验结果分析
本节通过进行一系列广泛的实验严格评估了所提出策略的有效性。将提出的模型与三个基线模型和三个最先进的模型进行了比较。最后,我们使用可视化技术来解释异常事件。
结论与未来展望
本文提出了一种利用多变量时间序列数据检测风力涡轮机中的多种故障并进行根本原因分析的新方法。该方法展示了即使在特征子集较少的情况下,也能检测到风力涡轮机SCADA数据中的多种异常。它结合了KDE,证明了在大型SCADA数据集中电路故障数据不足时区分正常运行行为和异常的能力。
CRediT作者贡献声明
Manisha Galphade:撰写——审稿与编辑、初稿撰写、方法论设计。
Valmik Nikam:概念构思。
Biplab Banerjee:概念构思。
Nilkamal More:撰写——审稿与编辑、监督。
Arvind W. Kiwelekar:方法论设计、调查。
Priyanka Sharma:撰写——审稿与编辑、概念构思。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。