一种基于强化学习（RL）的混合预测框架，用于预测飞机发动机的运行寿命（RUL）和性能排放作者：Ukbe üsame U?ar 和 Hakan Aygün

《Applied Sciences》：An RL-Guided Hybrid Forecasting Framework for Aircraft Engine RUL and Performance Emission Prediction Ukbe üsame U?ar and Hakan Aygün

【字体：大中小】 时间：2026年04月28日 来源：Applied Sciences 2.5

编辑推荐：

　　摘要：本文提出了一种新的混合预测方法，用于利用从微型涡轮喷气发动机获得的实验数据来估计剩余使用寿命、排放量和性能参数。实验在不同的旋转速度条件下进行，共获得了342个测量点。研究中考虑的输入变量包括涡轮转速、 exhaust gas temperature（排气温度）、燃油流量和

　　摘要：本文提出了一种新的混合预测方法，用于利用从微型涡轮喷气发动机获得的实验数据来估计剩余使用寿命、排放量和性能参数。实验在不同的旋转速度条件下进行，共获得了342个测量点。研究中考虑的输入变量包括涡轮转速、 exhaust gas temperature（排气温度）、燃油流量和推力；输出变量包括热效率、总功率、CO2和NO2。实验结果表明，热效率在0.49%到7.1%之间变化，总功率在0.266到13.94 kW之间变化，CO2排放量在0.317%到2.183%之间变化。所提出的RL-MH-LR-CBR方法结合了多种方法的优点。该方法以线性回归的可解释性为基础，在自适应元启发式优化过程中，采用基于UCB1的多臂老虎机方法选择最优算法。最后，基于CatBoost的残差误差学习组件用于捕捉线性模型无法解释的非线性模式。该方法在NASA C-MAPSS FD001数据集和真实发动机数据上与14种不同方法进行了比较，结果表明，与传统的回归模型和强大的AI方法相比，该方法具有更平衡、更稳定和更强的泛化能力，特别是在非线性、噪声较大和数据异构的情况下。在真实发动机数据集中，该方法对CO2的R2值为0.968，对NO2的R2值为0.936；对于热效率，预测性能甚至更强，相应的R2值分别为0.998和0.995。此外，该方法在难以建模的输出数据中表现出明显优势，将NO2预测的误差水平降低了0.061。这些发现表明，该方法不仅适用于微型涡轮喷气发动机，还为预测性维护、排放监测、能源系统、航空分析和其他高度动态的工程问题提供了一个稳健的决策支持框架。

1. 引言
实验研究对于加速微型燃气轮机的进步及其应用范围的扩展具有重要意义。这些研究在设计验证、性能映射、新模型评估和环境影响调查中也起着关键作用[1]。航空部门的温室气体排放日益成为重要的环境问题。除了CO2排放外，飞机排放的许多有害气体也会对气候变化产生显著影响，这些气体必须得到减少[2]。近年来，由于微型喷气发动机在模型飞机、无人机和UAV等领域的应用日益多样化，相关研究显著增长[3]。这些发展促使人们对微型涡轮喷气发动机的研究不断增加。Gawron等人[4]比较了纯Jet A-1燃料与含10%丁醇的Jet A-1/丁醇混合物在产生最大推力为70 N的喷气发动机上的表现，发现两种燃料的推力和排气温度（EGT）值相当接近。然而，在丁醇混合物中，由于热值较低，燃油消耗和比燃油消耗（SFC）略有增加。相比之下，混合燃料中的CO、CO2（变化范围为2.8%到3.4%）和NOx排放量低于纯Jet A-1。Manigandan等人[5]研究了添加了不同比例乙醇和戊醇的菜籽油和葵花籽油基生物燃料与Jet-A燃料的混合物，发现燃料中的氧含量和雾化是燃烧和排放的决定性因素。其中，R20E混合物（70% Jet-A，20%菜籽油，10%乙醇）产生的静态推力比纯Jet-A高35%，同时比燃油消耗降低了41%。此外，R20E和CS20E混合物分别提高了热效率24%和10%。此外，这些混合物减少了NOx、CO2（纯Jet A的排放量在1%到1.6%之间）和HC排放。Boodamevi等人[6]通过在不同比例下将螺旋藻生物燃料与Jet A燃料混合，在小型实验喷气发动机中进行了性能和排放分析，并将结果与纯Jet A进行了比较。实验在不同的发动机转速下进行，发现特别是低比例混合物（特别是B20和B40）在推力和发动机转速方面取得了更积极的结果。然而，当生物燃料比例增加到60%及以上时，由于能量含量低，性能出现恶化。Tasyurek和Aslantas[7]研究了来自葡萄籽油甲酯的生物喷气燃料对发动机性能和排放的影响。结果表明，在混合比例达到5%（B2.5和B5）时，发动机性能与Jet A-1相似；而B10燃料在所有功率水平下都导致了推力损失（在30%功率时为-12.0%）。随着生物燃料比例的增加，热效率下降，B2.5、B5和B10在全功率下的效率分别下降了4.8%、15.0%和25.0%。在排放方面，全功率下Jet A-1的CO和CO2最低，而生物喷气燃料使HC排放量减少了73–79%。Xu等人[8]研究了在不同负载条件下微型涡轮喷气发动机的颗粒数（PN）排放特性，包括颗粒形态、PN水平和颗粒尺寸分布。微型涡轮喷气发动机的PN排放量在EIn = 2.0到3.3 × 10^16颗粒/千克燃料之间，高于微型活塞发动机（1.2–1.5 × 10^16颗粒/千克燃料）。此外，EIm值在8–40毫克/千克燃料的范围内变化。颗粒的几何平均直径（GMD）随着推力的增加而减小，而几何标准偏差（GSD）略有增加，研究结果证实了低推力条件下PN测量方法的可靠性。Przysowa等人[9]利用Jet A-1燃料与两种不同生物成分（ATF和HEFA）的不同混合比例，比较了GTM-140微型涡轮机和全尺寸DGEN380涡轮风扇发动机的性能和气体排放。所获得的测量数据用于开发可以预测CO、HC和NOx等气体排放的发动机排放模型。结果表明，随着生物成分比例的增加，CO排放量显著增加，而HC和NOx略有增加。Sen[10]使用B5、B10、B20、B40和B80燃料混合物（CSP占5–80%，其余为Jet A）在JetCat-P160发动机和GasTurb-14上模拟了推力、TSFC、CO2、CO、NOx和热效率值，并在不同的发动机转速下进行了测试。结果显示，在B20、B40和B80混合物中，当CSP含量超过10%时，推力降至约130 N，而TSFC相对于Jet A增加了约2倍，特别是在低发动机转速下。CO2排放量因RPM和生物燃料混合物的影响而变化在2%到6%之间。Cican等人[11]研究了在微型涡轮喷气发动机中混合丙醇、丁醇、戊醇、己醇、庚醇和辛醇（比例分别为10%、20%和30%）与Jet A燃料的性能和排放效果。结果表明，每千克燃料消耗的CO2排放量在丙醇时最低为3.02千克/千克，而在辛醇时最高为3.22千克/千克。丙醇的比燃油消耗增加了最多12.8%，而热效率下降了1.8–5.6%。因此，丁醇和辛醇在排放-效率平衡方面表现突出。Lee等人[12]为JetCat P300-RX微型燃气轮机开发了一个更现实的集成分析模型，该发动机产生最大推力为300 N，除了主发动机组件外，还加入了二次流（3%）和90%的燃烧效率。使用ANSYS CFX（版本R1）在30,000–104,000 RPM范围内进行的模拟比较了压力比、空气流量和燃油流量等发动机性能指标与测试结果，发现大多数误差低于5%；EGT和燃油流量的差异归因于传感器和润滑系统的影响以及二次流损失。因此，这个集成模型无需组件性能图即可准确预测发动机的详细热流特性，从而提供了比以往研究更真实的性能预测。Szrama[13]基于F100-PW-229发动机的真实飞行数据，利用监督机器学习开发了一个先进的预测性健康管理模型，并使用新的发动机健康指数（EHI）将发动机状态分为“安全”、“中等”和“不安全”。模型性能通过5折和10折交叉验证进行评估，发现基于树的方法特别具有高准确性和零误分类成本，且无需降维。Patel等人[14]研究了正则化技术（如LASSO、Ridge和Elastic Net）在UAV推进系统中的燃气轮机推力预测准确性改进中的应用，使用了40,000–90,000 RPM范围内的实验数据，并比较了不同操作条件下的模型预测性能。结果表明，特别是Ridge回归模型提供了比其他方法更高的准确性，是最成功的推力预测方法。本文的主要原创贡献如下：
- 本研究的主要创新在于在同一实验平台上全面处理了微型涡轮喷气发动机的性能、热行为和排放输出，并通过先进的混合估计框架对这些输出进行了建模。首先从开发的发动机配置中获得了真实的实验测量数据。研究考虑了不同操作参数下的涡轮转速、推力、排气温度和燃油流量数据作为输入，得到的CO2、NO2、总功率和热效率值作为分析的输出值。本文不仅限于单一输出或模拟数据，而提出了一个允许多输出预测的混合问题结构，基于真实数据。
- 在文献研究中，线性回归、强化学习、元启发式算法和基于残差误差的学习方法通常独立处理。而在本文中，所有这些方法都被结合在一个统一的估计框架内。在提出的方法中，强化学习不是作为一个独立学习策略的代理，而是作为控制元启发式选择过程的机制。在这种背景下，使用基于UCB1的多臂老虎机方法的超启发式框架在四种固定元启发式算法中进行了选择。因此，根据验证性能评估了操作器的有效性，并减轻了固定选择序列带来的限制。此外，通过基于CatBoost的残差建模学习了线性回归无法解释的非线性误差成分，显著提高了预测准确性，同时保持了模型的物理一致性和可解释性。
- 该研究的另一个原创方面是在同一运行周期内通过相同的测量架构同时获取性能和排放数据。这使得可以直接分析发动机的推力输出和燃油消耗。此外，还可以研究操作条件对环境因素和热力学系统的影响。由于建立了实验系统，从而建立了物理测量与数据驱动建模之间的关联。该方法首先在NASA C-MAPSS数据集上进行了测试，然后在真实微型涡轮喷气发动机数据上进行了测试，证明了其通用性和适用于各种发动机问题的能力。
- 本文从系统定义到最终解释的结构化流程如下：第2节介绍了微型涡轮喷气发动机的实验系统，包括发动机配置、测量参数、传感器和数据采集程序。随后，第3节概述了研究的方法论框架。它包括实验数据的统计分析、机器学习和元启发式组件，以及提出的混合预测架构。一旦方法论基础建立起来，第4节就展示了应用结果。在这一章中，所提出的方法在NASA C-MAPSS数据集和真实的实验发动机数据上进行了评估。接下来，第5节详细讨论了研究的主要发现，并从预测性能、鲁棒性和泛化能力等方面对结果进行了解释。最后，第6节总结了本文，强调了所提出框架的总体意义。

2. 系统描述
实验是在德国Ballrechten-Dottingen的JetCat公司制造的JetCat P80单轴涡轮喷气发动机上进行的。根据该发动机的数据手册，在35,000到125,000转/分钟的运行范围内，其在怠速时产生3牛顿的推力，而最大推力约为97牛顿。压缩比率为2.3时，排气温度在510°C到700°C之间变化[15]。JetCat P80发动机的三个主要部件是压缩机、燃烧室和涡轮。空气在压缩机中被压缩，在燃烧室内通过燃油喷射点燃。在涡轮中，燃烧气体的能量被转化为机械能以驱动压缩机[16]。
表1列出了本研究中使用的发动机传感器（转速计、负载传感器、流量计和K型热电偶）和排放传感器（CO2和NO2）及其测量范围。表1. 实验系统的测量参数和传感器规格。在本研究中，通过微型涡轮喷气发动机的实验运行获得了发动机数据（推力、排气温度、转速和燃料流量）。为此，使用了用于测量推力的负载传感器、用于测量排气温度的K型热电偶、用于测量转速的磁感应传感器以及用于测量燃料流量的流量计。需要强调的是，最初以升/分钟（L/min）为单位测量的燃料流量被转换为了千克/秒（kg/s），因为这个单位更适合进行效率和功率相关的分析。排放数据是通过CO2和NO2传感器获得的。排气气体通过采样探头收集，然后在经过一系列处理后传输到排放室。传感器测得的发动机参数通过接口连接到计算机上。借助控制单元软件，可以记录原始信号数据。发动机通过启动开关操作，并由地面支持单元进行监控。一旦发动机在怠速状态下稳定下来，其转速会逐渐通过油门杆提升到最大速度。因此，实验数据集没有被划分成特定的飞行阶段，而是在地面测试设置下获得的一个连续运行范围内进行了分析。在这种情况下，如巡航或加速等稳定和瞬态飞行阶段并没有被明确标记为不同的状态。相反，研究重点是在所有运行状态下对发动机的排放和性能响应进行建模。
在这方面，整个发动机运行过程中，每个参数生成了一个包含342行的数据集。图1展示了带有测量设备的微型涡轮喷气发动机的实验设置。

3. 方法论
在本节中，首先从多个角度分析了发动机输入和输出之间的关系。在此背景下，使用正态性检验、相关性和LOESS（局部估计散点平滑）曲线来检查实验数据的统计特性。分析结果揭示了输入与排放输出之间的线性和非线性关系。接下来，引入了经典统计回归模型、机器学习方法和元启发式算法来捕捉数据结构中的复杂模式。最后，介绍了所提出的混合解决方案架构的详细内容和子组件。有关本节的信息如下所述。

3.1. 统计分析
在本研究中，对实验数据进行了详细的统计分析，以揭示飞机发动机的不同运行条件对排放和性能指标的影响。分析的主要目标是确定发动机输入与环境输出（CO2和NO2）及基于性能的输出（热效率和总功率）之间的关系结构，并以这种方式定义这些关系，为后续的建模和优化研究提供坚实的基础。在分析过程的第一阶段，检查了输出变量的统计分布特性。为此，应用了Shapiro–Wilk和Kolmogorov–Smirnov正态性检验来分析CO2、NO2、热效率和总功率的数据。测试结果显示，CO2和NO2数据存在显著的单调增加和局部波动，而热效率和总功率变量在狭窄的范围内表现出非线性分布。结果表明，并非所有输出变量都满足正态分布的假设，使用非参数方法进行分析更为合适。因此，进行了Spearman等级相关分析，以检查发动机输入（涡轮转速、燃料流量（kg/s）和涡轮出口温度（°C）对输出变量的影响，测试结果显示在表2中。表2. 发动机输入参数对排放和热力学性能影响的Spearman分析。表2中的相关分析显示，所有输入与CO2和总功率之间存在强烈且正的相关性。特别是观察到，随着涡轮转速、燃料流量和推力的增加，CO2排放和总功率输出显著增加。这清楚地表明，燃料流量和功率需求的增加直接影响了燃烧产物和发动机输出功率。当评估NO2输出时，其与输入的关系比CO2更为有限和适中。
因素如燃料量、功率水平、燃烧室内的局部温度分布和化学反应时间影响了NO2的形成。因此，相关变量的相关程度较低。在检查热效率输出时，观察到与发动机输入之间存在非线性的正相关关系。虽然在中低运行范围内效率有所提高，但在高转速和高推力水平下，这种提高趋于平稳。此外，发现在某些区域，变化有限。这些结果表明，发动机在特定的运行范围内以更高效的方式运行。相反，统计结果表明，在高负载条件下额外的燃料消耗并不会转化为相应的效率提升。综上所述，这些结果清楚地表明，发动机输入对排放和性能输出具有统计上显著且物理上一致的影响。

3.1.1. LOESS关系图
LOESS是一种强大的非参数回归方法，它允许在不依赖任何线性假设的情况下建模因变量和自变量之间的关系。这种方法通过在数据的特定局部区域应用加权回归，为每个观测点生成单独的估计值，从而能够识别非线性趋势。特别是在像发动机性能和排放这样的复杂过程中，变量之间的关系往往是非线性的，并且在特定的运行范围内可能表现出不同的行为。在这方面，LOESS超越了传统的线性回归，更准确地捕捉了斜率变化、波动和数据中的非线性结构[17]。
在本研究中使用LOESS关系图的主要原因是，发动机输入和输出变量之间的关系表现出无法仅用相关系数来解释的非线性结构。由于LOESS关系图，强烈线性和非线性行为都得到了详细揭示，这有助于更准确地解释性能-排放平衡，并识别出在优化研究中应该考虑的关键区域[18]。基于这些信息，图中显示了每个输出基于输入的LOESS关系图。图2. 发动机输入与排放输出之间的LOESS关系图。根据图2所示的结果，CO2和总功率性能指标普遍表现出强烈且正的趋势。值得注意的是，在中低运行范围内，增长速率更高。此外，在高运行范围内，这一速率有所下降。这种情况表明，发动机在不同运行条件下表现出不同的行为特征。在检查NO2输出的LOESS曲线时，发现该变量与转速、燃料流量和推力的关系存在明显的波动，远非线性结构。特别是在中等EGT范围内，观察到NO2水平的局部增减，表明了燃烧室内温度分布和化学反应动力学的影响。热效率的LOESS曲线显示，在中低运行区域内呈现增长趋势，而在高转速和推力值下斜率下降，表明效率增长受到限制。这一发现表明，发动机在其最大功率生产区域内达到热力学效率的饱和状态，额外的燃料消耗并不会直接转化为效率提升。
根据图2，CO2和总功率输出呈现出强烈且近乎线性的趋势。相比之下，NO2和热效率变量表现出显著的非线性行为。鉴于这些发现，确定线性或半线性模型可能足以预测CO2和总功率。此外，对于具有更复杂特性的参数（如NO2和热效率），应优先选择非线性的灵活建模方法。这些结果表明，线性回归模型在解释非线性结构方面存在不足，特别是在NO2和热效率性能指标的情况下。为了解决这个问题，已经在混合方法中集成了一种基于CatBoost的残差学习机制，用于学习线性模型无法充分解释的残差模式。

3.1.2. 回归方法
本文采用了涵盖数据结构中线性和非线性模式的互补统计回归模型。这些方法被用来展示现有统计方法在相关预测数据上的成功，并测试所开发方法的有效性。文章中优选了九种常用的统计方法，这些方法同时考虑了线性和非线性结构。首先是多元线性回归模型[19]，用于以清晰且可解释的方式捕捉多重线性关系。基于Huber损失的正则化回归被用来减少对异常值和测量噪声的敏感度；由于对大残差的线性惩罚，系数不会受到异常值的过度影响[20]。在文章中，多项式模型被用来建模非线性数据集。对于线性数据集，首选了一阶多项式回归方程；而对于复杂曲线行为，则使用了二阶、三阶和四阶多项式方程[21,22,23]。Ridge回归被用来减少方差并稳定高相关变量的估计值[24]。广义加法模型（GAMs）被选用来揭示变量对结果的平滑且可解释的非线性效应[25]。最后，Elastic Net模型被用来同时满足高相关性和特征众多的数据集中的变量选择（L1）和系数正则化（L2）要求，以提高预测性能[26]。

3.2. 机器学习
在本文中，K-最近邻（KNN）、随机森林（Random Forest）、CatBoost、LightGBM和XGBoost方法被一起用于预测模型的开发。选择这些方法是因为它们能够建模非线性关系、对噪声和异常值的鲁棒性、高效处理高维和混合类型数据的能力，以及防止过拟合的能力。选择每种方法的具体原因如下。KNN方法被优先选择，因为它基于局部相似性提供了一个稳健的基础，而不需要参数化的函数形式[27]。随机森林算法因其自举采样、方差减少以及可靠的变量重要性估计而被选中[28]。XGBoost被使用是因为它通过损失敏感剪枝和稀疏性感知等改进机制，在大型和复杂的数据集中提供了高准确性和计算效率[29]。在应用研究中，LightGBM更受青睐，因为它采用了以叶子为中心的增长策略、快速的处理时间和内存高效的学习方式[30]。文章中还使用了CatBoost，因为它能够以中性方式处理分类变量，并利用序列提升和中性目标统计[31]。

3.3. 元启发式优化
在本文中，选择了四种不同的元启发式算法SA、GA、BAT和HHO来优化预测性能。每种算法都是根据其独特的优势被选入混合方法中的。SA被选中是因为它能够迭代地朝着单一解决方案前进，而不会陷入局部最优解[32]。GA被选中是因为其基于种群的结构允许它在更广泛的解决方案空间中进行搜索[33]。BAT算法被使用是因为它为连续优化问题提供了自适应的搜索机制[34]。HHO被考虑是因为它在探索和利用阶段之间建立了动态的过渡[35]。
在本文中，元启发式操作符是在基于UCB1的多臂老虎机选择框架下进行的，在这个框架中，每次迭代在验证数据上的性能改进被视为一个奖励。下一步应用哪个操作符是根据UCB1规则来决定的。这允许根据数据自适应地确定最有效的元启发式操作符[36]。

3.4. 基于元启发式线性回归的混合预测算法，控制由强化学习和基于Catboost的残差建模
在这项研究中，提出了一种名为“基于元启发式线性回归的混合预测算法，控制由强化学习和基于Catboost的残差建模”的新颖预测框架。所开发的方法结合了基于线性回归的基本预测模型和由强化学习指导的元启发式优化算法。此外，系统中还集成了基于CatBoost的残差建模阶段，从而实现了全面、一致和分层的混合预测架构。在本文的其余部分，该方法将被称为RL-MH-LR-CBR。该方法的目的是通过自适应优化和人工智能辅助的非线性误差补偿机制来提高预测准确性。所提出的方法将文献中通常独立考虑的三种基本机制结合到了一个结构中。这三种机制如下所述：
(i) 由于经典最小二乘线性回归的公式架构和可解释结构，它被用作基本的预测器。
(ii) 通过由强化学习控制并由UCB1策略管理的超启发式优化框架，提高了验证数据集中的预测可靠性，该框架包含了多种元启发式算法。
(iii) 将CatBoost残差误差校正机制集成到方法中，用于建模线性回归模型无法捕捉到的非线性成分。
所开发解决方案的流程图如图3所示，方法的具体步骤在算法1中进行描述。图3. RL-MH-LR-CBR的流程图。在图3和算法1中展示的集成方法中，模型参数被自适应地优化，线性模型之后剩余的复杂误差结构在单独的阶段进行建模。元启发式优化过程由强化学习引导。此外，使用基于CatBoost的模型来处理残差误差，从而实现了更加稳健和平衡的预测结构。该系统的设计采用了不同于本文提出的端到端联合训练框架的机制。首先，优化了可解释的线性主线。然后，使用基于CatBoost的残差校正阶段开发了分阶段的混合学习策略。

3.4.1. 数据划分与评估
所提出的框架基于TRAIN–VALIDATION–TEST格式的三路数据分割。训练数据集用于模型的初始学习阶段，而所有的超启发式优化和模型调优过程仅在验证数据集上进行。测试数据集用于对方法性能进行最终的、无偏的评估。这种设计有助于防止信息从独立的测试集中泄露，并提高了报告结果的泛化能力。此外，基于UCB1的操作符选择阶段和基于CatBoost的残差学习阶段仅应用于训练和验证数据。测试数据集与这两个阶段完全分开。另外，测试数据从未用于奖励计算、残差模型训练或提前停止过程。
在所提出的方法中，数据被划分为三个集合：训练集、验证集和测试集。训练数据集用于模型的初始训练阶段。所有的超参数优化和模型调优过程都在验证数据集上进行。测试数据集用于对方法性能进行最终的、无偏的评估。由于这种设计，文献中常见的测试泄露问题得到了系统性的预防，结果的泛化能力得到了提升。此外，基于验证的优化方法旨在降低复杂混合模型过拟合的风险。

3.4.2. 初始线性回归模型和参数向量定义
在第一阶段，使用TRAIN数据集和经典的普通最小二乘（OLS）技术构建了一个线性回归模型。模型的截距项和斜率系数被组合成一个参数向量，并在方程(1)中表示[19]。利用这个参数向量对任何观测值的线性估计方程显示在方程(2)中[19]。通过OLS方法获得的“z参数向量”被用作超启发式优化过程的基准解。这一阶段的目标是最大化线性回归提供的简单和可解释结构的优势。

3.4.3. 基于Pareto的多目标评估和参数约束方法
在本文中，在基于Pareto的多目标评估框架内检查了性能指标MAE、MSE和R2。在这种方法中，同时在验证数据集上最小化MAE和MSE的值，同时最大化R2值。因此，候选参数向量是根据三个性能指标的Pareto优越性进行评估的，而不是基于单一的标量加权目标函数。代码中使用的目标函数定义如下。为了确保数值稳定性，参数向量z受到根据初始系数大小设定的对称上下限的约束。由于这种约束，搜索区域保持在统计上显著且物理上现实的范围内。此外，用于确定上下限的公式显示在方程(4)中[37]。

3.4.4. 基于UCB1的超启发式元启发式选择
在所提出的解决方案架构中，使用了四种元启发式算法来优化线性回归系数。这些方法是SA、GA、HHO和BAT。这些候选操作符之间的选择被构建为一个多臂老虎机问题，并使用UCB1规则来解决。在开发的算法中，与传统的强化学习框架不同，没有明确的状态空间被定义。主要原因是选择机制不是通过基于状态转换的代理结构来表达的。相反，它是使用基于UCB1的多臂老虎机方法实现的，为了确保公平比较，所有算法SA、GA、BAT和HHO都应用于相同的线性参数向量。此外，所有算法都从相同的最佳可用解决方案出发，在相同的上下限内运行，并针对相同的验证数据使用相同的性能指标进行评估。这样，尽管它们的内部工作结构不同，所有元启发式算法都是在相同的条件下进行比较的。在每个阶段，基于UCB1的控制器根据当前的探索和利用平衡选择一个元启发式操作符。然后，选定的操作符应用于当前最佳参数向量以生成候选解。该候选解在验证数据集上使用目标函数进行评估，由此产生的性能改进被视为奖励。这种奖励计算仅在训练和验证工作流中进行，而独立的测试集在整个过程中未被触碰。通过这种方式，候选操作符的相对有效性根据验证性能进行了自适应更新。在这项研究中，RL相关组件作为用于自适应操作符控制的基于带的超启发式选择机制。由于这种结构，混合方法提供了一个更加灵活和数据敏感的优化过程。相关基于带的方法和超启发式选择方法的理论基础在文献中有详细说明[38,39,40,41,42]。

3.4.5. 结合CatBoost的残差学习的混合建模
经过RL和元启发式优化后得到的线性模型在很大程度上捕捉了数据集中的线性趋势，但它可能包含由复杂非线性关系引起的系统残差。因此，在第二阶段，在线性数据集上定义了线性模型的残差序列，如方程(5)所示，并利用CatBoost回归模型学习这些残差[5]。CatBoost由于其序列提升结构和强大的泛化能力，为残差学习提供了合适的框架。文章中使用的基于CatBoost的残差模型的算法参数如下所示。算法中选择了RMSE作为损失函数，迭代次数设置为2000次。在模型运行期间，学习率设置为0.05，树深度设置为8。为了确保结果的可重复性，随机种子值设置为42。此外，自动选择了在验证数据集上表现最佳的迭代作为最终模型。如果在连续100次迭代中没有观察到验证误差的显著改进，则终止训练过程。文章中在模型训练期间使用验证数据集进行提前停止。这个残差学习阶段也仅限于训练和验证工作流，独立的测试集未用于残差模型训练或提前停止。提前停止过程是一种用于防止CatBoost模型训练过程中过拟合的规范化机制。在训练过程中，当模型试图最小化训练数据集上的残差误差时，也会监控验证数据集上的误差值。当在一定数量的连续迭代中没有观察到验证误差的有意义改进时，自动终止模型训练。这种方法防止了模型学习特定的于训练数据的噪声，确保产生更稳定、物理上一致的残差预测，并具有较高的泛化能力。最终的混合预测结果显示在方程(6)中[6]。

4. 计算实验
在本节中，对所提出的RL-MH-LR-CBR方法的性能在两个不同的数据集上进行了全面评估。在第一阶段，考虑了NASA C-MAPSS涡扇发动机故障模拟数据集FD001[48]，该数据集在航空领域的基于预测的维护研究中得到了广泛应用，并比较了将用于我们方法的回归模型的相对性能。在第二阶段，对实际燃气轮发动机收集的实验排放数据（NO2、CO2、热效率和总功率）进行了详细实验，揭示了所提出的超启发式结构相比线性和非线性回归模型所提供的优势。

4.1. NASA C-MAPSS数据集
在文章的第一个实验应用中，考虑了使用NASA的C-MAPSS（商业模块化航空推进系统模拟）程序生成的FD001数据子集。在这个数据集中，涡扇发动机可以产生90,000磅力（lbf）的推力，并能够爬升到40,000英尺的高度。飞行速度范围介于0马赫（Mach 0）到0.9马赫之间，环境温度则在-60华氏度（?60°F）到103华氏度（103°F）之间变化。模拟数据是在这些条件下获得的，同时在飞机机身的不同位置安装了21个传感器来监测发动机的健康状况和工作性能。数据集中，每个发动机的剩余使用寿命（RUL）被作为输出变量报告，模拟会持续进行，直到涡扇发动机的健康指数降为零或触发预定义的故障场景。文章中考虑了FD001数据集，并在该数据集上进行了应用。在此背景下，NASA的C-MAPSS FD001数据集中的20,631个训练数据点和13,095个测试数据点被合并在一起。然后，将合并后的数据集分为80%的训练数据和20%的测试数据，以创建一个集成的训练和独立测试工作流程。训练数据随后又被重新分配为80%的训练数据和20%的验证数据[48,49]。数据分割采用了正态分布。这种数据重构策略并不是为了替换标准的FD001基准协议。主要目标是建立提出的混合框架的集成训练、验证和测试工作流程，并在同一实验条件下评估该方法的泛化能力。此外，共有15种不同的方法（包括所提出的混合方法）被应用于相同重构的数据集和相同的计算环境中。这样做的目的是确保方法之间的比较是在公平、一致和标准化的基础上进行的。此外，从FD001的相关文献中可以看出，数据处理方法并不完全统一。已知许多研究关注的是RUL间隔在150年或更短的时间范围内，此时数据变得更加均匀和易于解释。同样，在Xu等人[50]的研究中，也是使用不同的数据处理方法来分析FD001数据集以预测飞机发动机的RUL。因此，本文中的结果不应被视为在使用原始数据分割的条件下获得的发现。相反，本文中的发现应被视为基于重构数据协议对各种方法进行比较分析的结果。另外，文章中基于FD001的RUL评估使用了MAE、MSE和R2等指标，并且所有候选方法都采用了相同的数据协议。标准化的不对称评分函数在C-MAPSS文献中被广泛使用。此外，最近的一些FD001研究也报告了基于回归的指标，如RMSE和R2[50,51,52]。因此，本文中的结果被认为是基于相同数据配置获得的内部研究比较结果。

基于这些信息，RL-MH-LR-CBR方法在21,585个训练数据点、5,397个验证数据点和6,745个测试数据点上进行了测试，并与14种不同的方法进行了比较。分析是在一台配备AMD RYZEN 5处理器（Radeon Graphics 3.30 GHz）和16 GB RAM的计算机上进行的。分析结果如表3所示，预测分布情况如图4所示。表3展示了所有RUL值的预测算法比较分析。图4基于所有RUL值，展示了RL-MH-LR-CBR模型在训练集、验证集和测试集上的实际值与预测值的比较。表3显示了不同预测算法在整个RUL范围内的性能比较。结果表明，线性和多项式回归模型在捕捉复杂和非线性RUL动态方面存在不足；相比之下，基于树的方法（如Random Forest、CatBoost、LightGBM和XGBoost）提供了更低的误差和更高的R2值。然而，观察发现即使在人工智能模型中，性能也无法降低到某个误差水平以下。而所提出的混合方法 producethe lowest MAE和MSE以及最高的R2值，并且由于最佳结果、平均结果和最差结果之间的差异较小，显示出稳定和泛化的结构。这些分析结果清楚地表明，定量分析并不依赖于单一的性能指标。所提出的方法在所有RUL值上都是基于MAE、MSE和R2指标进行比较评估的。在这些评估中，混合方法在误差水平和结果稳定性方面均优于其他方法。此外，训练集、验证集和测试集之间性能的一致性凸显了该方法在学习和泛化能力方面的成功。训练集、验证集和测试集的实际值和预测值图表表明，混合模型在学习和泛化阶段表现出一致的行为。预测值在所有数据段中大体上遵循实际值的中心趋势，这表明线性回归提供了可解释的基础，而基于RL控制的元启发式优化和基于CatBoost的残差建模有效地纠正了线性模型无法解释的复杂误差成分。然而，观察到在早期循环阶段（对应于高RUL值）预测误差会增加。这种情况被认为是由于数据集的结构特性造成的挑战。

图5显示了训练集和测试集获得的Min和Max RUL范围值。对图5的考察揭示了RUL变化性随循环次数变化的明显模式。具体来说，从第一个循环开始，Min和Max范围在较低的循环值时相当宽。这表明发动机的故障行为在初期可能会有显著差异，且此时RUL值具有较高的不确定性。相反，随着循环次数的增加，Min和Max范围逐渐缩小。在这些循环范围内，平均值、中位数和众数曲线趋于收敛。RUL分布变得更加均匀，特别是在循环值接近360的区域内。范围的缩小表明发动机之间的故障动态随时间变得相似。这表明随着故障的临近，RUL预测变得更加稳定和可靠。文献中的研究支持这一发现，FD001数据集的最大RUL值通常被研究为150年或更短[50,53,54,55]。统计上，当RUL值超过200年时，传感器数据的解释能力会下降，变量的解释能力和预测能力显著减弱。然而，结果显示，所提出的混合方法在独立测试数据上保持了其性能，并且该方法对数据引起的不确定性表现出稳健的结构。这些结果提供了一个物理上一致且可泛化的RUL估计算法框架。图5显示了训练集和测试集的Min和Max RUL分散度和中心趋势随循环次数的变化。除此之外，模型被设计为在RUL值不超过200年的条件下确定其有效性。在这种情况下，训练集、测试集和验证集是根据正态分布重新构建的。对该数据集的应用研究结果如表4所示。表4比较了RUL ≤ 200年的样本的预测算法。根据表4中测试数据列的结果，所提出的混合架构产生的结果优于其他预测算法。虽然在某些情况下单树模型在训练集上可以产生非常低的误差，但在验证集和测试集中观察到了明显的性能损失。相比之下，所提出的混合方法提供了一个可靠的预测结构，通过提供稳定且相对较高的R2结果以及较低的MAE和MSE值，避免了过拟合。这些结果还允许对数据集进行推断。这些结果还表明，由于数据结构的特性，RUL预测仍然是一个具有挑战性且部分不完善的问题。最后，对TTF值为150年和150年的情况进行了比较分析，结果如表5所示。在这种情况下，60%的训练数据、20%的测试数据和20%的验证数据再次利用C-MAPPS FD001中的数据进行构建。表5展示了RUL ≤ 150年的样本的预测算法比较分析。表5的结果表明，当RUL值为150年或更低时，数据集变得更加均匀和易于解释。在这一范围内，特别是基于树的模型在验证集和测试集中产生了较低的误差和较高的R2值，而所提出的混合方法在综合评估所有性能指标时显得最为成功和平衡。虽然某些方法在训练集上表现出过高的准确性，但在泛化性能上经历了显著下降，但混合方法避免了过拟合，并通过提供训练集和验证集之间一致的分布证明了可靠的泛化能力。然而，即使RUL值降低到150年或更低，传感器数据在某些区域的接近性仍表明，由于数据的本质，RUL预测问题尚未完全解决，数据驱动的不确定性仍然存在。这些发现表明，本文中的定量评估在不同数据环境下仍然成立。换句话说，所开发的混合方法不仅在整个数据集上进行了测试，还在RUL ≤ 200年和RUL ≤ 150年的情况下进行了测试。这样，就可以在不同运行条件下数值上分析泛化能力。

本文中的训练集、验证集和测试集是根据FD001数据根据正态分布重新获得的。在此背景下，所呈现的结果首次在文献中展示了混合方法在数据集变异性下的性能优势和稳定性。4.2实际系统应用在本节中，通过将所提出的方法与不同预测模型在独立测试数据集上的表现进行比较，评估了该方法在实际系统条件下的性能。在应用研究中，使用了来自微型涡轮喷气发动机的实时数据。因此，实际发动机验证数据不是根据巡航和加速等分离的飞行阶段标签生成的。验证过程使用了覆盖发动机连续工作范围的数据，在受控实验条件下进行。比较包括了基于树的方法（如XGBoost、CatBoost、Random Forest和LightGBM），以及KNN、GAM、线性和多项式回归模型和正则化回归方法（Ridge、Elastic Net和Huber）。分析是在配备AMD Ryzen 5 5600H处理器（Radeon Graphics）和16 GB RAM的Windows操作系统上的Google Colab环境中使用Python 3.10软件进行的。从测试集获得的MAE、MSE和R2值按CO2、NO2、热效率和总功率输出进行了展示。表6比较了所提出的混合方法与其他方法在CO2、NO2、热效率和总功率方面的测试性能。当基于排放量进行评估时，表6中的结果表明，所提出的混合方法在测试集上表现最佳。混合方法减少了误差幅度，并提高了所有三个性能指标（MAE、MSE和R2）的解释能力。尽管XGBoost模型表现出强大的性能和低误差值，但混合方法在MSE和R2指标上产生了更平衡和稳定的结果。这一结果表明，所提出的方法不仅控制了平均误差，还更有效地控制了误差分布。在NO2排放的结果中也观察到了类似的趋势。在这个数据集上，混合方法实现了最大的解释能力，并且由于其较低的MSE值，更成功地捕捉了异常值和突然变化的影响。这一特点在处理实际系统数据中常见的异构结构时提供了显著的优势。相比之下，分析表明多项式OLS模型在高阶情况下经历了显著的性能损失。特别是在三阶和四阶多项式模型中，CO2估计的均方误差（MSE）值非常高，这表明这些模型与真实系统数据相比容易过拟合。相比之下，在相同条件下，混合方法产生了稳定且具有物理意义的结果。对于热效率输出，大多数先进的机器学习方法都实现了非常高的准确度水平。在这种情况下，混合方法保持了较高的R2值，同时没有超过最佳单一模型的误差值。同样，在总功率预测中，XGBoost产生了最低的误差值，而混合方法尽管具有非常高的解释能力，但其排名仅位居第二。这种情况表明，在基于排放的以及更复杂的误差结构输出中，混合结构的贡献更为显著。

总体而言，研究结果清楚地表明，与经典回归模型以及强大的人工智能方法（如XGBoost、CatBoost和Random Forest）相比，所提出的混合方法在处理具有高环境影响（如CO2和NO2）的非线性和噪声输出时具有更优越的泛化能力。特别是在多项式回归因过拟合而失败以及个别人工智能模型在某些情况下达到性能饱和时，混合方法既能平衡误差指标，又能稳步增加解释的方差。这些结果证实，通过解决基于回归的结构和人工智能方法的局限性，所提出的方法能够在具有高动态性和不确定性的实际系统应用中产生更可靠、稳定和物理上一致的预测。

总之，研究结果表明，所提出的混合方法在处理具有高环境影响的非线性和噪声输出（如CO2和NO2）方面，优于经典回归模型和强大的AI方法。混合方法在定量指标上也取得了明显的成功。当应用于真实发动机数据时，该解决方案架构对CO2的R2值为0.968，对NO2的R2值为0.936；对于热效率和总功率，其R2值分别为0.998和0.995。这些结果表明，该方法不仅对单一输出具有高准确度，而且对各种物理和环境输出都具有很强的泛化能力。特别是在多项式回归因过拟合而失败以及个别AI模型在某些场景下达到性能饱和的情况下，混合方法能够平衡性能指标并增加方差解释率。这些结果证实，该方法可以在具有高动态性和不确定性的实际问题中生成更可靠、稳定和物理上一致的预测。

本文提出了一种新颖的混合方法——RL-MH-LR-CBR解决方案架构。这种方法已在基于仿真（NASA C-MAPSS FD001）的数据和真实系统数据（CO2、NO2、热效率和总功率）上进行了广泛评估。研究结果表明，所提出的混合方法在处理非线性、异构性和噪声输出时表现优于经典回归方法和人工智能模型。与其他方法相比，该方法在相关数据集上也提供了更稳定和可靠的泛化能力。NASA C-MAPSS和真实发动机数据的研究结果从多个角度进行了分析，并在下面进行了展示。

首先，通过结合分析展示了归一化的平均绝对误差（MAE）和R2结果（见图6和图7）。根据这些结果，所提出的混合方法在误差最小化和解释方差方面表现出最平衡和稳定的性能。在图6的归一化MAE图中，混合方法在多种物理输出和所有不同的运行寿命（RUL）范围内实现了最低的误差水平。图6展示了使用归一化MAE在FD001测试数据下不同RUL范围内多输出预测的准确性比较。图7展示了使用归一化R2在FD001测试数据下不同RUL范围内多输出预测的准确性比较。此外，混合方法在基于R2的比较中展示了最低的归一化R2损失，始终保持着其解释能力。基于树的方法在特定输出上产生了有竞争力的结果，但在不同RUL范围内的性能波动较大。高阶多项式和一些线性模型在误差和R2方面表现出显著的不稳定性。这些发现表明，混合方法不仅可以优化单一性能指标，还可以同时优化误差、泛化和稳定性三重指标，从而在涉及不同衰减阶段的实际场景中提供更可靠的决策支持工具，例如FD001数据集。

另一项评估使用了均方误差（MSE）性能指标。在这种情况下，图8展示了根据测试MSE值进行归一化并按列排序的所有输出变量和预测模型。这种排名以15个不同的颜色级别进行可视化，从最佳结果（最深的蓝色）到最差结果（最深的红色）。这种方法旨在直观地区分每种输出方法之间的小但显著的性能差异，不同于全局归一化方法。根据这种可视化，所提出的混合方法在所有输出中始终实现了最低的误差水平，包括CO2、NO2、ALL-RUL、RUL-200和RUL-150，显示出相对于竞争方法的持续优越性。基于树的方法（XGBoost、CatBoost、Random Forest和LightGBM）通常位于中等到好的性能范围内。

还使用MSE性能指标进行了另一项评估，结果如图8所示。在图8中，所有输出变量和不同RUL范围内的预测模型根据测试MSE值进行了归一化并按相关列进行排序。这种排名以15个不同的颜色级别进行可视化，从最佳结果（最深的蓝色）到最差结果（最深的红色），并作为比较热图呈现。与全局归一化方法不同，这种方法能够显示每种输出方法之间的小但显著的性能差异。根据这种可视化，所提出的混合方法在所有输出中始终实现了最低的误差水平，包括CO2、NO2、ALL RUL、RUL 200和RUL 150，显示出相对于竞争方法的持续优越性。另一方面，基于树的方法通常处于中等到好的性能范围内。

KNN和高阶多项式回归模型从较浅的颜色向红色调的变化表明，这些方法在极端值和不同RUL范围内存在泛化弱点。总体而言，该图清楚地证实，所提出的混合方法不仅在平均准确性方面提供了优越的预测框架，而且在基于输出的竞争性和跨区域稳定性方面也是如此。

最后，从鲁棒性的角度评估了这些方法，图9基于随机森林（Random Forest）、CatBoost、LightGBM、XGBoost和所提出的混合方法的最佳、平均和最差MAE值进行了稳定性分析（不包括基于回归的方法）。线性和多项式回归模型未包含在图中，因为它们的确定性结构在所有条件下的性能值相同，无法提供关于稳定性的独特信息。基于树的方法具有有限但可观察的性能范围，表明这些模型在训练过程中存在随机性和超参数敏感性。尽管KNN方法表现出确定性行为，但其误差水平高于其他方法。相比之下，所提出的混合方法不仅具有最低的MAE水平，而且还通过提供极窄的最佳-最差性能范围表现出高稳定性。这些结果表明，混合方法可以在不同的数据划分和操作条件下产生一致且可靠的预测，突显了该方法在预测性维护应用中的适用性。

总之，所提出的混合方法在处理具有高环境影响的非线性和噪声输出（如CO2和NO2）方面优于经典回归方法和稳健的AI方法。混合方法取得的成功在定量上也得到了明确体现。当应用于真实发动机数据时，该解决方案架构分别对CO2和NO2的R2值为0.968和0.936；对于热效率和总功率，其R2值分别为0.998和0.995。这些结果表明，该方法不仅对单一输出具有高准确度，而且对各种物理和环境输出都具有很强的泛化能力。特别是在多项式回归因过拟合而失败以及个别AI模型在某些场景下达到性能饱和的情况下，混合方法能够平衡性能指标并提高方差解释率。这些结果证实，该方法能够在具有高动态性和不确定性的实际问题中生成更可靠、稳定和物理上一致的预测。

本文提出了一种新颖的混合方法——RL-MH-LR-CBR解决方案架构。该方法已在基于仿真的（NASA C-MAPSS FD001）数据和真实系统数据（CO2、NO2、热效率和总功率）上进行了广泛评估。研究结果表明，所提出的混合方法在处理非线性、异构性和噪声输出时优于经典回归方法和人工智能模型。与其他方法相比，该方法在相关数据集上也提供了更稳定和可靠的泛化能力。来自NASA C-MAPSS和真实发动机数据的研究结果从多个角度进行了分析，并在下面进行了展示。

首先，通过结合分析展示了归一化的MAE和R2结果（见图6和图7）。根据这些结果，所提出的混合方法在误差最小化和解释方差方面在所有方法中表现出最平衡和稳定的性能。在图6的归一化MAE图中，混合方法在多个物理输出和所有不同的RUL范围内实现了最低的误差水平。图6展示了使用归一化MAE在FD001测试数据下不同RUL范围内多输出预测的准确性比较。图7展示了使用归一化R2在FD001测试数据下不同RUL范围内多输出预测的准确性比较。除了这些信息外，混合方法还在基于R2的比较中展示了最低的归一化R2损失，始终保持着其解释能力。基于树的方法在特定输出上产生了有竞争力的结果，但在不同RUL范围内的性能波动较大。高阶多项式和一些线性模型在误差和R2方面表现出显著的不稳定性。这些发现表明，混合方法不仅可以优化单一性能指标，还可以同时优化误差、泛化和稳定性三重指标，从而在涉及不同衰减阶段的实际情况中提供更可靠的决策支持工具。

另一项评估使用了MSE性能指标。在这种情况下，图8展示了根据测试MSE值进行归一化并按列排序的所有输出变量和预测模型。这种排名以15个不同的颜色级别进行可视化，从最佳结果（最深的蓝色）到最差结果（最深的红色）。这种方法旨在直观地显示每种输出方法之间的小但显著的性能差异，不同于全局归一化方法。根据这种可视化，所提出的混合方法在所有输出中始终实现了最低的误差水平，包括CO2、NO2、ALL-RUL、RUL-200和RUL-150，显示出相对于竞争方法的持续优越性。基于树的方法（XGBoost、CatBoost、Random Forest和LightGBM）通常位于中等到好的性能范围内。图8展示了基于预测模型在不同输出（测试MSE）上的排名热图。

还使用MSE性能指标进行了另一项评估，结果如图8所示。在图8中，所有输出变量和不同RUL范围内的预测模型根据测试MSE值进行了归一化并按相关列进行排序。这种排名以15个不同的颜色级别进行可视化，从最佳结果（最深的蓝色）到最差结果（最深的红色），并作为比较热图呈现。与全局归一化方法不同，这种方法能够显示每种输出方法之间的小但显著的性能差异。根据这种可视化，所提出的混合方法在所有输出中始终实现了最低的误差水平，包括CO2、NO2、ALL RUL、RUL 200和RUL 150，显示出相对于竞争方法的持续优越性。另一方面，基于树的方法通常处于中等到好的性能范围内。

KNN和高阶多项式回归模型从较浅的颜色向红色调的变化表明，这些方法在极端值和不同RUL范围内存在泛化弱点。总体而言，该图清楚地证实，所提出的混合方法不仅在平均准确性方面提供了优越的预测框架，而且在基于输出的竞争性排名和跨区域稳定性方面也是如此。

最后，从鲁棒性的角度评估了这些方法，图9基于随机森林、CatBoost、LightGBM、XGBoost、KNN和所提出的混合方法的最佳、平均和最差MAE值进行了稳定性分析（不包括基于回归的方法）。线性和多项式回归模型未包含在图中，因为它们的确定性结构在所有条件下的性能值相同，无法提供有关稳定性的独特信息。基于树的方法具有有限但可观察的性能范围，表明这些模型在训练过程中存在随机性和超参数敏感性。尽管KNN方法表现出确定性行为，但其误差水平高于其他方法。相比之下，所提出的混合方法不仅具有最低的MAE水平，而且还通过提供极窄的最佳-最差性能范围表现出高稳定性。这些结果表明，混合方法可以在不同的数据划分和操作条件下产生一致且可靠的预测，突显了该方法在预测性维护应用中的适用性。

总之，所提出的混合方法基于回归模型的可表达方程结构，并将其与人工智能方法的预测能力相结合。此外，它在一个动态解决方案架构内采用了自适应操作符选择机制。通过这种方式，它提供了一种创新、可泛化和稳健的预测范式，克服了现有方法的结构性限制。在所提出的混合解决方案架构中，使用超启发式算法优化了线性回归系数和误差项。此外，还使用基于UCI的操作符选择机制来迭代确定在给定阶段哪个元启发式操作符更有效。因此，它实现了能够自主适应学习过程的动态结构。所提出方法的最重要优势之一是它提供了一种通用的、问题无关的解决方案架构。与静态的单一阶段建模方法不同，所开发的解决方案架构将学习过程转变为适应性和上下文敏感的结构。因此，其目的是使其能够直接应用于具有线性、非线性、噪声和异构结构的各种工程问题，而不依赖于特定输出类型或数据集的参数设置。使用NASA C-MAPSS RUL估计的真实系统排放数据获得的成功结果表明，该方法不特定于任何特定问题类别，为高度动态的系统提供了一个通用的估计框架。由于这些特性，该方法已成为航空发动机、排放估计和类似高度动态工程系统的强大且可靠的决策支持工具。此外，通过基于CatBoost的残差建模方法，非线性误差成分得到了有效校正。得益于这种集成结构，该混合模型不仅改善了误差指标，还能在不同数据条件下使模型表现更加可预测和可靠。研究的另一个重要发现是数据集的结构特征对预测性能具有重要影响。根据正态分布重建FD001数据集有助于更真实地评估模型的泛化能力，同时保持了数据集的多样性。这种方法表明，传感器输入与设备运行寿命（RUL）及排放输出之间的关系在某些区域更为显著，而在其他区域则较弱，从而进一步凸显了该预测问题的数据驱动特性。

对于未来的研究工作，所提出的混合框架的模块化和灵活性为相关研究提供了诸多机会。将不同的人工智能算法整合到建模阶段中，在元启发式优化过程中采用更先进的强化学习策略，以及将多目标优化方法纳入框架，都有助于进一步提升该方法的表达能力。此外，将该框架扩展到实时和在线学习场景中，将进一步提升该方法在工业应用中的实用价值。总体而言，这项工作通过提供一种通用、自适应且可扩展的、受人工智能支持的预测方法，为解决复杂且不确定的工程问题做出了重要贡献。

热点排行