一种集成不确定性量化与校准的剩余寿命预测新框架

《RELIABILITY ENGINEERING & SYSTEM SAFETY》：A novel uncertainty-aware framework for remaining useful life prediction integrating uncertainty quantification and calibration

【字体：大中小】 时间：2026年04月24日 来源：RELIABILITY ENGINEERING & SYSTEM SAFETY 11

编辑推荐：

　　本文聚焦于深度学习在剩余寿命(RUL)预测中缺乏可靠不确定性量化的核心问题，提出了一种将贝叶斯深度学习(BDL)与保形预测(CP)相结合的新型框架。该研究利用高斯Dropout进行变分推断(VI)，联合建模认知不确定性和偶然不确定性，并引入保序回归主动校准异方差预测不确定性，最后通过分裂保形预测(SCP)构建具有有限样本边际覆盖保证的预测区间。在C-MAPSS和锂离子电池数据集上的实验表明，该方法在近似可交换性下实现了预测精度的提升、有效的不确定性量化与可靠的不确定性校准，增强了RUL预测结果在风险感知决策中的可信度。

随着工业4.0的快速发展，以预测性维护为核心的智能运维已成为提升系统可靠性的关键。准确预测设备或系统的剩余寿命，是制定科学维护策略、避免意外停机的基础。虽然深度学习在挖掘数据中复杂的非线性关系、提升RUL点预测精度方面展现出巨大潜力，但一个不容忽视的挑战是，大多数现有模型仅能给出一个确定性的预测值，而缺乏对预测结果“置信度”的度量。在现实世界的复杂工况下，传感器噪声、模型知识不完备、数据质量与数量限制等因素，都会给预测带来不确定性。当决策者（例如，设备维护工程师）面对一个“预计还能运行100小时”的预测时，他无从知晓这个“100小时”的可信度有多高，是十拿九稳，还是存在较大偏差风险。这种不确定性信息的缺失，使得模型输出难以直接用于高风险的决策场景，限制了其在实际工业应用中的深度落地。

为了解决现有深度学习模型在RUL预测中“只知其然，不知其所以然”（即能预测但无法评估可信度）的问题，来自米兰理工大学的研究团队在《RELIABILITY ENGINEERING & SYSTEM SAFETY》上发表论文，提出了一种全新的、统一的不确定性感知框架。这个框架的核心目标，不仅是给出一个尽可能准确的RUL预测值，更重要的是，要能够科学地“度量”并“校准”这个预测背后的不确定性，让模型学会“诚实”地表达自己的信心水平。

为了实现这一目标，研究人员巧妙地将贝叶斯深度学习的数学严谨性与保形预测的统计保证相结合。具体而言，他们首先利用基于高斯Dropout的贝叶斯深度神经网络，将模型参数视为随机变量，通过变分推断来近似其复杂的高维后验分布。这种方法使得模型能够同时捕捉到两种不同类型的不确定性：认知不确定性（源于模型知识或数据的不完备，理论上可通过增加数据或改进模型来降低）和偶然不确定性（源于系统固有的、不可消除的随机性，如传感器噪声）。模型通过多次前向传播采样，得到一个预测值的分布，而非单一数值。

然而，仅仅是量化出不确定性还不够。研究团队洞察到一个关键现象：对于一个“校准良好”的模型，其预测误差（残差）的绝对值应当与预测出的不确定性（方差）呈正相关——也就是说，模型在预测不准的地方，应该表现出更大的不自信。基于此，他们引入了保序回归作为一种单调的结构性约束，主动地对模型输出的预测标准差进行数据驱动的校准，强制其满足这一理想关系。最后，他们将校准后的不确定性估计，整合到分裂保形预测框架中。SCP能够在满足可交换性等标准假设的前提下，以统计理论为后盾，为每个新的输入样本构建出具有明确覆盖率保证（例如，95%的置信水平）的预测区间。这意味着，从长远平均来看，模型给出的预测区间将有95%的概率覆盖到真实的RUL值，为决策者提供了直观且可靠的置信边界。

该研究在预测性维护领域两个经典且具有挑战性的公开数据集上进行了验证：模拟航空发动机退化的C-MAPSS数据集和真实的锂离子电池循环老化数据集。广泛的实验结果表明，所提出的框架不仅在点预测精度上有所提升，更重要的是，其生成的不确定性估计是有效且经过良好校准的。即便在实际数据分布可能发生偏移的情况下，该方法依然展现出稳健的实证性能。

本研究为开展RUL预测，融合运用了多项关键技术方法。在模型构建与不确定性量化层面，采用了基于高斯Dropout的变分推断方法来训练贝叶斯深度神经网络，以联合建模认知不确定性和偶然不确定性，并通过多次随机前向传播获得集成预测分布。在不确定性后处理与校准层面，创新性地将主要用于分类概率校准的保序回归引入回归问题，作为单调约束来主动校准预测方差，使其与预测残差呈正相关。在预测区间构建与统计保证层面，引入了分裂保形预测框架，利用校准后的不确定性来构建具有有限样本边际覆盖率理论保证的预测区间。实验评估则在NASA的C-MAPSS涡轮风扇发动机退化模拟数据集和牛津大学等机构公开的锂离子电池循环老化数据集上进行。

1. 贝叶斯深度学习框架有效分解与量化了RUL预测中的不确定性

研究通过理论推导（公式1-4）和实验验证表明，所构建的基于高斯Dropout的贝叶斯神经网络，能够将总预测方差分解为认知不确定性和偶然不确定性两部分（公式3）。在C-MAPSS数据集上的可视化结果显示，在预测初期（RUL值较大时），由于历史数据较少，认知不确定性占主导；而在接近失效点时，由于退化过程的随机性增强，偶然不确定性变得更为显著。这种分解有助于理解不同阶段不确定性的主要来源。

2. 保序回归成功校准了异方差的预测不确定性

通过比较校准前后预测标准差与绝对预测误差之间的关系图，研究发现，未校准的BDL模型其预测方差与误差的相关性较弱，存在部分区域过度自信（方差小但误差大）或过度保守（方差大但误差小）的问题。应用保序回归校准后，两者的单调正相关关系得到显著增强。定量指标如平均校准误差和锐度显示，校准后的模型在保持合理不确定区间宽度的同时，大幅提升了预测不确定性的可靠性。

3. 集成SCP的框架生成了具有统计覆盖保证的预测区间

在满足近似可交换性的假设下，研究展示了所提框架能为测试样本生成具有指定置信水平（如90%）的预测区间。覆盖率的实证结果表明，该方法生成区间的实际覆盖率非常接近其名义置信水平，而作为对比的、仅基于未校准不确定性分位数构建的经验区间，其覆盖率则明显不足。这证明了引入SCP并结合校准步骤，对于获得具有严格统计解释的预测区间至关重要。

4. 框架在分布偏移下表现出鲁棒性

为了测试方法的实用性，研究还设计了数据分布偏移的场景，例如在C-MAPSS数据集中，使用在某一工况下训练的模型去预测另一工况下的RUL。实验结果表明，即使在分布偏移的情况下，所提框架生成的预测区间仍能维持相对合理的覆盖率，其性能衰减程度小于传统的非校准方法，显示出更强的实证鲁棒性。

综上所述，本研究针对RUL预测中不确定性量化与校准的难题，提出了一个创新的、端到端的解决方案。该框架的贡献主要体现在三个方面：其一，提出并实现了一个基于高斯Dropout的BDL框架，以统一的方式对认知和偶然不确定性进行建模与分解；其二，超越了单纯的不确定性量化，首次将保序回归作为一种主动校准工具引入RUL预测，显式地加强了预测误差与不确定性估计之间的理论关联，显著提升了不确定性估计的校准质量；其三，开创性地将校准后的不确定性估计与分裂保形预测框架结合，为RUL预测提供了具有有限样本边际覆盖理论保证的预测区间，这在现有文献中尚属首次。

这项研究的核心意义在于，它将RUL预测从提供单一的、缺乏置信信息的“点估计”，推进到了提供带有经过校准的、具有统计可信度的“区间估计”的新阶段。这不仅增强了预测结果本身的可解释性和可靠性，更重要的是，它为基于预测的决策（如何时安排维护、如何配置备件）提供了量化的风险依据。在安全至上的工业领域（如航空、能源），能够评估并控制预测错误的风险，与提升预测准确性同等重要。因此，该框架为构建下一代可信、可靠、可决策的智能预后系统奠定了重要的方法论基础。

热点排行