面向现场信息物理系统（Cyber-Physical System, CPS）中可解释时间序列预测（Time Series Forecasting, TSF）的双阶段方法

《Internet of Things》：A Dual-Stage Approach for Explainable Time Series Forecasting in On-Field Cyber-Physical Systems

【字体：大中小】 时间：2026年05月29日 来源：Internet of Things 7.6

编辑推荐：

　　摘要：时间序列预测（Time Series Forecasting, TSF）在信息物理系统（Cyber-Physical System, CPS）中发挥关键作用，可支撑预测性维护、资源优化及异常检测等关键任务。深度学习（Deep Learning, DL）模

摘要：时间序列预测（Time Series Forecasting, TSF）在信息物理系统（Cyber-Physical System, CPS）中发挥关键作用，可支撑预测性维护、资源优化及异常检测等关键任务。深度学习（Deep Learning, DL）模型因擅长捕捉时序依赖关系近年来在TSF中广受关注，但其巨大的算力需求常迫使模型部署于云端，引发隐私与能耗顾虑；且其"黑箱"特性导致可解释性不足，使工程人员难以理解并信任预测结果。为解决上述局限，研究人员提出一种面向CPS应用定制的双阶段时间序列预测方法，兼顾边缘端本地执行与模型可解释性双重需求。具体而言，第一阶段对具相似模式的时间序列数据进行聚类（Clustering）；第二阶段为每个簇训练一个决策树回归器（Decision Tree Regressor, DTR）。通过聚焦于较窄的数据子集，每棵决策树复杂度降低，可生成更简洁高效的模型；此外DTR具内在可解释性，能为每次预测提供清晰的推理依据。该轻量化可解释设计支持低算力开销的设备端高效运行，非常契合CPS场景。基于250条时间序列的实验结果表明，相比经典单一DTR准确率显著提升，且相较基于集成的树模型（Tree-Based Ensemble）在可解释性与推理耗时上均有明显改善，并于NUCLEO-STM32N657嵌入式设备上验证了可行性。

论文解读：面向现场CPS中可解释时间序列预测的双阶段方法

该研究发表于《Internet of Things》。

一、研究背景与动机

在信息物理系统（Cyber-Physical System, CPS）及工业物联网（Industrial Internet of Things, IIoT）中，时间序列预测（Time Series Forecasting, TSF）是支撑预测性维护、资源调度与异常检测的核心技术。当前主流深度学习方法（如LSTM、CNN、Transformer）虽能较好拟合非线性时序关系，但存在三方面突出问题：一是计算与存储开销大，通常需依赖云端或高性能GPU服务器，带来数据传输延迟、带宽占用、断网不可用及敏感数据外泄风险；二是深度学习模型为黑箱（Black-Box），缺乏全局可解释性（Global Interpretability），而CPS领域操作人员常需理解模型整体决策逻辑以建立信任并满足合规要求，仅靠局部解释方法（如SHAP、LIME）无法完全满足需求；三是随机森林（Random Forest, RF）、XGBoost等树集成方法虽比深度网络轻量且可提供局部解释，但仍缺失全局可解释性且推理时需遍历多棵树致计算量增加。单棵决策树回归器（Decision Tree Regressor, DTR）具备天然全局可解释性及极低推理成本（仅需特征阈值比较与树遍历），但在全量异质时序数据上易过拟合且精度有限。基于此，研究人员提出一种融合聚类与DTR的双阶段（Dual-Stage）混合专家（Mixture of Experts, MoE）式轻量可解释TSF框架，旨在CPS边缘节点实现高精度、全局可解释、低延迟的本地预测。

二、关键技术方法

研究人员选用UCR异常检测数据集中250条不同领域的时间序列，剔除标注异常段后作为实验对象。方法分为三阶段：①训练阶段——先用K-means算法对滑动窗口构造的历史样本向量（长度L）聚类为K个簇，再为每个簇独立训练一个剪枝可控的DTR作为该簇"专家"；历史窗口长度L依自相关函数判定的季节性周期设定，簇数K通过肘部法或g-means在2～10间调优，各簇DTR超参数（max_depth、min_samples_leaf等）经滚动时间窗交叉验证独立网格搜索确定。②模型适配阶段——利用m2cgen将聚类中心与决策树逻辑转为C代码以适配STM32N657微控制器（MCU）。③推断阶段——新样本计算与K个聚类质心的欧氏距离，归入最近簇后仅调用对应那棵DTR输出单步（H=1）预测值。精度以MSE与MAPE评估，聚类质量用轮廓系数（Silhouette Score），推理延迟与能耗于600MHz STM32N657实测；对照基线含单一DTR、RF（100棵树）、XGBoost（100棵树）、CNN及LSTM（TensorFlow），统计显著性采用Friedman及Nemenyi事后检验（α=0.05）。

三、研究结果

3.1 Accuracy of the Predictions（预测精度）

通过滚动时间窗交叉验证与Friedman+Nemenyi检验（p≈1.82×10^-82，Nemenyi检验显示双阶段法与单一DTR差异极显著p=3.22×10^-10），研究人员发现所提双阶段方法MSE/MAPE显著低于单一DTR，证明聚类划分同质子集后可减轻DTR过拟合并提升各专家泛化能力；但RF与XGBoost及深度学习模型整体精度仍略优于双阶段DTR，不过后者二者无全局可解释性且推理成本高。

3.2 On-Board evaluation（板级部署评估）

于NUCLEO-STM32N657实测表明：单一DTR推理延迟约13.27μs、能耗0.022mJ、模型尺寸3.39kB；双阶段法（含K-means分配+单DTR遍历）分别为约21.12μs、0.0357mJ、18.41kB（随K与树深波动）；XGBoost为39.13μs/0.066mJ/157kB，RF为77.35μs/0.1319mJ/389kB，CNN(TFLite)为123.38μs，LSTM不支持部署。双阶段法虽略慢于单一DTR，但远快于集成树与深度模型，内存与能耗亦处嵌入式可接受范围，适合资源受限CPS边缘节点。

3.3 Investigating the Impact of Clustering（聚类影响分析）

Pearson相关性检验（p=1.6495×10^-6）证实簇平均轮廓分数与DTR专家平均MSE呈显著负相关——聚类质量越高（簇内紧簇间分离好），预测误差越低。最优簇数因序列而异，多数序列K=2即达最低MAPE，部分需更多簇；增大K会线性增加聚类比较次数（推高推理延迟）及总模型尺寸（多棵较浅DTR），同时若误分类代价变大则鲁棒性略降，故K需折衷选取。

3.4 Interpretability Examples（可解释性示例）

推断时由聚类选定唯一DTR，沿从根至叶节点的分裂条件（如x₇≤0.314 ∧ x₂₃>0.682…）可直接提取IF-THEN型决策规则，以自然语言或逻辑表达式呈现预测依据，无需SHAP/LIME等事后解释工具，实现真正的全局可解释性——工程师可审查整棵树了解模型捕获的输入输出关系。

四、讨论与结论翻译

研究人员指出框架局限性在于固定长度滑动窗口难捕捉超出历史长度L的长程依赖，且K-means按窗口向量形状相似性聚类未显式建模时序先后顺序，极端长程或多尺度依赖场景需未来引入时序感知聚类策略；此外验证目前限于UCR基准，需在更多领域数据进一步检验。

结论（翻译）： 本文提出一种强调可解释性、计算效率及适合边缘部署的时间序列预测双阶段框架。通过混合专家范式，结合聚类与决策树回归器（DTR）实现全局可解释性——第一阶段聚类分组具相似模式的时间序列数据，简化预测流程并对数据集结构提供透明洞察；第二阶段各簇训练专属DTR作为该组"专家"。DTR因其结构可直观可视化解读决策过程而具备全局可解释性；专注较小组别使每棵树复杂度降低，生成比全量数据训练的单模型更简、更高效。推断时镜像训练双阶段：输入先由聚类模型分配至相应簇，再调用对应DTR给出预测。该设计简化预测流程并明晰模型行为，对需现场执行、信任与问责的CPS极具价值。广泛实验验证框架有效性：较经典DTR准确率明显更优（Nemenyi检验确认），相较基于集成的树模型显著提升可解释性并缩减计算时间。于NUCLEO-STM32N657设备上部署进一步证实其边缘执行可行性，凸显能效与实际CPS应用潜力。

热点排行