基于季节性-趋势分解(STL)-TimesNet-TimeXer混合框架的PM2.5浓度预测

《Atmosphere》:PM2.5 Concentration Prediction Based on STL-TimesNet-TimeXer Hybrid Framework

【字体: 时间:2026年06月10日 来源:Atmosphere 2.3

编辑推荐:

  本研究提出一种融合LOESS季节性-趋势分解(Seasonal-Trend decomposition using LOESS, STL)与TimesNet及TimeXer两种时间序列模型的混合预测框架。为捕捉PM2.5序列复杂的周期特征,研究人员首先通过ST

  
本研究提出一种融合LOESS季节性-趋势分解(Seasonal-Trend decomposition using LOESS, STL)与TimesNet及TimeXer两种时间序列模型的混合预测框架。为捕捉PM2.5序列复杂的周期特征,研究人员首先通过STL将原始数据分解为趋势(trend)、季节(seasonal)及残差(residual)分量;其中趋势与季节分量采用TimesNet进行预测,该模型将一维时间序列映射至二维表征以更好地建模多尺度周期性及时间依赖关系;残差分量则采用引入外生变量(exogenous variables)以增强内源动态建模能力的TimeXer进行预测;最终PM2.5预测值由三分量预测结果聚合得到。实验结果表明,所提出的STL-TimesNet-TimeXer模型具有较高的预测精度,决定系数(R2)达0.969,平均绝对误差(MAE)为2.834,均方误差(MSE)为19.063,平均绝对百分比误差(MAPE)为6.435。与单一模型基线的对比分析进一步证实基于STL的分解显著提升了预测性能,表明STL为PM2.5时间序列建模提供了一种有效且具可解释性的途径。
论文解读:基于STL-TimesNet-TimeXer混合框架的PM2.5浓度预测研究
研究背景与意义
PM2.5(细颗粒物)因与呼吸系统及心血管疾病密切相关,且受交通排放、工业源及气象条件等多因素影响呈现强非线性与非平稳性,其准确预测对环境政策制定与公众健康预警至关重要。传统数值模型(如WRF-Chem、CMAQ)计算量大且依赖高质量输入,传统统计方法(如多元线性回归、ARIMA)难以拟合PM2.5的非线性与非平稳特征。现有深度学习模型(CNN、LSTM、GRU、Transformer)虽能捕捉非线性与时序依赖,但单一架构存在局限——CNN弱于时序建模,LSTM弱于空间特征提取,且原始数据中的复杂周期与噪声会干扰模型学习。此外,STL(Seasonal-Trend decomposition using LOESS,基于局部加权回归的季节性-趋势分解法)已被证明可通过将序列分解为趋势、季节、残差分量为深度学习提供更好的表征空间。为此,研究人员开展了基于STL分解结合TimesNet与TimeXer的混合框架研究,以验证分解策略与分模型匹配对PM2.5短时预测精度的提升效果。该论文发表于《Atmosphere》。
主要关键技术方法
研究人员选用长沙市2022年1月1日至12月31日十个国控监测点小时级PM2.5、PM10、O3、CO、NO2、SO2数据(共8760条),按7:1:2时序划分为训练、验证、测试集。方法上:(1)采用STL将PM2.5序列分解为趋势(Tt)、季节(St)、残差(Rt)三分量,季节周期参数设为25(奇数);(2)对相对平滑且有周期规律的趋势与季节分量,使用TimesNet(通过将一维序列经FFT提取主导频率后重塑为二维张量,行捕捉周期间变化、列捕捉周期内变化,经Inception模块提取特征后再还原)进行预测;(3)对含随机波动与外源影响的残差分量为使用TimeXer(基于Transformer架构,对内源变量做Patch分段嵌入并引入全局token,对外源污染物变量做整体线性投影嵌入,通过内源自注意力与外源-内源交叉注意力建模)引入PM10等五种污染物作为外生变量进行预测;(4)三分量预测值相加得到最终PM2.5预测结果,采用R2、MAE、MSE、MAPE评估。
研究结果
3.1. STL Decomposition(STL分解)
研究人员对原始PM2.5序列实施STL分解,分离出趋势、日/周尺度季节分量及残差。分解后趋势与季节分量规律明显、波动平缓,残差含短期随机扰动。各分量分别预测后与观测值对比显示,TimesNet对趋势与季节分量拟合良好,TimeXer对残差整体轨迹可追踪但局部存在偏差(受突发污染事件影响)。三分量预测值叠加后的最终预测曲线与实测值高度吻合,模型整体达到R2=0.969,MAE=2.834,MSE=19.063,MAPE=6.435%。按全天四个时段(早高峰6:00–10:00、午后11:00–16:00、晚高峰17:00–19:00、夜间20:00–次日05:00)评估发现,午后边界层发展充分扩散规律时精度最高,早高峰因逆温消散与排放骤增精度略低,其余时段表现稳健。
3.2. Model Performance Analysis(模型性能分析)
研究人员将STL-TimesNet-TimeXer混合模型与未分解直接用TimesNet、TimeXer单模型对比。结果表明混合模型全面优于单模型:较TimesNet,R2提升2.9%,MAE降低28.1%,MSE降低48.4%,MAPE降低32.2%;较TimeXer,R2提升1.7%,MAE降低17.9%,MSE降低35.1%,MAPE降低23.4%。分时段对比显示混合模型在各时段MSE均有大幅下降(早高峰较TimesNet和TimeXer分别降55.6%和48.7%,午后分别降36.6%和17.9%,晚高峰分别降57.4%和41.6%,夜间分别降45.7%和29.9%),且R2更高、MAE与MAPE更低。不同预测步长(t+1、t+24、t+72)的分量RMSE分析显示趋势分量误差随步长增长最显著(RMSE从0.709增至26.871),残差分量是不确定性的主要来源,季节分量因周期规则误差相对稳定。
讨论与结论翻译(Conclusions)
本研究提出一种基于STL-TimesNet-TimeXer混合模型的PM2.5浓度预测新框架。在该框架中,首先应用STL将PM2.5时间序列分解为趋势、季节和残差分量;趋势分量反映长期演变行为,季节分量捕捉周期性波动,残差分量反映突发污染事件等随机因素引起的不规则变化。趋势与季节分量由TimesNet预测,利用其多周期表征能力增强对长期动态与周期模式的建模;残差分量由TimeXer预测,通过其均衡处理内源与外源变量及自适应注意力机制有效捕捉非线性波动。最终PM2.5浓度由各分量预测值聚合得到。研究人员使用长沙市2022年全年小时级PM2.5、PM10、O3、CO、NO2、SO2空气质量数据验证所提模型,结果显示最终预测值与实测值吻合良好,具有较高预测精度(R2=0.969,MAE=2.834,MSE=19.063,MAPE=6.435)。与未经STL分解的单模型基线相比,混合方法在所有评价指标上均表现更优,预测浓度与实测值贴合最为紧密。这些发现证实了所提出的STL-TimesNet-TimeXer模型在PM2.5预测中的有效性与实用价值。研究亦指出局限性:STL分解-预测-聚合引入额外计算开销;受数据限制未纳入风速、湿度等气象驱动因子;仅基于长沙市一年数据,跨区域与年际迁移性需进一步验证。未来工作将整合气象观测与大气物理指标、探索不稳定周期的自适应分解策略,并开发轻量化架构以提升效率与大规模部署能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号