使用STL分解和贝叶斯优化的并行xLSTM-Informer模型用于长期溶解氧预测

《Ecological Informatics》:Parallel xLSTM-informer model for long-term dissolved oxygen prediction using STL decomposition and Bayesian optimization

【字体: 时间:2026年04月02日 来源:Ecological Informatics 7.3

编辑推荐:

  溶解氧(Dissolved Oxygen, DO)是地表水生态系统中水质的重要指标。现有预测模型在全面提取水质数据特征方面存在局限性。为解决这一局限,研究人员提出了一种并行STL-BO-xLSTM-Informer模型,其中STL模块捕获季节性和趋势成分,In

  
溶解氧(Dissolved Oxygen, DO)是地表水生态系统中水质的重要指标。现有预测模型在全面提取水质数据特征方面存在局限性。为解决这一局限,研究人员提出了一种并行STL-BO-xLSTM-Informer模型,其中STL模块捕获季节性和趋势成分,Informer模块捕获长期时间依赖性,xLSTM模块提取局部时间特征和波动模式。研究使用2021年1月至2023年12月期间长江重庆段六个采样点(S1-S6)的每四小时水质数据作为数据集。该模型通过与基线模型(iTransformer、Autoformer、Crossformer、TimesNet和Informer)的比较,以及使用xLSTM-Informer作为基础模型在S6处进行的消融实验(消融变体包括STL-BO-Base、BO-Base和STL-Base)进行了验证。结果表明,STL-BO-xLSTM-Informer模型有效捕获了水质数据的内在特征和时空特性。与基线模型相比,MAE、RMSE和SMAPE分别降低了27.54%、21.55%和27.27%,R2提高了6.6%。STL-BO-xLSTM-Informer模型在预测精度上优于所有基线模型,在S6处的性能排名如下:STL-BO-xLSTM-Informer > Informer > iTransformer > TimesNet > Crossformer > Autoformer。
这篇论文解读文章基于发表在《Ecological Informatics》上的研究,围绕溶解氧(Dissolved Oxygen, DO)长期预测模型展开。以下为详细解读:

**研究背景与问题**

长江流域作为中国重要的淡水生态系统,其水质监测对生态保护至关重要。溶解氧(DO)是评价地表水环境质量和生态系统健康的关键指标,低DO水平常与富营养化及水生生物分布变化相关。然而,现有预测模型面临多重挑战:第一,DO时间序列包含多尺度模式,短期波动与长期趋势并存,传统方法(如统计模型或单一深度学习模型)难以联合建模;第二,原始DO序列具有非平稳性和噪声干扰,掩盖了趋势和季节结构;第三,模型性能对超参数高度敏感,手动调优效率低且易陷入局部最优。为此,研究人员提出一种并行STL-BO-xLSTM-Informer模型,旨在通过分解预处理、并行架构和自动超参数优化,提升长期DO预测的精度和鲁棒性。

**关键技术方法**

研究人员使用了以下主要方法(样本数据来源:中国环境监测总站,长江重庆段S1-S6六个国家监测断面,2021年1月至2023年12月,每4小时一次观测,共6571条记录,涵盖DO、pH、浊度、水温(WT)、电导率(EC)五个指标):(1)STL分解(Seasonal-Trend decomposition using LOESS):将原始DO序列分解为趋势、季节和残差分量,降低非平稳性。(2)xLSTM(Extended Long Short-Term Memory):通过指数门控和矩阵记忆单元,增强局部特征提取和短时依赖建模。(3)Informer:采用ProbSparse自注意力机制和自注意力蒸馏,高效捕捉长期时间依赖。(4)贝叶斯优化(Bayesian Optimization, BO):基于高斯过程代理模型,在有限评估预算内自动搜索最优超参数组合。以上模块以并行架构集成:STL输出与原始特征共同输入,xLSTM和Informer并行提取局部与全局特征,融合后经全连接层输出预测。

**研究结果**

**3.1 与基线预测模型的比较**
研究人员以S6站点为代表,在1步至12步(对应4小时至48小时)预测区间上,将提出模型与Informer、iTransformer、Crossformer、Autoformer、TimesNet对比。结果显示,提出模型在所有步长上均取得最优性能:在12步时R2达0.9134,MAE为0.1319,RMSE为0.1918,SMAPE为1.87%。与最优基线Informer相比,MAE、RMSE、SMAPE分别降低13.65%、14.03%、13.94%,R2提升2.01%。性能排序为:提出模型 > Informer > iTransformer > TimesNet > Crossformer > Autoformer。配对t检验表明提出模型与各基线差异显著(p<0.05)。

**3.2 跨监测断面泛化能力**
研究人员将提出模型应用于全部6个站点进行12步预测。各站点预测值与观测值的时间序列曲线和散点图显示紧密吻合,最小R2达0.88以上,说明模型在同类河流系统内具有一致的泛化能力和断面鲁棒性,即使面对短期剧烈波动也能有效追踪。

**3.3 多步预测误差分析**
通过比较MAE和RMSE随步长的变化及箱线图分布,提出模型在所有步长上中位数和上尾误差均最低。尤其在长步长(如12步)时,提出模型误差分布集中,大误差事件少,优于各基线。Autoformer因依赖自回归机制,误差随步长累积明显;Informer虽接近,但其稀疏注意力对噪声敏感,长步误差上限较高。

**3.4 消融实验**
以xLSTM-Informer为基础模型(Base),分别加入BO(BO+Base)、STL(STL+Base)及完整模型(STL-BO-xLSTM-Informer)。在12步预测中,Base相对于单独Informer已提升R2 1.35%;BO+Base相对于Base降低MAE 6.55%、提升R2 2.65%;STL+Base相对于Base降低MAE 13.37%、提升R2 3.96%。完整模型相对于Base总体降低MAE 27.54%、RMSE 21.55%、SMAPE 27.27%,提升R2 6.60%。这表明STL分解和贝叶斯优化通过不同机制(STL减少序列非平稳性,BO优化模型拟合)协同提升预测精度。

**讨论与结论**

**讨论总结**:
研究结果表明,将数据分解、并行多尺度特征提取与自动超参数优化有机整合,可有效克服单一模型在长期DO预测中的局限性。STL分解通过分离趋势和季节分量,降低了原序列的非平稳性,使模型能更专注学习稳定模式;xLSTM与Informer的并行结构互补了局部波动与全局依赖的建模能力;贝叶斯优化则在有限计算预算下高效获取了更优超参数。消融实验验证了各模块的独立贡献和集成增益。此外,跨站点测试表明模型具备良好的泛化性,能适应不同断面的异质性。但研究也指出预测精度随步长增加而下降,且当前评估局限于单一河段和时段,未来需在更多流域、更长时段下验证。此外,计算开销(训练时间、参数量)未予分析,预测变量仅包含少数水质指标,未来可引入降雨、径流等外部驱动因子以进一步提升鲁棒性。

**翻译研究结论(4. Conclusion)**:
本研究提出了一个集成STL分解和贝叶斯优化的并行xLSTM-Informer长期预测模型。利用2021年1月至2023年12月长江重庆段6个监测站点的每4小时DO数据,通过与5个基线模型比较及消融实验,全面评估了模型预测能力。主要发现如下:
(1) 提出模型有效捕获了水质时间序列的时间依赖关系,预测性能提升。在比较的6个模型中,精度排序为:提出模型 > Informer > iTransformer > TimesNet > Crossformer > Autoformer。
(2) STL模块显著增强了模型提取周期、季节和噪声相关特征的能力,改善了长期非线性DO序列的预测效果。相比xLSTM-Informer基础模型,STL增强模型(STL-Base)使MAE、RMSE、SMAPE分别降低13.37%、13.14%、12.58%,R2提高3.96%。
(3) 贝叶斯优化实现了超参数自动调优,进一步提升了预测精度。相比基础模型,BO+Base变体使MAE、RMSE、SMAPE分别降低6.55%、7.09%、6.90%,R2提高2.65%。
(4) 完整集成模型展示了优越的长期预测精度和鲁棒性(MAE=0.1319,RMSE=0.1918,SMAPE=1.87%,R2=0.9134),并在所有监测断面取得高拟合优度(R2>0.88),表明其具有强泛化能力和捕获断面异质性的能力。
综上所述,提出模型为长期水质预测提供了稳健准确的解决方案,对环境监测、预警系统和可持续水资源管理具有实际应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号