使用STL分解和贝叶斯优化的并行xLSTM-Informer模型用于长期溶解氧预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Ecological Informatics》：Parallel xLSTM-informer model for long-term dissolved oxygen prediction using STL decomposition and Bayesian optimization

【字体：大中小】 时间：2026年04月02日 来源：Ecological Informatics 7.3

编辑推荐：

　　溶解氧（Dissolved Oxygen, DO）是地表水生态系统中水质的重要指标。现有预测模型在全面提取水质数据特征方面存在局限性。为解决这一局限，研究人员提出了一种并行STL-BO-xLSTM-Informer模型，其中STL模块捕获季节性和趋势成分，In

溶解氧（Dissolved Oxygen, DO）是地表水生态系统中水质的重要指标。现有预测模型在全面提取水质数据特征方面存在局限性。为解决这一局限，研究人员提出了一种并行STL-BO-xLSTM-Informer模型，其中STL模块捕获季节性和趋势成分，Informer模块捕获长期时间依赖性，xLSTM模块提取局部时间特征和波动模式。研究使用2021年1月至2023年12月期间长江重庆段六个采样点（S1-S6）的每四小时水质数据作为数据集。该模型通过与基线模型（iTransformer、Autoformer、Crossformer、TimesNet和Informer）的比较，以及使用xLSTM-Informer作为基础模型在S6处进行的消融实验（消融变体包括STL-BO-Base、BO-Base和STL-Base）进行了验证。结果表明，STL-BO-xLSTM-Informer模型有效捕获了水质数据的内在特征和时空特性。与基线模型相比，MAE、RMSE和SMAPE分别降低了27.54%、21.55%和27.27%，R²提高了6.6%。STL-BO-xLSTM-Informer模型在预测精度上优于所有基线模型，在S6处的性能排名如下：STL-BO-xLSTM-Informer > Informer > iTransformer > TimesNet > Crossformer > Autoformer。

这篇论文解读文章基于发表在《Ecological Informatics》上的研究，围绕溶解氧（Dissolved Oxygen, DO）长期预测模型展开。以下为详细解读：

**研究背景与问题**

长江流域作为中国重要的淡水生态系统，其水质监测对生态保护至关重要。溶解氧（DO）是评价地表水环境质量和生态系统健康的关键指标，低DO水平常与富营养化及水生生物分布变化相关。然而，现有预测模型面临多重挑战：第一，DO时间序列包含多尺度模式，短期波动与长期趋势并存，传统方法（如统计模型或单一深度学习模型）难以联合建模；第二，原始DO序列具有非平稳性和噪声干扰，掩盖了趋势和季节结构；第三，模型性能对超参数高度敏感，手动调优效率低且易陷入局部最优。为此，研究人员提出一种并行STL-BO-xLSTM-Informer模型，旨在通过分解预处理、并行架构和自动超参数优化，提升长期DO预测的精度和鲁棒性。

**关键技术方法**

研究人员使用了以下主要方法（样本数据来源：中国环境监测总站，长江重庆段S1-S6六个国家监测断面，2021年1月至2023年12月，每4小时一次观测，共6571条记录，涵盖DO、pH、浊度、水温（WT）、电导率（EC）五个指标）：（1）STL分解（Seasonal-Trend decomposition using LOESS）：将原始DO序列分解为趋势、季节和残差分量，降低非平稳性。（2）xLSTM（Extended Long Short-Term Memory）：通过指数门控和矩阵记忆单元，增强局部特征提取和短时依赖建模。（3）Informer：采用ProbSparse自注意力机制和自注意力蒸馏，高效捕捉长期时间依赖。（4）贝叶斯优化（Bayesian Optimization, BO）：基于高斯过程代理模型，在有限评估预算内自动搜索最优超参数组合。以上模块以并行架构集成：STL输出与原始特征共同输入，xLSTM和Informer并行提取局部与全局特征，融合后经全连接层输出预测。

**研究结果**

**3.1 与基线预测模型的比较**
研究人员以S6站点为代表，在1步至12步（对应4小时至48小时）预测区间上，将提出模型与Informer、iTransformer、Crossformer、Autoformer、TimesNet对比。结果显示，提出模型在所有步长上均取得最优性能：在12步时R²达0.9134，MAE为0.1319，RMSE为0.1918，SMAPE为1.87%。与最优基线Informer相比，MAE、RMSE、SMAPE分别降低13.65%、14.03%、13.94%，R²提升2.01%。性能排序为：提出模型 > Informer > iTransformer > TimesNet > Crossformer > Autoformer。配对t检验表明提出模型与各基线差异显著（p<0.05）。

**3.2 跨监测断面泛化能力**
研究人员将提出模型应用于全部6个站点进行12步预测。各站点预测值与观测值的时间序列曲线和散点图显示紧密吻合，最小R²达0.88以上，说明模型在同类河流系统内具有一致的泛化能力和断面鲁棒性，即使面对短期剧烈波动也能有效追踪。

**3.3 多步预测误差分析**
通过比较MAE和RMSE随步长的变化及箱线图分布，提出模型在所有步长上中位数和上尾误差均最低。尤其在长步长（如12步）时，提出模型误差分布集中，大误差事件少，优于各基线。Autoformer因依赖自回归机制，误差随步长累积明显；Informer虽接近，但其稀疏注意力对噪声敏感，长步误差上限较高。

**3.4 消融实验**
以xLSTM-Informer为基础模型（Base），分别加入BO（BO+Base）、STL（STL+Base）及完整模型（STL-BO-xLSTM-Informer）。在12步预测中，Base相对于单独Informer已提升R² 1.35%；BO+Base相对于Base降低MAE 6.55%、提升R² 2.65%；STL+Base相对于Base降低MAE 13.37%、提升R² 3.96%。完整模型相对于Base总体降低MAE 27.54%、RMSE 21.55%、SMAPE 27.27%，提升R² 6.60%。这表明STL分解和贝叶斯优化通过不同机制（STL减少序列非平稳性，BO优化模型拟合）协同提升预测精度。

**讨论与结论**

**讨论总结**：
研究结果表明，将数据分解、并行多尺度特征提取与自动超参数优化有机整合，可有效克服单一模型在长期DO预测中的局限性。STL分解通过分离趋势和季节分量，降低了原序列的非平稳性，使模型能更专注学习稳定模式；xLSTM与Informer的并行结构互补了局部波动与全局依赖的建模能力；贝叶斯优化则在有限计算预算下高效获取了更优超参数。消融实验验证了各模块的独立贡献和集成增益。此外，跨站点测试表明模型具备良好的泛化性，能适应不同断面的异质性。但研究也指出预测精度随步长增加而下降，且当前评估局限于单一河段和时段，未来需在更多流域、更长时段下验证。此外，计算开销（训练时间、参数量）未予分析，预测变量仅包含少数水质指标，未来可引入降雨、径流等外部驱动因子以进一步提升鲁棒性。

**翻译研究结论（4. Conclusion）**：
本研究提出了一个集成STL分解和贝叶斯优化的并行xLSTM-Informer长期预测模型。利用2021年1月至2023年12月长江重庆段6个监测站点的每4小时DO数据，通过与5个基线模型比较及消融实验，全面评估了模型预测能力。主要发现如下：
(1) 提出模型有效捕获了水质时间序列的时间依赖关系，预测性能提升。在比较的6个模型中，精度排序为：提出模型 > Informer > iTransformer > TimesNet > Crossformer > Autoformer。
(2) STL模块显著增强了模型提取周期、季节和噪声相关特征的能力，改善了长期非线性DO序列的预测效果。相比xLSTM-Informer基础模型，STL增强模型（STL-Base）使MAE、RMSE、SMAPE分别降低13.37%、13.14%、12.58%，R²提高3.96%。
(3) 贝叶斯优化实现了超参数自动调优，进一步提升了预测精度。相比基础模型，BO+Base变体使MAE、RMSE、SMAPE分别降低6.55%、7.09%、6.90%，R²提高2.65%。
(4) 完整集成模型展示了优越的长期预测精度和鲁棒性（MAE=0.1319，RMSE=0.1918，SMAPE=1.87%，R²=0.9134），并在所有监测断面取得高拟合优度（R²>0.88），表明其具有强泛化能力和捕获断面异质性的能力。
综上所述，提出模型为长期水质预测提供了稳健准确的解决方案，对环境监测、预警系统和可持续水资源管理具有实际应用价值。

联系信箱：

粤ICP备09063491号

热点排行