图注意力增强的混合深度学习模型用于城市污水处理厂出水总氮和总磷预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Water》：A Graph Attention-Enhanced Hybrid Deep Learning Model for Effluent Total Nitrogen and Total Phosphorus Prediction in Municipal WWTPs

【字体：大中小】 时间：2026年06月10日 来源：Water 3

编辑推荐：

　　准确的出水水质预测对于提高污水处理厂（WWTP）中氮、磷去除性能及降低能耗至关重要。然而，废水处理过程中存在的强耦合性、高噪声和时间滞后效应为现有预测模型带来了重大挑战。本研究提出了一种GAT-CNN-LSTM（GCL）模型用于出水总氮（TN）和总磷（TP）的

准确的出水水质预测对于提高污水处理厂（WWTP）中氮、磷去除性能及降低能耗至关重要。然而，废水处理过程中存在的强耦合性、高噪声和时间滞后效应为现有预测模型带来了重大挑战。本研究提出了一种GAT-CNN-LSTM（GCL）模型用于出水总氮（TN）和总磷（TP）的预测。该GCL模型首先采用图注意力网络（GAT）自适应地学习变量间关系，随后应用卷积神经网络（CNN）和长短期记忆（LSTM）网络提取局部和长期时序特征。该GCL模型使用来自中国北方某城市污水处理厂的真实运行数据进行训练与评估。基于各模型的最优运行结果，与LSTM和Transformer相比，GCL在TN预测中将R²分别提高了13.7%和6.4%，同时将MAPE分别降低了39.4%和30.4%。对于TP预测，R²的相应提升分别为70.7%和59.1%，MAPE的降低幅度分别为37.1%和36.0%。消融实验进一步证实了三个模块的互补贡献，表明基于图的特征融合增强了后续的时序建模。邻居注意力权重的时间变化分析以及一次一因子（OAT）敏感性分析提供了与A²/O工艺机制一致的解释性。这些发现基于来自单一污水处理厂有限数据集的初步验证，其在更多样化运行条件下的更广泛适用性有待进一步研究。

本研究旨在构建一种能够有效应对城市污水处理厂出水水质预测挑战的数据驱动模型。随着中国城镇化进程持续深入及环境法规日趋严格，城市污水处理厂在保护受纳水体和满足更严格排放标准方面发挥着关键作用。氮、磷等营养物质的排放受到严格管控，已有研究报道淡水系统中总磷（TP）和总氮（TN）的富营养化阈值分别为0.02–0.10 mg P L^?1和0.50–1.00 mg N L^?1。然而，在满足严格排放要求与降低能耗之间取得平衡仍是大多数污水处理厂面临的主要挑战。准确控制出水水质对于现代污水处理厂实现达标排放与节能降耗具有重要意义。

传统自动控制策略如比例积分微分（PID）控制、专家控制系统和模糊逻辑控制主要基于反馈机制，其性能在进水水质显著波动时受限。因此，具有预测能力的控制策略近年来受到越来越多的关注。模型预测控制（MPC）和强化学习控制（RL）能够预测过程演化并基于过程响应优化控制动作，但其有效性依赖于对关键指标的准确预测。数据驱动模型相比机理模型更适合此类场景，因其能更有效地捕捉复杂非线性关系且对显式过程机理的依赖较低。传统机器学习方法已在出水预测中展现出良好性能，但其表征复杂系统动态的能力有限。长短期记忆（LSTM）网络因其能捕捉非线性时序依赖并缓解传统循环神经网络的梯度消失问题而被广泛应用于出水水质预测。为进一步提升预测性能，研究者开发了多种LSTM变体，融入注意力机制、卷积结构、编码器-解码器框架等架构增强手段。然而，这些方法主要关注时序依赖，缺乏有效表征过程变量间复杂耦合关系的机制。

图注意力网络（GAT）由Veli?kovi?等人于2018年提出，能够通过注意力机制自适应地学习相邻节点的重要性，实现对图结构数据的灵活有效表示学习。GAT已在多个水相关领域得到应用，但主要应用于具有明确空间结构的预测任务，用于表征污水处理系统内部耦合过程变量的研究仍然有限。

基于此，本研究提出了一种GAT-CNN-LSTM（GCL）混合模型，用于利用城市污水处理厂数据预测出水TN和TP。GAT模块将过程变量视为图节点以自适应学习变量间关系，CNN模块提取局部时间波动模式，LSTM模块捕捉长期动态依赖。通过整合这三个组件，所提出的模型联合表征变量交互与时序动态，从而提升出水水质预测性能。本研究的主要贡献包括：提出了面向污水处理厂出水TN和TP预测的GCL框架；通过变量级图构建和加性注意力聚合，使GAT模块自适应识别相邻变量的重要性并提取互补信息；结合注意力追踪方案和一次一因子（OAT）敏感性分析，揭示GAT学习的时间变化变量间关系并量化各输入变量对预测性能的贡献。

研究数据来源为中国北方某采用厌氧/缺氧/好氧（A²/O）工艺的市政污水处理厂。共监测26个变量，包括进水特性、过程变量、控制变量和出水指标。数据记录间隔为15分钟，涵盖2021年11月1日至12月31日的5856个样本。数据集按时间顺序划分为训练集（70%）、验证集（15%）和测试集（15%）。数据预处理包括缺失值前向填充、Hampel滤波器异常值检测、基于最大信息系数（MIC）的特征选择及z-score标准化。最终数据集包含5807个有效时间步长和21个变量。

研究所采用的关键技术方法包括：图注意力网络（GAT）用于自适应学习变量间关系，通过完全连接图将各时刻输入变量视为图节点，采用加性注意力聚合机制；一维卷积神经网络（1D-CNN）沿时间维度进行卷积操作，提取短期局部波动模式；长短期记忆网络（LSTM）捕捉长期时序依赖。模型将GAT更新后的节点表示展平并与目标变量历史值拼接，构建新的序列表示，依次经过CNN和LSTM处理后生成预测值。基线模型包括多层感知器（MLP）、极端梯度提升（XGBoost）、LSTM和Transformer。采用均方误差（MSE）作为损失函数，使用决定系数（R²）、平均绝对百分比误差（MAPE）和百分比偏差（PBIAS）评估模型性能，并通过分裂共形策略构建校准预测区间。输入序列长度设置为48个时间步（12小时），考虑水力传输滞后和反应延迟特性。

模型预测性能比较结果：GCL在TN和TP预测中均取得最佳整体预测性能。对于TN预测，GCL的R²为0.83，MAPE为4.49%；MLP表现最弱，R²为0.08，MAPE为15.32%；XGBoost取得中等性能；Transformer表现优于LSTM但提升有限。GCL取得了最低的系统性偏差（PBIAS为0.72%）。对于TP预测，GCL的R²为0.70，MAPE为3.94%；值得注意的是TP整体预测精度低于TN，这归因于TP浓度极低（均值0.03 mg/L）、动态范围狭窄（0.01–0.10 mg/L）及信噪比较低。XGBoost在TP预测中表现优于LSTM和Transformer。所有模型对TP均存在系统性高估。不确定性评估方面，TN的90%和95%校准区间覆盖率分别为0.854和0.918，TP区间略偏保守。

消融实验分析结果：CNN-LSTM相较于LSTM提升有限；GAT-LSTM取得更显著改善，表明显式建模变量间关系比仅依赖局部时序特征提取更为关键，该效应在TP预测中更为明显；GCL的最佳性能表明三模块组合具有协同效应，GAT模块的特征增强使CNN和LSTM更易捕捉时序模式。

邻居注意力权重时间变化分析结果：选取溶解氧（ML-DO-2）和缺氧区末端溶解氧（AX-DO-alym）为代表性节点分析。对于ML-DO-2，注意力权重最高的邻居包括曝气流量、溶解氧指标、氧化还原电位等，与A²/O系统工艺机制一致。注意力权重随时间动态调整，如进水流量（INF-FLOW）权重随实际流量增加而上升，弱耦合变量如温度（AM-T）保持相对稳定。分析表明GAT模块不仅能区分变量相关性，还能根据相邻变量的实际变异性调整动态响应程度。

OAT敏感性分析结果：对于TN预测，氧化还原电位（AX-ORP-1）影响最强，去除后R²从0.83降至0.79，MAPE从4.41%升至5.33%；进水流量（INF-FLOW）次之。对于TP预测，进水氨氮（INF-NH₄⁺）影响最强，去除后R²从0.70降至0.41，MAPE从3.94%升至5.77%。值得注意的是，去除回流量（RAS-FLOW）和排泥量（WAS-FLOW）反而改善了TP预测性能，表明这些变量在当前数据条件下可能引入了额外噪声，选择性排除可能提升预测性能。

多步超前预测性能结果：在15分钟和1小时短期预测中， persistence基准因强时间自相关性而极具竞争力。2小时及以上预测中，所有模型的R²均转为负值。TN预测中，GCL在2小时和4小时以MAPE衡量优于persistence（2小时：15.07% vs. 17.36%；4小时：17.18% vs. 18.53%），8小时优势消失。TP预测中，persistence在所有研究时段均优于GCL，且差距随预测时距增加而扩大。但GCL在所有TP预测时距上均优于LSTM基线，表明GAT和CNN模块仍具价值。

研究结论部分翻译：本研究提出了一种GAT-CNN-LSTM模型用于污水处理厂出水TN和TP预测，并使用两个月的真实运行数据进行了初步验证。与基线模型相比，GCL取得了最佳的整体预测性能和更高的稳健性。消融结果确认了基于GAT的变量交互建模是最关键的组成部分，三个模块形成了互补的建模流程。解释性分析进一步表明，GAT模块能够响应变化的过程条件自适应调整邻居重要性，并识别出对TN和TP预测最重要的输入变量。总体而言，GCL在提升预测准确性的同时，从变量交互和变量重要性两个角度提供了有用的解释性。然而，由于数据集的限制，需要进一步研究和验证以评估所提出模型的更广泛适用性。未来研究的重要方向包括：使用来自多个污水处理厂的更长监测周期数据评估模型的泛化能力；探索融入过程知识的图构建方法以提升预测性能和解释性；进一步研究模型的多步预测能力及其与预测控制的潜在集成。

联系信箱：

粤ICP备09063491号

热点排行