在低频数据环境下,利用TAM-BiLSTM模型提高水质预测的准确性

《Journal of Water Process Engineering》:Improving the accuracy of water quality prediction using the TAM-BiLSTM model under low-frequency data scenarios

【字体: 时间:2026年04月24日 来源:Journal of Water Process Engineering 6.7

编辑推荐:

  针对低频数据下的废水水质预测难题,提出时空注意力增强的BiLSTM模型,通过时间距离衰减机制优化特征提取,有效提升预测精度,在减少30%采样频率时仍保持0.81的R2值。

  
吴晓宇|易曼

摘要

面对快速的全球城市化和工业化,污水处理厂(WWTPs)面临着满足排放标准和控制成本等压力。准确预测进水水质对于减少能源消耗和确保出水合规性至关重要。尽管已经提出了许多预测方法,但水质预测任务在数据方面仍面临挑战。在实际场景中,传感器漂移、设备维护和数据传输中断等因素往往导致监测记录稀疏。在这项研究中,通过降低高频数据的采样率来模拟低频条件,以模拟基础设施限制导致数据收集不密集的情况。由于低频数据丢失了大量时间信息,因此该模型使用此类数据的预测准确性受到限制。本研究提出了一种时间特征增强模型(TAM-BiLSTM),以解决低频数据对预测准确性的影响。该模型根据历史观测数据的滑动窗口预测下一个时间步的COD负荷。它结合了增强的时间注意力机制和BiLSTM。通过引入时间-距离衰减偏差,模型自动重新分配时间步的权重,减少信息较少步骤的影响,同时优先考虑与预测目标最相关的步骤。通过进行模拟不同数据收集间隔的对比实验,结果表明,当时间分辨率和训练样本量同时减少时,BiLSTM的R2值降至0.2131,而TAM-BiLSTM在保留的测试集上仍保持0.8134。需要指出的是,本研究中的低频条件是通过系统地降低原始1分钟序列的采样率来模拟的,而不是通过更粗的间隔进行自然采集。

引言

污水处理厂(WWTPs)是城市水环境管理的核心基础设施[1];其稳定高效的运行直接影响水资源保护、生态安全和公共卫生[2]。随着全球城市化和工业化的加速,废水排放量持续增加[3]。随着环境标准的提高和行业向智能化转型发展,污水处理领域现在面临三大挑战:满足排放标准、提高能源效率和控制成本[4]。WWTPs是复杂的非线性系统,其运行受到多种因素的影响,包括进水流量、污染物浓度、化学条件和水力条件。这些系统表现出显著的时间动态变化[5]。水质参数的时间序列预测是WWTPs智能控制的关键技术,因为其预测准确性直接决定了过程优化的及时性和有效性[6]。准确预测进水水质参数,特别是COD负荷和氨氮等关键指标的动态变化,为调整曝气强度和优化化学药剂剂量等过程决策提供了实时的科学依据[7],从而有可能提高处理效率并降低出水超标风险[8]。
传统的进水水质预测方法主要依赖于基于物理和生化过程的机制模型。这些模型试图通过数学方程描述废水处理过程中的生化反应动力学来预测进水水质。活性污泥模型(ASMs)是这一领域的里程碑式成就。通过整合多种生化过程(包括微生物生长、底物降解和硝化-反硝化),它们为废水处理过程设计提供了重要的理论工具[9]。这些传统的机制模型虽然具有某种理论基础,但存在显著局限性。它们的应用面临许多实际困难,因为模型包含数十个需要校准的参数。例如,广泛使用的ASM3模型需要确定大约30个化学计量和动力学参数——包括异养生物的最大特定生长率、衰减系数和半饱和常数——并且添加不同的模块(如生物磷去除模块)会显著增加参数数量。校准和验证这些参数需要大量的实验数据,使得校准过程耗时且劳动密集,同时需要操作人员具备高水平的专业知识[10]。由于实际废水处理过程中涉及高度复杂的生化反应网络,机制模型不可避免地依赖于简化假设以降低计算复杂性。这种简化使得模型难以准确捕捉系统的非线性动态。当面临进水水质或运行条件的显著波动时,这些模型的预测准确性会显著下降,限制了它们在实时控制优化中的应用价值[11]。
随着人工智能的快速发展,机器学习方法由于其强大的非线性映射能力和不需要明确机制假设的优势,逐渐成为废水处理质量预测的研究热点[12]。人工神经网络[13]、[14]、支持向量回归[15]、[16]、极端梯度提升[17]、[18]、随机森林[19]、[20]、贝叶斯网络[17]等算法已广泛应用于WWTPs的水质预测。深度学习技术的不断成熟催生了专门为时间序列数据设计的神经网络模型,成为水质预测的有希望的解决方案。循环神经网络[18]、门控循环单元(GRU)[19]、[20]、[21]和长短期记忆(LSTM)网络[22]、[23]、[24]等深度学习模型在预测进水水质方面取得了显著成果,因为它们具有强大的时间特征提取能力[19]。张等人开发了一种残差LSTM模型用于预测WWTPs的进水水质,展示了LSTM架构在捕捉水质参数之间的非线性依赖性方面的优越能力[25]。曹等人提出了一种结合卷积神经网络和门控循环单元的混合模型,并通过图卷积网络进一步优化,该模型已应用于提高WWTPs的进水预测性能[26]。尽管深度学习模型在连续高频率采样下具有强大的预测能力,但在实际工程应用中,水质数据通常表现出低频或不规则采样的特征。在实践中,这表现为由于成本或策略限制导致的规则性稀疏采样,或者由于设备维护中断或通信中断导致的 irregular 缺失块[27]、[28]。增加数据采样间隔会破坏时间信息的连续性。传统的深度学习模型难以从稀疏的时间点捕获有效的特征表示,导致预测准确性显著下降[29]。使用低频数据进行预测的模型更容易受到干扰,例如偶然的流入冲击负荷和传感器漂移。现有模型缺乏针对性的抗干扰机制,导致预测结果不稳定、不可靠,无法满足实际工程需求。因此,迫切需要开发新的方法来预测低频水质数据[30]。
在实践中区分不同类型的数据退化非常重要,因为它们呈现出根本不同的建模挑战。首先,规则性降采样降低了时间观测的密度,同时保持了采样模式的规律性。这是本研究主要关注的场景,并通过系统地降低原始1分钟序列的采样率来模拟。其次,不规则的缺失块(由设备维护中断、传感器故障或通信故障引起)导致无法预测的持续时间和时序的间隙;本研究也包括了在这种场景下的补充实验。第三,传感器漂移和噪声(由污染、校准错误或干扰引起)独立于采样频率影响数据质量。第四,过程冲击(由风暴事件或工业排放引起的进水负荷的突然大幅变化)代表真正的过程动态,而不是数据质量问题,是模型注意力机制的关键关注对象。TAM-BiLSTM主要针对第一种场景设计,对第二种场景进行了补充评估,对第三和第四种场景的鲁棒性作为次要结果进行了评估。
尽管关于深度学习用于水质预测的文献越来越多,但相对较少的研究明确讨论了模型在稀疏或退化监测条件下的鲁棒性。马等人应用深度矩阵分解结合深度神经网络从港口水中的稀疏观测矩阵预测5天BOD,证明了缺失数据会显著降低标准预测器的性能,并且明确建模数据稀疏性对于可靠的软感知是必要的[31]。王等人进一步证明,具有频繁间隙的沿海水质时间序列(由仪器故障、生物污染和传输错误引起)与完全观测的序列存在根本不同的建模挑战,标准插值基的插补无法捕捉此类数据的非平稳动态[32]。总体而言,这些研究揭示了一个一致的问题:现有模型主要在连续高频率采样条件下进行评估,而在规则性稀疏采样(由于成本或基础设施限制故意增加观测间隔)下的行为仍然研究不足。特别是,没有先前的研究在受控的WWTP进水预测环境中量化了标准循环架构在一系列采样间隔下的退化行为。
为了解决这些挑战,本研究提出了一种双向长短期记忆(BiLSTM)网络,该网络增强了时间注意力模块(TAM),专门用于低频进水预测。TAM的核心新颖性在于在注意力评分函数中引入了时间-距离衰减偏差项。与标准缩放点积注意力不同,所提出的机制通过减去与时间间隔成比例的项来明确惩罚远距离查询-键对之间的注意力分数。这种结构修改编码了归纳偏见,即低频WWTP进水序列中时间相邻的观测值比远距离观测值更有可能对当前状态提供信息,这是之前废水预测研究中使用的标准注意力机制所没有捕捉到的属性。需要特别指出的是,在本研究中,高频数据指的是1-2分钟的采样间隔,在这种间隔下,大多数深度学习模型由于足够的时间分辨率而能够实现满意的预测性能。相比之下,低频数据对应于3-10分钟的采样间隔,代表了在资源受限或大规模监测部署中常见的情况,其中密集连续采集不切实际。通过对时间序列数据应用不同的权重,它自动关注高价值的时间步,同时抑制冗余的干扰信号。这有效地解决了低频流入数据的挑战,在这种情况下,有效特征占比较小,而干扰信号的影响较大。BiLSTM的双向时间捕获能力与注意力机制的特征增强效果相结合,使得在低频采样条件下能够彻底探索时间依赖性,并提高特征提取效率。为了进一步评估模型的工程适用性,开发了一个结合整体拟合能力和动态预测能力的二维评估框架,更好地满足了废水处理过程控制的实际需求。同时,引入了SHapley Additive exPlanations(SHAP)方法进行特征贡献分析,以验证模型的合理性,确保预测结果为过程优化提供可解释的参考。

数据来源

本研究使用了来自中国广东省惠州市的一个全尺寸厌氧-缺氧-好氧(AAO)WWTP的进水监测数据。该厂服务于一个市政流域,全年连续运行。数据由在线传感器在大约17天的连续时间内记录(代表该厂的一个案例研究),仪器以1分钟间隔进行测量,包括在线COD分析仪、电磁流量计等。

TAM-BiLSTM的预测性能

预测间隔直接决定了下游WWTP控制系统的响应能力。在1分钟分辨率下,操作人员可以主动调整曝气、加药和循环,以应对快速的变化;在10分钟间隔下,进水变化与控制响应之间的滞后显著增加,降低了系统预先应对突发干扰的能力。以下实验量化了这一范围内预测准确性的下降情况,并证明了

结论

在全球城市化和工业化加速的背景下,废水排放量的激增给WWTPs带来了满足排放标准同时控制成本的压力。为了解决在数据采集成本受限的情况下进水水质参数预测准确性不足的工程挑战,本研究提出了一种时间特征增强的BiLSTM。通过结构创新和机制优化,该模型实现了高精度

CRediT作者贡献声明

吴晓宇:撰写——原始草稿、可视化、验证、软件、方法论、形式分析。易曼:撰写——审阅与编辑、监督、资源获取、数据管理、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了国家自然科学基金22478141)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号