基于机器学习的热解生物炭逆向设计及工艺优化以实现强化脱氮:一种采用堆叠集成方法的框架

《Process Safety and Environmental Protection》:Machine learning-assisted inverse design of pyrolyzed biochar and process optimization for enhanced denitrification: A stacking ensemble-based framework

【字体: 时间:2026年03月21日 来源:Process Safety and Environmental Protection 7.8

编辑推荐:

  基于生物炭特性的反硝化效率优化及机器学习模型构建研究,通过整合XGBoost、CatBoost和LightGBM的堆叠模型(Stacking3)与人工神经网络,建立了双目标预测模型(R2=0.95/0.89,RMSE=0.038/0.086),并利用遗传算法(GA)结合合成数据集(n=3000)确定了最优生物炭原料(甘蔗渣)及工艺参数(300-500℃、8-10小时等)。实验验证显示模型预测误差分别为16.90%和5.27%,为可持续废水处理提供数据驱动解决方案。

  
Jingang Huang|Ruilin Wang|Weishuai Li|Yang Yang|Hai Wang|Wei Han|Huanxuan Li|Jie Liu|Shanshan Qiu|Xiaobin Xu|Pingzhi Hou
杭州电子科技大学材料与环境工程学院,中国杭州310018

摘要

热解生物炭是一种碳汇材料,来源于生物质,能够改善反硝化过程,从而实现碳中和的废水处理。然而,其效果取决于生物炭特性与操作参数之间的复杂权衡。本研究开发并验证了一种基于堆叠集成模型的机器学习框架,以辅助优化生物炭和工艺条件,从而提高反硝化效率。该模型使用MissForest生成的生物炭-反硝化数据集(n=183)进行训练,结合了XGBoost、CatBoost和LightGBM作为基础学习器,以及ANN作为元学习器,表现出优异的预测性能。在硝酸盐去除效率(NRE)方面的测试R2值为0.95,在生物炭诱导的特定反硝化速率增强(ΔNRR)方面的测试R2值为0.89,相应的测试均方根误差(RMSE)分别为0.038和0.086。通过遗传算法嵌入的优化(Stacking3-GA)在Synthpop生成的生物炭数据集(n=3000)上,确定了最佳原料(甘蔗渣)和热解条件(100°C/min,300–500°C,60–120分钟),以及相应的操作参数(8–10小时,1.4–1.6克/升,31–32°C,pH 7.8–8.1)。在这些优化配置下的实验验证证实了预测的准确性,ΔNRR的相对误差为16.90%,NRE的相对误差为5.27%。这项工作建立了一种数据驱动的策略,用于智能设计生物炭并优化操作条件,以推进可持续的反硝化过程。

引言

反硝化是废水处理中关键的生物氮去除(BNR)过程,其效果受到多种因素的限制,包括碳源的可用性、电子/物质传递动力学、溶解氧(DO)浓度、水力停留时间(HRT)和操作温度(Ucar等人,2025年)。在碳受限和/或低温条件下,加速从有限的有机电子供体向硝酸盐(NO??-N)的电子传递仍然是实现高效和经济反硝化过程的基本挑战(Tang等人,2024年;Yang等人,2025b年)。通过减少能源和化学物质的消耗来克服这些挑战,对于推动废水处理向碳中和目标迈进至关重要。
热解生物炭是一种通过热解各种生物质原料产生的碳汇材料,由于其石墨结构和氧化还原活性位点,它在解决电子传递限制方面展现出巨大潜力(Wu等人,2025年;Zhang等人,2023年)。在反硝化系统中,生物炭不仅作为促进生物膜形成和细胞外聚合物物质(EPS)分泌的微生物载体,还通过其固有的导电性和电子传递功能基团(例如酚羟基和醌基团)介导直接和种间电子传递(Chen等人,2025b年;Yang等人,2025a年)。生物炭的这种多功能性有助于优化反硝化途径,提高反应动力学,并降低能源消耗。先前的研究已经证实,在较低的热解温度(300–500°C)下生产的生物炭可以提高关键反硝化酶(Nar、Nir、Nos)的活性,并增加功能性微生物的数量(Guo等人,2023年;Li等人,2025b年)。
然而,生物炭特性与反硝化性能之间的复杂相互作用和内在权衡带来了重大挑战。具体来说,原料类型和热解条件极大地影响了电子传递能力、表面化学性质和孔结构(Xu等人,2025年)。例如,高温热解(600–900°C)可以提高导电性和疏水性,但会减少氧化还原功能基团的含量;而低温热解(300–500°C)虽然保留了电子传递功能基团,但导电性和微生物附着能力较低(Oliveira等人,2017年)。此外,生物炭增强反硝化涉及多因素、非线性和随机相互作用,这些相互作用难以用传统实验方法进行优化(Wang等人,2024a年)。鉴于这种复杂性,迫切需要先进的数据驱动方法来指导生物炭的合理设计,以增强反硝化效果。
机器学习(ML)建模已成为一种强大的工具,可以自主解析生物炭特性和操作参数对这些可持续BNR过程的复杂影响,实现无需先验机制假设的预测建模和逆向优化(Fu等人,2025年;Zhong等人,2021年)。然而,当应用于生物炭-反硝化研究中常见的小规模、稀疏或不完整的数据集时,这些模型的准确性往往受到限制。为了解决这些问题,可以采用堆叠学习等集成方法,结合基础学习器和元学习器来提高预测性能并降低过拟合风险(Bakir和Orak,2024年;Ramya等人,2024年;Wang等人,2021年)。此外,合成数据生成可以帮助扩展有限的数据集,提高模型的鲁棒性和泛化能力(Alvi等人,2024年;Kim等人,2025年)。这些方法共同有效地解决了ML建模过程中的不确定性,降低了实验成本,并建立了生物炭特性与反硝化效果之间的定量映射。
本研究汇编了一个基于文献的数据集,其中包含了关键的生物炭特性和反硝化条件参数,用于建立闭环ML建模框架,以选择最佳的生物炭和相应的工艺参数来增强反硝化效果。具体目标包括:(1)开发一个堆叠集成ML模型,准确预测NO??-N去除效率(NRE)和生物炭诱导的特定反硝化速率增强(ΔNRR);(2)在合成生成的生物炭数据集中集成遗传算法(GA),同时优化生物炭特性和反硝化工艺参数;(3)在优化结果下对反硝化性能进行实验验证。本研究为可持续的生物炭增强反硝化过程向碳中和目标迈进提供了数据驱动的途径。

数据集片段

生物炭-反硝化数据集来源

本研究使用的原始生物炭-反硝化数据集包含了来自相关文献的183条观测记录,涉及各种生物炭辅助的反硝化系统(图S1)。输入变量包括各种生物炭特性和操作参数。生物炭特性包括元素组成(C%、N%、H%、S%、O%)、比表面积(SSA)、总孔体积(TPV)和表面功能基团(C-H、C=O、C=C、O-H、C-O、-OH、C-O-C、C-N-C、COOH、N-H)。

原始数据分析和预处理

使用四分位数范围(IQR)方法分析了原始生物炭-反硝化数据集中的反硝化操作参数和生物炭特性的变异性(表S1和S2)。操作参数的频率分布显示,进水NO??-N浓度存在显著变化(5.11–526.15毫克/升),表明该数据集涵盖了多种废水类型和处理场景,包括地表水、市政废水和工业废水

结论

本研究开发了一个闭环ML框架和数据驱动的方法,用于智能逆向设计和优化可持续的生物炭增强反硝化过程。Stacking3集成模型结合了XGBoost、CatBoost和LightGBM作为基础学习器,以及ANN作为元学习器,在NRE和ΔNRR方面表现出优异的预测性能,测试R2值分别为0.95和0.89,测试RMSE分别为0.038和0.086。通过遗传算法嵌入的优化(Stacking3-GA),

未引用的参考文献

(Martín-Calzada等人,(2025))

CRediT作者贡献声明

Hai Wang:可视化、软件。Yang Yang:可视化、软件、数据管理。Weishuai Li:验证、研究、数据管理。Ruilin Wang:撰写——初稿、可视化、验证、研究、数据管理。Shanshan Qiu:软件、方法论。Jie Liu:撰写——审稿与编辑。Huanxuan Li:撰写——审稿与编辑、资源管理。Wei Han:撰写——审稿与编辑、方法论。Jingang Huang:撰写——审稿与编辑、撰写——初稿、指导。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了浙江省自然科学基金(LY23E080007)、国家重点研发计划(2022YFE02107002)和浙江百顺服装有限公司(KYH203124019M)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号