《International Journal of Hydrogen Energy》:An explainable deep learning framework for hydrogen production via supercritical water gasification: Focusing on interaction analysis and accurate prediction
编辑推荐:
超临界水气化(SCWG)为湿生物质高效制氢提供途径,但其复杂多相反应动力学导致传统经验调控困难。本研究提出CNN-LSTM-DDAT可解释深度学习框架,通过Chameleon Swarm Algorithm优化模型参数,实现氢产量预测R2达0.993,RMSE≈0.443 mol/kg。注意力机制揭示温度与停留时间协同效应,元素含量对高温工况氢产率影响显著,为SCWG工艺优化提供可解释预测工具。
李在鑫|葛亚东|袁壮|王志|陶俊宇|李健|周胜全|朱晓超|严北北|陈冠毅
天津大学环境科学与工程学院,天津,300072,中国
摘要 超临界水气化(SCWG)是一种将湿生物质高效转化为氢气的途径。然而,复杂的化学反应过程使得通过经验评估实现稳定控制和生产变得困难。一种可解释的预测性仿真方法可能有助于克服这些障碍。本研究将氢气生产预测问题构建为基于表格输入的监督回归问题,并提出了一种紧凑且可解释的深度学习模型。结果表明,Chameleon Swarm Algorithm(CSA)能够识别出最准确的模型配置。在10折交叉验证中,该模型的预测精度很高(R2高达约0.98),而通过CSA优化的模型在R2约为0.993的情况下,均方根误差(RMSE)为约0.443摩尔/千克。交互作用分析显示,在较高温度和较短至中等停留时间内,氢气产量更高;此外,灰分和氮的含量在高温下对氢气产量的影响更为显著。这一框架为SCWG过程中氢气生产的预测及操作条件的优化提供了指导。
引言 随着对化石燃料枯竭、气候变化和环境退化的日益关注,可持续和低碳能源系统的发展已成为全球性的战略重点。在可再生能源中,生物质因其潜在的低碳利用潜力而备受关注,这取决于原料来源和生命周期系统的边界,同时生物质还具有广泛的可用性,并且可以转化为多种燃料和化学品[1,2]。根据国际能源署的预测,到2050年,现代生物能源可能占全球能源需求的15%至20%,凸显了其在未来能源体系中的关键作用[3]。特别是作为清洁高效的能源载体,通过生物质气化生产氢气已经引起了广泛关注,因为这种方法可以实现高效率和低污染排放[4]。然而,生物质的高水分含量限制了其在传统气化过程中的直接应用,尤其是在湿生物质(如污泥、藻类和禽粪)的情况下[5]。生物质干燥所需的大量能源输入会负面影响整个转化过程的能量效率和经济效益[6]。此外,从气化过程中获得的合成气仍需进一步净化以提高氢气浓度并去除焦油,这也降低了气化生产氢气的经济效益[7]。
超临界水气化(SCWG)作为一种高效的替代技术,能够在不进行干燥预处理的情况下直接将湿生物质转化为富含氢气的合成气。SCWG在水的热力学临界点(374°C和22.1 MPa)以上运行,在该温度下,水会转变为超临界状态,从而增强传质效果、具备非极性溶剂特性和快速扩散能力[8]。这些条件促进了反应速率的提高,碳转化效率的提升,并减少了焦油和炭等副产物的生成。与传统的气化方法相比,SCWG具有更高的氢气浓度和无需干燥基质的显著优势[9]。然而,SCWG过程受到复杂的多相反应、复杂的传输机制以及原料组成、温度、压力和停留时间等因素之间的非线性关系的影响[10,11]。这些因素共同使得SCWG性能的控制变得复杂,并阻碍了过程的优化。因此,开发一种稳健的、数据驱动的、可解释的建模策略对于指导SCWG的操作和设计至关重要。
传统的建模方法,如热力学平衡分析、反应动力学和计算流体动力学,已被广泛用于研究SCWG[12,13]。尽管这些模型提供了宝贵的理论见解,但它们依赖于理想化的假设、难以获得的详细动力学数据以及计算成本较高的仿真[14,15]。这些限制了它们在实际SCWG条件下捕捉真实反应动态和支持自适应控制或实时优化的能力。
近年来,机器学习(ML)作为一种强大的数据驱动方法,已成为模拟SCWG性能的有效工具[16]。ML模型可以直接从数据中学习输入和输出之间的复杂非线性关系,而无需明确的反应机制。这使得ML特别适用于SCWG等多变量过程,在这些过程中,原料特性(如元素含量、组成和热值)和过程条件(温度、停留时间和固体浓度)共同决定了氢气的产量[17,18]。然而,大多数“静态”学习模型将输入视为可交换的特征向量,这可能限制了它们表示变量间条件依赖性和上下文敏感相互作用的能力。
多种ML模型已被应用于SCWG以提高预测精度,包括集成方法、神经网络以及结合热力学和学习组件的混合框架[19][20][21]。Azadvar和Tavakoli(2024)应用了四种机器学习模型,并结合粒子群优化(PSO)进行氢气产量预测,取得了0.95的R2[19]。相比之下,Santos J等人(2024)开发了一种结合简化热力学模型和ML的混合建模框架,实现了约0.99的预测精度[21]。此外,越来越多的研究开始关注模型的可解释性,而不仅仅是追求高预测精度。Khandelwal等人(2025)结合PSO优化的CatBoost模型和SHAP分析来识别影响SCWG性能的关键变量[17]。Zhang等人(2022a)和Aslam Khan等人(2024)通过SHapley Additive Explanations(SHAP)的交互图揭示了原料特性和过程条件之间的非线性依赖关系[22,23]。这种对可解释性的关注凸显了朝着物理可解释的ML方法发展的趋势,以优化生产过程。然而,生物质的不同特性和过程条件之间存在相互作用,这些因素共同决定了SCWG系统的氢气产量。目前,很少有ML模型能够直接捕捉在不同输入条件下的变量交互变化。
本研究通过关注模型结构而非数据处理来改进SCWG建模,以实现准确且可解释的预测。主要目标如下:
(1) 开发了一种混合卷积神经网络-长短期记忆-双向通道点积注意力(CNN-LSTM-DDAT)模型。在该模型中,卷积部分学习局部模式,门控循环机制保持了不同因素之间的长距离关联,双向自注意力机制捕捉了全局交互作用。这种结构使得生物质特性和过程条件在SCWG过程中得以关联。
(2) 通过比较不同模型组件的效果,发现完整的混合模型在准确性和可解释性之间取得了最佳平衡。
(3) 通过双向注意力和可解释性分析实现了模型的可解释性。注意力权重显示了重要变量及其相互关系,而SHAP和部分依赖性图将这些结果转化为简单实用的运行规则。
数据来源 本研究收集了2015年至2025年间发表的实验性SCWG研究文章中的数据集,这些文章通过搜索Google Scholar、ScienceDirect和Web of Science数据库获得。共从30篇SCWG研究文章中提取了285个相关数据点用于ML建模(详见表S1)。数据使用WebPlotDigitizer Version 4从表格或图表中提取,该工具的链接为:
https://apps.automeris.io/wpd/index.zh_CN.html 。
生物质特性与SCWG
数据预处理 图2显示了填充缺失值前后17个重要变量的统计分布。结果表明,该方法遵循了方程(1)和(2)中的填充规则,将缺失数据从5.9%减少到0%,同时没有改变原始数据模式或变异性。C、H、O、N和S元素的四分位数在填充前后几乎相同,所有变量的中位数变化小于±2%。例如,C元素从45.8%增加到46.7%(+1.9%),H元素...
结论 本研究通过严格的数据整理和可解释的深度学习框架,推进了生物质SCWG过程中氢气生产的数据驱动预测。研究中训练了一个紧凑的CNN-LSTM-DDAT模型,并评估了六种基于群体的优化器在匹配协议下的表现。优化后的模型在交叉验证和保留测试中均取得了高精度(R2≥0.99),并且其预测结果与已建立的化学理解一致。SHAP...
作者贡献声明 李在鑫: 撰写——原始草案、方法论、数据整理、概念化。葛亚东: 撰写——审阅与编辑、方法论、概念化。袁壮: 撰写——审阅与编辑、验证、方法论、形式分析。王志: 撰写——审阅与编辑、验证、方法论、形式分析。陶俊宇: 可视化、方法论、数据整理。李健: 资源获取、调查。周胜全: 调查、数据整理。朱晓超: 监督
利益冲突声明 作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
致谢 本研究得到了国家重点研发计划 (编号2024YFF0505801)、国家自然科学基金 (编号52336008)和国家自然科学基金 (编号52506264)的支持。