TabNet和GrowNet机器学习模型用于预测苯基甲苯-二苯基甲苯作为液态有机氢载体的性质

《International Journal of Hydrogen Energy》:TabNet and GrowNet machine learning models to predict properties of benzyltoluene-dibenzyltoluene as a liquid organic hydrogen carrier

【字体: 时间:2026年04月27日 来源:International Journal of Hydrogen Energy 8.3

编辑推荐:

  液态有机储氢载体(LOHC)BT/DBT混合物的热物理性质预测研究中,采用传统机器学习(随机森林、KNN)和深度学习(TabNet、GrowNet)模型,通过RMSE、R2等指标评估显示GrowNet性能最优(密度RMSE=0.438,R2=0.9998;热膨胀系数RMSE=0.0127,R2=0.9995;等温压缩率RMSE=0.0198,R2=0.9998),SHAP分析验证了输入参数的影响机制,异常检测证实模型泛化能力。

  
阿米尔·侯赛因·谢赫肖埃伊 | 雷扎·扎比希
伊朗克尔曼省沙希德·巴霍纳尔大学石油工程系

摘要

二苯基甲苯(DBT)和苯基甲苯(BT)混合物是高效的液态有机氢载体(LOHCs),适用于安全、大规模的氢储存以及与现有基础设施的集成。在本研究中,应用了传统的机器学习模型(如随机森林(RF)和K-最近邻(KNN)以及先进的深度学习模型(如TabNet和GrowNet),来预测BT/DBT混合物的关键热物理性质,包括密度、热膨胀系数和等温压缩性。对各种统计误差进行了评估,如均方根误差(RMSE)、平均绝对百分比相对误差(AAPRE)、标准差(SD)、平均绝对误差(MAE)和决定系数(R2)。结果表明,GrowNet的表现优于所有模型,获得了最低的误差和最高的准确性:密度的RMSE为0.438,R2为0.9998,AAPRE为0.0311;热膨胀系数的RMSE为0.0127,R2为0.9995,AAPRE为0.1211;等温压缩性的RMSE为0.0198,R2为0.9998,AAPRE为0.2304。在三个热物理性质上,模型的效率顺序为GrowNet > TabNet > RF > KNN。Shapley加性解释(SHAP)分析揭示了输入参数的影响,基于杠杆的异常值检测证实了模型的稳健性。这些结果表明,GrowNet能够可靠地捕捉温度和压力依赖的性质变化,能够泛化到未见数据,并为建模复杂的LOHC系统提供了强大的潜力,支持高效、安全和可靠的氢储存技术。

引言

化石燃料目前供应了全球约75%的能源,是温室气体排放的主要驱动因素,对全球变暖、空气污染和气候相关灾害负有重大责任。它们的燃烧会释放大量二氧化碳、硫氧化物和氮氧化物,加剧温室效应并降低空气质量[1]。化石燃料储备的有限性以及环境和健康影响促使全球寻求更清洁的替代品[2,3]。由于氢能源具有高能量密度、多功能性和零排放特性,它已成为一种有前景的替代品[4,5]。作为一种清洁燃料,氢可以在运输、工业和发电等多个领域得到应用,唯一的副产品是水[[6], [7], [8]]。氢能与燃料电池技术的兼容性及其在现有能源系统中的大规模集成潜力,使其成为向低碳、可持续能源转型的重要推动力。
氢储存对氢经济的发展起着关键作用,是生产与最终使用之间的重要纽带[9,10]。传统的物理储存方法(如压缩和液化)面临安全、成本和可扩展性方面的挑战,这推动了化学储存方法的发展[11,12]。其中,液态有机氢载体(LOHCs)作为一种有前景的途径,能够实现大规模、安全且经济可行的氢储存和运输。LOHCs是通过催化加氢可逆结合氢并通过脱氢释放氢的有机化合物。这种方法不仅提供了有利的储存和处理条件,还利用了现有的燃料分配基础设施,使LOHCs成为促进向低碳、可持续能源系统转型的有力候选者[13]。
在各种LOHC候选者中,苯基甲苯(BT)和二苯基甲苯(DBT)因其高氢储存容量、有利的热物理和化学性质以及适用于大规模应用而特别吸引人。基于BT和DBT的LOHCs表现出优异的热稳定性和化学稳定性,能够进行多次加氢-脱氢循环而不会显著降解,这对于长期氢储存和运输至关重要。它们相对较高的沸点、较低的蒸气压、良好的毒理学特性、商业可用性以及在常温下的液态特性,使得它们可以安全处理并无缝集成到现有的燃料分配基础设施中,成为实际应用中的领先候选者[[14], [15], [16], [17], [18]]。尽管基于DBT的系统因其较低的蒸气压和出色的稳定性而被广泛认为是工业上的最佳选择,但其较高的粘度(尤其是在低于常温的温度下)和较慢的脱氢动力学可能会在某些操作条件下限制其性能。相比之下,基于BT的系统由于分子尺寸较小而表现出较低的粘度和更快的脱氢动力学,但其较高的蒸气压则使得氢的纯化变得复杂。将这两种LOHC系统混合可以有效利用它们的互补性质,从而得到一种粘度降低、在催化剂孔内质量传输和扩散改善、氢释放速率提高的多组分载体,同时保持足够低的蒸气压以实现高效的氢分离。这些改进归因于BT的快速脱氢、有效氢分压的降低以及两种LOHC组分之间的转移加氢效应。因此,BT/DBT混合物代表了一种可调且面向应用的LOHC概念,克服了单组分系统的关键限制,扩大了高效、安全和可扩展的氢储存和运输的操作窗口[19]。
热力学性质对于基于LOHC的氢储存和运输系统的设计和安全运行至关重要,确保了效率和经济效益。在这些性质中,密度起着核心作用,因为它常用于跟踪加氢反应的进展,并与混合LOHC的组成一起决定了氢的储存质量和体积潜力[20,21]。除了密度之外,派生性质如等温压缩性和热膨胀系数对于预测LOHC流体在不同操作条件下的行为也至关重要。等温压缩性描述了载体体积对压力变化的响应,为优化反应器条件和维持过程控制提供了宝贵的见解。热膨胀系数表明了流体随温度膨胀的程度,这对于设计储存罐、管道及相关基础设施以适应加氢-脱氢循环或环境温度变化过程中的压力波动和结构应力至关重要。准确了解和考虑这些性质对于维持系统稳定性、高效泵送、受控操作以及LOHC氢储存技术的长期可靠性至关重要[18,22]。尽管热力学和热物理性质很重要,但它们的实验测定通常与高昂的实验室成本、复杂的实验设置和大量时间消耗相关,特别是对于在宽温度和压力范围内运行的LOHC系统。因此,热力学模型通常被用作估计这些性质和支持过程设计和优化的有效替代方法。然而,传统的立方状态方程(如PR EoS、SRK EoS和RK EoS)尽管简单且广泛使用,但在准确预测碳氢化合物的液相密度、焓和熵以及比热容方面存在显著限制,尤其是在不同的温度和压力条件下[23]。这些模型严重依赖于临界性质,而这些性质往往不可获得或高度依赖于实验数据,限制了它们的预测能力。相比之下,基于统计力学的先进热力学模型(如P-C-SAFT和SAFT-γ Mie)在模拟复杂的混合LOHC系统方面提供了更高的准确性和灵活性[24,25]。尽管P-C-SAFT和SAFT-γ Mie等先进热力学模型提高了准确性,但它们在捕捉复杂非线性关系方面仍然有限,并且严重依赖于可用的实验数据[26]。为了解决这些限制,机器学习和深度学习方法作为预测LOHC系统热力学性质的有力替代方案应运而生。与传统基于方程的模型不同,机器学习技术可以直接从数据中捕捉复杂非线性依赖关系,而无需对潜在的物理形式做出明确假设。此外,训练有素的机器学习模型表现出高预测准确性,并具有泛化到未见条件的能力,使得在现有实验数据范围之外进行可靠的性质估计成为可能。虽然传统机器学习模型可能仍存在外推能力有限的问题,但先进的架构(如深度神经网络和混合建模框架)提供了更高的鲁棒性、更好的泛化能力和更优的性能,使其特别适合于复杂LOHC系统的热力学性质预测[[27], [28], [29]]。
为了解决传统热力学模型在捕捉LOHC系统复杂和非线性行为方面的固有局限性,本研究首次应用机器学习技术来预测用作LOHC的BT和DBT混合物的热物理性质。在这项工作中,使用了传统的机器学习算法(包括RF和KNN)以及先进的深度学习架构(即TabNet和GrowNet)来建模基于BT/DBT的LOHC系统的关键热物理性质。这些数据驱动模型的预测性能不仅在它们之间进行了系统评估和比较,还与广泛使用的热力学状态方程模型进行了比较,从而全面评估了它们表示复杂LOHC行为的能力。此外,还对GrowNet模型应用了Shapley加性解释(SHAP)分析,以量化各个输入参数对模型预测的贡献和影响,提供了有价值的物理洞察力和可解释性。最后,通过异常值检测和可靠性分析检验了所提出模型的稳健性和泛化能力,证明了它们适用于实际工程应用,并具有克服传统热力学方法预测局限性的潜力。

数据收集

实验数据来自文献[22]。在这项工作中,温度(T)、压力(P)和苯基甲苯的摩尔分数(XBT)被用作输入,以预测密度(ρ)、热膨胀系数(αp)和等温压缩性(κT)。表1展示了输入和输出参数的关键统计指标,图1(a)展示了相应的箱形图,而图1(b)展示了本研究采用的工作流程示意图。

K最近邻(KNN)

K-最近邻(KNN)算法是一种简单而有效的监督学习方法,属于非参数模型类别[32]。它通常应用于回归和分类问题,特别是在关于数据分布的先验信息有限的情况下。在KNN回归中,新数据点的预测值是通过平均其K个最近邻居的输出来计算的,其中邻近性通常使用...

结果与讨论

表S1–S3表示了每个模型用于预测密度、热膨胀系数和等温压缩性的最佳超参数值。为了评估模型在预测密度、热膨胀系数和等温压缩性方面的性能,我们使用了统计误差指标和图形分析。这一评估的详细结果在以下部分中呈现。

结论

在这项研究中,我们研究了BT和DBT混合物的关键热物理性质——密度、热膨胀系数和等温压缩性的预测,这两种混合物被广泛认为是有效的LOHCs。为此目的,我们使用了传统的机器学习模型(RF和KNN)和先进的深度学习模型(TabNet和GrowNet)。在所有评估的模型中,GrowNet表现出最佳的预测性能,获得了最低的误差和最高的准确性。

CRediT作者贡献声明

阿米尔·侯赛因·谢赫肖埃伊:撰写——原始草稿、验证、方法论、调查、数据整理、概念化。雷扎·扎比希:撰写——审阅与编辑、验证、监督、方法论、调查、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号