《British Accounting Review》:Machine Learning-Driven Prediction of Coal Pyrolysis Product Distribution and Multi-objective Optimisation of Pareto Frontier
编辑推荐:
余遵义|李洪强|刘根|杨攀西|傅克明|郝宣志|郭伟|杨博伦|张斌|谢涛|吴志强中国陕西省西安市西安交通大学化学工程与技术学院氟氮化学国家重点实验室,邮编710049摘要:煤炭在全球能源消费中占据很大比例;提高其热化学转化效率对于能源安全、低碳转型和增值利用至关重要。热解是煤炭利用
余遵义|李洪强|刘根|杨攀西|傅克明|郝宣志|郭伟|杨博伦|张斌|谢涛|吴志强
中国陕西省西安市西安交通大学化学工程与技术学院氟氮化学国家重点实验室,邮编710049
摘要:
煤炭在全球能源消费中占据很大比例;提高其热化学转化效率对于能源安全、低碳转型和增值利用至关重要。热解是煤炭利用的关键步骤。预测热解产物的分布是优化热解过程和有针对性地调控产物的基础。传统的实验方法耗时且成本高昂。现有的动力学预测模型存在结构复杂或精度有限的问题,无法满足工业生产和科学研究的需求。为了实现煤炭热解产物的准确且低成本的预测,本文构建了一种改进的混合预测模型SSA-BOA-BPNN,该模型结合了麻雀搜索算法(SSA)和蝴蝶优化算法(BOA)以及反向传播神经网络(BPNN)。对于三相产物分布、焦油组分分布、焦油分数组成和热解气体组成,平均预测精度分别达到了0.9508、0.9699、0.9294和0.9758。该模型的预测精度和泛化性能显著优于传统的BPNN、单一算法优化模型和其他常用模型。为了为热解产物的调控和过程优化提供指导,通过多目标Pareto前沿优化得到了典型烟煤和褐煤的最佳热解条件,这些条件对应于优化目标的最优范围(包括焦油产率和轻质焦油比例、焦油中的芳香烃和酚类化合物含量、气体产率和焦油产率)。研究结果实现了煤炭热解产物分布的准确、高效和低成本预测,为促进煤炭热化学转化技术的发展提供了重要参考。
引言
2024年,全球煤炭消费量超过了87.7亿吨,占全球一次能源消费的27.9%,提供了34.3%的电力供应[1]、[2]、[3]。煤炭在全球能源消费中的关键地位依然不可动摇。热解通常是煤炭利用的关键步骤,也是煤炭转化过程中极其重要的一环。煤炭热解是一个高度复杂的过程,大致可以分为三个阶段[4]、[5]:干燥脱气、分解和解聚、二次脱气。有关热解过程中涉及的物理和化学过程的信息可以参考补充材料中的第S1节。传统的实验方法获取煤炭热解产物分布的效率非常低,无法满足工业生产的需求。通过建立热解过程模型,可以预测热解产物的分布。目前,一些学者基于先进的表征方法建立了一系列热解网格动力学模型,如CPD模型[6]、FG-DVC模型[7]和FLASHCHAIN模型[8]。然而,这些模型的结构较为复杂,调整过程繁琐,限制了它们的进一步推广和应用[9]、[10]。相关学者试图简化煤炭热解过程,并开发了简化的动力学模型。其中,一步法模型最为常见,广泛应用于煤炭热转化研究[11]、[12]。模型中使用的参数主要来源于文献,仍有许多数据需要通过实验获得,整个过程耗时且劳动强度大[13]、[14]、[15]。此外,一步法模型没有考虑复杂的反应路径,无法揭示反应机理或阶段变化。而且,对热解产物中特定组分的预测性能较弱[16]、[17]、[18]。由于模型过于简化,预测精度有限,且对关键参数的依赖性较强,适应热解条件变化的能力较差。为了提高预测性能,相关学者尝试结合多种模型,如PC Coal Lab[19]、PKP[20]和TDP[21]。尽管这些模型的加入可以有效提高一步法模型的预测性能,但这些模型通常受到商业封闭保护的制约,使用门槛较高。
机器学习模型能够自动捕捉数据集中的复杂关系,并通过更新训练数据来适应变化,显示出强大的通用性和适用性[22]、[23]。目前,机器学习模型已广泛应用于碳氢资源转化领域。Wang等人[24]基于ANN和RF构建了生物炭产量的预测模型,证实了ANN模型的预测性能更好。Hao等人[25]使用基于分类树和回归树以及极端回归树的算法模型对碳氢资源的热解进行了建模,通过深入研究输入参数,探讨了输入变量对目标输出的贡献,并提出了输入参数的优化建议。Zhang等人[26]基于RF模型实现了生物油的产量预测,并分析了生物质组成和热解条件对模型预测的贡献。Wang等人[27]在参数调整后使用RF、SVR和XGBoost对煤炭热解产物进行了预测,并评估了输入特征对模型预测的影响。总体而言,现有的碳氢资源热转化预测模型主要以树基模型为主,如RF。然而,这类机器学习模型在预测目标变量范围之外的数据时表现较差,对实际生产过程的指导作用有限[28]。相比之下,ANN模型能够学习数据集中的极端复杂非线性关系和特征交互作用,能够更准确地模拟数据中的复杂模式,表达数据的能力更强[29]。相关研究表明,在许多复杂任务中,ANN模型通常能够实现更高的预测精度,并有效减少过拟合现象。在处理大规模数据时具有更强的可扩展性,泛化能力和预测性能更好[30]、[31]。
本研究基于广泛收集的煤炭热解产物分布实验数据构建了一个数据集,并开发了一个考虑各变量相关性的多输出神经网络模型。该模型通过多种优化算法进行了拟合和优化,得到了用于预测煤炭热解的三相产物分布、焦油组分分布、焦油分数组成和气体组成的预测模型。通过将预测结果与其他模型和实验值进行比较,证实了所构建模型的优越性。基于多目标Pareto前沿优化,筛选出了对应于热解产物分布最优值范围的最佳热解条件,为煤炭热解过程的优化提供了参考。
章节片段
数据收集
在Web of Science、X-MOL、CNKI等软件中输入“煤炭”、“褐煤”、“烟煤”、“热解”、“产物”、“产物分布”、“产量”、“焦油”、“半焦”、“炭”、“气体”、“实验”等关键词,检索到了约120篇关于煤炭热解的已发表实验论文[32]、[33]、[34]、[35]、[36]、[37]、[38]、[39]、[40]、[41]、[42]。这些论文涵盖了煤炭质量分析、热解条件、三相产物分布、焦油分数组成等方面的数据
数据统计与分析
箱线图可以直观地展示数据集中的数据分布情况,通过显示最小值、最大值、中位数和四分位数来呈现数据的集中趋势和离散程度,有助于优化数据集。图S1展示了输入特征的统计结果,包括元素分析、最终分析以及热解条件(反应压力、热解温度、粒径等)。图S2展示了输出结果的统计结果
结论
基于广泛收集的煤炭热解产物分布实验数据,开发并验证了一个基于SSA-BOA联合优化算法的神经网络模型,实现了对煤炭热解产物分布的精确预测。该模型有效结合了SSA的快速收敛特性和BOA的信息交换机制,从而显著克服了传统BPNN模型受局部最优解限制的问题
CRediT作者贡献声明
郝宣志:验证、数据整理。郭伟:软件、资源、调查。杨博伦:撰写 – 审稿与编辑、资源获取、资金筹集。张斌:撰写 – 审稿与编辑、监督、资金筹集。谢涛:撰写 – 审稿与编辑、监督、资金筹集。吴志强:撰写 – 审稿与编辑、监督、资金筹集。余遵义:撰写 – 原初稿、方法论、概念构建。李洪强:验证、数据整理。刘根:
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
致谢
国家自然科学基金(U24B6016)、中国华能集团有限公司的能源安全技术专项项目(HNKJ20-H87-03)、陕西能源实验室的科技计划(ESLB202430)、学科人才引进高校计划(B23025)以及煤炭转化国家重点实验室基金(资助编号J26-27-103)的财政支持。同时,作者也非常感谢