基于大型语言模型的CFD喷雾场模型阶数简化

《Energy》:Model order reduction of CFD spray field based on large language model

【字体: 时间:2026年04月27日 来源:Energy 9.4

编辑推荐:

  液氨闪蒸雾化场预测中基于POD与LLM的快速建模方法,提出POD降维提取主导模态后,利用LoRA微调轻量级LLM实现动态参数到模态系数的高效映射,在保证物理一致性的同时显著降低计算成本,适用于工程数字孪生的实时场重构需求。

  
宋新泽|马耀民|胡勇|赵飞阳|于文斌
山东大学核科学与能源动力工程学院,济南250061,中国

摘要:

计算流体动力学(CFD)能够高精度地捕捉复杂的物理过程,但其高昂的计算成本阻碍了其在数字孪生应用中的实时预测。传统的降阶模型和回归方法受到固定输入-输出维度的限制,这限制了它们在适应运行条件与流场特性之间变化和动态映射方面的灵活性。得益于大型语言模型(LLMs)的进步,本研究提出了一个快速预测框架,该框架整合了适当正交分解(POD)和LLM。首先使用POD将高维喷雾场分解为低维模式和系数,以构建降阶模型(ROM)。然后通过LoRA微调,利用LLM学习运行参数到模态系数的映射,并采用专门为数值回归任务设计的加权交叉熵损失函数。与高斯过程回归(GPR)、决策树(DT)和多层感知器(MLP)相比,所提出的方法在预测准确性、喷雾形态恢复和气体穿透长度预测方面表现更优。预测的喷雾场在物理上是一致的,并且在外推情况下具有很强的泛化能力,验证了预训练LLM在特定领域回归任务中的巨大潜力,为工程数字孪生中复杂物理场的实时建模和快速重建提供了一条新颖且高效的途径。

引言

近年来,以液氨为代表的零碳燃料因其高能量密度、低排放以及安全的储存和运输方式而受到广泛关注[1]、[2]。然而,液氨在低环境压力下容易发生闪蒸沸腾,虽然改善了雾化效果,但同时也会导致喷嘴空化或喷雾崩塌等问题[3]、[4]。随着CFD技术和计算能力的发展,CFD仿真方法已经能够高保真地再现复杂的流场。然而,传统的液滴破碎模型难以准确描述由气泡驱动的液滴闪蒸沸腾破碎行为[4]、[5]。因此,引入了气泡动力学来改进破碎模型。Robinson[6]研究了微重力条件下气泡的生长动力学,包括均匀温度场中的球形气泡和非均匀温度场中加热平面上的半球形气泡,揭示了气泡与周围流体之间的热传递和流动相互作用,并阐明了无界液体中气泡生长的驱动机制。Shin和Park等人基于气泡动力学建立了一个液氨闪蒸沸腾破碎模型,并验证了其在0.1至3 MPa的压力范围内的有效性[7]。Saha等人基于成核理论和RPE分析了液氨喷雾中过热液滴的破碎过程[8]。我们团队之前的研究也基于成核理论和气泡动力学建立了一个多气泡液氨闪蒸沸腾破碎模型,并验证了其在广泛运行条件下的准确性[9]。
然而,复杂的CFD模型在广泛的运行条件下会显著增加计算成本,从而限制了这些模型在数字孪生实时仿真中的应用[10]、[11]。为了解决这一挑战,已经广泛使用了各种模型降阶技术,包括动态模态分解(DMD)和适当正交分解(POD)来处理高维CFD数据[12]。作为主要的降阶方法,POD已成功应用于多种工程场景。Sirovich等人首次将POD引入湍流分析[13]。Luo等人将POD与有限体积方法结合,实现了二维粘弹性问题的高效降维[14]。Yun等人利用POD揭示了反应堆冷却泵内部的流动诱导激励特性[15]。Giorgi等人采用POD和DMD提取了旋流火焰中的相干结构[16]。Chen等人基于POD构建了一个用于燃煤锅炉温度和物种场的快速预测框架,实现了低延迟的高效场重建[17]。这些研究表明,POD可以从高维流数据中有效提取主导特征,并作为CFD加速的可靠工具。
为了满足数字孪生的实时需求,需要能够基于降维后的表达式快速准确地重建物理场信息。尽管DMD和POD等模型降阶方法可以将空间喷雾场分解为由几个模式及其系数表示的低维形式,但降阶模型的实际应用依赖于系统参数到模态系数的快速精确映射。因此,必须建立一种精确高效的回归框架,以实现喷雾场的快速降维重建。目前常见的监督回归算法,如高斯过程回归(GPR)、支持向量机(SVM)、决策树和基于神经网络的回归头,尽管在可解释性、抗过拟合能力和捕捉非线性数据关系方面表现良好,但这些方法仍面临以下问题:一方面,传统模型中输入和输出层数量的增加会导致全连接层的计算成本急剧上升[20];另一方面,所有输入都被处理成固定维度的张量表示[21],这意味着对于处理不同任务的单个模型,输入和输出的维度必须保持不变。一旦维度发生变化,模型就需要重新训练,这种表示瓶颈使得处理动态参数空间变得困难,从而导致跨任务迁移能力的丧失。
得益于大型语言模型(LLMs)的快速发展,它们强大的表示学习和非线性拟合能力为上述问题提供了新的解决方案。LLMs能够突破维度限制,在复杂的回归任务中展现出优异的潜力。对于本研究中基于POD的降阶模型,LLM能够学习运行参数与POD模态系数之间的复杂映射,而这正是传统回归方法难以处理的。然而,直接对LLMs进行全量微调需要巨大的计算资源,并且在小样本条件下容易过拟合和灾难性遗忘。作为一种轻量高效的反向微调策略,低秩适应(LoRA)可以在保持高预测准确性的同时有效降低训练成本,使LLM成为学习运行参数与喷雾场重建之间非线性映射的有前景的工具。
为了解决多相物理场CFD中高计算成本的问题,本研究的目标是提出一个快速喷雾场预测框架,该框架整合了数据降维和大型语言模型,以快速再现我们之前研究中的液氨闪蒸沸腾喷雾场。喷雾场的降阶模型(ROM)是使用POD方法建立的。在我们的ROM中,运行条件参数(例如破碎模型参数)被视为输入,而通过POD分析获得的相应模态系数作为待预测的输出。然后利用LLM的生成能力实现模态系数与模型参数之间的回归。不同运行条件下的破碎参数和模态系数向量被构建成文本描述的输入-输出对,作为LLM的训练集进行标记化处理。在轻量级LLM DeepSeek-R1-Distill-Qwen-1.5B上进行了LoRA微调,在训练过程中根据令牌重要性为交叉熵损失函数分配不同的权重,成功提高了预测的准确性,为将LLM应用于回归任务提供了宝贵的见解。
本研究的结构如下:第2节介绍了本研究中应用的基本方法。2.1节介绍了液氨闪蒸沸腾破碎模型和使用POD建立ROM的基本方法,2.2节介绍了基于大型模型微调的回归方法。第3节展示了该方法的分析结果和一些评估指标的性能。最后,在第4节得出了一些结论。

章节摘录

闪蒸沸腾喷雾模拟和数据降维

基于我们团队之前建立的经过验证的液氨闪蒸沸腾破碎模型[9],通过改变与液滴破碎相关的参数,在不同时间点进行了氨质量分数的模拟,随后对所有喷雾场快照进行了POD处理,以获得模态系数矩阵,从而建立了喷雾场的降阶模型。

训练配置

如上所述,在LoRA微调过程中配置了几个关键参数,如表1所示。在LoRA微调过程中,低秩适配器的秩对微调性能起着关键作用。非常低的会限制适配器的表达能力,使模型无法充分捕捉与任务相关的特征映射;而非常高的则可能引入冗余参数,导致过拟合并增加计算成本

结论

本研究提出了一种基于适当正交分解(POD)和大型语言模型(LLM)的快速液燃料闪蒸沸腾喷雾场降维重建方法,该方法基于CFD结果。使用POD获得的模态系数矩阵作为训练数据,在LoRA微调框架内进行了训练,并在新运行条件参数组合下进行了测试。主要结论如下:
  • (1)
    降阶

CRediT作者贡献声明

马耀民:可视化、研究。胡勇:可视化、研究、概念化。宋新泽:撰写——原始草稿、方法论、研究、概念化。赵飞阳:方法论、研究、概念化。于文斌:方法论、研究、概念化

未引用参考文献

[18]、[19]、[37]、[41]。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作

致谢

作者衷心感谢国家自然科学基金(编号:52406145)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号