在固液界面模拟中兼顾精度与效率:一种用于MgO水化反应的加速微调策略
《Computational Materials Science》:Bridging accuracy and efficiency in solid-liquid interface simulations: An accelerated fine-tuning strategy for MgO hydration
【字体:
大
中
小
】
时间:2026年04月27日
来源:Computational Materials Science 3.3
编辑推荐:
原子级固液界面模拟受量子精度与计算效率的权衡限制,本文提出融合低精度密度泛函理论(DFT)计算的加速分层精细调优主动学习(AHFT-AL)策略,构建高精度机器学习势能模型,将数据收集时间从数月缩短至数天。以MgO水合反应为例,纳米秒级分子动力学模拟揭示其通过Mg2?外溶及后续离子聚集形成Mg(OH)?层,与金属镁腐蚀机制形成鲜明对比。该框架有效解决了传统主动学习依赖高精度DFT数据带来的效率瓶颈,为复杂界面系统微观机理研究提供高效范式。
王远瑞|周思进|王子良
国家燃煤减排工程实验室,教育部环境热技术工程研究中心,山东大学绿色热能与碳减排重点实验室,中国山东省济南市250061
摘要
原子尺度下的固液界面模拟对于能源和环境应用至关重要,但受到量子精度与计算效率之间权衡的限制。虽然机器学习势(MLPs)能够弥合这一差距,但其构建仍受限于高昂的高精度数据采集成本。在此,我们提出了一种加速分层微调主动学习(AHFT-AL)策略,这是一种高效的神经进化势框架,整合了低精度密度泛函理论(DFT)计算。通过纠正低精度数据中的系统误差,该方法将主动学习的时间从几个月缩短到了几天。一旦获得最终训练集,便会统一进行高精度DFT计算,以确保精度的准确性。将这一框架应用于MgO水化过程,我们进行了纳秒级的分子动力学模拟,揭示了一种由溶解驱动的机制:水化过程通过Mg2+的向外溶解及随后的离子聚集实现,最终形成化学计量的Mg(OH)2层。这与金属镁的腐蚀过程形成鲜明对比,后者涉及羟基向内扩散并产生非化学计量产物。这项工作为阐明复杂界面系统中的微观机制提供了一种经济高效、高精度的方法。
引言
固液界面是物理化学中最引人注目的研究领域之一。深入理解这些界面处发生的化学反应的机制和动力学,是推动异相催化、能量存储和环境修复等领域技术创新的基石[1]。在异相催化领域,原子尺度下的动力学研究对于新型功能材料的设计至关重要;特别是,阐明低维系统(如团簇和界面)内的反应机制已成为催化剂开发的核心挑战[2]、[3]、[4]。在能量存储领域,电极/电解质界面处的化学键重组和溶剂化行为直接影响设备的效率和寿命[1];而在碳捕获和地质封存过程中,矿物-水界面处的溶解和沉淀反应对于理解元素地球化学循环至关重要[5]。以氧化镁(MgO)为例,这种第二丰富的矿物[6]在低碳材料和核废料固化方面具有巨大潜力[7]。其水化及随后的碳酸化反应[8]涉及复杂的化学键断裂和重组,是开发环保材料(如负碳水泥[9]、[10])的核心机制。因此,理解固液界面处化学反应的动态演变并精确阐明其微观反应路径已成为现代科学中的紧迫问题[2]。
目前,固液界面处化学反应的模拟主要依赖于两类方法:基于量子力学的方法和基于经验势的传统分子动力学(MD);然而,两者都面临严重的“计算瓶颈”[2]。首先,以密度泛函理论(DFT)为代表的量子力学方法能够从第一性原理出发准确捕捉电荷转移、键断裂与形成以及变化的化学环境,而无需依赖预设参数。然而,其计算成本随系统规模呈指数级或高阶幂函数增长[2]、[11]、[12]。现有的先进算法通常将模拟规模限制在几百个原子和几十皮秒以内。鉴于界面反应相关的原子迁移、溶剂化动力学和产物演变通常发生在纳秒或更长的时间尺度上,从头算分子动力学(AIMD)难以观察到真实的稀有反应事件[2]、[11]。其次,尽管传统的经验势(如EAM、ReaxFF等)具有出色的计算效率,能够模拟包含数百万原子的系统并达到纳秒至微秒的尺度,但它们在精度和普适性方面存在内在缺陷[11]、[13]。因此,现有方法陷入了“高精度”与“大规模”难以兼顾的困境,严重限制了对复杂界面反应机制的深入研究。
近年来,机器学习势(MLPs)作为一种变革性技术迅速崛起。其核心思想是利用机器学习算法拟合来自第一性原理计算的能量和力,从而构建具有原子级精度且计算成本大幅降低的势能面[14]、[15]、[16]。例如,通过引入深度学习描述符,DeepMD实现了对复杂有机分子和材料系统的高精度表征,使得涉及数百万原子的超大规模动态过程成为可能[14]、[17]、[18]。同时,神经进化势(NEPs)在处理热传输和预测大规模材料性质方面展现出巨大潜力,这得益于它们在GPU上的卓越计算效率和优异性能[1]、[19]、[20]、[21]、[22]。这些模型的出现使得在保持接近量子化学精度的前提下探索固液界面的长期时空演变成为可能[23]、[24]。实际上,MLPs已成功再现了金属腐蚀[25]和石英水化[2]等过程中涉及键断裂和形成的复杂反应路径,初步验证了使用物理约束神经网络拟合全原子势能面的可行性。
然而,在实际应用中,从头开始为复杂化学系统构建高精度MLP模型仍面临显著的实际挑战。构建能够覆盖复杂化学反应空间的稳健模型严重依赖于大规模、高质量标记的数据集[14]、[26]。尽管通过迭代的“训练-采样-标记-重新训练”循环引入了主动学习来弥补数据不足[17]、[27],但在处理复杂的固液界面反应路径时,这一工作流程仍存在效率瓶颈。频繁的结构采样通常伴随着高昂的DFT单点计算成本,而在大规模配置空间中定位关键反应配置(如过渡态)需要极高的采样密度[15]、[28]。此外,每次迭代中更新势的训练过程同样耗时[29]。最近,出现了一系列通用机器学习势,包括NEP89[19]、CHGNet[30]和M3GNet[31]。这些模型的核心优势在于它们强大的知识转移能力和出色的数据效率。与“从头开始训练”相比,微调策略能够以最小的数据成本将通用物理定律应用于特定的复杂化学环境。例如,在处理聚合物热接触电阻[32]和界面系统中的能量传输与存储[33]等复杂固液相互作用时,基础模型中已有的化学相似性知识可以显著加速训练收敛[14]。尽管通用大型模型和微调策略展示了巨大潜力,但将它们应用于涉及化学反应的固液界面系统仍面临诸多挑战[15]、[28]。通用大型模型在预测固液界面化学反应方面的直接能力往往有限。现有的微调工作流程通常需要密集的主动学习循环来捕获关键反应配置,这不可避免地会导致高昂的高精度DFT计算成本。特别是在面对庞大的配置空间和复杂反应路径时,平衡模型预测精度与数据采集的计算成本成为一个亟待解决的问题。
在这里,我们提出了一种高效的NEP微调框架,旨在通过整合低精度DFT计算与微调策略来解决复杂界面模拟中精度与效率之间的权衡。该策略被应用于构建MgO–H2O界面反应的高精度势能,成功捕捉了水化过程中涉及的复杂化学路径。它有效克服了传统微调工作流程对昂贵高精度DFT计算的依赖,同时大幅降低了计算成本。此外,所开发的框架为阐明氧化镁水化的微观动力学机制提供了有效方法,并有望高效探索其他固液界面系统中的异相化学反应。
部分摘录
势能构建的整体工作流程
势能的构建包括三个阶段:初始势能构建、主动学习和最终势能训练。初始训练集由手动挑选的代表性结构组成,涵盖了固体基底(Mg、MgO、MgH2、Mg(OH)2)、液态水系统(纯水、OH?/H3O+溶液)以及来自高温AIMD模拟的MgO-水界面配置(表S1)。然后通过10轮主动学习对势能进行了优化
加速分层微调主动学习
在构建涉及化学键断裂和形成的复杂界面反应系统的机器学习势时,由于反应势能面的复杂性,早期迭代常常遇到效率瓶颈。初始模型的精度不足经常导致MD模拟过程中产生非物理结构,而纠正这些结构需要高昂的DFT计算成本。为了解决这个问题,
结论
为了解决固液界面化学反应模拟中的“精度-效率”困境,本文提出了一种高效的NEP微调框架。通过引入AHFT-AL加速策略,并创新性地实施“能量移动”和“维里权重归零”技术,有效解决了主动学习过程中由低精度数据引起的系统偏差和噪声干扰问题。
CRediT作者贡献声明
王远瑞:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,方法论,数据整理,概念化。周思进:撰写 – 审稿与编辑,研究,概念化。王子良:撰写 – 审稿与编辑,验证,监督,项目管理,方法论,资金获取。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
感谢山东省泰山学者青年专家计划(tsqn202312002)和山东省优秀青年科学基金项目(2023HWYQ-022)的支持。本文中的科学计算是在山东大学的高性能计算云平台上完成的。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号