超越经典力场:基于物理原理对Grappa机器学习得到的FoldBind数据集上力场的评估

《ChemPhysChem》:Beyond Classical Force Fields: Physics-Driven Assessment of the Grappa Machine-Learned Force Field on the FoldBind Dataset

【字体: 时间:2026年04月24日 来源:ChemPhysChem 2.2

编辑推荐:

  机器学习替代经验力场,通过FoldBind基准集(18系统含14蛋白质折叠和4结合诱导折叠)评估采样方法和力场准确性。MELD框架利用贝叶斯推断整合有限数据,平衡探索与利用,高效访问传统方法难以达到的构象,验证力场在复杂状态下的物理真实性。

  

摘要

基于物理的方法依赖于精确的力场和高效的采样技术,以提供对生物分子系统的机制性理解。最近的人工智能技术正在改变这一领域,用机器学习模型取代了基于手动整理的原子类型经验性拟合的力场。实现这些新力场与现有采样策略之间的互操作性,并在远超近似天然状态的挑战性基准测试集上进行验证,对于该领域的进展至关重要。为此,我们引入了FoldBind基准测试集,该集合包含了18个系统,其中包括14个蛋白质折叠案例和4个在结合过程中发生折叠的肽-蛋白质复合物。这套测试集通过探究构象转变和结合诱导的折叠,扩展了现有的验证工作,为采样方法和力场的准确性提供了严格的测试。为了研究这些系统,我们采用了“利用有限数据的建模”(MELD)框架作为采样引擎。MELD通过将模糊或噪声较大的物理约束(例如,蛋白质通常会形成疏水核心的一般预期)整合到贝叶斯推理框架中,加速了构象探索的过程。通过平衡探索(广泛的构象搜索)和利用(稳定符合物理和数据的结构),MELD能够有效地获取传统分子动力学方法无法获得的类天然状态。在相同的数据条件下,力场的质量决定了哪些状态能够被稳定下来,以及正确的天然构象是否能够出现。此外,力场在多种数据兼容状态中持续稳定天然构象的能力,为其物理真实性提供了额外的衡量标准。总之,FoldBind基准测试集以及MELD中使用的相关信息,可以用来评估和区分未来的力场开发工作。

图形摘要

“利用有限数据的建模”(MELD)框架将机器学习与分子物理学相结合,实现了精确的、数据驱动的蛋白质折叠过程,能够更高效地引导未折叠的蛋白质集合向其天然结构过渡,同时提高了采样精度和收敛速度。

利益冲突

作者声明没有利益冲突。

数据可用性声明

Grappa开发分支:https://github.com/PDNALab/meld-grappa

主要MELD仓库:https://github.com/maccallumlab/meld

教程:https://github.com/maccallumlab/meld/tutorials

FoldBind数据集:https://github.com/PDNALab/FoldBindDataset

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号