《International Journal of Biological Macromolecules》:Artificial intelligence-driven insights into the modulation of enzyme activity toward accelerated industrial applications
编辑推荐:
AI驱动的酶工程在工业生物技术中的应用与挑战,涵盖结构预测、突变效应分析及生成式设计方法,优化酶活性、稳定性和底物特异性,面临数据稀缺与模型可解释性难题。
韩红梅|张琪|陈月|王梓轩|苏新元|朱一博|王星龙|冯梓轩
苏州工业职业技术学院生物与食品工程学院,中国江苏省苏州市南三环路99号,215500
摘要
人工智能(AI)已成为工业酶工程中的变革性工具,它将酶活性的优化方式从经验驱动转变为数据驱动的理性调节。最近的人工智能方法不仅超越了传统的结构引导策略,还能够预测功能残基、估算突变效应,并设计出具有增强催化性能的酶序列。本综述系统地探讨了AI驱动的酶活性调节方法的最新进展,重点关注其在工业中的应用。首先概述了主要的酶类及其相关的调控挑战,然后深入介绍了结构预测、突变效应预测和生成设计框架等AI方法。来自食品加工、生物医学和生物技术等行业的精选案例研究展示了AI在酶工程中的实际影响。最后,综述指出了数据稀缺性、模型可解释性以及计算预测与实际工业应用之间的差距等关键挑战。将AI与实验系统相结合为未来的发展提供了有希望的途径,旨在实现稳健且可扩展的酶设计与工业应用。
引言
酶作为工业生物技术中最重要的生物催化剂之一,已广泛应用于食品加工、动物饲料、制药、生物能源和环境相关领域。全球工业酶市场主要由水解酶(约占40-52%)和氧化还原酶(约占19-23%)主导,这两种酶占据了全球酶生产和商业使用的绝大部分[1]、[2]、[3]。大规模分析表明,水解酶、氧化还原酶和异构酶在商业应用中占据主导地位,并且占据了全球酶生产的绝大部分[1]。它们具有高催化效率——通常表现出10^3至10^6 s^-1的转化数(K_cat)——以及显著的底物选择性,这使得它们能够在温和条件下(如常温和中性pH值)高效地进行转化,因此成为传统化学催化剂的理想替代品[4]、[5]。然而,在实际的工业环境中,只有少数酶系统能够大规模应用[6]。许多天然酶在面对非天然底物、高温或复杂反应环境时表现出较低的活性和稳定性。例如,活性-稳定性权衡分析显示,增强活性的突变往往会降低酶的熔点(T_m)约5-15°C,严重限制了其工业应用性[7]。同时,传统的酶工程仍然主要依赖于经验驱动的突变和筛选方法,通常需要经过多轮筛选10^4至10^6个变体,导致开发周期长且整体效率低[8]、[9]。这些限制阻碍了酶性能快速准确地适应不断变化的工业需求,因此开发更高效和可预测的优化策略成为工业生物技术中的一个关键挑战。
为应对传统酶开发策略的局限性,越来越多的研究开始探索基于人工智能(AI)的工具在酶设计和优化中的应用[10]、[11]。在本综述中,人工智能(AI)一词被广泛定义为包括各种数据驱动的计算算法,而不仅限于深度神经网络方法。具体来说,我们的定义涵盖了用于初始性质预测的传统机器学习算法、用于复杂结构和突变效应建模的先进深度学习架构,以及用于新型序列设计的新兴生成模型和蛋白质语言模型。通过整合这些多样化的方法,AI提供了一个全面的工具包,从根本上重塑了理性的酶工程。最近的进展表明,数据驱动的模型能够高精度地预测酶的关键性质,如催化活性、热稳定性和底物特异性。例如,机器学习模型在评估脂肪酶的热稳定性或转氨酶的底物特异性时,经常能够达到80-90%以上的预测准确率或强回归相关性(R > 0.7)[12]。这些AI引导的方法已成功应用于多种工业相关的酶,包括氧化还原酶、水解酶和转移酶,从而显著提升了性能。例如,AI引导的工业植酸酶和转氨酶的工程改造使其活性提高了2到10倍以上,而特定PET降解水解酶的优化则使其在工艺相关条件下的热稳定性提高了5-20°C或酶半衰期延长了数倍[13]、[14]。与此同时,基于深度学习的蛋白质结构预测技术的快速发展使得人们能够更系统地探索酶序列空间,超越了传统的实验直觉[15]、[16]。此外,新兴的生成和优化框架被用来高效地遍历庞大的组合突变空间(通常包含10^7至10^9个可能的变体),或者设计具有新颖或扩展功能的酶,同时大幅减少了实验筛选的工作量[10]、[17]、[18]。这些由深度学习架构和生成算法驱动的技术飞跃正在重新定义生物分子领域,并加速了结构预测向功能性酶工程的转化[19]。总体而言,这些发展表明了向更高效和可扩展的酶工程范式的明确转变,同时也突显了迄今为止报告的各种方法论和应用场景的多样性。
尽管AI已广泛用于酶性能预测和优化,但研究正逐渐转向多性能维度的协同调控[20]。催化活性、底物特异性和热稳定性等关键性质并非独立存在,而是通过酶的结构特征、构象动态和反应动力学紧密耦合[21]、[22]。在不同的酶系统中,这种耦合导致了常见的性能权衡,例如活性提高的同时稳定性降低或底物范围扩大但特异性降低,这使得单目标优化策略难以完全捕捉复杂反应环境中的酶行为[23]。在分子层面,这种限制通常源于不同酶性质之间的结构需求冲突。高催化活性通常需要一个高度灵活的活性位点来促进底物进入、过渡态稳定和产物释放;而高热稳定性则通常需要一个刚性且密集堆积的结构框架。因此,增加活性位点灵活性的突变往往会无意中破坏重要的稳定相互作用网络,导致严重的活性-稳定性权衡。为了解决这一挑战,一些研究开始整合多源信息(包括序列、结构和功能数据),并应用数据驱动的方法来模拟多种性能属性之间的相互关系[24]、[25]。在模型训练或变体筛选过程中,会引入多表型约束或基于帕累托的优化目标。然而,现有研究往往关注特定的性质组合或特定的酶系统,缺乏对AI驱动的多性质协同调控的常见分子水平模式和方法论框架的系统性总结。
基于这一观点,本综述系统总结了AI在工业酶设计和优化应用中的最新进展,特别关注调控催化活性、底物特异性和热稳定性的方法论框架。我们首先概述了常用的AI模型和数据驱动策略,并讨论了它们在模拟酶序列-结构-功能关系中的基本作用。随后,从活性增强、底物特异性调节和稳定性优化的角度,回顾了不同工业背景下的代表性研究和实际应用,强调了各自的优点和局限性。我们进一步探讨了多性质协同优化所面临的挑战,并讨论了新兴生成模型和集成优化策略在应对复杂工业需求方面的潜力。最后,考虑了与数据质量、模型可解释性和实验验证相关的问题,并讨论了AI驱动的工业酶工程的未来发展方向。通过这一系统的概述,本综述旨在为AI辅助的工业酶的理性设计提供一个清晰的概念框架和参考路线图。
工业相关酶的七大主要类别
酶的系统分类通常基于国际生物化学与分子生物学联合会(IUBMB)建立的酶委员会(EC)编号系统[26]。该系统根据酶所催化反应的化学性质将酶分为七大类,为理解酶的功能多样性和其在工业生物技术中的应用提供了一个统一的理论框架(图1)。
氧化还原酶(EC 1)
AI驱动的酶设计方法及其研究进展
传统的酶设计长期以来依赖于物理化学建模方法,如分子对接、分子动力学模拟和能量计算,以阐明催化机制并指导理性突变[51]。尽管这些方法提供了强大的机制解释能力,但它们通常需要大量的计算资源,采样效率有限,并且严重依赖于准确的力场和初始构象。因此,
食品和工业生物技术中的AI驱动酶设计
近年来,AI技术已成为工业酶工程的关键驱动力。在食品和工业生物技术领域,基于AI的方法能够预测蛋白质结构,同时支持有益突变的识别,从而显著提升了酶的催化性能[99]、[119]。一个典型的例子是由某大学研究团队开发的自主智能酶工程平台
当前现状、关键瓶颈和AI驱动的工业酶工程的未来方向
在工业酶工程领域,AI正逐渐从一个传统的辅助工具发展成为重塑酶设计和修改逻辑的关键技术。尽管数据驱动的建模方法已经取得了显著进展,但整个领域仍处于快速发展阶段,AI在工业应用中的全部潜力尚未完全实现。本章概述了AI在工业酶工程中的当前应用现状
结论
本综述全面讨论了AI在工业酶工程中的最新进展和应用模式,强调了其在方法论和实践工程方面的变革性影响。通过整合来自序列、结构和功能的多维数据,基于AI的方法为理性酶设计、性能优化和决策过程建立了新的框架。这显著拓宽了设计
CRediT作者贡献声明
韩红梅:撰写——审稿与编辑、监督、项目管理、资金获取、概念构思。张琪:撰写——审稿与编辑、撰写——初稿、可视化、方法论、形式分析。陈月:撰写——审稿与编辑、撰写——初稿、可视化、方法论、形式分析。王梓轩:撰写——审稿与编辑、可视化、形式分析。苏新元:撰写——审稿与编辑。朱一博:撰写——审稿与编辑。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
致谢
本工作得到了江苏省基础研究计划(项目编号:BK20241615)的支持。