《Protein Science》:Integrative SAXS and AFM analysis of engineered carbohydrate-active enzyme assemblies with tunable spatial organization
纤维素酶体(cellulosomes)是多酶组装体,其催化效率取决于各组分空间组织方式。然而,该类复合体显著的构象柔性使得酶间距离与整体拓扑结构的定量表征长期受限。本研究提出了一种方法学框架,利用Jo-In支架固定酶的位置,从而定制化并分析约束型多酶复合体的结构。该复合体由两种内切葡聚糖酶AtCel8A和AtCel9R以及一种木聚糖酶AtXyn11A组成。此方法能够生成明确的组装体结构,并通过小角X射线散射(SAXS)和/或原子力显微镜(AFM)进行表征。对双葡聚糖酶复合体的SAXS分析揭示了对应于不同空间排布所导致的不同压实程度的独特散射图谱。对双功能组装体的互补AFM成像在单颗粒水平上支持了SAXS衍生模型,增强了所提出方法流程的稳健性。三酶组装体的SAXS测量可区分不同构建体,同时显示出相对均一的回转半径(53 ± 2 ?)和180至200 ?的最大尺寸。采用DADIMODO和BILBO-MD两种独立方法进行的全原子建模趋同于一致的平均空间组织,具有受约束的域间距离范围及一致的定量参数,验证了结构模型。综上所述,研究结果建立了设计定制化多酶组装体的定量框架。Jo-In支架为模块化动态蛋白质复合体的结构分析提供了多功能工具,推进了对多酶系统中结构-功能关系的理解。
多结构域蛋白质占所有蛋白质组的一半以上,真核生物蛋白质中高达70%,凸显了模块性在蛋白质进化中的重要性。糖苷水解酶(glycoside hydrolases, GHs)是这一原则的典型代表,其常将催化结构域与非催化糖结合模块(carbohydrate-binding modules, CBMs)相结合。越来越多的证据表明,连接这些结构域的柔性Linker调控酶活性、底物可及性及域间协同效应。自然界在更高层次上利用这种模块性,以纤维素酶体(cellulosome)为例,这是一种专门降解不溶性植物细胞壁多糖的多酶复合体,其中Dockerin模块特异性结合含粘连模块的支架蛋白,使酶在底物及彼此附近共定位。支架蛋白携带的CBM3a靶向结晶纤维素,而相邻Linker影响其定位。"设计型纤维素酶体"(designer cellulosomes, DCs)概念由此产生,其中正交粘连蛋白-Dockerin相互作用使得构建定制化多酶组装体成为可能,其性能通常优于等量的游离酶。
已有研究探讨了DCs中酶空间组织如何影响催化性能。关键变量包括:支架Linker长度、酶定位(可决定协同或反协同效应)、CBM3a的底物靶向位置、支架几何构型,以及游离酶与支架结合酶之间的相互作用。许多研究依赖于支架架构的重大改造以调节酶间距离和相对取向,共同表明性能提升源于酶的紧密空间邻近性及支架柔性——催化域适应不溶性底物的异质性表面,同时限制产物扩散从而触发协同效应。
对纤维素酶体及DCs的结构与生物物理学研究已被广泛用于关联效率与酶空间组织。小角X射线散射(SAXS)可实现复合物的溶液态分析,提供构象涨落、整体尺寸和压实程度的信息。从单酶到双价及三价DCs的SAXS研究揭示了共存的紧缩和伸展构象。分子建模、冷冻电镜(cryo-EM)及原子力显微镜(AFM)等互补技术证实了这种主要由Linker区内在无序性驱动的构象异质性。
基于此,研究人员推测纤维素酶体的柔性通过动态酶定位在催化效率中起关键作用,但酶在水解过程中形成瞬时关联或维持可变酶间距离尚不明确。一个有望解决该问题的策略是将酶固定在明确的刚性空间构型中,系统研究酶间距离对催化的影响。研究人员利用两种工程化蛋白片段Jo和In实现这一目标,二者自发形成不可逆异肽键,产生Jo-In复合体(亦称生物分子焊接工具)。该工具通过将各酶分别融合于Jo或In组分的一端实现酶的刚性定位;混合后Jo和In自发共价结合,锁定融合酶的相对取向,同时保持其独立折叠和催化活性。该策略已成功应用于连接固定空间排布的GHs对或GH与CBM。
本研究以AFM和SAXS约束建模探测三种GHs通过Jo-In偶联形成六种不同复合体的结构组织。研究受"解构-重建"策略启发,在重建多酶系统前先表征各酶组分,分析了模拟DCs的单酶、双酶和三酶组装体,以获得三维结构组织的洞见。选用的两种内切-1,4-β-葡聚糖酶(AtCel9R和AtCel8A)及一种内切-1,4-β-木聚糖酶(AtXyn11A)均来源于纤维梭菌属细菌(Acetivibrio thermocellus,旧称Clostridium thermocellum),其复合体中的活性已得到验证。研究人员同时采用BILBO-MD的Minimal Ensemble Search(MES)和DADIMODO软件评估柔性,以表征三酶复合体;AFM实验补充并证实了含两种葡聚糖酶复合体的建模多结构域精修。
**多酶组装策略**
研究人员选择了A. thermocellus纤维酶体酶AtCel9R、AtCel8A和AtXyn11A。Cel8A和Cel9R纤维素酶已在大肠杆菌中过表达,并有晶体结构报道(PDB: 1KWF,分辨率0.94 ?;PDB: 7UNP,分辨率2.00 ?)。AtXyn11A呈现模块化架构,由GH11木聚糖酶和CBM6家族糖结合模块通过20个氨基酸的Linker连接;虽然该木聚糖酶结构域尚无三维结构报道,但GH11家族成员被描述为β-果冻卷折叠(β-jelly roll fold),AtCBM6结构则已发表。这三种纤维酶体酶在相同条件(pH和温度)下发挥作用,且已在设计型纤维素酶体中生产,是探索多酶组装的理想候选。
与天然含Dockerin模块及连接催化域的Linker的纤维酶体酶不同,Jo-In介导的复合体仅包含催化模块和CBM,以限制Linker所赋予的构象或动态自由程度,实现精确的酶定位。Jo-In生物分子焊接工具允许Jo(K191)与In(N695)伙伴之间自发形成分子内异肽键,产生刚性核心。通过混合Jo和In嵌合酶变体,研究人员组装了多酶复合体,其中每个催化单元共价锚定于确定位置。共生产八种不同复合体:两种含Cel8A和Cel9R(命名为CC_1和CC_2),六种含三种酶(XCC_A至XCC_L)。
**复合体中酶活性的验证**
通过小色原底物评估了组装体中各酶相对于游离形式的催化活性,以规避复合体内构象柔性受限和酶间邻近可能导致的活性位点可及性限制。木聚糖酶和内切葡聚糖酶分别以4-硝基苯基-木三糖(X3-pNP)和4,6-O-(3-酮丁基亚基)-4-硝基苯基-β-D-纤维五糖(BPNPG5)为底物进行测定。
游离酶活性测定确认了木聚糖酶和内切葡聚糖酶对各自底物的严格特异性。酶组装体在X3-pNP上表现出相似活性(306 ± 5至383 ± 16 U/μM),XCC-E的木聚糖酶比活性较游离酶降低10%。AtCel8A和AtCel9R的比活性分别为3.7 ± 0.2 U/μM和0.5 ± 0.1 U/μM。三种酶混合溶液中的比活性对应于各内切葡聚糖酶比活性之和,表明无协同相互作用。组装体内酶活性与游离酶相当,XCC-F的内切葡聚糖酶活性约增加20%。数据证明复合体内在酶活性得以保留。
**游离酶的SAXS分析**
为应用"解构-重建"策略,对游离酶AtCel8A、AtCel9R和AtXyn11A进行了SAXS分析。AtCel8A在溶液中呈现紧凑球状构象,归一化Kratky图显示主峰位于q·Rg ≈1.73,高q处有次级肩峰,表明折叠核心内存在优先的分子内距离。实验曲线与晶体结构拟合良好(CRYSOL拟合χ
2 = 1.94)。AtCel9R的P(r)分布较宽,D
max = 102 ?,Kratky图揭示球状核心伴非对称延伸,自相关函数支持紧凑结构域后接延伸片段的特征,这与通过Linker与催化核心共价连接的CBM3c存在一致,散射数据与现有晶体结构吻合良好。AtXyn11A的散射曲线呈现两阶段特征,为模块化蛋白的典型表现;Kratky图偏离理想钟形,高q处出现平台,指示域间部分柔性;P(r)函数显示两个明显峰,证实双结构域组织,同时表明CBM6采取空间受限构象而非完全柔性。GASBOR生成的从头包络(NSD = 1.01)与DADIMODO精修模型一致,支持稳定的双模块排布。
**双功能复合体的SAXS表征**
对含两种内切葡聚糖酶的中间组装体CC_1和CC_2进行SAXS分析。Guinier分析获得Rg值分别为46.3 ?(CC_1)和43.2 ?(CC_2)。中间q范围(0.02 < q < 0.15 ?
-1)出现显著差异,提示两种组装体整体拓扑不同。Kratky图强调这些差异:CC_1呈现更开放的伸展构象,而CC_2更为紧凑。两者均保留良好折叠蛋白特征,但明显偏离理想球状性,与模块化架构一致。P(r)函数提供额外结构信息:虽两种复合体均在58 ?附近显示主最大值,CC_2的D
max显著小于CC_1(130 ? vs. 172 ?),与其较低Rg值(43.2 ? vs. 46.3 ?)及更紧凑的归一化Kratky图一致。这些参数表明CC_2采取更紧凑的平均组织,而CC_1采样更伸展的排布。
通过DADIMODO生成全原子模型以在原子水平解释SAXS数据。每种复合体五次独立优化运行的χ
2值为CC_1的1.61–2.80和CC_2的1.17–1.32,表明与实验数据良好吻合。重点放在最敏感于整体分子形状和域间组织的中间散射区(q ≈ 0.05–0.15 ?
-1),以捕获复合体间主要结构差异。两种内切葡聚糖酶的催化核心在所有运行中采用可重现的相对取向,支持模型的稳健性。相反,AtCel9R的CBM3c域取向在两种组装体中均不一致,未趋同于独特空间排布。两催化域间平均域间距离为CC_1的86 ± 3 ?和CC_2的66 ± 5 ?,与P(r)和Kratky分析推断的差异一致。GASBOR从头重建未趋同于单一共识包络(NSD > 1),指示可能源于CBM3c流动性的构象异质性。这些观察支持溶液中存在多种构象而非单一确定结构。
**双功能酶复合体的AFM表征**
为提供单颗粒视角,在液体条件下对新解离的高定向热解石墨(HOPG)上的CC_1和CC_2进行AFM成像。单个颗粒的代表性图像揭示两种构建体整体形状的明显差异:CC_1频繁显示伸展的、各向异性轮廓,与SAXS推断的更伸展构型一致;CC_2则更圆或轻度椭圆,反映紧凑组织。若干情况下可辨识单个亚基,通常每颗粒三至四个,与两种复合体的预期架构一致;少数复合体中可见第五亚基,可能对应AtCel9R结构域的CBM。
定量分析表征了颗粒尺寸和形状。提取的各颗粒最大Feret直径(等于D
max)分布区分了CC_1和CC_2:CC_1显示略宽的分布,平均D
max较高(190 ± 46 ?),而CC_2平均D
max较小(178 ± 60 ?)。绝对值因针尖增宽略大于SAXS衍生D
max,但两种复合体间的相对差异得以保留。实心度(颗粒面积与其凸包面积之比)定量显示:CC_1具有较低平均实心度(0.73 ± 0.11),与各向异性伸展形状一致;CC_2显示较高平均实心度(0.81 ± 0.09),反映更球状构象。SAXS衍生坐标模型经MATLAB工作流模拟多种表面结合取向,在简化几何假设下生成投射AFM样颗粒足迹;尽管此类PDB模型本质代表比溶液中生物分子组装体完整柔性更受限的构象空间,CC_1和CC_2在2000个随机取向中持续产生与实验数据良好吻合的不同实心度分布,表明其形状差异 primarily 源于内在架构差异而非成像伪影或吸附取向。
**三功能多酶复合体的SAXS分析**
将分析扩展至含木聚糖酶(AtXyn11A)与AtCel8A和AtCel9R的三功能组装体。通过改变与Jo-In的融合位置产生六种不同复合体(XCC-A至XCC-L)。所有复合体显示相似的低q散射,表明可比的总体尺寸和寡聚状态。Guinier分析获得Rg为53.5 ± 0.9 ?,显示添加第三酶至双功能复合体略微增加尺寸同时减少构建体依赖的全局尺寸差异。归一化Kratky图揭示一致的总体折叠但不同的中q行为(0.05–0.15 ?
-1),为柔性多域系统的特征。所有复合体呈现伸展但折叠的构象,峰值位置和振幅的差异反映复合体内酶间距的变化。P(r)函数在六种组装体间高度相似,D
max值180 ?(XCC-E, F, K)至195 ?(XCC-A, B, L)不等,所有P(r)函数在30和60 ?附近显示两个主导最大值,XCC-F和XCC-K在120 ?处有第三较弱峰,提示这些构建体独有的额外域间分离。
DADIMODO建模用于在原子水平解释SAXS数据。每种复合体五次独立优化运行产生令人满意的SAXS拟合。组装体最大颗粒尺寸范围161 ?(XCC-L)至195 ?(XCC-B)。多数情况下模型结构略比实验数据提示的更紧凑,但模型Rg值仍接近实验测量值;XCC-K是唯一模型Rg高于实验值的复合体。尽管整体形状相似,观察到平均组织的差异:XCC-K采用更弯曲的排布,XCC-A、B、E和L显示更伸展的组织,XCC-F呈现独特排布。催化域在DADIMODO模型中通常定义良好,多数组装体趋同于独立运行中的一致相对取向。直接融合于Jo-In核心的域系统性地比远端域更好解析,木聚糖酶尤为明显,其CBM通过20残基Linker连接。直接CBM融合至Jo-In支架导致定义较差的催化域,反之亦然,表明Linker位置影响域定位和构象采样。酶空间排布因复合体而异:XCC-A和XCC-K中内切葡聚糖酶催化位点更邻近,XCC-L和XCC-B中则更远。木聚糖酶位置因内在Linker柔性更难解析,但其催化域与CBM的距离与所示P(r)函数一致。
鉴于三功能组装体柔性的增加,进行了Minimal Ensemble Search(MES)分析。与先前DCs研究一致,两种构象足以重现散射图谱。构象体从一增至二导致拟合显著改善,而添加额外构象体仅导致边际χ
2改进,表明两种构象捕获本质构象变异性而不致过拟合。图5d显示相对构象体群体与Rg的关系,说明压实度分布。除XCC-K外,所有组装体的主要构象体显示小于实验值的Rg,指示集合中主导紧凑群体,与DADIMODO分析中观察的趋势一致。XCC-F、XCC-L和XCC-E由紧凑构象主导(≥75%),XCC-A和XCC-B显示紧凑和伸展状态间更平衡的分布(分别为52/48%和65/35%)。XCC-K是唯一主要采样伸展构象的复合体,占集合近70%,与DADIMODO建模同样预测更伸展构象一致。
**域间平均距离的确定**
为定量复合体间差异,计算各域催化氨基酸之间的域间距离。DADIMODO提供针对SAXS数据优化的代表性平均构象,而BILBO-MD采样跨越紧凑和伸展状态的加权集合,因此BILBO-MD衍生距离显示更大标准差。尽管方法学差异,大多数域间距离在两种方法间一致,特别是XCC-F和XCC-L表现出相似的距离分布。相反,XCC-A、XCC-E和XCC-K显示特定域间分离的局部差异:XCC-A表现纤维素酶域间更短距离,XCC-E和XCC-K显示Cel9R与木聚糖酶催化域间缩减间距。这些变化可能源于域连接性的差异,特别是木聚糖酶结构域未直接融合至Jo-In核心的构建体。XCC-B呈现独特的距离模式,这可由MES分析中识别出的多种构象状态解释,这些状态未被平均DADIMODO模型完全捕获。木聚糖酶-CBM距离作为内部参照:DADIMODO维持紧凑排布(~40 ?),接近自相关函数中所观察,而BILBO-MD采样更伸展构象(~70 ?),贡献于集合多样性。
**讨论**
天然纤维素酶体利用结构柔性有效水解不溶性植物细胞壁底物,但其内在构象动力学阻碍了理解空间组织如何影响催化性能。本研究利用Jo-In焊接系统设计了具有控制和明确空间排布的多酶复合体。该方法组合两种纤维酶体内切葡聚糖酶AtCel8A和AtCel9R形成双功能复合体,并添加纤维酶体木聚糖酶AtXyn11A产生三功能复合体。通过简单改变N端或C端与Jo或In的融合,可获得定制构象。每种嵌合酶的酶活性保留情况被系统评估,以确保结构约束不损害催化功能。游离酶至多酶架构的空间组织通过SAXS系统研究,双功能复合体额外通过AFM研究。
该方法揭示Jo-In介导的组装体采用紧凑和受约束的构象。双功能复合体的SAXS分析证明酶定位直接影响整体拓扑和压实程度,不同散射图谱对应不同空间排布。互补AFM成像在单颗粒水平验证这些溶液结构,确认CC_1和CC_2展现差异形状,最大Feret直径和实心度的差异反映伸展与更紧凑架构。关键地,AFM证明溶液中观察到的拓扑在HOPG表面吸附后得以保留。单颗粒分析进一步揭示每种组装体类型内的构象异质性,表明Jo-In连接复合体在维持确定拓扑的同时保留一定程度的柔性。
全原子建模使用DADIMODO和BILBO-MD结合SAXS数据和结构域结构,趋同于具有一致拓扑和约束域间距离的结构,为三功能组装体提供了稳健的结构模型。两种方法对XCC-K产生更高的计算Rg值,其显示最大比例的伸展构象体,反映由紧凑状态主导但具有显著伸展亚群体的构象集合。XCC-K的架构可理性化分析:CBM融合至Jo的N端,可能松弛对Xyn11-CM6 Linker的约束并促进更大柔性,与XCC-A中通过催化域融合可能限制构象景观形成对比。
SAXS分辨率固有地限制精确域取向的确定,扩展q范围至更高散射角将改善建模约束和精修域定位。此外,结合分子动力学模拟与SAXS引导的集合精修可能提供最准确的柔性组装体描述。高分辨冷冻电镜为验证溶液中多酶组装体的SAXS衍生结构模型提供了互补方法,但对于柔性蛋白可能需要进一步的方法学进展。
与动态的粘连蛋白-Dockerin纤维素酶体不同,Jo-In形成刚性共价异肽键,可重现地定位酶,产生紧凑且架构明确的三功能组装体。这种结构刚性直接反映在SAXS测量的生物物理学参数中:三功能180 kDa Jo-In组装体表现Rg ≈ 55 ?和D
max ≈ 190 ?,明显比先前报道的约300 kDa三功能设计型纤维素酶体(Rg ≈ 91 ?,D
max ≈ 305 ?)更紧凑。尽管两系统分子量差异显著,值得注意的是三功能DC搭载三种酶中的两种相同酶(Cel8A和Cel9R)。Jo-In组装体的总体增加紧凑性很可能反映异肽键连接的Jo-In核心作为刚性结构锚,减少了可及构象空间并约束溶液中可达到的最大域间距离。
产生具有明确和可重现拓扑的多酶复合体的能力,为研究域间距离和催化域相对空间排布如何影响不溶性底物上的协同活性开辟直接路径。这与植物细胞壁多糖纳米尺度组织的新兴结构数据尤其相关,为理性设计酶组装体提供了结构框架。具有不同受控域间构象的Jo-In组装体的可用性,创造了独特的实验平台来验证多酶复合体的空间拓扑与其底物超分子组织匹配是否增强催化性能——这一假说在架构异质的纤维素酶体系统中难以严格验证。
本研究建立了工程化多酶系统的真正架构规则,构成研究酶组织与活性关系的基石。更深入理解合成组装体如何与不溶性底物相互作用,包括潜在的扩散限制、构象约束和进行性酶相互作用的动态学,对于阐明空间组织在调节多酶系统催化性能中的作用至关重要。Jo-In基组装体为酶协同作用的基础研究和生物催化系统的理性设计提供了有前景的平台。其形成具可控拓扑的明确复合体的能力,结合单分子水平观察到的柔性,为工程化优化的多酶系统提供了强大框架,这些系统不仅参与不溶性底物降解,还涉及许多关键生物学过程。