《Current Opinion in Structural Biology》:Labelling in cryogenic electron tomography - Bridging the gap between correlative light and electron microscopy and protein identification
编辑推荐:
冷冻电子断层成像(cryogenic electron tomography, cryoET)可在无染色、无固定的条件下,通过天然原子对电子的散射获得细胞分子构象的原位视图,所有分子均参与最终断层重构像的形成,因此在拥挤的细胞环境中,目标蛋白的识别仍具挑战。现
冷冻电子断层成像(cryogenic electron tomography, cryoET)可在无染色、无固定的条件下,通过天然原子对电子的散射获得细胞分子构象的原位视图,所有分子均参与最终断层重构像的形成,因此在拥挤的细胞环境中,目标蛋白的识别仍具挑战。现有cryoET专用分子标记策略虽可提供重构断层像中的蛋白识别方案,但多数不适用于数据采集阶段的兴趣区域定位。为提升cryoET的通量与实用性,未来方法应整合相关光镜与电镜(correlative light and electron microscopy, CLEM)与标记技术,实现单一修饰在小尺度与大尺度的通用性。结合机器学习方法自动化识别断层像中的标记物并实现跨模态关联,将进一步提升方法通量,适配稀有事件解析及亚断层平均(sub-tomogram averaging)结构测定需求。cryoET可在细胞原生环境中实现蛋白结构的高分辨率捕获,结合亚体积平均可连接分子结构与细胞架构及生理状态。尽管其提供了前所未有的胞内复杂环境解析能力,数据解读仍是持续存在的难点:分子拥挤导致难以将密度信号明确归属至目标蛋白,辐射损伤限制了断层像的信噪比。截至目前,原位cryoET最稳定解析的为大分子复合物,如核孔复合体、蛋白酶体和核糖体,这类结构尺寸足够大,可在断层像中直接识别,或已有充分结构表征支持模板匹配。膜蛋白的研究尤为困难,脂质双分子层会遮蔽大部分结构信息。随着领域向组织、类器官等复杂样本拓展,数据解读难度进一步提升。为应对上述挑战,冷冻相关光镜与电镜(cryoCLEM)已被常规整合至工作流程,用于指导聚焦离子束(focused ion beam, FIB)减薄与倾斜系列采集。在此背景下,高分辨率断层像中可扩展的蛋白质识别成为核心瓶颈。本综述系统梳理了应对该蛋白识别挑战的多类策略。
蛋白质识别的可选策略
冷冻相关光镜与电镜(cryoCLEM)
cryoCLEM可实现荧光引导的cryoET样品制备、图像采集与结果解读。宽场cryoCLEM的主要局限在于荧光定位精度与断层像视场尺度相当,且光轴方向的分辨率各向异性降低了厚样品的定位精度,因此当前该技术多用于细胞内区域的FIB减薄或倾斜系列采集定位,而非离散大分子解析。cryo荧光模块正逐步被整合至cryo-FIB减薄流程的硬件层面。新型蛋白识别策略的设计需覆盖全流程:cryoCLEM引导的区域筛选与减薄,以及后续断层像中的cryoET可见识别。
计算方法
基于模式识别的计算策略,包括模板匹配与卷积神经网络,已被用于已采集断层像中的蛋白识别。这类方法高度依赖蛋白结构与定位的先验信息,目前仅对大型组装体或易识别特征有效。核心挑战在于新型靶点缺乏可靠的先验信息或真实标注,限制了模板匹配与机器学习(machine learning, ML)结果的评估。多数工具本质是高效的颗粒挑选器,可自动化完成专家可人工判定的任务,尚无法实现全蛋白质组的从头识别。此外,cryoET数据的低信噪比限制了分类器性能,且胞内不同复合物间的结构同源性易导致识别歧义。可提供正交、直接可见信号的互补标记策略,有助于区分同源结构并提升下游分类的可信度。
冷冻电子断层成像专用标记
cryoET专用标记为正交识别策略,由具有独特尺寸、形状或密度的识别元件与功能化靶向组件构成,可在断层像中实现目标蛋白定位。目前已成熟开发的标记体系包括:金纳米颗粒(gold nanoparticles, AuNPs)、铁蛋白基FerriTag、基于 encapsulin 的基因编码多聚颗粒(genetically encoded multimeric particles, GEMs)以及DNA纳米结构基路标折纸标签(sign-post origami tags, SPOTs)。
AuNPs的优势包括惰性较高、在生物环境中对比度强、可合成尺寸范围广(支持区分与多重标记潜力),且易于偶联多种亲和试剂(从传统抗体到小型结合剂),还可与荧光基团联用适配相关工作流程。
铁基标记利用金属的电子密度特性,同时支持基因编码靶向。FerriTag是一种荧光重组电子致密铁蛋白颗粒,可通过雷帕霉素诱导的异源二聚化连接至目标蛋白。铁蛋白是由24个蛋白亚基组成的笼状结构(外径约12 nm),最多可储存约4500个铁原子,形成电子致密核心,在无铁负载状态下也可通过电镜识别。在FerriTag系统中,目标蛋白与FKBP结构域融合表达,铁蛋白工程化引入FRB结构域,雷帕霉素可触发两者异源二聚化实现快速连接。
GEMs同样采用基因编码蛋白笼策略,源自encapsulin的笼状结构尺寸较大(25–42 nm 二十面体颗粒),蛋白笼本身即具有独特结构特征。最小尺寸变体兼顾了可检测性与扩散可及性,也可通过雷帕霉素诱导异源二聚化系统特异性结合目标融合蛋白,部分体系可额外引入纳米抗体作为适配接头。需注意,GEMs与铁蛋白等多聚标签可能携带多个靶向元件,存在改变靶蛋白定位或介导分子间桥接的风险。
DNA折纸基标签利用可编程纳米结构的精确几何构型实现识别。DNA折纸通过长支架链与短订书钉链的折叠形成特定形状,SPOTs利用核酸骨架的电子密度产生对比度,同时最小化对邻近结构的遮挡。其设计包含高对比度“标识”与功能化“柱体”两部分,当前多通过抗GFP适配体靶向GFP家族融合蛋白。
各类标记体系的共性挑战是高、低倍率下的检测平衡:大尺寸标记在低倍下可见,适用于倾斜系列采集前的区域选择,但占据更多视场;小尺寸标记虽不遮挡周围细胞结构,却无法在数据采集前被观测到,尚无体系可同时满足所有应用标准。
标记策略的选择考量
标记策略的选择需匹配生物学问题与数据采集、分析的实际限制,核心决策点包括:
- •
靶点丰度:低频靶点通常需要更大或更独特的标记,或更强的先验信息以缩小搜索范围。
- •
定位先验知识:膜定位、细胞器邻近性或已知亚细胞富集特征可显著提升实验可行性。
- •
定位需求与平均目标:若以亚断层平均为最终目标,更小、扰动更低的标记与更小的位置不确定性更为关键。
有限先验知识下的蛋白靶向
有限先验知识的蛋白靶向是cryoET的核心难点:典型哺乳动物细胞的尺寸远大于单张倾斜系列的成像范围,稀有或低丰度蛋白若无预先靶向几乎不可能被采集到。现有标记体系均可整合荧光蛋白或染料,适配活细胞荧光显微镜与相关光镜与电镜流程。例如ExSloNano系统中的1.4 nm金颗粒可与Alexa Fluor 488(或594)标记的葡聚糖偶联;FerriTag可携带最多12个荧光基团,已通过室温共聚焦验证与目标蛋白的共定位;多聚GEMs每个颗粒可携带60个HALO标签,可通过HALO配体染料染色,已用于cryoCLEM引导的薄片放置与倾斜系列采集;SPOTs可整合荧光染料偶联寡核苷酸,荧光信号强度与免疫荧光相当。将荧光与标记整合至cryoET样品制备流程,可实现多分辨率梯度的目标蛋白识别,但该方案通量较低,可观测的拷贝数有限,限制了亚断层平均的结构解析能力。
针对先验信息匮乏的靶点,标记需具备高特异性和明确的方向性。由于现有标记均需翻译后步骤(外源性标记如纳米金与SPOTs的添加,或内源性标记如GEMs与FerriTag的组装),必须能清晰区分结合态与游离态。游离标记的背景信号会限制特异性,而球形标记仅能将定位限定于球状区域,若无膜等上下文信息则无法进一步精准定位。最新设计还探索了工程化颗粒几何构型以实现多重标记,即可同时标记两个蛋白且标记间可区分,如共价连接的纳米金二聚体或多聚体理论上可通过形状与单体区分,但在拥挤细胞断层像中实现稳健区分仍是下一步需要解决的问题。
具备一定定位先验知识下的蛋白靶向
对于已有定位先验的蛋白,标记仍可帮助确认其在特定细胞环境中的存在,例如验证某蛋白是否定位于细胞器接触位点、囊泡出芽或细胞骨架组装等特征区域,无需依赖荧光共定位。GEMs可通过靶向这些结构胞质面表达的蛋白,标记内质网、内体、过氧化物酶体、溶酶体、着丝粒、核仁、应激颗粒等细胞亚结构表面,但标记到达速度较慢(数十分钟至数小时),可能与颗粒尺寸和多组分组装有关,需针对每个靶点与表达水平优化。纳米金(1.4 nm)已通过组蛋白上的HALO标签实现核内标记,突破了核区标记的历史难题,但线粒体、叶绿体、外泌体、溶酶体等多数细胞器的内部区域仍未被现有标记策略覆盖。
面向结构平均的蛋白靶向
亚断层平均是获得目标蛋白高分辨率结构模型的关键动机,此场景下标记可用于识别含特定亚基的复合物,或在低分辨率平均中定位特定蛋白。通常采用极小尺寸标记,如1–2 nm金颗粒或融合蛋白(如GFP)。金颗粒的电子散射能力远高于生物分子,易于识别,但可能遮挡邻近蛋白信号,可通过掩模处理缓解。多数金颗粒或融合蛋白的连接化学会引入“模糊区间”:颗粒仅报告邻近性而非精确分子坐标,若使用全长抗体或长连接子,位置不确定性会显著增加。标记的对称性也无法仅凭标记实现靶蛋白的无歧义定位与取向判定,限制了其直接用于亚断层平均的颗粒挑选。已有研究证明纳米金、GEMs与SPOTs可被稳定挑选并用于亚体积平均,且不会显著干扰目标蛋白的平均解析。模板匹配或ML辅助的标记自动化识别有望大幅提升通量,是获得更高分辨率平均的必要支撑。目前已在原理上验证了GEMs与金颗粒的ML识别潜力,其他在研方向还包括蛋白折纸标签、其他金属基标记,以及利用小蛋白(如工程化荧光蛋白)偏置模板匹配、连接CLEM靶向与下游计算识别的策略。
展望
现有cryoET标记体系已支持多语境下的细胞蛋白探索,不同策略分别适配复杂生物样本的不同挑战,但目前仍存在向膜相关靶点的偏向性,可溶性胞质蛋白的标记仍是待解决的难题,明确区分标记的结合态与游离态是突破该问题的关键。许多细胞区室(如细胞器腔室)仍无任何可用标记策略覆盖,这类场景可能需要基因编码型标记,且需在不破坏细胞器结构的前提下被cryoET清晰识别。随着cryoET领域向单细胞外的组织、类器官等复杂系统拓展,标记策略也需同步适配。与此同时,基于ML的蛋白识别计算流程正在快速发展,cryoET标记可作为先验信息与真实标注支撑这类计算方法的开发。未来最成功的工作流将采用多模态整合策略:以荧光信号实现靶向定位,以cryoET可见标记实现直接识别与计算挖掘。