《Analytical Chemistry》:Automating Middle-Down Mass Spectrometry Analysis for Extensive Antibody Characterization
编辑推荐:
为了解决中端(middle-down)与顶层(top-down)质谱工作流程在数据分析和结果验证上对用户专业性要求高、多软件切换繁琐且缺乏自动化平台的瓶颈,研究人员开发了名为 Proteoform Studio 的集成软件。该平台能够自动化完成从仪器设置、质谱数据去卷积、蛋白形式(proteoform)鉴定到碎片离子结果聚合的全流程,并通过设定碎片信噪比(S/N)和同位素拟合分数阈值,使自动化匹配结果与手动验证高度一致。应用该平台进行中端抗体亚基分析,实现了轻链(Lc)与重链 Fd 段 >80% 的序列覆盖率,显著降低了数据分析门槛,为生物制药分析中治疗性蛋白形式的精准表征提供了高效工具。
在当今生物制药领域,单克隆抗体等治疗性蛋白药物的精准表征至关重要。传统的肽图(peptide mapping)工作流程虽已成熟,却无法提供完整的蛋白形式(proteoform)信息,即由基因变异、翻译后修饰等导致的所有蛋白变体。而能够直接分析完整蛋白的顶层(top-down)和中端(middle-down)质谱技术,尽管能获取这些宝贵信息,却一直面临着巨大的应用壁垒:实验设置复杂、数据分析繁琐,且缺乏一个集成的软件工具。研究人员往往需要组合多个软件,并投入大量时间进行手动验证,这严重阻碍了该类技术在常规质控和深入表征中的广泛应用。为此,发表在《Analytical Chemistry》上的这项研究,引入了一个全新的自动化软件平台——Proteoform Studio,旨在彻底改变这一局面。
本研究主要采用了以下几项关键技术方法:1)中端质谱分析流程:使用限制性蛋白酶(如IdeS)消化单克隆抗体标准品(如NIST mAb)产生大亚基(Lc, Fd),并进行液相色谱-质谱(LC-MS/MS)分析。2)软件算法整合:Proteoform Studio 整合了kDecon(针对同位素未分辨谱图)和THRASH(针对高分辨谱图)等去卷积算法,并采用滑动窗口去卷积技术进行质量组分鉴定。3)多碎片化技术聚合:利用碰撞诱导解离(CID)、高能碰撞解离(HCD)、电子转移解离(ETD)、电子转移/高能碰撞解离(EThcD)和紫外光解离(UVPD)等多种互补碎片化技术,并通过软件自动聚合其碎片离子结果。4)靶向分析流程:软件支持通过.fastp文件(基于ProForma notation)直接匹配用户指定的蛋白形式理论碎片离子,并进行同位素拟合分析。5)参数优化与验证:通过对比自动化分析结果与TDValidator软件的手动验证结果,优化了碎片离子的信噪比(S/N)和最小同位素拟合分数(isotope fit score)等关键参数。
结果与讨论
自动化亚基表征
研究团队展示的 Proteoform Studio 平台提供了从质量去卷积、质量组分鉴定、蛋白形式表征到碎片化靶标选择的集成工作流。该平台利用滑动窗口去卷积技术,准确测定了来自NIST、曲妥珠单抗等抗体的Lc和Fd亚基的质量与保留时间,并可直接将选定的电荷状态靶标部署至仪器采集方法中,实现了从分析到采集的闭环。
提高自动化碎片指认的可信度
碎片离子的高置信度指认对于修饰定位和蛋白形式鉴定至关重要。研究通过对比 Proteoform Studio 自动化分析与TDValidator手动验证的结果,确定了当碎片信号信噪比(S/N)阈值设为10,最小同位素拟合分数设为0.68时,自动化分析获得的序列覆盖率与手动验证结果具有高度一致性。这大幅减少了耗时的手动验证需求。研究指出,紫外光解离(UVPD)因其产生极其复杂的谱图,在手动验证中面临挑战,但自动化平台有望克服这一难点。
通过聚合碎片化结果提高覆盖率
Proteoform Studio 的核心创新功能之一是能够自动聚合来自多个数据文件和不同碎片化技术的结果。研究发现,通过聚合EThcD、ETD和HCD等互补技术的结果,能够显著提高序列覆盖率。例如,对于NIST Lc和Fd亚基,聚合三种技术的结果可使覆盖率分别提升至≥77%和≥70%。聚合所有五种碎片化技术的结果,覆盖率可超过85%(Lc)和80%(Fd)。即使将碎片离子最小观测次数(minimum number of observations)提高至3以增加严格性,聚合结果仍能保持较高的覆盖率,证明了该流程的稳健性和可重复性。
优化碎片化参数与电荷态靶标
通过对碰撞能量(HCD)、反应时间(ETD/EThcD)和靶标电荷态进行优化,并适当提高上样量,研究进一步提升了序列覆盖率。优化后的实验使得Lc和Fd亚基的覆盖率(最小观测次数为3时)分别从55.2%提升至74.5%和从55.8%提升至69.2%。生成的聚合碎片图谱直观显示,优化后观测到了更多大质量碎片离子,从而填补了序列覆盖的空白,特别是对互补性决定区(CDR)的表征得到了改善。
滑动窗口对碎片化分析的影响
研究评估了在碎片数据分析中使用滑动窗口去卷积模式与“全窗口”模式(window mode “all”)的差异。滑动窗口模式通过平均多个重叠时间窗口内的谱图,增加了单个文件内碎片离子被多次观测的机会,从而提高了指认的灵敏度,有助于在要求最小观测次数时保留真实的碎片指认。而“全窗口”模式将所有谱图平均为一张,虽可能精度略高,但灵敏度有所损失。对于旨在聚合多文件证据以提高可信度的分析,滑动窗口模式更具优势。
评估内部离子以提高覆盖率
Proteoform Studio 也支持对内部碎片离子(internal ions)的指认,这可以进一步提高序列覆盖率,特别是填补末端离子覆盖的缺口。研究初步分析了HCD数据中的内部离子,发现它们能有效补充末端离子的覆盖盲区。但考虑到内部离子指认存在更高的假阳性风险,软件为此类离子设置了更严格的同位素拟合参数,并建议在需要高置信度的分析中谨慎使用。
在复杂基质中表征亚基
为了验证工作流程在更接近真实样本环境下的适用性,研究将NIST亚基加标到复杂的人血浆IgG背景中进行靶向分析。尽管加标量高于生理水平,但 Proteoform Studio 的自动化靶向蛋白形式工作流程,在单个EThcD进样中,仍对Lc和Fd分别实现了68.9%和50.4%的序列覆盖率,与手动验证结果吻合度在6%以内。这初步证明了该平台在复杂生物样本靶向分析中的潜力。
利用质子转移电荷还原技术改善亚基覆盖率
研究还展示了 Proteoform Studio 处理质子转移电荷还原(PTCR)MS3数据的能力。PTCR 通过降低碎片离子的电荷态、拉开其质荷比(m/z)间距,有助于提高复杂混合物分析的深度和碎片指认的可信度。分析表明,对于PTCR数据,调整滑动窗口宽度和拟合分数阈值,同样可以实现自动化与手动结果的一致性。
结论与意义
本研究成功开发并验证了 Proteoform Studio 这一针对靶向顶层和中端蛋白形式表征的端到端集成软件平台。它有效解决了该领域长期存在的软件碎片化、分析流程复杂、高度依赖手动操作等核心瓶颈。平台通过自动化整合质量去卷积、多碎片化技术结果聚合、以及可调谐的严格性控制(如最小观测次数和拟合分数),实现了高效、可靠且深入的抗体亚基表征,序列覆盖率可超过80%。更重要的是,其自动化分析结果与专家手动验证高度一致,显著降低了技术门槛和时间成本。
这项工作的意义在于,它通过提供一套完整的自动化信息学解决方案,极大地推动了顶层/中端质谱工作流程从“专家专用”向“常规可用”的转变。这不仅将促进该技术在生物制药研发、质控和更精准的治疗性蛋白形式表征中的广泛应用,也为临床蛋白质组学中复杂样本的靶向分析提供了有力的新工具。最终,Proteoform Studio 有望成为连接信息丰富的完整蛋白质谱数据与高效、精准的生物医药研发之间的关键桥梁。