《mAbs》:Deep learning assessment of nativeness and pairing likelihood for antibody and nanobody design with AbNatiV2
编辑推荐:
:由免疫系统产生的大多数抗体在良好结合力与稳定性、低毒性及自身低反应性之间实现了平衡。因此,量化候选序列的自然度(即其属于天然免疫库的可能性)已成为从合成库中进行命中筛选、优化与人源化以及指导从头设计朝着可开发候选分子发展的一种重要策略。研究人员先前提出了Ab
:由免疫系统产生的大多数抗体在良好结合力与稳定性、低毒性及自身低反应性之间实现了平衡。因此,量化候选序列的自然度(即其属于天然免疫库的可能性)已成为从合成库中进行命中筛选、优化与人源化以及指导从头设计朝着可开发候选分子发展的一种重要策略。研究人员先前提出了AbNatiV,这是一种基于Transformer架构的矢量量化变分自编码器(VQ-VAE),用于自然度评估,并在多项纳米抗体工程任务中证明有效。然而,AbNatiV1处理的是未配对的序列,这限制了其对于传统VH-VL抗体的适用性。此外,当时可用的纳米抗体库数量有限、多样性不足,也制约了其纳米抗体自然度评估的性能。本研究对新的骆驼科动物(camelid)抗体库进行了测序,整合了更多近期数据集,并提出了AbNatiV2:这是一种增强的架构,包含多个模型,每个模型在≥2000万条序列上进行训练。AbNatiV2在留出测试集和多样化测试集上提升了纳米抗体自然度分类的性能,并能更稳健地检测互补决定区(CDR)移植后的自然度变化。研究人员还引入了p-AbNatiV2,这是一个在370万对人源配对序列上微调的交叉注意力模型。p-AbNatiV2为VH/VL配对提供残基水平和序列水平的人源度(humanness)评分,并通过噪声对比训练学习配对可能性。在留出测试中,p-AbNatiV2在74%的情况下为天然配对赋予了更高的分数,显著优于近期的配对模型。综上所述,AbNatiV2和p-AbNatiV2将自然度评估与工程化扩展到了纳米抗体和传统抗体领域,支持在单残基、Fv(可变区片段)序列和配对结构域水平上做出设计决策。AbNatiV2已作为可下载软件和网络服务器提供。
一、 研究背景、问题与研究意义
抗体作为重要的治疗性蛋白,其理想特性(如高结合力、稳定性、低毒性、长半衰期)通常与免疫系统自然产生的抗体所具有的“自然度”(nativeness)密切相关。量化候选抗体序列属于天然抗体分布的可能性(即其自然度),已成为指导抗体发现、优化、人源化(humanization)以及从头设计(de novo design)的关键策略。纳米抗体(VHHs)作为一种新兴的治疗形式,在肿瘤靶向、CAR-T细胞疗法等领域应用日益广泛,其自然度评估同样至关重要。然而,现有的评估工具存在局限性。例如,研究团队此前开发的AbNatiV1模型虽然在纳米抗体工程中有效,但存在两大不足:其一,它仅能处理未配对的单链序列,无法评估传统抗体中重链(VH)与轻链(VL)配对的影响,这对于Fv区的结构完整性和稳定性至关重要;其二,其纳米抗体自然度评估性能受限于当时可用的训练数据规模和多样性。同时,尽管近年来基于抗体大规模测序数据(如OAS数据库)的蛋白质语言模型(PLMs)在序列生成和嵌入表示方面表现出色,但AbNatiV模型的设计初衷是提供一种直接且可解释的自然度评估方法,特别是能够在全序列和单残基分辨率上进行量化。本研究旨在克服AbNatiV1的局限性,通过扩展数据集、升级模型架构,并引入能够评估配对兼容性的新模型,开发出更强大、更全面的抗体与纳米抗体自然度与配对可能性评估工具——AbNatiV2与p-AbNatiV2,以支持更高效的抗体设计与工程化。本研究成果发表于《mAbs》期刊。
二、 主要关键技术方法
研究人员在本研究中主要应用了以下关键技术方法:
- 1.
大规模数据集构建与预处理:通过收集、测序并整合多种来源的序列,构建了包含超过2000万条骆驼科动物纳米抗体序列、近2000万条人源未配对VH/VL序列以及超过370万条独特人源配对序列的数据集。所有序列均使用ANARCI软件按照AHo编号方案进行比对和标准化。
- 2.
升级的VQ-VAE模型架构:AbNatiV2在AbNatiV1的基础上进行了架构升级。它采用基于Transformer的矢量量化变分自编码器框架,引入了旋转位置编码(rotary positional encodings)以更好地编码相对位置信息,集成了门控注意力机制,并使用SwiGLU激活函数提升表示能力。模型通过自监督的掩码学习进行训练,其重建损失采用了焦点重建损失(FRL),以减轻对高保守位置(如框架区)的过度关注,从而提升模型捕捉可变区域(如CDR3)高维关系的能力。
- 3.
配对模型p-AbNatiV2的设计:为了评估配对抗体的自然度与配对可能性,研究人员开发了p-AbNatiV2。该模型基于预训练的未配对AbNatiV2 VH和VL模型,通过交叉注意力层将它们连接,形成一个能够联合处理VH/VL配对的VQ-VAE。此外,模型顶部集成了一个配对预测头,采用噪声对比学习进行训练,通过区分天然配对、批次内随机重组的“打乱”负例以及来自不同B细胞类别或物种的“错配”负例,来学习配对可能性。
- 4.
模型性能评估与基准测试:使用留出测试集、多样化测试集(与训练集序列差异≥5%)、来自其他物种(如恒河猴、小鼠)的序列以及基于位置特异性评分矩阵生成的人工序列,对模型的自然度/人源度分类准确性、重建精度、泛化能力以及配对预测能力进行了全面评估。并与当前先进模型(如Humatch、ImmunoMatch)进行了性能比较。
三、 研究结果
1. 未配对的AbNatiV2模型
AbNatiV2在架构和损失函数上的改进带来了性能提升。旋转嵌入与SwiGLU等组件的结合显著降低了重建损失。动态焦点重建损失(FRL)策略有效提升了模型区分天然纳米抗体序列与仅基于位置频率独立生成的人工序列(PSSM-generated)的能力,表明其更好地捕捉了残基间的高阶相互作用。
2. 纳米抗体自然度评估
基于扩增至2100万条序列的纳米抗体训练集,AbNatiV2模型在多个测试中表现出色。它在区分骆驼科动物纳米抗体与其他物种VH序列(人、恒河猴、小鼠)以及人工序列方面,其精确率-召回率曲线下面积(PR-AUC)均优于AbNatiV1,特别是在针对与训练集差异≥5%的多样化测试集时,优势更为明显。此外,AbNatiV2能够更准确地检测到CDR环被移植到不同支架(如通用框架UF)时所导致的自然度下降,在测试序列中识别出90%的CDR移植后自然度降低案例,而AbNatiV1仅识别出64%。
3. 未配对抗体序列的人源度评估
分别在人源VH和VL大规模数据集上训练的AbNatiV2模型,在评估抗体“人源度”(humanness)方面也取得了进步。特别是,统一训练Vκ和Vλ的单一VL模型,在区分人源与恒河猴VL序列方面表现出显著提升的准确性。这些模型为后续构建配对模型提供了预训练基础。
4. 配对的p-AbNatiV2模型
p-AbNatiV2模型能够对VH/VL配对进行联合人源度评估,并提供配对可能性评分。在区分人源天然配对与错配或人工序列时表现出近乎完美的分类性能。在配对预测任务中,p-AbNatiV2在74%的情况下能正确地将天然配对的评分置于随机配对之上,在从50个随机配对中选出天然配对的排名任务中,有35%的概率将天然配对排在前5名,性能显著优于Humatch和ImmunoMatch等现有模型。
5. 针对VHHs和Fv的人源化应用
AbNatiV2评分显示,已进入临床阶段的纳米抗体在人源度-VHH自然度图谱中,位于人源VH与骆驼科动物VHH序列分布之间的区域。研究提供了分别针对纳米抗体和Fv配对的自动化人源化流程。对于Fv,新引入的配对人源化流程利用p-AbNatiV2联合优化重链和轻链序列,并在迭代中监控配对可能性,以确保突变不会破坏链间配对。
四、 讨论与结论
本研究提出了未配对模型AbNatiV2和配对模型p-AbNatiV2,用于抗体和纳米抗体的自然度评估与工程化。AbNatiV2模型通过整合旋转嵌入、门控注意力机制和焦点损失策略,相比AbNatiV1在性能和准确性上均有提升,能更有效地捕捉残基间的高阶关系,并减轻抗体PLMs中常见的种系偏倚。p-AbNatiV2模型采用了一种新颖的基于交叉注意力的VQ-VAE架构,并配备了配对预测头,能够同时评估VH/VL人源度并预测其配对可能性。
作为本工作的一部分,研究人员构建了一个包含2100万条纳米抗体序列的新数据集,以及一个包含近400万条人源配对序列的数据集,为纳米抗体和配对抗体工程的计算工具开发奠定了重要基础。捕获VH-VL配对兼容性对于稳健的抗体工程和从头设计至关重要。p-AbNatiV2通过噪声对比学习,结合“容易但明确”和“困难但嘈杂”的负例,有效评估了配对兼容性,并解决了其固有的复杂性。通过将伙伴条件性人源度评估与明确的VH/VL配对可能性评分相结合,p-AbNatiV2提供了一个可解释的、即用型评分工具,用于对Fv进行人源度排序、优先选择兼容的配对、指导合理的突变设计,并补充生成式和实验流程。
总之,AbNatiV2和p-AbNatiV2旨在作为抗体设计和优化流程中的实用评分层。在生成式设置中,序列水平的VHH自然度或人源度提供了高效的生成前和生成后过滤器,而残基分辨率的图谱则将突变建议、CDR移植选择和可开发性编辑集中在与天然库最兼容的位置上。具有伙伴意识的人源度评分与明确的VH/VL配对可能性评分相结合,能够对给定重链的候选轻链(反之亦然)进行排序,支持通用轻链和多特异性格式,并标记可能破坏配对或互补位稳定的变体。经过校准的评分(使用一致的0.8操作阈值)便于与亲和力、稳定性和可制造性指标一起进行多目标选择,而仅需序列输入和百分位数评分使其易于集成到迭代的设计-制造-测试循环中。通过发布模型、数据集和网络服务器,这项工作将自然度和配对评估标准化为常规标准,预计其更广泛的应用将减少实验死胡同,并缩短获得可开发先导分子的路径。