综述:从单细胞到硅基:新兴技术变革单克隆抗体发现

《Antibodies》:From Single Cells to Silicon: Emerging Technologies Transforming Monoclonal Antibody Discovery

【字体: 时间:2026年06月10日 来源:Antibodies 2.7

编辑推荐:

  单克隆抗体(monoclonal antibody, mAb)发现已被单细胞技术、微流控、高通量测序和计算设计的进展所变革。现代平台能够探究大量单个B细胞,直接将抗体序列与抗原特异性和功能活性相关联。微流控和光流控系统现在支持抗体分泌细胞的高通量区室化和功能筛

  
单克隆抗体(monoclonal antibody, mAb)发现已被单细胞技术、微流控、高通量测序和计算设计的进展所变革。现代平台能够探究大量单个B细胞,直接将抗体序列与抗原特异性和功能活性相关联。微流控和光流控系统现在支持抗体分泌细胞的高通量区室化和功能筛选,而基于测序的方法允许并行恢复配对的重链和轻链序列。这些发展已将抗体发现从基于结合的选择转向功能优先范式,使得能够快速识别诊断和治疗相关的抗体。与计算工具(包括机器学习和基于结构的建模)的整合进一步促进了闭环发现流程的出现,其中实验方法和计算机模拟方法迭代优化候选分子。本综述总结了近十年来单细胞微工具的关键进展,并强调了实验技术与计算技术的融合如何将抗体发现重塑为可扩展、数据驱动且日益自动化的平台。
**1. Introduction**
单克隆抗体(monoclonal antibody, mAb)已成为现代医学中最具变革性的治疗药物类别之一,全球已有超过170种抗体类疗法获批,其中阿达木单抗、利妥昔单抗、曲妥珠单抗和英夫利西单抗等属于最畅销药物。尽管其临床和商业成功,发现过程仍然复杂且资源密集。传统方法(如杂交瘤技术和噬菌体展示)虽被广泛使用,但存在通量低、人工配对破坏天然VH/VL配对、无法直接揭示天然免疫背景等局限。自2000年代中期以来,单细胞分析技术的出现实现了范式转变,可直接检查单个B细胞并恢复天然配对的抗体序列。同时,人工智能(AI)方法(如AlphaFold、生成式模型)被应用于结构预测、序列优化和从头设计,推动了闭环发现流程的发展。本综述探讨了单细胞技术与AI驱动计算工具的融合如何重塑抗体发现,涵盖高通量B细胞分离、计算机优化以及实验验证的反馈作用。

**2. Phase 1: Biological Capture & Screening**
**2.1. Microengraved Microwells, Chambers and Microcapillary Arrays**
基于微孔的系统将单个细胞隔离在纳升级体积中,通过表面捕获或原位荧光检测分泌抗体。现代纳升级孔系统支持多重、时间分辨的分泌谱分析,实现单细胞水平的动态表征,包括分泌动力学、抗原特异性和功能表型。微流控腔室系统提供精确的细胞微环境控制,支持多步骤测定,如亲和力测量、受体阻断和信号调节。近年来,这些系统已演变为先进的光流控平台,可并行培养和探究数千个B细胞或浆细胞,实现功能优先的抗体发现。微毛细管阵列通过熔融毛细管束在极小体积内空间隔离数百万个细胞,实现高吞吐量筛选和空间索引。

**2.2. Microdroplet and Encapsulation Technologies**
微滴系统在过去十年中从概念验证分泌测定发展为最具可扩展性的单细胞抗体发现格式之一。其核心优势在于水包油液滴将单个细胞与试剂限制在皮升级体积内,使分泌抗体快速积累至可检测水平,同时保持与产生细胞的联系。最新封装系统结合液滴形成与水凝胶捕获基质,使抗体分泌细胞(antibody-secreting cells, ASCs)更易用于快速发现,可在约两周内筛选数百万个ASC并获得高亲和力抗体。微滴和封装技术已不再是简单的微型化分泌测定,而是涵盖超高通量初级筛选、定量分泌表型分析和序列恢复的平台家族。

**2.3. Single-Cell Sequencing and Immune Repertoire Profiling**
单细胞测序的整合从根本上改变了“筛选”的输出。现代工作流程不再止于阳性孔或液滴,而是直接获得配对重链和轻链序列、克隆型分配以及相关的特异性或功能标签。LIBRA-seq通过将B细胞暴露于DNA条形码化抗原,恢复抗原条形码和配对B细胞受体(B cell receptor, BCR)序列,实现大规模特异性映射。TRAPnseq捕获抗体分泌细胞局部分泌的免疫球蛋白,将抗原特异性与测序关联,可分析抗原特异性IgG和IgE分泌细胞。单细胞免疫库分析还用于重建克隆扩增、体细胞超突变、类别转换和谱系关系,结合转录组数据可识别可辨别的转录状态。

**2.4. Scalability, Integration and Throughput**
文献中一个明确的主题是,平台不再仅凭敏感性或优雅性评估,而是取决于其可扩展性和上下游整合程度。腔室和纳米笔系统通常处理数千到数万个细胞,提供丰富的功能信息;微孔系统处于中等通量;微毛细管阵列和液滴工作流程在通量上领先,每实验可筛选105至107个细胞。可扩展性已不再等同于原始细胞计数,而是工作流程意义上的可扩展:支持有意义的细胞数量,与细胞回收和测序无缝集成,并生成可进行计算处理的数据集。

**2.5. Emergence of Function-First Antibody Discovery**
过去十年中的一个重要概念变化是从结合优先转向功能优先发现。更新型的单细胞平台将生物学相关行为(如中和、受体阻断、信号调节)作为最早的选择标准。微流控腔室和微毛细管阵列尤其影响深远,因为它们允许对同一细胞进行重复和顺序测定。多重化趋势也显著,通过抗原面板、条形码或荧光读数从单细胞导出多个功能或特异性特征。功能优先和多重化发现的实践效果是可衡量的时间压缩,将抗体发现周期从数月缩短至数天。

**3. Phase 2: Computational Analysis & Generative AI**
**3.1. Computational Repertoire Analysis**
计算库分析将大规模单细胞测序数据集转化为生物学见解。克隆型聚类是核心步骤,基于共享的V(D)J基因使用和互补决定区3(complementary determining region 3, CDR3)高相似性对序列分组。工具如IgBlast、MiXCR和Change-O可注释V(D)J片段并分组为克隆相关家族。谱系追踪通过构建系统发育树建模体细胞超突变和亲和成熟过程。多样性度量(如辛普森多样性指数、香农熵)评估库结构。机器学习方法(如UMAP、t-SNE)用于可视化库结构并预测功能属性。与功能性筛选数据(如LIBRA-seq)的整合可精确识别富集型结合子。

**3.2. 3D Structure Prediction**
三维结构预测已成为计算机抗体发现的支柱。AlphaFold利用Evoformer架构从多序列比对(multiple sequence alignment, MSA)和学习到的残基间空间关系预测高度准确的结构。针对抗体高度可变的CDR环,专门模型如IgFold和DeepAb在抗体结构数据集上训练,改进了CDR-H3的预测。AlphaFold3引入扩散建模策略,可处理蛋白质复合物、配体等。RFdiffusion等全原子扩散框架增强了动态特征建模。ESMFold基于蛋白质语言模型实现快速结构预测。AlphaFold-Multimer用于抗原-抗体复合物建模,RosettaDock和HADDOCK模拟结合相互作用。这些工具可评估可开发性特征(如稳定性、聚集性),并作为后续生成设计的结构基础。

**3.3. Generative AI Design—Molecular Docking and Dynamics Simulation**
生成式AI的进步实现了蛋白质结构和序列的直接设计。RFdiffusion扩散模型根据结构约束生成蛋白质骨架,可设计几何上与目标表位兼容的新型结合界面或CDR区域。ProteinMPNN在骨架生成后优化氨基酸序列,通过图神经网络生成结构兼容且生物学合理的序列。RFdiffusion Antibody将抗体框架和抗原固定,迭代添加和移除CDR区域的噪声,生成与预定表位“热点”残基对接的多样化骨架构象。物理学能量评估工具FoldX可快速估计折叠稳定性和结合自由能变化(ΔΔG)。随后,通过分子对接(如RosettaDock、HADDOCK)和结合预测模拟抗体-抗原相互作用并估计亲和力。分子动力学(molecular dynamics, MD)模拟捕获复合物的动态行为、构象灵活性和热波动,并通过MM/PBSA或自由能扰动方法估计结合自由能。对接和模拟的输出被整合用于候选排名,形成迭代闭环优化过程。当前挑战包括准确建模构象灵活性、评分函数和训练数据的局限性以及AI模型的“黑箱”特性。

**3.4. Computational Filtering: Binding Affinity and Developability Assessment**
计算过滤是下游关键步骤,通过整合结合亲和力预测和可开发性特征来优先排序高质量抗体。结合亲和力评估采用基于结构的方法(对接分数、能量计算)和机器学习模型。可开发性评估分析稳定性、溶解度、低聚集倾向,识别电荷分布、疏水斑块和聚集倾向基序等缺陷。平台如治疗性抗体分析器(Therapeutic Antibody Profiler)集成多项指标标记高风险候选。局限性在于模型和输入结构的准确性,尤其是在CDR环等柔性区域。

**3.5. Integration of Single Cell and In Silico Pipelines: Closed-Loop Antibody Discovery**
单细胞技术与计算优化的融合形成了预测、验证和优化的连续循环。单细胞平台生成的高分辨率实验数据与机器学习和计算机设计工具耦合。闭环系统允许重复优化周期:计算预测指导实验验证,新数据反馈回AI模型以提出更具结合性或可开发性的候选序列。实例包括LIBRA-seq快速识别SARS-CoV-2广谱中和抗体、深度学习优化曲妥珠单抗的亲和力和可开发性,以及贝叶斯语言模型优化单链可变区片段。尽管取得了进展,但训练数据质量和多样性、异质数据整合、计算预测与实际生物学行为的偏差仍是挑战。实验验证仍然必不可少。

**4. Phase 3: Selection and Experimental Validation**
第三阶段涉及计算机预测候选抗体的选择、实验表达和验证。典型检测包括抗原结合(ELISA、流式细胞术、SPR/BLI)、功能活性(中和、受体阻断、基于细胞的测定)和可开发性评估(稳定性、聚集倾向、表达产量)。实验验证的结果直接反馈回计算流程,形成迭代反馈循环。高质量的序列-预测-实验测量数据集用于重新训练和精炼机器学习模型,改进其预测准确性。这种整合使抗体发现转向混合实验-计算学科,实现数据驱动、自我改进的工程化过程。AI驱动抗体发现的主要局限性包括:湿实验室环境缺乏计算专业知识和基础设施、深度学习模型的“黑箱”可解释性差、训练数据集偏差影响通用性,以及手动流程阻碍广泛采用。

**5. Conclusions and Future Directions**
单细胞微工具、高通量筛选、测序和计算设计的整合带来了速度和规模的巨大提升,功能优先筛选和多重测定提高了候选质量。然而,各平台间在通量和测定复杂性上存在权衡,AI模型受数据质量、偏差和通用性限制。非蛋白抗原(如糖类)的抗体发现因数据稀缺和结构异质性面临更大挑战。未来方向包括改进实验平台标准化和互操作性、扩展高质量数据集、增强AI模型可解释性,以及实现真正闭环、自适应、可预测的发现系统。功能优先发现的兴起已改变了抗体发现平台的结构和抱负,最新的系统不仅识别抗体,还表征功能潜力并将其与序列关联,以直接影响治疗时间线的速度和规模。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号