《SCIENCE ADVANCES》:Scalable and cost-efficient custom gene library assembly from oligopools
编辑推荐:
研究人员开发了OMEGA(Oligo-based Multiplexed Efficient Gene Assembly,寡核苷酸多重高效基因组装)方法,这是一种低成本且易操作的技术,可利用标准实验室流程并行组装数百至数千个全长基因。该方法将目标基因计算拆分成
研究人员开发了OMEGA(Oligo-based Multiplexed Efficient Gene Assembly,寡核苷酸多重高效基因组装)方法,这是一种低成本且易操作的技术,可利用标准实验室流程并行组装数百至数千个全长基因。该方法将目标基因计算拆分成短片段,使其兼容Golden Gate(GG)克隆,并以混合寡核苷酸池的形式订购,在多重亚池中进行组装。研究人员系统优化了每个基因的片段数和每个反应的独立连接位点,证实OMEGA可利用多达70个GG位点组装长度达2.6千碱基的构建体。为验证方法,研究人员组装并功能筛选了包含810个天然及合成绿色荧光蛋白变体的文库,成功回收94%至97%的目标序列,且均匀性高。OMEGA实现了大规模精准文库构建,单基因成本最低可达1.50美元,为计算蛋白设计与高通量实验验证提供了广泛适用的解决方案。该软件已开源,并提供易于使用的Colab Notebook以促进社区应用。
本研究针对当前基因合成中存在的序列长度与规模难以兼得的瓶颈问题展开。随着宏基因组学、深度学习及生成式蛋白设计的发展,科研人员能够在计算机中探索庞大的序列空间,但实验表征仍受限于DNA合成的成本与可扩展性。现有商用合成方法必须在长片段基因合成(≤5000碱基对)与短片段寡核苷酸池(oligopools,约300碱基对)之间做出选择,前者成本高昂,后者长度不足以覆盖多数蛋白编码基因。虽然可通过DNA组装技术将寡核苷酸拼接成更长的基因,但已有方法在通量、保真度及工作流程复杂性方面存在局限。为此,研究人员开发了OMEGA方法,旨在利用标准分子生物学技术实现低成本、高通量的精准基因文库构建。
关键技术方法包括:(1)利用数据优化组装设计(Data-optimized assembly design, DAD)识别高保真Golden Gate连接位点;(2)采用模拟退火算法进行组合优化,为每个亚池分配正交的4碱基过hang位点;(3)将寡核苷酸池按正交引物分为最多92个亚池,在每个亚池中并行完成多重GG组装;(4)利用PacBio、Illumina及Oxford Nanopore测序评估组装保真度、覆盖率及偏差。样本队列包括Rubisco基因集、截短Cas9序列集,以及由天然同源序列与生成式蛋白语言模型设计的绿色荧光蛋白(GFP)变体集。
OMEGA:寡核苷酸多重高效基因组装
研究人员将目标基因拆分为多个寡核苷酸片段,并在亚池水平优化连接位点的正交性,确保各片段仅与正确配对片段连接。计算模拟显示,OMEGA在高序列一致性、极端GC含量及重复序列条件下均能保持高保真组装。
Golden Gate多重化的可扩展性极限
通过逐步增加GG位点数(20至70个)和片段数(3至15个),研究人员发现大多数组装的正确率超过90%,但当片段数超过12个时保真度显著下降。结果表明,在保持高保真度的前提下,OMEGA可实现多达70个GG位点的多重组装。
大规模基因文库的组装
研究人员成功组装了500个Rubisco基因(7片段)和18个截短Cas9基因(12片段),分别回收95%和近100%的目标序列,且多数序列丰度在平均值的10倍以内。误差分析表明,合成错误多于组装错误,且多为不影响功能的沉默突变。
天然与合成GFP基因的大规模组装
利用810个GFP基因(含天然同源序列与生成式模型设计的合成序列),OMEGA回收了94%至97%的目标序列,且文库均匀性高。功能性筛选显示,合成GFP库中约26%的变体具备荧光活性,其中部分亮度超过野生型。
OMEGA加速合成荧光蛋白的生成式设计与筛选
结合多种蛋白语言模型(CARP-640M、MIF-ST、ESM-MSA)生成的序列,研究人员验证了OMEGA在高度相似序列中的组装能力,并成功筛选出功能变体,证明了其在生成式蛋白设计闭环中的应用潜力。
在讨论部分,研究人员指出OMEGA突破了传统基因合成的长度与规模权衡限制,单基因成本降低十倍以上,并能与现有Golden Gate流程无缝衔接。尽管文库存在一定丰度偏差,但通过重复独立组装并合并结果可有效缓解。OMEGA的性能随寡核苷酸合成技术进步而有望进一步提升,未来可支持更长、更精准的基因文库构建。该方法为蛋白质工程、代谢工程及合成生物学提供了经济、高效且可扩展的解决方案,尤其适用于需要大规模探索序列功能关系的研究。