DNA复制错误驱动的全基因组小反向三倍体动态研究

《Advanced Science》:DNA Replication Errors Drive Genome-Wide Small Inverted Triplication Dynamics

【字体: 时间:2026年04月09日 来源:Advanced Science 14.1

编辑推荐:

  本研究聚焦于基因组结构变异(SV)的起源机制,针对罕见且复杂的小型反向三倍体(SIT)的发现与成因展开探索。研究人员通过分析大量癌症基因组数据,结合自主开发的PacBioR工具进行长读长测序分析,揭示了FEN1/Rad27基因缺陷通过影响冈崎片段成熟(OFM)过程导致SIT形成,并解析了其特有的DUP/IN/DUP结构特征与细胞内的动态消除机制。该研究不仅为理解基因组不稳定性提供了新见解,也为相关疾病研究提供了新的工具和靶点。

  
我们的基因组就像一本精心编写的生命之书,但其稳定性时刻受到威胁。其中,结构变异(Structural Variants, SVs)——包括基因片段的插入、删除、倒位和重复——是导致基因组“错版”的重要原因之一,与癌症等多种人类疾病密切相关。然而,在众多SVs中,有一类称为“反向三倍体”的复杂变异尤其神秘。它像一个被镜像翻转后又被复制的片段,插入基因组中,形成独特的“重复-倒位-重复”结构。以往报道的反向三倍体动辄长达数千甚至数百万碱基对,但对于更小尺度、更普遍存在的类似变异,科学家们知之甚少。它们是如何产生的?与哪些基因有关?又在基因组中扮演什么角色?这些问题一直悬而未决。
为了解决这些谜题,一项发表在《Advanced Science》上的研究展开了深入探索。研究人员首先将目光投向了癌症基因组。通过对1340个涵盖22种癌症类型的样本进行数据分析,他们发现了4608个新颖的“小反向三倍体”事件。进一步的突变分析将矛头指向了一个关键基因:FEN1。这个基因的突变在SIT高发的癌症群体中显著富集。FEN1编码的蛋白是冈崎片段成熟过程中的关键“剪刀手”。为了在更可控的系统中验证这一发现,研究转向了模式生物酵母。他们利用PacBio高保真长读长测序技术,对FEN1的酵母同源基因rad27的缺失突变体及其他菌株进行了测序,并专门开发了名为PacBioR的生物信息学工具,用于从复杂的测序数据中精准捕获包括SIT在内的各种结构变异。
研究发现,在rad27缺失的酵母细胞中,SIT事件的数量显著增加,而在野生型中几乎检测不到。这直接证明了FEN1/Rad27的功能缺失是驱动SIT形成的关键因素。通过对这些SIT结构的精细解剖,研究团队描绘了它的标准“肖像”:这是一个平均由148 bp的直接重复序列、一个160 bp的中心倒位片段、一个30 bp的间隔序列和6 bp的断点连接区构成的DUP/IN/DUP结构。更有趣的是,SIT的断点倾向于位于核小体的中心点,并与冈崎片段的末端对齐,这将其起源牢牢锚定在DNA复制过程,特别是冈崎片段成熟这一环节。
那么,具体的形成机制是什么?研究人员提出了一个模型:当Rad27功能缺失时,5'瓣状结构无法被正常切除,可能导致3'瓣状结构的形成。这个3'末端如果遇到回文序列,可能折回自身或与互补链以反向方式退火,从而启动反向的DNA合成。随后,在复制叉遇到障碍时,DNA聚合酶可能发生模板转换,跳回原始模板再合成一次,最终形成完整的SIT结构。
然而,故事并未结束。研究发现,SIT结构在细胞中并不稳定。当将含有SIT结构的质粒转入大肠杆菌后,该结构会随着时间的推移被逐步、精确地消除。进一步的基因筛选发现,敲除sbcC、sbcD或rep基因会抑制这种消除,而敲除dnaQ或holC则会促进消除。基于此,研究提出了SIT的两种消除途径:一是DNA聚合酶III在复制发夹结构时发生滑动;二是Rep解旋酶促进链分离,以及SbcCD结构特异性核酸酶对发夹结构的切割。
本研究综合运用了癌症基因组学分析、PacBio高保真长读长测序、生物信息学工具开发(PacBioR)、酵母遗传学模型、微球菌核酸酶测序以及大肠杆菌功能筛选等关键技术方法。其中,癌症样本数据来源于公共数据库和本实验室收集的B细胞急性淋巴细胞白血病样本。
研究结果部分的主要发现如下:
2.1 FEN1突变在高SIT发生率癌症群体中显著富集
通过对1340个癌症样本的分析,确定了SIT事件在不同癌症中的存在。突变分析显示,在SIT高发组中,有4002个功能缺失突变基因显著富集,其中DNA相关基因有303个。FEN1是富集程度最高的前10个基因之一,其突变与高SIT发生率显著相关。
2.2 PacBioR:利用HiFi测序数据精确注释SIT的高性能工具
为解决短读长测序在检测复杂SV方面的局限,研究团队开发了PacBioR软件包。在模拟数据集上,PacBioR在检测插入、重复、倒位和SIT方面表现优异,其综合性能(特别是召回率)优于其他常用SV检测工具。
2.3 rad27基因的缺失促进SIT形成
在酵母模型中,rad27Δ突变体中检测到大量SIT事件,而野生型中未检测到。其他参与5'瓣状结构处理的基因(如exo1Δ和dna2-1)突变体仅产生极少量SIT。互补实验证实,表达野生型Rad27可几乎完全回补表型,而表达催化死亡突变体(D179A)则不能,证明Rad27的瓣状内切酶活性是抑制SIT形成所必需的。此外,dun1缺失能减少rad27Δ在高温下产生的SIT数量,而pif1缺失也能显著抑制SIT形成。
2.4 SIT的基因组分布和序列特征
SIT广泛分布于酵母基因组中,其数量与染色体长度正相关。对SIT结构的序列分析明确了其四个组成部分的典型尺寸:侧翼重复中位长度148 bp,中心倒位片段160 bp,间隔序列30 bp,断点连接区6 bp。
2.5 SIT断点连接区定位于冈崎片段连接点
通过微球菌核酸酶测序分析核小体定位,并整合冈崎片段测序数据,发现SIT的断点以及冈崎片段的末端都倾向于集中在核小体的中心点附近,这为SIT起源于DNA复制过程提供了空间关联证据。
2.6 SIT的细胞不稳定性与消除
将SIT结构克隆到质粒并转入大肠杆菌后,该结构会被细胞主动消除。基因筛选实验发现,dnaQ(编码Pol III的ε亚基,具有3'→5'外切酶活性)和holC(编码Pol III的χ亚基)的缺失会加速SIT的消除;而rep(编码解旋酶)以及sbcC和sbcD(组成SbcCD核酸酶复合体)的缺失则会稳定SIT结构,抑制其消除。
结论与讨论
本研究系统性地鉴定并阐明了一种新型的基因组结构变异——小反向三倍体。其主要结论是:SIT是一种由DNA复制错误驱动、与FEN1/Rad27功能缺陷密切相关的小型DUP/IN/DUP结构变异。它很可能源于冈崎片段成熟过程受阻后,通过3'瓣状结构的异常侵入和模板转换机制形成。研究开发的PacBioR工具为检测此类复杂SV提供了有力手段。此外,SIT在细胞中处于动态平衡状态,可通过DNA聚合酶滑动和发夹结构切割两种途径被消除。
这项研究的意义重大。首先,它揭示了DNA复制过程中一个此前未被充分认识的错误途径,极大地丰富了我们对基因组不稳定性和结构变异起源的理解。其次,它将FEN1这一关键基因与特定的复杂SV联系起来,为理解相关疾病的遗传基础提供了新视角。再者,研究所阐明的SIT消除机制,暗示细胞可能进化出相应的“质量监控”系统来维护基因组完整性。最后,PacBioR工具的推出,为科学界研究复杂基因组重排提供了宝贵的资源。当然,研究也存在局限性,例如机制研究主要在酵母和大肠杆菌中进行,其在哺乳动物系统中的普适性有待验证。SIT形成过程中第二次模板转换的具体分子事件也需进一步阐明。这些问题的探索,将有助于完善基因组不稳定性的理论框架,并可能为相关疾病的诊断和治疗带来新的启示。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号