揭示獐(Hydropotes inermis)适应性演化与基因组奥秘的端粒到端粒完整基因组图谱

《Scientific Data》:A telomere-to-telomere genome assembly of Chinese water deer (Hydropotes inermis)

【字体: 时间:2026年04月22日 来源:Scientific Data 6.9

编辑推荐:

  为解决高质量基因组资源匮乏制约对相对原始的獐(Hydropotes inermis)独特适应性与生物学性状研究的瓶颈,研究人员利用PacBio HiFi、Oxford Nanopore Technologies (ONT)及Hi-C测序技术,成功构建了雌性獐的端粒到端粒(Telomere-to-Telomere, T2T)无间隙基因组。该组装大小为3.45 Gb,挂载于35条染色体,包含60个端粒和35个着丝粒。基因注释获得24,398个蛋白质编码基因。基因组质量值(QV)达52.56,BUSCO完整度为99.40%,证实了其高度的完整性、连续性与准确性。该研究为鹿科(Cervidae)的演化历史研究提供了关键的遗传学依据。

  
在生命科学的宏伟画卷中,每一个物种的基因组都是一本记录着其演化历程与生存智慧的“天书”。解读这些“天书”,是理解生物多样性起源、物种适应性演化乃至生命奥秘的关键。在中国东部沿海及朝鲜半岛,生活着一种古老而特别的鹿科成员——獐(Hydropotes inermis)。作为一种体型相对较小、染色体数目为2n=70的原始鹿科物种,獐拥有许多独特的生物学性状,比如雄性不长角而发育有发达的上犬齿(獠牙),这使得它在鹿科家族中显得特立独行。然而,长期以来,由于缺乏高质量的基因组资源,科学家们难以深入探究这些独特性状背后的遗传基础,也无法在精细的基因组水平上厘清獐在鹿科乃至更广范围内的演化地位。这成为了阻碍相关进化生物学和遗传学研究的瓶颈。一个高质量、完整的基因组参考序列,就如同为这片未知的遗传大陆绘制出一张精确的全景地图,是开启后续一切探索的基石。
为了填补这一空白,并为鹿科的进化研究提供高质量遗传资源,一个研究团队在《Scientific Data》上发表了一项重要成果。他们综合利用了PacBio高保真(HiFi)长读长测序、Oxford Nanopore Technologies (ONT)超长读长测序以及Hi-C染色质构象捕获技术,成功完成了对一只雌性獐的端粒到端粒(Telomere-to-Telomere, T2T)无间隙基因组组装。这意味着,从染色体一端的端粒到另一端的端粒,其基因组序列被完整、连续地拼接出来,没有留下任何未知的缺口。
本研究主要采用了以下关键技术方法:首先,利用PacBio HiFi和Oxford Nanopore Technologies (ONT)长读长测序技术获取高精度、超长的原始序列数据,为跨越复杂重复区域和实现无缝拼接奠定了基础。其次,应用Hi-C测序数据进行染色体水平的辅助组装,将组装出的长序列(contigs)准确无误地定位并挂载到具体的染色体上,构建出染色体级别的基因组图谱。在此基础上,通过生物信息学流程对组装序列进行注释,识别重复序列和蛋白质编码基因。
研究结果
高质量T2T基因组组装
研究人员成功获得了雌性獐的T2T基因组。最终组装大小为3.45 Gb,重叠群(contig)的N50长度达到了101.09 Mb,显示出极高的连续性。所有序列被成功地锚定到35条染色体上(对应其2n=70的核型),并鉴定出60个端粒和35个着丝粒序列,真正实现了“端粒到端粒”的完整覆盖。
全面的基因组注释
对组装好的基因组进行深入注释,发现其中33.36%的序列为各类重复序列。更重要的是,共预测出24,398个蛋白质编码基因,为后续的功能和比较基因组学分析提供了丰富的基因数据集。
基因组质量评估
通过与近缘物种基因组的比较分析,证实了该獐基因组具有高度的完整性、连续性和准确性。两项关键指标提供了有力支持:基因组质量值(Quality Value, QV)高达52.56,表明碱基水平的准确性极佳;通过基准通用单拷贝同源基因(BUSCO)评估,完整度达到了99.40%,说明绝大部分核心基因都被完整地包含在组装序列中。这些数据共同表明,该基因组组装达到了参考基因组级别的质量。
研究结论与意义
本研究成功构建了獐(Hydropotes inermis)的首个端粒到端粒(T2T)无间隙、染色体级别的高质量基因组。该基因组组装在连续性、完整性和准确性方面均表现出色,为这一原始鹿科物种提供了迄今为止最完善的遗传蓝图。这一成果具有多重重要意义:首先,它为解决因缺乏高质量基因组而制约的獐独特适应性(如无角、具獠牙)和生物学性状的遗传机制研究扫清了障碍。其次,这个高质量的基因组作为关键遗传资源,为在精确的分子水平上探讨鹿科(Cervidae)内部的系统发育关系、物种形成机制以及适应性演化历史提供了不可或缺的基准数据。最后,该研究也展示了利用PacBio HiFi、ONT和Hi-C等技术组合进行复杂基因组T2T组装的可行性,为其他非模式生物的高质量基因组学研究提供了可借鉴的技术路线。总之,这项研究不仅揭开了獐基因组的神秘面纱,也为我们更深入地理解鹿科动物的进化史诗打开了一扇新的大门。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号