《Scientific Data》:De novo assembly at Chromosomal level of the Indigenous Venda chicken
编辑推荐:
本研究致力于解决地方鸡种遗传背景未知制约其可持续育种与改良的问题。研究人员利用长读长测序技术,结合Omni-C数据,首次对南非本土文达鸡进行了染色体水平的基因组从头组装,获得了高质量的基因组图谱。结果为解析其环境适应性(robustness traits)的遗传机制奠定了基础,对推进南部非洲家禽业的遗传改良和该品种的保护具有重要意义。
在南非,有一种被称为文达鸡的本土鸡种。它们以其卓越的“鲁棒性”(robustness)而闻名,能够在炎热、干燥、潮湿乃至食物短缺的恶劣环境下良好地生长、繁殖和存活。这些宝贵的性状,正是当地社区长期自繁自养过程中自然选择的结果,蕴含着适应极端气候和粗放管理的遗传“密码”。然而,尽管其表型优势突出,科学家们对其背后的遗传基础却知之甚少。没有一份高质量、精细的“遗传蓝图”——即染色体水平的基因组序列,就难以系统解析其适应性的分子机制,更不用说在现代化、可持续的育种计划中精准利用这些优良基因了。因此,为文达鸡构建一个染色体水平的参考基因组,不仅是揭开其生存奥秘的关键一步,更是保护和改良这一宝贵遗传资源、支持南部非洲家禽产业发展的迫切需求。
为了填补这一空白,一项发表在《Scientific Data》上的研究应运而生。研究人员的目标明确:为一只雌性文达鸡,利用前沿的基因组学技术,完成一个达到染色体水平的高质量基因组从头组装(de novo assembly)。
研究者主要采用了两种关键技术来达成这一目标。首先,他们利用长读长测序技术来克服短读长测序在复杂重复区域组装的困难,这是获得长片段连续序列的基础。其次,为了将组装的片段(scaffolds)进一步提升至染色体水平,他们引入了Omni-C(一种基于染色质构象捕获的技术)数据。该技术能够揭示基因组三维空间中的互作信息,从而有效地将scaffolds进行排序、定向和锚定到染色体上。样本来源为一只雌性文达鸡。
研究结果
基因组组装与质量评估
通过整合长读长测序和Omni-C数据,研究团队成功构建了文达鸡的基因组。组装出的基因组大小约为1.09 Gb,其中最长的scaffold达到了179 Mb。衡量组装连续性的关键指标表现优异:scaffold N50为90.4 Mb,contig N50为20 Mb,两者的L50值均为4。基因组的GC含量为42%。使用BUSCO(Benchmarking Universal Single-Copy Orthologs,一种基于保守同源基因评估组装完整性的工具)进行评估,结果显示该基因组的完整性高达97.3%,其中完整且单拷贝的基因有8056个。这些数据共同表明,本次组装获得了高度连续和完整的染色体水平基因组。
基因组注释
在组装好的基因组基础上,研究人员进行了基因结构预测。他们共预测出17,891个蛋白质编码基因,这些基因的平均长度约为4665.8 bp。这为后续的功能基因组学研究提供了基础的基因目录。
结论与讨论
本研究成功完成了首个南非本土文达鸡染色体水平的基因组从头组装。这个高质量的基因组是文达鸡遗传研究的里程碑式资源。它不仅填补了该重要地方品种基因组信息的空白,更重要的是,为后续深入解析其独特的鲁棒性(robustness traits,包括生长、繁殖和生存能力)的遗传机制铺平了道路。研究人员可以基于此参考基因组,开展群体遗传学、选择信号分析、重要经济性状和适应性性状的候选基因鉴定等一系列研究。因此,该基因组组装成果将对文达鸡这一遗传资源的科学保护、可持续的遗传改良计划的制定,乃至整个南部非洲地区家禽产业的韧性发展,做出至关重要的贡献。