编辑推荐:
本研究成功组装了芋头(Colocasia esculenta)的高质量染色体级别参考基因组。研究人员利用Hi-C等测序技术,构建了大小为2,336.63 Mb、scaffold N50达181.70 Mb的基因组,并将96.86%的序列锚定到14条染色体上。基因组注释揭示了大量重复序列(85.16%)并预测了28,253个蛋白编码基因。该基因组的发布为深入进行芋头功能基因组学研究和遗传改良奠定了坚实基础。
芋头(Colocasia esculenta)是一种原产于东南亚的重要作物,属于天南星科(Araceae)芋属。它不仅在全球热带和亚热带地区被广泛种植作为粮食来源,其独特的口感和营养价值也备受青睐。然而,与许多主要粮食作物相比,芋头的基因组学研究长期以来相对滞后。这种滞后状态严重制约了从分子层面对其重要农艺性状(如抗病性、淀粉品质、环境适应性等)的理解,也阻碍了利用现代生物技术手段进行高效遗传改良的进程。为了突破这一瓶颈,填补芋头基因组资源的空白,一项旨在构建高质量染色体级别芋头基因组图谱的研究应运而生。
本研究发表在《Scientific Data》期刊上,其核心目标是产出首个染色体级别的芋头参考基因组,为后续深入的比较基因组学、功能基因组学及分子育种研究提供不可或缺的基础框架。为了达成这一目标,研究团队主要运用了高通量测序技术获取原始基因组序列数据,并利用Hi-C(染色质构象捕获)技术进行染色体水平的支架(scaffold)构建和挂载。此外,研究还采用了生物信息学方法对基因组进行重复序列注释、蛋白编码基因预测以及非编码RNA(包括rRNA、tRNA、snRNA、miRNA)的鉴定。
基因组组装与挂载
通过整合Illumina短读长、PacBio长读长以及Hi-C测序数据,研究人员成功获得了芋头基因组的染色体级别组装。最终组装版本的大小为2,336.63 Mb,其scaffold N50长度达到了181.70 Mb,显示出高度的连续性和完整性。利用Hi-C互作图谱,成功将96.86%的组装序列锚定到了14条染色体上,这与芋头的细胞遗传学染色体数目相符。
基因组注释
对组装基因组进行深入注释发现,重复序列构成了芋头基因组的绝大部分,比例高达85.16%,相当于1,989.98 Mb的序列。进一步的基因预测工作共鉴定出28,253个蛋白质编码基因。通过比对多个公共数据库,其中95.14%的预测基因获得了功能注释,揭示了这些基因可能参与的生物学过程。此外,研究还系统鉴定了芋头基因组中的各类非编码RNA,包括2,842个rRNA(核糖体RNA)、1,392个tRNA(转运RNA)、452个snRNA(小核RNA)以及68个miRNA(微RNA),为理解芋头基因表达的转录后调控提供了资源。
结论与讨论
本研究成功构建并发布了首个染色体级别的高质量芋头(Colocasia esculenta)参考基因组。该基因组组装在连续性和完整性方面表现优异,为芋头乃至整个天南星科植物的基因组学研究树立了新的标杆。全面的基因组注释不仅揭示了芋头基因组以重复序列为主的特征,还预测了超过2.8万个蛋白质编码基因并鉴定了大量非编码RNA,极大地丰富了芋头的基因组信息。这个参考基因组的获得,具有重要的意义。它为解决芋头重要农艺性状的遗传基础、物种进化历史、与其他作物的比较基因组学分析等关键科学问题提供了核心数据支撑。更重要的是,它将成为加速芋头分子育种进程的强大工具,例如通过基因编辑等技术针对特定性状进行精准改良,最终服务于芋头产业的可持续发展。