Zygotorulaspora florentina菌株的康普茶(kombucha)的染色体级基因组组装

《Microbiology Resource Announcements》:Chromosome-level genome assembly of a kombucha isolate of Zygotorulaspora florentina

【字体: 时间:2026年04月24日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  基因组测序显示,源自诺福克产有机康普茶的开裂酵母菌Zygotorulaspora florentina NCYC 4520含15条contig,其中8条具末端13bp串联重复序列,总长11,137,782bp,GC含量41.03%,基因预测数5065,tRNA 194个。

  

摘要

Zygotorulaspora florentina是一种在酿造和葡萄酒制造行业中越来越受到关注的发酵酵母。本文报告了来自康普茶的Z. florentina NCYC 4520菌株的基因组序列草图。

公告

Zygotorulaspora florentina(以前称为Zygosaccharomyces florentinus1)是一种子囊菌酵母,可从多种来源分离得到,包括葡萄汁、植物材料、果蝇以及以水果为原料的软饮料(2)。由于它能够发酵麦芽糖和麦芽三糖,并且在与Saccharomyces cerevisiae共发酵过程中能够提升香气复杂性,因此在酿造和葡萄酒制造领域的应用前景日益受到关注(35)。本研究结合了短读长和长读长测序技术,对从英国诺里奇购买的一瓶诺福克产有机康普茶中分离出的Z. florentina NCYC 4520菌株进行了基因组组装。将100 μL康普茶样本接种在Rose Bengal琼脂上,于25°C下培养2天后,挑选菌落并通过两轮在Yeast Malt(YM)琼脂(含有10 g/L葡萄糖、3 g/L麦芽提取物、5 g/L蛋白胨和3 g/L酵母提取物)上的划线培养进行纯化,再次在25°C下培养。利用ITS1和ITS4引物(6, 7)通过ITS测序对该菌株进行鉴定(GenBank登录号:PX480735)。通过与NCBI的rRNA_typestrains/ITS_RefSeq_Fungi数据库进行BLASTn比对(8),发现其序列与Z. florentina标准菌株(KY106082)的同一性达到100%。
基因组DNA的提取使用的是Cambio公司的MasterPure酵母DNA纯化试剂盒,并添加了zymolyase和proteinase K处理步骤,样品来自在25°C下培养2天的液体YM培养物。短读长文库的制备采用了Illumina公司的Nextera DNA Flex文库制备试剂盒,使用20倍稀释的试剂,在Illumina NextSeq 500测序仪上进行测序,获得了1160万个150 bp的双端读取序列。Nanopore文库的制备则未进行片段化或大小筛选,使用的是Oxford Nanopore Technologies公司的SQK-LSK109 1D连接试剂盒(ONT),并在MinION仪器(ONT)上使用R9.4.1流动池进行测序,得到了336,776条读取序列,平均长度为15,734 bp。除非另有说明,所有软件均使用默认参数进行操作。碱基鉴定使用的是ONT公司的Guppy(v3.6.0)软件,并设置为高精度模式(model dna_r9.4.1_450bps_hac)。
Illumina测序数据使用fastp v.0.23.2(9)进行过滤;Nanopore测序数据使用NanoFilt v.2.3.0(10)进行过滤,筛选出质量≥10且长度≥5,000 bp的读取序列。读取序列的质量通过FastQC v.0.12.1(11)进行验证。过滤后保留了161,449条Nanopore读取序列(平均长度为14,386 bp)。Nanopore读取序列的de novo组装使用Flye v2.9.1(12)完成,采用“ONT regular reads, pre-Guppy5”模式处理长读取序列。最终组装结果通过三轮使用BWA-MEM v.0.7.17.1(13)的对齐和Pilon v.1.24(14)的校正进行了优化。最终组装结果包含15个 contigs,其中8个为染色体大小的 contigs,其中5个 contigs在一端含有13 bp的端粒重复序列(5′-TGTAGGGGTGTGG-3′)n15),该序列通过Tandem Repeats Finder v.4.09(16)鉴定得出。基因组总长度为11,137,782 bp,N50为1,404,365 bp,G + C含量为41.03%。使用saccharomycete_odb10数据集通过BUSCO v.5.5.0(17)估计基因组完整性为99.6%。Augustus v.3.2.3(18)基于Saccharomyces cerevisiae训练数据集预测了5,065个蛋白质编码基因,tRNAscan-SE 2.0(19)检测到194个tRNA基因。

致谢

作者衷心感谢生物技术和生物科学研究委员会(BBSRC)的支持;本研究由BBSRC的食品微生物组与健康战略计划(项目编号BB/X011054/1)及其下属项目BBS/E/F/000PR13631资助。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号