Zygotorulaspora florentina(以前称为
Zygosaccharomyces florentinus(
1)是一种子囊菌酵母,可从多种来源分离得到,包括葡萄汁、植物材料、果蝇以及以水果为原料的软饮料(
2)。由于它能够发酵麦芽糖和麦芽三糖,并且在与
Saccharomyces cerevisiae共发酵过程中能够提升香气复杂性,因此在酿造和葡萄酒制造领域的应用前景日益受到关注(
3–5)。本研究结合了短读长和长读长测序技术,对从英国诺里奇购买的一瓶诺福克产有机康普茶中分离出的
Z. florentina NCYC 4520菌株进行了基因组组装。将100 μL康普茶样本接种在Rose Bengal琼脂上,于25°C下培养2天后,挑选菌落并通过两轮在Yeast Malt(YM)琼脂(含有10 g/L葡萄糖、3 g/L麦芽提取物、5 g/L蛋白胨和3 g/L酵母提取物)上的划线培养进行纯化,再次在25°C下培养。利用ITS1和ITS4引物(
6,
7)通过ITS测序对该菌株进行鉴定(GenBank登录号:
PX480735)。通过与NCBI的rRNA_typestrains/ITS_RefSeq_Fungi数据库进行BLASTn比对(
8),发现其序列与
Z. florentina标准菌株(
KY106082)的同一性达到100%。
基因组DNA的提取使用的是Cambio公司的MasterPure酵母DNA纯化试剂盒,并添加了zymolyase和proteinase K处理步骤,样品来自在25°C下培养2天的液体YM培养物。短读长文库的制备采用了Illumina公司的Nextera DNA Flex文库制备试剂盒,使用20倍稀释的试剂,在Illumina NextSeq 500测序仪上进行测序,获得了1160万个150 bp的双端读取序列。Nanopore文库的制备则未进行片段化或大小筛选,使用的是Oxford Nanopore Technologies公司的SQK-LSK109 1D连接试剂盒(ONT),并在MinION仪器(ONT)上使用R9.4.1流动池进行测序,得到了336,776条读取序列,平均长度为15,734 bp。除非另有说明,所有软件均使用默认参数进行操作。碱基鉴定使用的是ONT公司的Guppy(v3.6.0)软件,并设置为高精度模式(model dna_r9.4.1_450bps_hac)。
Illumina测序数据使用fastp v.0.23.2(
9)进行过滤;Nanopore测序数据使用NanoFilt v.2.3.0(
10)进行过滤,筛选出质量≥10且长度≥5,000 bp的读取序列。读取序列的质量通过FastQC v.0.12.1(
11)进行验证。过滤后保留了161,449条Nanopore读取序列(平均长度为14,386 bp)。Nanopore读取序列的
de novo组装使用Flye v2.9.1(
12)完成,采用“ONT regular reads, pre-Guppy5”模式处理长读取序列。最终组装结果通过三轮使用BWA-MEM v.0.7.17.1(
13)的对齐和Pilon v.1.24(
14)的校正进行了优化。最终组装结果包含15个 contigs,其中8个为染色体大小的 contigs,其中5个 contigs在一端含有13 bp的端粒重复序列(5′-
TGTAGGGGTGTGG-3′)
n(
15),该序列通过Tandem Repeats Finder v.4.09(
16)鉴定得出。基因组总长度为11,137,782 bp,N
50为1,404,365 bp,G + C含量为41.03%。使用saccharomycete_odb10数据集通过BUSCO v.5.5.0(
17)估计基因组完整性为99.6%。Augustus v.3.2.3(
18)基于
Saccharomyces cerevisiae训练数据集预测了5,065个蛋白质编码基因,tRNAscan-SE 2.0(
19)检测到194个tRNA基因。