来自墨西哥查尔乔阿潘湖的Coelastrella sp. UAM-C/S07的基因组草图组装与注释
《Microbiology Resource Announcements》:Draft genome assembly and annotation of Coelastrella sp. UAM-C/S07 from Chalchoapan Lake, Mexico
【字体:
大
中
小
】
时间:2026年04月24日
来源:Microbiology Resource Announcements 0.6
编辑推荐:
基因组测序显示Coelastrella sp. UAM-C/S07具备合成类胡萝卜素和脂肪酸潜力,完成1,065条contig组装(89.9 Mb,N50 218 kb),鉴定9,319个CDS,其中11个参与类胡萝卜素代谢,93个与脂质代谢相关。
摘要
在这项研究中,分析了微藻株Coelastrella sp. UAM-C/S07的基因组,以评估其作为生产高价值类胡萝卜素和脂肪酸的潜力。共鉴定出9,319个编码序列(CDSs),这些序列分布在通过de novo方法组装的1,065个contigs中。
公告
缓解大气中的二氧化碳是一个重大的环境挑战,而微藻作为高效的碳汇,在碳固定方面通常优于陆地植物(
1)。微藻生物量还提供了可持续的可再生能源和高价值代谢物(
2,
3)。
Coelastrella属具有生产类胡萝卜素(如虾青素和角黄素)以及积累适合生物柴油的脂质的能力(
4–6),因此具有很大的潜力。然而,该属的基因组资源仍然有限。
用于基因组分析的
Coelastrella sp.菌株先前是从墨西哥韦拉克鲁斯州的Chalchoapan湖(18.41,611° N, 95.13,417° W)分离得到的(
7)。该菌株是从单个分离细胞培养成单克隆,并在BG11培养基中于35°C、100 rpm和100 μmol photons m?2 s?1的条件下培养72小时后提取DNA(
8)。
基因组DNA使用DNeasy PowerSoil Kit(QIAGEN,德国)按照制造商的协议进行提取,并进行了一些小修改。DNA质量通过Thermo Fisher Nanodrop One(OD260/280和OD260/230)进行检测,完整性通过琼脂糖凝胶电泳验证(
9)。
全基因组测序是在MinION R10.4.1流式细胞仪(mK1b设备,FLO-MIN114)上使用Rapid Barcoding Kit V14(SQK-RBK114.24;Oxford Nanopore Technologies,英国牛津)进行的,生成了1,031,325条读段(200–173,656 bp)。读段质量使用FastQC(v0.74)(
10)进行评估,Filtlong(v0.3.1)(
11)用于Q20过滤,最终得到598,477条读段,N50为3,751 bp。组装工作使用Flye(v2.9.6)(
12)完成,随后通过三轮Racon(v1.4.3)(
13)和一轮Medaka(
14)进行优化,最后使用purge_dups(v1.2.6)(
15)去除冗余contigs。污染物和嵌合序列通过BlobToolkit(v4.4.6)(
16)、Kraken2(标准数据库)(v2.17.0)(
1718)去除。组装质量和完整性使用QUAST(v5.2.0)(
19)和BUSCO(v5.5.0)(
20)进行评估。
最终的基因组组装包含1,065个contigs,总长度为89.9 Mb,N50为218 kb,GC含量为52.05%,BUSCO完整性为91%。结构基因预测使用GeMoMa(v1.9)(
21)进行,以
Scenedesmus glucoliberatum PABB004(
22)和
Scenedesmus sp. NREL 46B-D3(
23)的基因组注释作为参考物种来预测蛋白质编码基因。
功能注释使用InterProScan(v5.76-107.0)(
24)、eggNOG-mapper(v2.1.13)(
25)和BLASTp(v2.1.16)(
26)针对UniProtKB/Swiss-Prot数据库进行。详细的注释覆盖率和完整性指标总结在
表1中。
表1Coelastrella sp. UAM-C/S07的组装和注释摘要| 类别 | 指标 | 值 |
|---|
| 基因组组装 | 组装大小 | 89.9 Mb |
| contigs数量 | 1,065 |
| N50 | 218 kb |
| L50 | 127 |
| GC含量 | 52.05% |
| 基因组注释 | BUSCO完整性 | 组装:91%;注释:87% |
| 预测的蛋白质编码基因 | 9,319 |
| 注释覆盖率 | InterProScan:8,645(92.8%)COG:7,139(76.6%)Swiss-Prot:5,311(57.0%)KEGG:4,649(49.9%)GO术语:1,302(14.0%) |
| 总ncRNA位点 | 119(54个tRNA,7个rRNA,3个snRNA,21个miRNA家族元件,33个isrG样小RNA) |
非编码RNA的注释使用Infernal(v1.1.5)(
27)进行,全长rRNA基因则使用Barrnap(v0.9)(
28表1。
这个草图基因组组装为未来研究微藻作为高价值化合物(如色素和脂质)的生产者,以及推进基因组生物学和代谢工程研究提供了宝贵的资源。
致谢
Mauricio Carrasco感谢SECIHTI提供的奖学金支持(CVU 1253628)。Adrian A Estrada-Graf感谢Fulbright García-Robles研究生奖学金的支持。这项工作得到了UAM资助的项目106 S264-24的支持,该项目是在应对当前挑战的研究提案征集活动中获得的,同时也得到了SECTEI(资助号SECTEI/044/2024)的支持。
作者们还感谢Mónica Rodríguez-Palacio提供对这项研究至关重要的生物材料。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号