来自墨西哥查尔乔阿潘湖的Coelastrella sp. UAM-C/S07的基因组草图组装与注释

《Microbiology Resource Announcements》:Draft genome assembly and annotation of Coelastrella sp. UAM-C/S07 from Chalchoapan Lake, Mexico

【字体: 时间:2026年04月24日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  基因组测序显示Coelastrella sp. UAM-C/S07具备合成类胡萝卜素和脂肪酸潜力,完成1,065条contig组装(89.9 Mb,N50 218 kb),鉴定9,319个CDS,其中11个参与类胡萝卜素代谢,93个与脂质代谢相关。

  

摘要

在这项研究中,分析了微藻株Coelastrella sp. UAM-C/S07的基因组,以评估其作为生产高价值类胡萝卜素和脂肪酸的潜力。共鉴定出9,319个编码序列(CDSs),这些序列分布在通过de novo方法组装的1,065个contigs中。

公告

缓解大气中的二氧化碳是一个重大的环境挑战,而微藻作为高效的碳汇,在碳固定方面通常优于陆地植物(1)。微藻生物量还提供了可持续的可再生能源和高价值代谢物(2, 3)。Coelastrella属具有生产类胡萝卜素(如虾青素和角黄素)以及积累适合生物柴油的脂质的能力(46),因此具有很大的潜力。然而,该属的基因组资源仍然有限。
用于基因组分析的Coelastrella sp.菌株先前是从墨西哥韦拉克鲁斯州的Chalchoapan湖(18.41,611° N, 95.13,417° W)分离得到的(7)。该菌株是从单个分离细胞培养成单克隆,并在BG11培养基中于35°C、100 rpm和100 μmol photons m?2 s?1的条件下培养72小时后提取DNA(8)。
基因组DNA使用DNeasy PowerSoil Kit(QIAGEN,德国)按照制造商的协议进行提取,并进行了一些小修改。DNA质量通过Thermo Fisher Nanodrop One(OD260/280和OD260/230)进行检测,完整性通过琼脂糖凝胶电泳验证(9)。
全基因组测序是在MinION R10.4.1流式细胞仪(mK1b设备,FLO-MIN114)上使用Rapid Barcoding Kit V14(SQK-RBK114.24;Oxford Nanopore Technologies,英国牛津)进行的,生成了1,031,325条读段(200–173,656 bp)。读段质量使用FastQC(v0.74)(10)进行评估,Filtlong(v0.3.1)(11)用于Q20过滤,最终得到598,477条读段,N50为3,751 bp。组装工作使用Flye(v2.9.6)(12)完成,随后通过三轮Racon(v1.4.3)(13)和一轮Medaka(14)进行优化,最后使用purge_dups(v1.2.6)(15)去除冗余contigs。污染物和嵌合序列通过BlobToolkit(v4.4.6)(16)、Kraken2(标准数据库)(v2.17.0)(1718)去除。组装质量和完整性使用QUAST(v5.2.0)(19)和BUSCO(v5.5.0)(20)进行评估。
最终的基因组组装包含1,065个contigs,总长度为89.9 Mb,N50为218 kb,GC含量为52.05%,BUSCO完整性为91%。结构基因预测使用GeMoMa(v1.9)(21)进行,以Scenedesmus glucoliberatum PABB004(22)和Scenedesmus sp. NREL 46B-D3(23)的基因组注释作为参考物种来预测蛋白质编码基因。
功能注释使用InterProScan(v5.76-107.0)(24)、eggNOG-mapper(v2.1.13)(25)和BLASTp(v2.1.16)(26)针对UniProtKB/Swiss-Prot数据库进行。详细的注释覆盖率和完整性指标总结在表1中。
表1
表1Coelastrella sp. UAM-C/S07的组装和注释摘要
类别指标
基因组组装组装大小89.9 Mb
contigs数量1,065
N50218 kb
L50127
GC含量52.05%
基因组注释BUSCO完整性组装:91%;注释:87%
预测的蛋白质编码基因9,319
注释覆盖率InterProScan:8,645(92.8%)COG:7,139(76.6%)Swiss-Prot:5,311(57.0%)KEGG:4,649(49.9%)GO术语:1,302(14.0%)
总ncRNA位点119(54个tRNA,7个rRNA,3个snRNA,21个miRNA家族元件,33个isrG样小RNA)
非编码RNA的注释使用Infernal(v1.1.5)(27)进行,全长rRNA基因则使用Barrnap(v0.9)(28表1
这个草图基因组组装为未来研究微藻作为高价值化合物(如色素和脂质)的生产者,以及推进基因组生物学和代谢工程研究提供了宝贵的资源。

致谢

Mauricio Carrasco感谢SECIHTI提供的奖学金支持(CVU 1253628)。Adrian A Estrada-Graf感谢Fulbright García-Robles研究生奖学金的支持。这项工作得到了UAM资助的项目106 S264-24的支持,该项目是在应对当前挑战的研究提案征集活动中获得的,同时也得到了SECTEI(资助号SECTEI/044/2024)的支持。
作者们还感谢Mónica Rodríguez-Palacio提供对这项研究至关重要的生物材料。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号