利用长读长和短读长宏基因组数据,再次完成了来自Anastrepha fraterculus昆虫体内的Wolbachia菌种的全基因组组装

《Microbiology Resource Announcements》:De novo whole-genome assembly of the Wolbachia sp. endosymbiont from Anastrepha fraterculus using long- and short-read metagenomic data

【字体: 时间:2026年04月24日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  基于宏基因组分析的南美果蝇Anastrepha fraterculus中Wolbachia sp.的基因组组装与注释完成,揭示了其基因组结构特征、宿主互作机制及在防控中的应用价值。

  

摘要

通过对宿主基因组项目中的测序数据进行宏基因组分析,完成了感染Anastrepha fraterculus 1号的Wolbachia菌种的整个基因组组装和注释。这项研究有助于表征这种内共生细菌,并为研究宿主-共生体相互作用和害虫管理策略提供了宝贵的见解。

公告

包括古菌、细菌、病毒和真菌在内的微生物在昆虫的消化、营养、发育和免疫过程中发挥着关键作用(1)。特别是,研究昆虫害虫中的共生细菌为开发创新和可持续的控制策略开辟了新的研究途径(2)。南美洲果蝇Anastrepha fraterculus Wiedemann 1830(双翅目:实蝇科)是南美洲和中美洲国家最具破坏性的昆虫害虫之一,造成了巨大的经济损失(3)。我们基于宏基因组分析,结合Oxford Nanopore Technologies(ONT)和Illumina-MGI的宿主基因组数据,完成了感染A. fraterculus Brazilian 1形态型的Wolbachia菌种的de novo基因组组装和注释(4)。
基因组DNA是从感染了wAfraCast2_A Wolbachia菌株的A. fraterculus新出现的雌性个体中获得的(5),具体方法如前所述(4)。使用SRE-XS Kit(Pacific Biosciences, CA)进行了尺寸筛选。文库使用SQK-LSK110 Kit(ONT, UK)制备,在PromethION R9流式细胞仪上测序72小时,并使用Guppy-v6.4.6(ONT, UK)以高精度模式进行碱基调用。兼容Illumina的文库通过Covaris公司的shearing和NxSeq AmpFREE Low-DNA-Ligation Kit(BioSearch Technologies, CA, USA)以及IDT xGen-Dual-Index-Adapters制备,转换为MGI格式,并在DNBSEQ-G400(MGI Tech, USA)上进行测序,使用cPAS化学方法生成150-bp的双端读长。所有测序服务均由McGill Center(加拿大蒙特利尔)提供。ONT读长的质量控制使用了Nanoplot-v1.44.0(6)、Porechop-v0.2.4(7)来修剪接头,以及Filtlong-v0.2.1(8)来过滤长读长。使用Flye-v2.9.5-b1801(9)和--meta选项完成了de novo宏基因组组装。Kraken2结合StandardPF数据库(10)用于contig的分类。使用Seqtk-v1.5(11)提取被归类为Wolbachia的contig,并通过Minimap2-v2.3(12)进行末端重叠验证。Illumina-MGI短读长使用Pilon-v1.24(13)进行 polishing处理。基因组的完整性和一致性使用Benchmarking Universal Single-Copy Orthologs(BUSCO)-v5.8.2(14)和Rickettsia基因数据集进行评估。使用FastANI-v1.34(15)计算与Drosophila melanogaster wMel(NZ_CP046925.1)中的Wolbachia内共生体的成对平均核苷酸身份(ANI)。结构注释使用RASTtk-v1.073(16)完成。dnaA基因的位置通过注释确定,序列使用SeqKit-v2.10.0(17)进行旋转。< />(18)用于注释Wolbachia基因组中的噬菌体序列。
共有247,588条高质量的ONT长读长被分配给微生物(表1),组装得到1,363个contig。一个包含1,463,312个核苷酸的环状contig被分类为Wolbachia菌种,覆盖率为869倍。使用965,855条Illumina-MGI读长进行polishing处理后,得到了一个长度为1,463,854 bp的基因组,其鸟嘌呤-胞嘧啶(GC)含量为35.07%,与wMel参考基因组的ANI为99.1%。BUSCO分析表明该基因组质量较高,完整性为99.5%,重复序列占比为0.3%。注释后的基因组包含1,549个预测的蛋白质编码序列、34个tRNA以及两个不相连的转录单元(16S和23S-5S)中的完整rRNA基因集。鉴定出两个完整的噬菌体区域和119个与IS5和IS4家族的插入序列(ISs)相关的开放阅读框(ORFs)(图1)。A. fraterculus中的Wolbachia内共生体基因组为研究宿主-共生体相互作用和增强害虫管理策略提供了宝贵的资源。
表1
表1 A. fraterculus雌性个体ONT长读长中微生物的分类鉴定(总原始读长 = 15,810,325;高质量读长 = 15,810,276)
KluyveromycesFlammeovirgaErwiniaStreptomyces Segatella Staphylococcus Vibrio Sphingobacterium Rickettsia Acinetobacter Brevibacterium
微生物组 分类 读长数量
病毒 Herpesvirales 19
Poxviridae 13
Baculoviridae 10
Caudovirales 4
双链DNA病毒,无RNA阶段 3
总病毒 49
真菌 Fusarium 4,948
Yarrowia 928
Candida 374
169
Naumovozyma 137
Tetrapisispora 135
Botrytis 108
总真菌 6,799
细菌 Wolbachia 239,236
774
280
126
84
51
48
44
38
34
25
总细菌 240,740
总计 247,588
污染物 Homo sapiens 82,520
图1
Wolbachia菌株的圆形基因组可视化图,显示了同心数据层,包括噬菌体区域、编码序列、GC含量模式、复制起点以及带有基因注释的rRNA转录单元。
图1 感染Anastrepha fraterculus 1号的wAfraCast2_A Wolbachia菌株的基因组示意图。从外环到内环依次为:完整的噬菌体区域、编码序列、GC含量和反向链编码序列。复制起点用绿色标示,rRNA转录单元用红色标示。

致谢

本研究得到了PICT 2021 0491和PICT 2021-0447(阿根廷国家科学技术促进局)、PDI087(国家农业技术研究所)以及国际原子能机构研究合同编号23402的支持,该合同属于“用于SIT应用的遗传性别鉴定菌株开发通用方法”的协调研究项目的一部分。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号