《Biochemistry and Biophysics Reports》:In silico exploration of the genomic repertoire of Iranian aquatic bacteria: Prophage carriage, bioactive compound potential, CRISPR-Cas immunity, and integrated defensive-metabolic islands
编辑推荐:
伊朗独特且探索不足的水生生态系统代表了微生物多样性的重要储库。本研究首次对来自高盐湖泊和湿地的38株本地伊朗细菌菌株进行了全面的基因组调查,整合了其次级代谢组、细菌素潜力、常驻前噬菌体和基因组结构的计算机分析。基因组挖掘揭示了次级代谢产物生产的多产能力,识别了
伊朗独特且探索不足的水生生态系统代表了微生物多样性的重要储库。本研究首次对来自高盐湖泊和湿地的38株本地伊朗细菌菌株进行了全面的基因组调查,整合了其次级代谢组、细菌素潜力、常驻前噬菌体和基因组结构的计算机分析。基因组挖掘揭示了次级代谢产物生产的多产能力,识别了数十个生物合成基因簇(BGCs)。ectoine生物合成无处不在,强调了其作为关键渗透保护剂的作用,而萜烯、聚酮化合物和杂合代谢物的多样化BGCs也很普遍。同时,研究人员鉴定了广泛的核糖体合成和翻译后修饰肽(RiPPs),包括已知的细菌素。此外,研究人员在这些基因组内表征了八个高质量的前噬菌体,编码辅助基因,如碳水化合物活性酶(CAZymes)和推定的anti-CRISPR(ACR)蛋白。细菌宿主本身配备了强大的防御系统,在大多数菌株中检测到CRISPR-Cas位点,主要是I型。至关重要的是,研究人员识别了多功能基因组岛,其在物理上将BGCs与防御系统(例如CRISPR-Cas、限制-修饰)和前噬菌体区域联系起来。研究人员提出了“堡垒假说(Fortress Hypothesis)”来解释这种架构,即代谢物生产和防御机制的共定位保护了代谢投资免受噬菌体捕食和遗传丢失的影响。这种整合的基因组排列突显了一种在极端环境中生存的复杂协同进化策略。研究结果将这些本土细菌定位为发现新型生物活性化合物、酶和生物技术工具的宝贵遗传资源,对抗生素发现、CRISPR调控和理解极端生态位中的适应性微生物基因组学具有重要意义。
这篇发表于《Biochemistry and Biophysics Reports》的论文,针对伊朗独特且研究不足的水生生态系统,首次对源自高盐湖泊和湿地的38株本土细菌菌株进行了全面的基因组调查。研究旨在通过整合计算机分析,解析这些极端环境微生物的次级代谢潜能、细菌素生产能力、前噬菌体多样性及其与宿主防御系统的基因组架构关联,以揭示其在极端环境下的协同进化策略及生物技术应用潜力。
研究人员主要采用以下关键技术方法:从伊朗生物资源中心(IBRC)和国家生物技术信息中心(NCBI)获取38株细菌的基因组数据;利用antiSMASH和BAGEL4工具识别次级代谢产物和细菌素基因簇(BGCs);通过PHASTEST和VirSorter2结合CheckV筛选高质量前噬菌体;使用PhaBOX和PhageScope进行前噬菌体注释与分类;借助FastANI进行平均核苷酸一致性分析,ViPTree构建系统发育树;通过eggNOG-mapper、InterProScan和dbCAN3预测辅助代谢基因(AMGs)、受体结合蛋白(RBPs)和碳水化合物活性酶(CAZymes);利用CRISPRCasFinder和DefenseFinder分析CRISPR-Cas及其他防御系统;并采用空间邻近性方法定义多功能基因组岛。
研究结果
3.1. 已识别的次级代谢物基因盒
研究发现单一生物合成基因盒中,ectoine生物合成基因簇出现频率最高(43次),表明其作为渗透保护剂的关键作用。此外,还广泛检测到萜烯、III型聚酮合酶(T3PKS)和非核糖体肽合成酶(NRPS)等簇。杂交簇分析揭示了多个基因簇的物理连锁,例如在Marinobacter persicus中发现的芳基多烯和间苯二酚路径的杂交簇,暗示了新型“嵌合”代谢物的合成潜力。
3.2. 已识别的细菌素
通过BAGEL4和antiSMASH分析,共鉴定出46个独特的细菌素BGCs。其中包括Sactipeptides、LAPs(类羊毛硫抗生素肽)等多种核糖体合成和翻译后修饰肽(RiPPs),以及Linocin_M18、Zoocin_A等已知细菌素的核心蛋白。Salininema halophila被鉴定为主要的细菌素生产者。
3.3. 前噬菌体识别
通过生物信息学工具预测并筛选出8个高质量、宿主特异性的前噬菌体。这些前噬菌体分属不同的分类谱系,包括Caudoviricetes和Bielevirus phiO18P等,其中大多数表现为温和生活方式,仅Ph_Sapr1被鉴定为烈性噬菌体。
3.4. 细菌基因组和前噬菌体相似性
ANI热图显示同种细菌菌株间的基因组相似性极高(≥78%),而不同物种间则显著降低(<78.3%)。前噬菌体序列比较显示,除同宿主内的高度相似外,不同宿主来源的噬菌体间无显著相似性。
3.5. 前噬菌体特征
选定的8个前噬菌体基因组长度平均为50.4 kbp,GC含量跨度较大(39.8%至65.6%)。它们在基因组成上存在差异,例如Ph_Salpro2拥有最多的基因数(75个),而Ph_Sapr1则拥有最多的裂解基因(5个)。
3.6. 系统发育分析
ViPTree分析显示,不同前噬菌体聚类于不同的病毒进化枝。例如,Ph_Salpro簇与Streptomyces噬菌体密切相关,而Ph_Sapr1则与感染弧菌属(Vibrio)的噬菌体聚在一起,反映了噬菌体与其宿主的生态关联。
3.7. 比较基因组分析
与参考基因组的比较证实了前噬菌体的分类地位,并揭示了基因组内的共线性。例如,Ph_Salpro1和Ph_Salpro4表现出广泛的序列共线性,表明它们之间存在密切的遗传关系。
3.8. 预测的CAZymes, RBPs, 和AMGs
仅在三个前噬菌体中发现了CAZyme基因(如GH24和GH18家族),表明多糖降解能力分布不均。仅Ph_Ocea成功预测了一个尾部纤维蛋白(RBP)。未通过KEGG数据库验证到推定的AMGs。
3.9. 已识别的CRISPR-Cas系统
在38株菌中的35株中检测到了CRISPR-Cas系统,主要为I型(尤其是I-E亚型)及其效应蛋白Cas3。Salininema proteolyticumIBRC-M 10908携带的CRISPR位点数量最多。
3.10. 推定的ACR蛋白
通过AcrHub分析,在8个噬菌体基因组中预测了122个潜在的anti-CRISPR(ACR)蛋白。Ph_Alpe拥有最多的预测ACR蛋白(25个),表明其可能具备较强的抑制宿主CRISPR免疫的能力。
3.11. 防御和反防御系统
细菌基因组中广泛存在限制-修饰(RM)系统等防御机制,Salinivibrio proteolyticusTGB10拥有最多的防御系统。前噬菌体中也携带了少量的RM系统和Butters_gp30_gp31等防御/反防御基因。
3.12. 整合代谢-防御岛的基因组架构
在12株细菌中发现了23个不同的基因组岛,主要分为防御-代谢岛、CRISPR-代谢岛等。这些岛屿的物理共定位表明代谢生产与防御机制在基因组水平上的整合。
3.13-3.17. 各类基因组岛的具体案例
研究详细描述了多种复杂的整合架构。例如,在Salinivibrio proteolyticusTGB10中发现了一个结合了CRISPR阵列、Cas基因簇、Hachiman防御系统和氢氰酸BGC的多层适应性免疫与代谢岛。在Limimonas halophila和Oceanobacillus limi中,观察到了最复杂的完全整合架构,其中代谢基因簇与防御系统(如Mokosh_TypeII、RM_Type_IIG)共享完全相同的基因组位点,显示出极高的功能重叠。
讨论与结论
讨论部分指出,这些细菌装备了复杂的遗传武器库,包括丰富的次级代谢产物(如普遍存在的ectoine)、多样的细菌素以及宿主特异性的前噬菌体。这些前噬菌体不仅是遗传搭车者,还通过编码CAZymes(如GH18)和ACR蛋白直接影响宿主生态和免疫逃逸。细菌自身强大的CRISPR-Cas系统(主要是I型)与前噬菌体携带的反防御基因之间,构成了动态的协同进化军备竞赛。
研究提出的“堡垒假说(Fortress Hypothesis)”是核心理论贡献。该假说认为,由于次级代谢产物的生产在代谢上代价高昂,细菌通过将BGCs与防御系统(CRISPR-Cas、RM等)物理耦合,以保护其巨大的代谢投资免受噬菌体捕食和遗传丢失。这种“恐慌按钮”策略确保了细胞在代谢活跃、高价值目标状态下启动最强的防御机制。此外,TTA密码子在防御基因中的高频使用暗示了代谢物生产与防御动员可能受共同的细胞翻译能力信号调控。
综上所述,这项首次针对伊朗本土水生细菌的基因组调查揭示了一个丰富的遗传库,其特征是多功能的基因组岛战略性地共定位了BGCs与防御/反防御系统。研究人员提出的“堡垒假说”解释了这种架构的进化逻辑:即通过代谢生产与保护系统的物理耦合,保障了对抗噬菌体捕食和遗传漂变的细胞投资。这一发现突显了化学创新与抗病毒免疫在极端伊朗栖息地适应中的复杂交织,并将这些本土细菌确立为发现新型生物活性化合物、酶和生物技术工具(如新型酶、CRISPR抑制剂、抗菌肽和渗透保护剂途径)的重要遗传资源。