四种垃圾填埋场中抗菌素耐药基因的多样性、流行率及其迁移性

《Canadian Journal of Microbiology》:Antimicrobial resistance gene diversity, prevalence, and mobility within four landfills

【字体: 时间:2026年03月24日 来源:Canadian Journal of Microbiology 1.6

编辑推荐:

  **摘要** 抗生素在垃圾填埋场中会对存在的微生物产生选择压力,从而选择出具有抗生素抗性基因(ARGs)和抗生素抗性生物(ARO)。本研究的目的是评估垃圾填埋场是否是抗菌素抗性的热点区域,以及垃圾填埋场是否可能通过ARG的横向基因转移促进全球ARO的多样性。本研究使用了基因组

  **摘要**
抗生素在垃圾填埋场中会对存在的微生物产生选择压力,从而选择出具有抗生素抗性基因(ARGs)和抗生素抗性生物(ARO)。本研究的目的是评估垃圾填埋场是否是抗菌素抗性的热点区域,以及垃圾填埋场是否可能通过ARG的横向基因转移促进全球ARO的多样性。本研究使用了基因组解析的宏基因组测序技术,结合序列搜索工具和深度学习方法,分析了四个活跃的市政垃圾填埋场及其相邻地下水或地表水系统中的ARG多样性和流行情况。与原始环境和人为污染环境的比较显示,垃圾填埋场的微生物群落具有独特的ARG特征,包括更广泛的ARG多样性。根据样本类型的不同,质粒占组装支架的4.1%–8.4%,并携带了5.4%–12.0%的已鉴定ARGs。在移动元件上富集的ARG抗性机制包括多重耐药性和抗生素失活。结果表明,垃圾填埋场拥有高度多样的抗菌素抗性机制和药物类别,其中相当一部分抗性机制编码在移动元件上。因此,垃圾填埋场可能是ARG转移和新抗性生物谱系进化的混合场所。

**引言**
抗生素作为药物污染物,在垃圾填埋场中日益受到关注(Bandala等人,2021年)。抗生素可能通过兽医药物、家庭垃圾、非法临床废物和活性污泥等途径进入垃圾填埋场(Wang等人,2015年;Bai等人,2022年)。随着垃圾填埋场中液态渗滤液的形成,其中会含有抗生素(Bai等人,2022年)。由于强烈的选择压力,垃圾填埋场内可能发生新的抗生素抗性基因(ARGs)和抗生素抗性生物(ARO)的进化(Liu等人,2018年)。垃圾填埋场中的ARGs和ARO可以通过渗滤液渗出进入周围环境,污染周围的地下水和地表水系统(Wang等人,2015年;Liu等人,2018年;Bai等人,2022年),并通过环境传播对人类健康构成潜在威胁(Ben等人,2019年)。一些研究主要通过靶向扩增已知ARGs来分析垃圾填埋场中的ARGs和ARO(Wang等人,2015年;Xu等人,2021年),但这些研究仅限于可用引物所能检测到的ARGs多样性(Zhang等人,2022年)。

抗生素抗性在细菌谱系中变得越来越普遍,这在很大程度上是由于通过水平基因转移(HGT)获得ARGs所致。ARGs的传播主要通过移动遗传元件(MGEs)实现。MGEs允许DNA在细胞内和细胞间移动(Partridge等人,2018年)。MGEs可以通过转化、转导或接合等方式通过HGT获得(Davies和Davies,2010年;San Millan,2018年;Brown-Jaque等人,2015年;Li和Wang,2021年)。质粒、噬菌体和基因组岛(GIs)都是HGT的载体(Smillie等人,2010年),并且都能够携带ARGs并将其整合到宿主的基因组中(Smillie等人,2010年;Brown-Jaque等人,2015年;San Millan,2018年;Li和Wang,2021年)。本研究的目的是确定垃圾填埋场中ARGs的多样性、流行情况及其移动潜力,以及ARO的多样性,因为这些环境可能是ARG进化和ARO发展的关键场所。为此,我们使用了基于读段的宏基因组测序和基因组解析技术来分析四个垃圾填埋场中的ARG多样性和流行情况,并将其与受污染环境和原始环境进行比较。我们预测质粒可能是垃圾填埋场微生物群落中ARGs的移动储存库。我们假设垃圾填埋场的ARG特征与其他环境相比具有更高的多样性,并且垃圾填埋场中ARG的丰度可能与ARG的移动性相关,这表明该地点存在强烈的抗生素抗性选择压力。

**材料与方法**
**垃圾填埋场宏基因组**
本研究共使用了四个垃圾填埋场和29个宏基因组。这些宏基因组分别来自安大略省南部的垃圾填埋场(SO)、加利福尼亚州南部的垃圾填埋场(CA)、美国东北海岸的垃圾填埋场(NEUS)以及牙买加的市政垃圾填埋场(JA)(表S1)。SO垃圾填埋场处理住宅和商业垃圾,2016年和2017年共采集了14个宏基因组样本。SO垃圾填埋场的样本包括渗滤液井(2016年:LW1至LW3;2017年:LW1至LW4)、复合渗滤液池(代表整个填埋场区域的混合样本,2016年7月14日:CLC_T1;2016年7月20日:CLC_T2;2017年10月:CLC_T3)以及地下水或雨水收集池(2016年:GW1;2017年:GW1、GW3和SWC)。CA垃圾填埋场主要处理工业垃圾,2019年6月采集了4个宏基因组样本:两个来自渗滤液处理厂的生物反应器(CA_Filter和CA_Sludge,这两个样本均来自0.22 μm过滤器,分别使用物理过滤器或堵塞的碎片进行DNA提取);一个来自处理厂进水流的渗滤液样本(CA_TPIn);还有一个来自渗滤液井的样本(CA_LW1)。NEUS垃圾填埋场处理住宅固体垃圾和建筑废弃物,共采集了9个宏基因组样本,其中8个来自渗滤液井(2019年3月:NEUS_A、B、C、D1、D2、E、F1、F2),另一个来自复合渗滤液样本(2019年3月:NEUS_CSWMC)。JA垃圾填埋场处理市政固体垃圾,提供了2个宏基因组样本,一个来自渗滤液池样本(2015年:JA_Leachate),另一个来自相邻河流的地表水样本(2015年:JA_River)。生物样本的采集方法包括离心(JA)、过滤到0.2 μm Sterivex过滤器(CA、NEUS)或0.1 μm聚醚砜膜过滤器(SO)(Collins-Fairclough等人,2018年;Sauk和Hug,2022年;George和Hug,2023年;Grégoire等人,2023年)。

这些宏基因组之前已被用于研究总微生物多样性(Collins-Fairclough等人,2018年;Sauk和Hug,2022年)、垃圾填埋场内的病毒-宿主相互作用(George和Hug,2023年)、垃圾填埋场内甲烷循环种群动态的变化(Grégoire等人,2023年),以及跨垃圾填埋场的病毒多样性研究(包括巨噬病毒和病毒编码的CRISPR-Cas系统,George等人,2025年)。然而,此前没有研究对这些数据集中的ARG进行注释或分布分析。

对于所有宏基因组,首先使用bbduk(https://github.com/BioInfoTools/BBMap/blob/master/sh/bbduk.sh)进行读段质量控制,去除适配子和常见污染物(如PhiX、lambda DNA),然后使用sickle(https://github.com/najoshi/sickle)根据fastq质量指标对读段进行筛选。宏基因组使用metaspades v.3.13.1进行组装,读段使用bowtie2 v.2.4.4映射到组装的支架上(Bankevich等人,2012年;Langmead和Salzberg,2012年)。长度超过2.5 kb的支架使用CONCOCT、MaxBin2和MetaBAT2进行分箱,共识分箱由DAS Tool生成(Alneberg等人,2014年;Wu等人,2015年;Sieber等人,2018年;Kang等人,2019年)。如果宏基因组的完整性超过70%且污染程度低于10%(根据CheckM版本1,Parks等人,2015年),则将其保留用于进一步分析。使用GTDB-tk v.2.4.0(Chaumeil等人,2019年)确定宏基因组的分类归属。

为了进行比较,我们将渗滤液井(LW:SO_2016 LW1至LW3;SO_2017 LW1至LW4;CA_LW1;JA_Leachate;NEUS_A、B、C、D1、D2、E、F1、F2)、复合渗滤液池(CLC:SO_2016 CLC_T1、CLC_T2;SO_2017 CLC_T3;CA_TPIn;NEUS_CSWMC)、处理厂样本(TP:CA_Filter;CA_Sludge)、地表水样本(SW:SO_2017 SWC和JA River)以及地下水样本(GW:SO_2016 GW1;SO_2017 GW1、GW3)进行了分组。共使用了30个对照环境宏基因组(表S1)。用于比较的环境包括与农业相关的淡水样本(AG1-4)、饮用水样本(DW1-4)、地下水样本(GW1-4)、矿井废水样本(M1-2)、污水样本(S1-2)和污水处理厂样本(WWTP1-14)(相关样本的访问编号和引用信息见表S1)。

**RGI和DeepARG的数据处理**
为了确保所有组装的宏基因组都经过了一致的处理,使用pullseq从大于1000 bp的宏基因组fasta文件中提取所有序列(https://github.com/bcthomas/pullseq)。Prodigal用于从1000 bp以上的支架中预测基因(Hyatt等人,2010年)。氨基酸序列被用作抗性基因识别器(RGI)的输入(McArthur等人,2013年)。使用“rgi main”命令,设置“-t”为蛋白质,“-n”为8,并包含“—clean”标志。核苷酸基因序列被用作DeepARG的输入,设置“—model”为LS,“—type”为nucl(Arango-Argoty等人,2018年)。对于基于读段的分析,所有经过质量修剪和过滤的读段在RGI中使用“rgi bwt”命令进行分析,并映射到CARD数据库v4.0.1和wildcard数据库v4.0.1。映射读段的统计信息见表S2。

对于每个组装的宏基因组,汇总并比较了按抗性机制(仅RGI)、药物类别和基因家族分类的开放阅读框(ORFs)的数量。比较表根据每个宏基因组每100,000个ORFs的预测ARG数量进行了标准化,以消除宏基因组大小差异的影响。对于基于读段的分析,根据CARD访问号、基因家族和药物类别对结果进行总结,并按每100,000个读段进行标准化(完整结果见补充文件1,该文件存储在Open Science Framework上,网址为https://doi.org/10.17605/OSF.IO/MYG8Q)。

**RGI和DeepARG识别的含有ARG的支架**
将RGI和DeepARG识别的含有ARG的支架与质量过滤后的分箱连接起来,以确定携带ARG的宏基因组(MAGs)。参考GTDB分类文件来确定携带ARG的ARO的分类。从Hartmann Science Center Pathogen Search(A–Z;https://www.hartmann-science-center.com/en/hygiene-knowledge/pathogens-a-z)中识别已知病原体属,根据文献搜索确定个别物种是病原体、机会性病原体还是非病原体。

**统计与数据可视化**
在R中从标准化数据生成热图。为了更好地可视化相对丰度的变化,数据进行了对数转换,将零值转换为-2以便将其包含在热图中。使用R中的ComplexHeatmap包(v4.4.1;Gu等人,2016年),按行数据(标准化ARG计数)对列(宏基因组)进行聚类,并按相对丰度降序排列行。使用R(v4.4.1;Gu等人,2016年)中的非参数测试确定统计差异。初步的分类比较使用Kruskal–Wallace检验,子类别的比较使用Wilcox秩和检验,并应用Benjamini Hochberg p值校正进行多重检验(Haynes,2013年)。所有比较的显著性阈值设为0.05。

**与其他环境的比较**
用于比较的宏基因组从联合基因组研究所(Joint Genome Institute)的Integrated Microbial Genomes(IMG)数据库下载。从IMG中获取环境的分类对象ID,以找到具有代表性的宏基因组(平均组装大小:每个样本227.0 Mbp)。所有外群样本类型及其宏基因组序列元数据详见表S1。所有外群宏基因组的处理方法与上述组装宏基因组相同,从使用pullseq进行初始支架清理开始。每个宏基因组每100,000个基因的标准化ARG计数见补充文件1,该文件存储在Open Science Framework上,网址为https://doi.org/10.17605/OSF.IO/MYG8Q。热图和统计比较按照上述方法进行。

**PlasClass和PPR-Meta的数据处理**
使用PlasClass和PPR-Meta(Fang等人,2019年;Pellow等人,2020年)对1000 bp以上的支架文件进行质粒分类。对于PlasClass,使用“classify_fasta.py”命令和默认参数。任何概率等于或大于0.8的支架都被视为潜在的质粒,这一标准比默认的0.5更为严格(Pellow等人,2020年)。PPR_meta使用默认参数,任何被标注为“plasmid”的支架都被保留(Fang等人,2019年)。对于每个垃圾填埋场宏基因组,保留PlasClass和PPR-Meta预测的质粒的交集(即两个分类器都检测到的支架)。使用Virsorter和CheckV对1000 bp以上的支架文件进行检测,以识别潜在的噬菌体(Guo等人,2021年;Nayfach等人,2021年)。使用“virsorter”命令和默认设置。VirSorter的结果使用CheckV在默认设置下进行了质量检查。那些被CheckV列为“高质量”噬菌体元件的支架被编译成一个列表,以便与质粒列表进行比较。那些被VirSorter和CheckV检测为噬菌体,同时被PlasClass和PPR-Meta检测为质粒的支架被从进一步分析中移除。

### 质粒载量和ARG移动性的确定
被确定为质粒的支架与编码ARG的支架ID列表进行了比较,以识别编码ARG的质粒。质粒载量是通过计算编码ARG的质粒数量除以样本中包含ARG的支架总数来计算的(Kraemer等人,2022年)。

### 质粒编码的ARG的分类
质粒编码的ARG根据RGI和DeepARG的分类被总结为抗性机制(仅RGI)、药物类别和基因家族类别,以便在不同样本之间进行比较。这些分类与RGI和DeepARG生成的完整、标准化的ARG数据集进行了对比。使用R中的ggplot包和geom_col函数(Wickham 2016)通过可视化工具展示了这些比较结果。

### 结果
#### 抗生素抗性基因谱型
预测的ARG数量与组装的宏基因组大小密切相关,因此将数量标准化为给定宏基因组中ARG占总基因的比例,然后为了便于数值比较,报告为每100,000个基因的ARG数量(ARGs/100 kG)。由于宏基因组组装并未包含所有序列信息,还进行了基于读取的分析,将宏基因组读取映射到RGI-CARD数据库。对于垃圾填埋场数据集,纳入样本组装的读取比例从20.9%到89.3%不等(平均值:55.8%)(详见补充数据文件1中的完整宏基因组组装和读取纳入统计)。

RGI和DeepARG的结果分别报告,以便比较基于序列搜索和基于深度学习的方法。从每个数据集中识别出的ARG比例在RGI和DeepARG之间具有相关性(R2 = 0.66)。对于垃圾填埋场样本,RGI结果显示JA Leachate宏基因组的ARG比例最高,为63.52 ARGs/100 kG,而SO 2017 GW3宏基因组的ARG比例最低,为45.50 ARGs/100 kG(表S1)。RGI基于读取的数据和组装的宏基因组之间的ARG丰度水平总体呈弱正相关(R2 = 0.28),其中基于读取的数据显示出更广泛的标准化值范围(256–3317 reads/1M reads),而组装的数据范围为45.50–63.52 RGS/100 kG。在基于读取的分析中,JA Leachate宏基因组编码的ARG比例也最高(3317.2 reads/1M reads),而SO 2017 GW3宏基因组编码的ARG比例最低(308.4 reads/1M reads)。使用DeepARG的结果,CA LW1宏基因组的ARG比例最高,为75.64 ARGs/100 kG,而SO 2017 LW1宏基因组的ARG比例最低,为10.30 ARGs/100 kG。

### 环境比较
两种方法都将垃圾填埋场的ARG/100 kG范围进行了划分。根据RGI的预测,S2宏基因组编码的ARG比例最高,为182.67 ARGs/100 kG,DW3和WWTP3宏基因组的比例分别略低于SO 2017 GW3宏基因组,分别为44.72和44.63 ARGs/100 kG(表S1)。DeepARG也显示了类似的模式,S2编码的ARG比例为263.85 ARGs/100 kG,但AG3宏基因组的预测ARG比例最低,为3.07 ARGs/100 kG(见表S1中的所有样本的ARG数量和标准化值)。

当按样本类型合并数据时,垃圾填埋场样本类型的ARG标准化数量处于中等水平(见表1中的范围)。与单独分析样本时类似,当在样本类型层面合并时,比较环境也涵盖了垃圾填埋场相关样本类型的ARG/100 kG范围(表1)。从RGI的结果来看,非垃圾填埋场环境类型的平均ARGs/100 kG最高的是污水宏基因组,为115.28(尽管这可能受到S2宏基因组相对较小的影响),而WWTP样本的ARGs/100 kG最低,为50.37。从DeepARG来看,污水类别的ARGs/100 kG最高,为153.47,而AG的ARGs/100 kG最低,为11.43(表1)。在两种方法下,没有任何环境类别在统计上显著不同。

### 环境中的ARG分类
RGI将ARG分类为三个层次:抗性机制是最广泛的类别,其次是药物类别,最后是基因家族,这是最精确的类别。DeepARG在其分类中仅使用药物类别和基因家族。

#### 抗性机制(RGI):
与其他环境相比,垃圾填埋场具有独特的抗性机制特征(图1A),包括更多样化的抗生素抗性机制。当将组装的宏基因组分类为“比较”、“垃圾填埋场”(LW、CLC和TP样本)以及“垃圾填埋场相关”(来自垃圾填埋场的GW和SW)时,垃圾填埋场样本观察到的抗性机制类别显著更高(与相关样本的p值分别为0.048和1.2e?9,与比较样本的p值分别为1.2e?9),其中垃圾填埋场相关样本观察到的抗性机制也显著高于比较环境(p = 0.012)。这些差异是由LW样本与AG(p = 0.025)、DW(0.027)、GW(0.022)和WWTP(0.00014)样本以及CLC与WWTP(p = 0.031)之间观察到的抗性机制数量显著增加所驱动的。从RGI的预测来看,所有环境中数量最多的抗性机制是单一药物抗性机制:抗生素外排、抗生素失活和抗生素靶点改变。抗生素靶点替换和抗生素靶点保护在组装数据中也非常普遍,其数量超过了任何多机制类别,并且在基于读取的分析中超过了抗生素靶点改变的合并类别。剩余的单一抗性机制类型——对抗生素的渗透性降低——显示出较低的信号强度(图1A)。DW2宏基因组与其他样本明显不同,其ARGs的总体多样性较低,且少数抗性机制的ARGs/100 kG值非常高(图1A)。

#### 药物类别:
RGI在组装的宏基因组中检测到的前五种目标药物类别是(1)二氨基嘧啶;(2)四环素/氟喹诺酮;(3)氨基糖苷;(4)四环素;(5)碳青霉烯类/青霉素类/头孢菌素类(图1B,图S1)。基于读取的分析也发现了其中两种,前五种药物类别是(1)消毒剂和防腐剂;(2)四环素和氟喹诺酮;(3)糖肽;(4)氨基糖苷;(5)利福霉素。DeepARG检测到的前五种目标药物类别是(1)多重药物;(2)氨基糖苷;(3)大环内酯类和林可霉素类(MLS);(4)福斯米霉素;(5)未分类(图S2)。所有分析中都高度识别出的目标药物类别抗性包括四环素、氨基糖苷、MLS和肽类抗生素抗性(图1B;图S2)。

#### 抗性机制的多样性
垃圾填埋场样本对不同药物类别的抗性多样性最广(图1B,图S1)。从RGI的数据来看,非垃圾填埋场环境类型的平均ARGs/100 kG最高的是污水宏基因组,为115.28(尽管这可能受到S2宏基因组相对较小的影响),而WWTP样本的ARGs/100 kG最低,为50.37。从DeepARG来看,污水类别的ARGs/100 kG最高,为153.47,但AG的ARGs/100 kG最低,为11.43(表1)。在任何一种ARG预测方法下,包括垃圾填埋场数据在内的所有环境类别之间都没有统计学上的显著差异。

### 不同环境中的ARG分类
RGI将ARG分类为三个层次:抗性机制是最广泛的类别,其次是药物类别,然后是基因家族,这是最精确的类别。DeepARG在其分类中仅使用药物类别和基因家族。

#### 抗性机制(RGI):
与其他环境相比,垃圾填埋场具有独特的抗性机制特征(图1A),包括更多样化的抗生素抗性机制。当将组装的宏基因组分类为“比较”、“垃圾填埋场”(LW、CLC和TP样本)以及“垃圾填埋场相关”(来自垃圾填埋场的GW和SW)时,垃圾填埋场样本观察到的抗性机制类别显著更高(与相关样本的p值分别为0.048和1.2e?9,与比较样本的p值分别为1.2e?9),其中垃圾填埋场相关样本观察到的抗性机制也显著高于比较环境(p = 0.012)。这些差异是由LW样本与AG(p = 0.025)、DW(0.027)、GW(0.022)和WWTP(0.00014)样本以及CLC与WWTP(p = 0.031)之间观察到的抗性机制数量显著增加所驱动的。从RGI的预测来看,所有环境中数量最多的抗性机制是单一药物抗性机制:抗生素外排、抗生素失活和抗生素靶点改变。抗生素靶点替换和抗生素靶点保护在组装数据中也非常普遍,其数量超过了任何多机制类别,并且在基于读取的分析中超过了抗生素靶点改变的合并类别。其余的单一抗性机制类型——对抗生素的渗透性降低——显示出较低的信号强度(图1A)。DW2宏基因组与其他样本明显不同,其ARGs的总体多样性较低,且少数抗性机制的ARGs/100 kG值非常高(图1A)。

#### 药物类别:
RGI在组装的宏基因组中检测到的前五种目标药物类别是(1)二氨基嘧啶;(2)四环素和氟喹诺酮;(3)氨基糖苷;(4)四环素;(5)碳青霉烯类和青霉素类(图1B,图S1)。基于读取的分析也发现了其中两种,前五种药物类别是(1)消毒剂和防腐剂;(2)四环素和氟喹诺酮;(3)糖肽;(4)氨基糖苷;(5)利福霉素。DeepARG检测到的前五种目标药物类别是(1)多重药物;(2)氨基糖苷;(3)大环内酯类和林可霉素类(MLS);(4)福斯米霉素;(5)未分类(图S2)。所有分析中都高度识别出的目标药物类别抗性包括四环素、氨基糖苷、MLS和肽类抗生素抗性(图1B;图S2)。

#### 抗性机制的多样性
与抗性机制水平类似,垃圾填埋场样本对不同药物类别的抗性多样性最广(图1B,图S1)。从RGI的数据来看,垃圾填埋场样本在不同药物类别中的代表性显著更高(与相关样本的p值分别为0.036和1.5e?9,与比较样本的p值分别为0.04和1.5e?9),这种差异主要由类别间的相似性驱动(LW与AG、DW、GW、WWTP)。在DA数据中,这一趋势得到了保持,垃圾填埋场样本的药物类别多样性显著高于相关(p = 0.04)和比较(p = 4e?5)环境,但显著配对较少(仅LW与AG、GW)。垃圾填埋场样本在热图中也聚集在一起,表明这些药物类别的分布是共享的(图1B,图S2)。DeepARG数据将垃圾填埋场TP样本与WWTP样本在热图中归为一类,这与RGI的结果不同,RGI的结果将垃圾填埋场TP样本与其他垃圾填埋场渗滤液样本归为一类(图S2)。

#### 基因家族:
RGI在组装的数据中检测到的前五种基因家族是(1)抗性-结节-细胞分裂(RND)抗生素外排泵;(2)三甲氧嘧啶抗性二氢叶酸还原酶;(3)主要促进因子超家族(MFS)抗生素外排泵;(4)OXA β-内酰胺酶;(5)ABC-F ATP-结合盒核糖体保护蛋白(图S3)。在基于RGI的基因分析中,前五种基因家族再次出现重叠,分别是(1)小型多重药物抗性抗生素外排泵;(2)抗性-结节-细胞分裂(RND)抗生素外排泵;(3)主要促进因子超家族(MFS)抗生素外排泵;(4)利福霉素抗性RNA聚合酶β亚基(rpoB);(5)vanY;糖肽抗性基因簇。RGI组装分析中检测到的其他三个最普遍的基因家族也在基于读取的分析中位列前25位基因家族之列。DeepARG检测到的前五种基因家族全部由单个基因组成:(1)ompR(外膜孔蛋白成分);(2)kdpE(两部分调节系统的一部分,属于CARD中的kdpDE基因家族);(3)bacA(在细胞壁生物合成过程中回收十一碳烯基焦磷酸盐,属于CARD中的十一碳烯基焦磷酸盐相关蛋白基因家族);(4)rpoB2(利福霉素抗性RNA聚合酶β亚基);(5)oprM(外膜蛋白,属于RND抗生素外排泵基因家族)(图S4)。对于垃圾填埋场而言,DeepARG中最常见的基因家族与整体DeepARG输出有所不同,rpoB2、oprM、vanU(一种转录调节因子,属于vanG基因簇中的vanG变体)和ugd(属于CARD中的pmr磷酸乙醇胺转移酶)是垃圾填埋场样本中检测到的最高基因家族。在RGI和DeepARG结果中都存在的基因家族有ompR、rpoB2、vanU和ugd(图S3;图S4)。然而,在RGI输出中,rpoB2、vanU和ugd的相对计数较低,其中vanU是所有基因家族中最低的,且仅存在于少数垃圾填埋场样本中。与其他环境相比,垃圾填埋场样本的基因家族多样性总体更高(见图S5中的p值)。这种基因家族的富集在统计上显著,将LW样本与AG、GW、WWTP和DW(仅RGI)样本进行比较时尤为明显,以及将CLC样本与WWTP样本进行比较时也是如此(见图S5图例中的p值)。

#### 垃圾填埋场宏基因组中的ARO分类
将预测的ARG与生成的MAGs关联起来,可以比较垃圾填埋场微生物群落中的完整多样性和预测的ARO。从完整的垃圾填埋场数据集中识别出432个目,包括UBA命名的谱系和其他未命名但在GTDB命名法(版本226)中定义的谱系。其中,RGI和DeepARG分别从337个和310个目中识别出了假定的ARO。Bacteroidales和Burkholderiales在完整数据集和两个程序预测的ARO数据集中的MAG数量最高(图2和S6)。在目级别,完整数据集与RGI ARO MAGs(p = 0.011)或DeepARG ARO MAGs(p = 0.00053)之间的总体比例存在显著差异。在RGI或DeepARG数据集中,所有四个垃圾填埋场数据集之间以及所有样本类型之间的鉴定ARO的分类归属也存在显著差异,除了CLC与LW(两者都如此)、GW与LW(两者都如此)以及CLC与GW(仅DeepARG)(表S3)。

在任何分析中,MAG比例超过10%的所有目都被突出显示以供进一步探索(图2和S6)。在牙买加垃圾填埋场宏基因组中,被识别出的抗生素抗性基因(MAGs)中,属于这些高比例(>10%)的目(orders)的基因所占比例要高得多。牙买加的宏基因组比其他地点的垃圾填埋场宏基因组小得多,因此MAGs的数量也少得多,这导致了被识别出的MAGs的相对丰度被夸大了。图2显示了使用RGI结果比较所有MAGs与编码抗生素抗性基因(ARGs)的MAGs的比例。RGI中垃圾填埋场中的ARG编码基因与MAGs中的支架相连,MAGs的分类来自GTDB-TK。使用R语言中的ggplot包和geom_col函数创建了每个样本的总MAGs(左列)和预测的编码ARGs的MAGs(右列)的分类条形图。MAGs按目(orders)进行总结,任何单个样本中占比超过10%的目被着色显示。垃圾填埋场地点按样本类型着色,分别来自安大略省南部(SO)、美国东北部(NEUS)、加利福尼亚州(CA)和牙买加(JA)。ARG代表抗生素抗性基因;RGI代表抗性基因标识符。

在完整数据集和RGI预测的ARO MAGs之间,这18个目之间的比例在成对Wilcoxon秩和测试中没有显著差异,表明这些数据集之间的差异来源于丰度较低的目。在完整数据集和DeepARG预测的ARO MAGs之间,有三个目表现出显著差异(Bacteroidales(p = 0.0074)、Minisyncoccales(0.0014)、Patescibacteriales(0.012),这些目在ARO MAGs数据集中的比例显著较低。

在RGI和DeepARG预测的ARO MAGs中,共有335个已命名的属的代表。其中,15个属携带已知的病原体,其中一个(Mycobacterium)属于NIAID生物防御病原体列表中的属(NIAID 2024)。与这15个属相关的51个MAGs中,有20个被分类到物种水平,其中6个代表已知的病原体,5个属于通常在环境样本中发现的机会性病原体(表S4)。被分类为病原体物种的6个MAGs来自Aeromonas caviae、Aeromonas bestiarum、Achromobacter pulmonis、Acinetobacter towneri、Pseudomonas fluorescens和Stenotrophomonas acidaminiphila。这些MAGs编码了多种ARGs,最值得注意的是,它们编码了多种多重耐药机制(详见表S4中每个疑似病原体的完整ARG列表)。

**质粒鉴定和质粒负荷**
从所有垃圾填埋场宏基因组数据集中鉴定出了质粒和噬菌体,以研究这些环境中预测的ARGs的移动性。LW(渗滤液井)样本类型的总质粒数量最多,其次是复合渗滤液池(CLC),然后是TP(处理厂)(表2)。地下水(GW)和地表水(SW)样本的总质粒数量最少(表2)。在所有情况下,合并的宏基因组数据集的大小大致与检测到的质粒数量成正比。数据被标准化为百分比以便直接比较。TP样本的预测质粒支架百分比最高,为8.39%(表2),其次是地表水(SW)样本,为5.81%(表2)。GW、CLC和LW样本的百分比相似(4.12%–4.72%),其中LW样本的每个支架上的质粒百分比最低(表2)。

**噬菌体数量**
当查看检测到的噬菌体支架总数时,LW样本检测到的噬菌体数量最多(52,932个),其次是CLC样本(7,324个;表2)。地表水样本检测到的噬菌体最少(285个)。一旦标准化为噬菌体支架的百分比,LW样本的百分比仍然最高(0.44%;表2),而TP样本的百分比最低(0.13%)。所有样本类型的噬菌体比例都比质粒小一个数量级。

**质粒负荷**
质粒负荷是指质粒编码的ARGs占所有检测到的ARGs的比例,TP样本的质粒负荷最高(0.12),LW样本的质粒负荷最低(0.054;表3)。当根据总质粒数量来看质粒编码ARGs的百分比时,TP样本的百分比最高(0.49%),LW样本的百分比最低(0.34%)。CLC、GW和SW样本的质粒编码ARGs的百分比相似(0.39%–0.45%;表3)。

**质粒编码的ARGs分类**
质粒编码的ARGs在给定的垃圾填埋场宏基因组数据集中所占比例相对较小(图3A和S7A)。质粒编码的ARGs与其他抗性机制相比,具有相同的主要抗性机制类别,如抗生素失活、抗生素外排、抗生素靶点替换和抗生素靶点修饰,且其丰度更高(图3B)。

**讨论**
RGI和DeepARG的比较
对于垃圾填埋场和外部环境宏基因组,RGI几乎总是识别出比DeepARG更多的ARGs(表1)。这可能是由于两个因素:DeepARG的分类系统范围有限,以及RGI通过其“宽松”的算法能够识别更多不同的基因(有关此比较的更多细节,请参见补充材料)。从这项工作中可以看出,RGI目前似乎既能识别出宏基因组中的更多潜在ARGs,又能对检测到的ARGs进行更深入的分类,但代价是假阳性预测的可能性更高。RGI识别出的不同序列是扩展现有已知ARGs数据库的有趣目标。

鉴于RGI的较高检测率,我们使用RGI进行了读取映射分析,使用了来自垃圾填埋场及其相关宏基因组的未组装读取序列。基于读取的结果识别出了更多的基因家族多样性(388个,而组装数据中只有240个),包括一系列额外的β-内酰胺酶(148个仅基于读取的基因家族中的109个)。读取数据中丰富的基因家族与组装数据中常见的基因家族有重叠(前100个常见基因家族中有92个存在于基于读取的检测中),读取丰度与基因丰度之间存在中等程度的相关性(R2 = 0.46)。虽然组装数据在ARG分配上提供了更高的信心,并能更准确地识别不同的ARG序列,但基于读取的分析识别出了更广泛的ARG类型,并允许进行丰度的定量比较。

**环境中的抗生素抗性基因负担**
垃圾填埋场渗滤液(LW、CLC和TP)宏基因组以及垃圾填埋场相关水系统(SW、GW)宏基因组在组装数据中的平均每10,000个开放阅读框(ORFs)的ARGs标准化计数并不最高——事实上,与我们的预期相反,垃圾填埋场及其相关样本的ARGs标准化计数相对较低(表1)。相比之下,污水宏基因组的计数最高,尽管样本之间的方差最大。垃圾填埋场通常含有许多污染物,如重金属、携带ARGs的病原体和药物,这些都会影响垃圾填埋场中ARGs的丰度和多样性(Bandala等人2021;Lin等人2021)。从我们的调查来看,ARGs的数量并不比其他环境高。然而,ARGs的多样性确实反映了垃圾填埋场系统的异质性和高度污染特性,与其他环境相比,垃圾填埋场样本中的ARGs类别多样性显著更高。例如,仅在垃圾填埋场样本中观察到对抗生素的降低渗透性作为抗性机制,尽管其丰度较低。我们注意到,垃圾填埋场宏基因组的测序深度通常比外部环境宏基因组更深(表S1),这也可能有助于识别出更多的ARGs多样性。

在RGI和DeepARG的分析中,都发现了对目标药物类别四环素、氨基糖苷类、多重耐药(MLS)、糖肽类和肽类抗生素的抗性(图1;S2)。这些药物类别在质粒上的相对丰度高于其他药物类别(图S7)。质粒上抗性机制的分布与完整垃圾填埋场数据集中的分布一致(图S7),除了抗生素失活在质粒上略有富集。在药物类别层面,质粒上的药物类别分布与配对完整垃圾填埋场数据集中的分布一致,除了少数宏基因组(JA Leachate;SO 2016 GW1, LW1, LW2;SO 2017 GW3, LW1, SWC)(图S7B),并且多重耐药目标药物类别在质粒上略有富集。

**RGI和DeepARG的比较**
RGI几乎总是识别出比DeepARG更多的ARGs,无论是对于垃圾填埋场宏基因组还是外部环境宏基因组(表1)。这可能是由于两个因素:DeepARG的分类系统范围有限,以及RGI通过其“宽松”的算法能够识别更多不同的基因(有关此比较的更多细节,请参见补充材料)。从这项工作中可以看出,RGI目前似乎既能识别出宏基因组中的更多潜在ARGs,又能对检测到的ARGs进行更深入的分类,但代价是假阳性预测的可能性更高。RGI识别出的不同序列是扩展现有已知ARGs数据库的有趣目标。

鉴于RGI的较高检测率,我们使用RGI进行了读取映射分析,使用了来自垃圾填埋场及其相关宏基因组的未组装读取序列。基于读取的结果识别出了更多的基因家族多样性(388个,而组装数据中只有240个),包括一系列额外的β-内酰胺酶(109个仅来自读取的基因家族)。读取数据中丰富的基因家族与组装数据中常见的基因家族有重叠(前100个常见基因家族中有92个存在于基于读取的检测中),读取丰度与基因丰度之间存在中等程度的相关性(R2 = 0.46)。虽然组装数据在ARG分配上提供了更高的信心,并能更准确地识别不同的ARG序列,但基于读取的分析识别出了更广泛的ARG类型,并允许进行丰度的定量比较。

**环境中的抗生素抗性基因负担**
垃圾填埋场渗滤液(LW、CLC和TP)宏基因组以及垃圾填埋场相关水系统(SW、GW)宏基因组在组装数据中的平均每10,000个ORFs的ARGs标准化计数并不最高——事实上,与我们的预期相反,垃圾填埋场及其相关样本的ARGs标准化计数相对较低(表1)。相比之下,污水宏基因组的计数最高,尽管样本之间的方差最大。垃圾填埋场通常含有许多污染物,如重金属、携带ARGs的病原体和药物,这些都会影响垃圾填埋场中ARGs的丰度和多样性(Bandala等人2021;Lin等人2021)。从我们的调查来看,ARGs的数量并不比其他环境高。然而,ARGs的多样性确实反映了垃圾填埋场系统的异质性和高度污染特性,与其他环境相比,垃圾填埋场样本中的ARGs类别多样性显著更高。例如,仅在垃圾填埋场样本中观察到对抗生素的降低渗透性作为抗性机制,尽管其丰度较低。我们注意到,垃圾填埋场宏基因组的测序深度通常比外部环境宏基因组更深(表S1),这也可能有助于识别出更多的ARGs多样性。

在RGI和DeepARG的分析中,都发现了对目标药物类别四环素、氨基糖苷类、MLS、糖肽类和肽类抗生素的抗性(图1;S2)。这些药物类别的抗性基因不仅存在于垃圾填埋场数据集中,也存在于污水处理厂(WWTP)宏基因组中。在垃圾填埋场中高丰度检测到的常见目标药物类别包括大环内酯类、β-内酰胺类、氟喹诺酮类、磺胺类、四环素类、氨基糖苷类、多重耐药和糖肽类(Zhao等人2018;Wang等人2020;Czatzkowska等人2022),这些都在我们的垃圾填埋场宏基因组样本中被识别出来。肽类抗生素抗性通常不是高频检测到的抗菌类别(Peschel和Sahl 2006;Xuan等人2023),但它们是本研究中前五大目标药物类别。

**垃圾填埋场中常见的ARGs**
在垃圾填埋场中发现的常见ARGs包括aac6、aadA1、aadA、ampC、bacA、blaCTX-M、blaOXA10、blaOXY、blaSHV、blaTEM、cat、dfrA、ermB、ermF、mefA、mexF、penA、qnrA、qnrB、qnrD、qnrS、sul1、sul2、tetO、tetM、tetQ、tetW和tetX(Czatzkowska等人2022;Zhang等人2022)。在我们的垃圾填埋场数据集和其他垃圾填埋场中之前发现的共同基因和/或基因家族包括aac6、aadA、ampC、bacA、blaCTX-M、blaOXA10、blaOXY、blaSHV、blaTEM、dfrA、ermB、ermF、mefA、mexF、qnrA、sul1、sul2、tetO、tetM、tetW和tetX(有关每个基因及其在垃圾填埋场数据集中的相对丰度的更多信息,请参见补充材料,图S3和S4)。根据RGI的数据,mexF基因在所有垃圾填埋场样本中的丰度最高。

**之前未在垃圾填埋场报道但在RGI和DeepARG中识别的基因家族**
ompR、rpoB2、vanU和ugd(pmrE)。OmpR蛋白调节外膜孔蛋白以响应β-内酰胺类。环境中β-内酰胺类的增加会提高ompR的表达,从而增强对β-内酰胺类的抗性(Ko和Choi 2022)。rpoB2基因使用RGI的宽松模型识别,编码一种RNA聚合酶β亚单位,提供对利福平的抗性。利福平用于临床治疗感染,如结核病(Ishikawa等人2006)。vanU基因属于vanG调控操纵子,编码一种转录调节因子。vanG操纵子提供对万古霉素的抗性(Depardieu等人2015),尽管值得注意的是,操纵子的其余部分在我们的数据集中未被识别,因此这种抗性机制在垃圾填埋场中可能不活跃。ugd基因编码UDP-D-葡萄糖脱氢酶,通过合成4-氨基阿拉伯糖来提供对多粘菌素B(一种肽类抗生素)的抗性(Mouslim和Grossman 2003)。

**抗性机制**
抗生素外排和抗生素失活是最常见的抗性机制,其次是针对这些抗性机制的目标药物类别。对于四环素和氨基糖苷类,抗性机制是抗生素外排和抗生素失活;对于大环内酯类,抗生素外排是主要抗性机制(Roberts等人1999;Becker和Cooper 2013;Grossman 2016)。一个抗生素外排的例子是mefA,它编码一种类似于MFS外排泵的蛋白质(Roberts等人1999)。检测到的抗生素失活基因包括tetX、aac6和aadA,分别编码四环素修饰酶、氨基糖苷酰转移酶和氨基糖苷腺苷转移酶(Becker和Cooper 2013;Grossman 2016)。较少见的抗性机制包括抗生素靶点保护(针对四环素和喹诺酮类的抗性机制;Flach等人2013;Warburton等人2016);抗生素渗透性(针对氨基糖苷类的抗性机制;Becker和Cooper 2013);以及抗生素靶点修饰(针对氨基糖苷类和MLS抗生素的抗性机制;Xu等人2012;Becker和Cooper 2013)。检测到的编码抗生素靶点保护机制的基因包括tetO、tetM、tetW和qnr。tet基因编码核糖体保护蛋白,而qnr基因编码一种蛋白质,该蛋白质可以保护II型拓扑异构酶、DNA旋转酶和DNA拓扑异构酶IV免受喹诺酮类抗生素的抑制(Jacoby和Hooper 2012;Flach等人2013;Hooper和Jacoby 2015;Warburton等人2016)。erm基因参与抗生素靶点的修饰,通过编码一种腺苷-N6甲基转移酶来提供对MLS类抗生素的耐药性,这种酶会甲基化23S rRNA肽基转移酶中心中的腺嘌呤残基,从而破坏氢键,导致目标50S核糖体亚基的构象变化(Xu等人2012)。

在垃圾填埋场宏基因组中,编码预测抗生素抗性基因(ARGs)的微生物群落(MAGs)数量最多的是Bacteroidales、Burkholderales和Campylobacterales目(图2和S6)。尽管在完整数据集与RGI和DeepARG预测的MAGs子集之间整体丰度差异不大,但个别样本在特定谱系中显示出富集现象(图2和S6)。例如,Patescibacteria目在RGI数据中是第七大常见目,但在DeepARG结果中则排名较低(第57位)。Patescibacteria在某些编码ARG的群落中的丰度较高,尤其是在SO 2017渗滤液井中(图2),尽管RGI预测的Patescibacteriales与完整MAG数据集之间的总体比例没有显著差异。在渗滤液井中观察到的富集现象出乎意料,因为Patescibacteria的基因组较小,生长和繁殖功能有限(Brown等人2015;Méheust等人2019;Tian等人2020),因此预计它们携带的ARG比例较低。

从RGI和DeepARG的ARO MAGs中鉴定出少数疑似病原体或机会性病原体,包括Achromobacter pulmonis和Pseudomonas fluorescens。所有15种鉴定出的潜在病原体都含有与多重耐药机制相关的多个ARGs。

**质粒上编码的ARGs及质粒载量**
不同样本类型的质粒丰度不等(4.12%–8.39%),其中TP样本中的预测质粒比例最高,但这种富集并不显著(与平均值相差小于2个标准差)。微生物群落中的质粒丰度受许多生物和非生物因素的影响(Smalla等人2015)。目标群落中宿主细胞的多样性会影响质粒的存在、丰度和持久性(Medaney等人2016;Alonso-del Valle等人2021)。这可能是TP样本中质粒比例较高的原因之一,因为这些样本包含了更丰富的微生物群落。TP数据集中的高质粒比例也可能反映了该地点不同的抗生素压力。

**质粒编码ARGs的分布**
不同样本类型中质粒编码ARGs的分布也不均匀。质粒载量(衡量环境中ARGs的移动比例)在CA处理厂样本中最高,尽管这些样本的ARG总数或质粒上的ARG数量并不最高(表3)。CA处理厂样本中的高质粒载量可能表明这些环境具有较高的选择压力,有助于维持质粒编码的ARGs。尽管LWs和CLCs样本中质粒编码的ARG绝对数量较多,但其质粒载量较低(表3),表明这些地点的ARG池相对较大,超过了与质粒相关的ARG数量。GW和SW样本是非渗滤液样本,预计它们的ARG谱型应与较低的抗生素压力一致。然而,与预期相反,这些样本类型的质粒载量或携带ARG的质粒比例并不最低(表3)。垃圾填埋场有物理屏障防止渗滤液渗入周围水系统(Hilger和Barlaz 2007;Bandala等人2021;Ozbay等人2021;Parvin和Tareq 2021)。GW和SW样本中质粒编码ARGs的高比例可能表明,垃圾填埋场渗滤液污染产生的抗生素残留物创造了选择压力,促使本土群落成员适应新的抗生素入侵。然而,地下水和地表水抗性组也可能受到其他人为活动的影响。地下水由于营养物质有限,抗生素的降解速率较慢,因此ARGs的选择期较长,这可能增加质粒编码ARGs的比例(Smillie等人2010;San Millan 2018;Huang等人2023)。

**垃圾填埋场中的ARG移动组**
与完整的宏基因组数据集相比,质粒编码的ARGs在垃圾填埋场中仅占一小部分(图3A)。质粒编码的ARGs可能由于宿主维持质粒的适应性成本而较少见。或者,从质粒引入的有益基因可能转移到染色体上(San Millan和MacLean 2017)。如果对ARGs有正向选择,选择将有利于ARGs整合到宿主染色体中,最终可能导致质粒的丢失(Hall等人2016)。此外,使用的组装流程可能对质粒组装有偏见,从而降低了质粒携带ARGs的识别率。在质粒上高丰度出现的抗性机制包括抗生素失活、抗生素外排、抗生素靶点替换和抗生素靶点修饰(图3)。质粒编码的抗性机制和药物类别在相对丰度上与整个地点的完整ARG数据集相似(图3B和S7)。质粒上的抗生素失活和抗生素外排抗性机制略有富集。在高相对丰度下出现的质粒编码靶点药物类别包括多重耐药、MLS、氨基糖苷类和糖肽类(图3)。erm基因可以提供对MLS类抗生素的耐药性,并且可以存在于质粒上(Xu等人2012),这支持了这种基因在垃圾填埋场中的传播。Aac基因提供对氨基糖苷类抗生素的耐药性,通常位于MGEs上(Becker和Cooper 2013)。Aac基因也在质粒ARG数据集中被预测到。总体而言,质粒编码的抗性机制和靶点药物类别的分布与垃圾填埋场抗性机制和靶点药物类别的分布一致。

**结论**
我们假设垃圾填埋场具有与其他环境不同的ARG特征,尤其是ARG类型的多样性更为丰富。虽然垃圾填埋场中的ARG数量与其他环境相比没有显著增加,但我们确实发现垃圾填埋场容纳了更多类型的ARG。进一步地,我们假设四个垃圾填埋场内的ARG多样性与其ARG的移动性相关,表明在特定地点存在强烈的抗生素抗性选择压力。我们发现质粒编码的ARGs在垃圾填埋场中占比较小,且质粒编码和完整ARG数据集中的抗性机制和药物类别的比例相似。总体而言,垃圾填埋场与其他环境相比具有独特的ARG特征,所有检测水平上的多样性都更高。这项工作表明,垃圾填埋场是ARG多样性的重要热点,这种多样性反映在ARG移动组中。垃圾填埋场似乎是支持ARG转移和新抗性谱系进化的环境。鉴定出的携带多重耐药机制的疑似和机会性病原体进一步强调了垃圾填埋场作为临床相关ARGs和AROs库的潜力。

**致谢**
2016年和2017年,Hug实验室成员共同对安大略省南部的垃圾填埋场进行了采样。牙买加金斯顿的垃圾填埋场由Aneisha Collins-Fairclough博士和Melessa Ellis博士采样。NEUS垃圾填埋场由Hug研究小组的Rebecca Co、Nikhil George和Alex Sauk在2019年采样。CA垃圾填埋场由Kira Goff博士和Veronica Viljakainen在2019年采样。我们感谢牙买加理工大学的Aneisha Collins-Fairclough博士提供牙买加宏基因组数据,并感谢Collins-Fairclough博士和Rebecca Co对这些数据集进行测序和初步分析。加拿大和美国的垃圾填埋场宏基因组样本由Nikhil A. George分类。

完成这项工作使用了大量的公共数据集。宏基因组和MAGs通过Integrated Microbial Genomes & Microbiomes (IMG/M)数据库(https://img.jgi.doe.gov/)获取。这些数据集由世界各地的研究人员生成(表S1)。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号