《Molecular Ecology Resources》:Accounting for Intra- and Intergenomic Sequence Variation in Reference Barcodes Improves eDNA Metabarcoding Biodiversity Assessment
编辑推荐:
为解决环境DNA(eDNA)宏条形码因参考数据库不完整导致的生物多样性评估偏差,研究人员在波多黎各深海珊瑚群落开展案例研究,通过基因组浅层测序构建本地珊瑚28S参考条形码,并系统评估参考数据库的完整性对eDNA分类的影响。研究发现,包含基因组内变异和本地物种序列的参考数据库,不仅显著提升了序列变体(ASV)的科、属级分类分辨率,纠正了因序列缺失导致的误分类,还避免了将未被识别的基因组内变异误判为未采样类群。该研究证实,结合参考基因组浅层测序与eDNA宏条形码,可将已知珊瑚科级丰富度在浅于1000米水深提升36%,在深于1000米水深提升181%,并发现了两个波多黎及附近岛屿此前未知的珊瑚科,凸显了eDNA在发现深海生物多样性方面的巨大潜力。
海洋,这片覆盖地球大部分表面的蓝色疆域,不仅是无数生命的家园,也为人类提供了渔业、碳封存等至关重要的生态系统服务。然而,人类活动正日益威胁着其可持续性。有效监测海洋生态系统的变化,依赖于全面、准确的基线生物多样性评估。遗憾的是,对于深海等偏远生境的生物类群,区域性的生物地理学知识存在巨大空白,这使得有效监测变得异常困难。传统的监测方法往往依赖于提取性采样,并由专家分类学家进行详尽的形态鉴定,过程耗时耗力且对脆弱生物群落有影响。在此背景下,从环境样本(水、沉积物等)中分析核酸的环境DNA(eDNA)技术,以其成本效益高、高效和非破坏性的特点,成为了基线生物多样性评估和生态系统监测的理想替代方案。
eDNA宏条形码技术通过从环境样本中扩增具有分类学诊断特征的DNA条形码,能够快速评估属和物种的存在。但其应用价值高度依赖于用于鉴定DNA条形码身份的参考数据库的完整性。不完整的参考数据库不仅导致大量从环境样本中恢复的操作分类单元(OTU)或扩增子序列变体(ASV)无法被鉴定到有意义的分类学水平,更可能带来假阳性检测和具有生态意义的误分类,从而误导对生物群落结构的理解。
一个尤为棘手的问题是DNA条形码本身的序列变异,这种变异既存在于不同个体和物种之间(基因组间变异),也存在于同一个体的基因组内部(基因组内变异)。特别是对于珊瑚等类群,其核糖体DNA(rDNA,如28S)作为串联重复序列,已显示出显著的基因组内变异,但在eDNA宏条形码的语境下却很少受到关注。未能充分认识并整合这些序列变异到参考条形码库中,可能导致对生物多样性的不完整甚至错误评估。
为了探究这些问题,一个由Luke J. McCartin等人组成的研究团队,选择在波多黎各附近的深海珊瑚群落开展了一项详尽的案例研究。他们的核心问题是:在参考条形码中考虑基因组内和基因组间的序列变异,究竟能在多大程度上改善eDNA宏条形码的生物多样性评估?这项研究发表在《Molecular Ecology Resources》期刊上。
为了回答上述问题,研究人员综合运用了几项关键技术:1) 在两次科考中,利用遥控潜水器(ROV)在波多黎各附近的深海珊瑚群落采集珊瑚组织样本和环境水样;2) 对346份珊瑚样本进行基因组浅层测序,以从头组装和迭代映射两种策略构建28S核糖体DNA条形码参考序列,这种方法能一次性获取多个条形码并捕获基因组内变异;3) 对采集的海水样本进行eDNA提取,使用针对珊瑚的28S-Anth和28S-Scler引物进行宏条形码扩增与建库,并在Illumina平台上测序;4) 利用DADA2流程进行序列数据处理、去噪,生成扩增子序列变体,并利用包含/不包含本地新条形码、包含/不包含基因组内变异谱系的定制参考数据库,对ASV进行分类学鉴定;5) 通过系统发育分析、基因组映射、转录组数据比对等生物信息学方法,深入分析基因组内变异的特征、分布与功能。
3.1 基因组浅层测序成功组装珊瑚28S条形码
研究人员成功从314份珊瑚样本(90.8%)中组装出28S条形码。组装成功率在八放珊瑚、石珊瑚和黑珊瑚中相似,且与DNA提取浓度显著相关。新的条形码覆盖了7个黑珊瑚科、9个石珊瑚科和19个八放珊瑚科。
3.2 珊瑚28S条形码中存在显著的基因组内序列变异
超过一半的珊瑚样本(51.9%)产生了多个(2-5个)28S条形码变体。其中,八放珊瑚每个基因组产生的变体数量显著多于黑珊瑚和石珊瑚,且变体间的平均序列相似性显著更低。更重要的是,在五个八放珊瑚科中 consistently 发现了分组到不同进化支系的、高度分歧的28S条形码变体谱系,这表明存在先前通过桑格测序未被发现的、分歧的基因组内谱系。
3.3 包含本地参考序列显著影响eDNA分类学鉴定结果
将本地采集珊瑚的条形码纳入参考数据库后,对ASV的分类鉴定产生了实质性影响。具体表现为:22个ASV获得了属级分辨率,19个ASV被重新分配到不同的属,14个ASV失去了原本错误的属级分类。这说明,不完整的参考数据库不仅产生未分类的ASV,还会导致假阳性检测和有生态意义的误分类。当排除本地参考序列时,一些ASV被错误地分类到在研究地点未观察到的珊瑚属,这些误分类在加入本地参考后得到了纠正。
3.4 基因组内变异影响八放珊瑚ASV的分类鉴定
当从参考数据库中排除新发现的八放珊瑚基因组内变异谱系时,有18个ASV无法被鉴定到科或属水平。这证明,未被识别的基因组内变异可能被误认为是未采样的分类群,从而部分解释了宏条形码研究中普遍存在的未分类序列多样性。
3.5 eDNA宏条形码与基于组织样本的DNA条形码在生物多样性评估上具有互补性
在序列变体水平,大部分28S条形码变体是各自方法独有的。然而,在分类学多样性水平,两种方法的结果高度一致且互补。两种方法共同检测到了大部分珊瑚科和属,同时也各自发现了对方未覆盖的独特科和属。eDNA检测到了两个此前在波多黎各及维尔京群岛水域未有记录的珊瑚科。
3.6 eDNA宏条形码、新样本采集和历史记录共同扩展了对深度的生物多样性认知
在不同深度区间,eDNA检测、新组织样本采集都贡献了新的珊瑚科记录。综合这些新数据,将使浅于1000米水深的已知珊瑚科丰富度平均增加36%,使深于1000米水深的丰富度平均大幅增加181%。eDNA在10个深度区间中的8个检测到了珊瑚科,并在其中6个区间检测到了既无历史记录也未在本研究采集到的珊瑚科。
研究结论与重要意义
这项研究通过基因组浅层测序技术,首次系统揭示了珊瑚(特别是八放珊瑚)28S rDNA中广泛存在且高度分歧的基因组内变异谱系。对Callogorgia gracilis染色体水平基因组组装的分析表明,这些变异谱系可能位于不同染色体上,独立进化,并都编码有功能的大核糖体亚基。这一发现挑战了rDNA在 concerted evolution 作用下均质化演化的经典范式。
研究表明,构建包含基因组内变异和本地物种序列的高质量参考数据库,对于实现准确、高分辨率的eDNA宏条形码生物多样性评估至关重要。不完整的参考数据库不仅会降低分类分辨率,更会导致生态学上严重的误分类(如将深海造礁石珊瑚Madrepora oculata误判为浅水石珊瑚Plesiastrea)和假阳性检测。忽略基因组内变异则会使相关ASV无法分类,可能被误解为新的未采样类群。
本研究证实,将参考基因组浅层测序与eDNA宏条形码相结合,是一种评估深海生物多样性的强有力且互补的策略。基因组浅层测序是构建能涵盖序列变异参考数据库的理想方法,它不受PCR扩增偏好性影响,能同时获取多个位点,并能发现低丰度变异。eDNA宏条形码则能检测到传统方法容易遗漏的、体型小或隐秘的类群,如本研究中新发现的Turbinoliidae(石珊瑚)和Parasphaerascleridae(八放珊瑚)科成员。
这项研究的发现对未来的eDNA研究具有重要指导意义:1) 应尽可能通过基因组浅层测序等无偏好性方法构建本地参考数据库,以涵盖基因组内和种内序列变异;2) 在数据解读时,需审慎评估参考数据库对本地动物群的覆盖度,对存在空白的类群保持警惕;3) 对于像深海这样采样困难的生境,结合eDNA与非破坏性的影像调查等传统方法,是进行最全面生物多样性评估和同步完善参考数据库的推荐策略。最终,只有建立在坚实、完整的参考数据基础上的eDNA技术,才能真实、可靠地揭示海洋,特别是神秘深海的生物多样性图景。