白鱼科(Leuciscidae)鱼类之间的广泛多物种杂交现象

《Molecular Ecology》:Extensive Multi-Species Hybridization Between Leuciscidae Minnow Species

【字体: 时间:2026年03月27日 来源:Molecular Ecology 3.9

编辑推荐:

  **摘要** 人为干扰可能会破坏生态系统并改变物种种群动态。在基因相关的生物之间,种间杂交现象很常见,尤其是在空间隔离等繁殖障碍被消除之后。我们利用基于测序的基因分型数据来评估几种Leuciscidae科小鱼物种之间的杂交结果,并确定土地利用类型和环境变量在多大程度上影响了杂交

  **摘要**

人为干扰可能会破坏生态系统并改变物种种群动态。在基因相关的生物之间,种间杂交现象很常见,尤其是在空间隔离等繁殖障碍被消除之后。我们利用基于测序的基因分型数据来评估几种Leuciscidae科小鱼物种之间的杂交结果,并确定土地利用类型和环境变量在多大程度上影响了杂交频率。我们发现,两种物种之间的杂交以及多物种之间的杂交都非常普遍;在所有25个采样点都发现了杂交个体,它们占所有采样个体的近30%。虽然大多数物种至少与另一种采样物种发生了杂交,但杂交的程度各不相同。我们使用逻辑回归来估计人为干扰对杂交的影响,发现杂交与环境因素之间的关系较弱。这项研究提高了我们对像Leuciscidae这样具有较低繁殖隔离性的物种中杂交动态的理解,并指出了需要进一步研究以更好地理解多物种杂交区域的杂交预测因素。

**1 引言**

在同域分布且亲缘关系密切的物种之间,杂交现象可能很常见,但杂交个体往往难以检测。虽然某些杂交实例可以通过形态学特征来识别,但回交和渐渗的程度难以量化,而且隐性的杂交个体或回交个体可能完全被忽略(Arnold等人,2003年;Slager等人,2020年)。尽管难以检测,但很明显,杂交对生物多样性有着重要但多变的影响。在某些情况下,杂交可以导致适应性渐渗或物种形成,但杂交也可能导致灭绝,并可能通过遗传或人口淹没效应造成生物多样性的净损失(Rhymer和Simberloff,1996年;Todesco等人,2016年;Wolf等人,2001年)。当干扰改变了配子前期的繁殖隔离(例如,改变繁殖时间、繁殖地点或配偶选择)或当干扰导致杂交个体的适应性高于亲本物种时,杂交及其在种群中的比例会增加(Chunco,2014年;Grabenstein和Taylor,2018年;Todesco等人,2016年),这使得干扰与杂交之间的相互作用对于理解杂交如何影响生物多样性尤为重要。尽管杂交可能对生物多样性产生重大影响,但迄今为止的研究大多集中在单个物种对上。我们在许多分类群中都观察到了这一点,包括鱼类(Scribner等人,2001年)、哺乳动物(McFarlane和Pemberton,2021年;Jansson等人,2007年;Malukiewicz等人,2015年)、鸟类(Lavretsky等人,2016年;Slager等人,2020年)、植物(Anttila等人,2000年;Majka等人,2019年)和昆虫(Carson等人,1989年)。在某些情况下,研究已经扩展到三个或四个物种(例如Natola等人,2022年;Duvernell等人,2025年;Mandeville等人,2015年;Sullivan等人,2016年;Arnold,1993年;Rieseberg等人,2003年),但在家族或群落层面上的研究较少(例如Zbinden等人,2023年;Ottenburghs,2019年;Whitney等人,2010年;Satokangas等人,2023年)。在更广泛的范围内研究杂交可以增进对群落层面进化的理解,并有助于发现多物种杂交体和以前未被检测到的物种杂交事件。这对于像Leuciscidae科这样的杂交现象普遍存在的分类群尤为重要(Zbinden等人,2023年)。Leuciscidae科小鱼的形态学鉴定具有挑战性,需要丰富的专业知识;中间型杂交体的鉴定更加困难(Hubbs,1955年)。此外,杂交个体并不一定具有中间型表型。在许多不同分类群的杂交事件中,F1代杂交体的表型变化很大,且可能明显偏向其中一个亲本,这使得它们——尤其是与任一亲本群体的回交个体——很容易被忽略(Thompson等人,2021年)。因此,使用遗传数据来补充形态学数据是很有必要的。20世纪70年代和90年代,分子标记(如同工酶和微卫星)分别被广泛用于杂交检测(Allendorf等人,2022年;Barton和Hewitt,1985年)。然而,早期的分子标记使用通常仅限于研究两种物种的系统(Scribner等人,2001年;Wenne,2023年)。随着高分辨率基因组数据的日益可用,现在可以更好地解析复杂的杂交动态或来自多个来源的祖先信息。DNA序列数据可用于估计祖先关系,并在形态学鉴定或分子标记无法提供足够分辨率时检测渐渗和回交(Arnold等人,2003年;Slager等人,2020年)。对于检测较小比例的混合或涉及两个以上物种的杂交区域,使用基因组数据尤为重要(Natola等人,2022年;Satokangas等人,2023年)。本研究的主要目的是调查鱼类科物种之间的杂交程度。具体来说,我们采样并使用基因组数据评估了以下Leuciscidae鱼类之间的杂交情况:溪流鰕虎鱼(Semotilus atromaculatus)、普通闪光鱼(Luxilus cornutus)、中央石滚鱼(Campostoma anomalum)、角质头鰕虎鱼(Nocomis biguttatus)、西部黑鼻鲦鱼(Rhinichthys obtusus)、条纹闪光鱼(Luxilus chrysocephalus)、长鼻鲦鱼(Rhinichthys cataractae)、河鰕虎鱼(Nocomis micropogon)和玫瑰面闪光鱼(Notropis rubellus)。由于环境因素已被证明会改变Leuciscidae科小鱼在其分布范围内的杂交率(Zbinden等人,2023年),我们还将每个采样点的杂交比例与上游流域的土地利用和环境数据进行了比较。我们探讨了两个问题:(1)不同物种对之间的杂交频率和类型有何差异?(2)采样地点的干扰类型和程度在多大程度上影响了杂交结果?

**2 材料与方法**

**2.1 采样和研究地点**

安大略省南部是加拿大人口最多的地区之一,拥有广泛的农业用地,并被五大湖所环绕。该地区的地质特征是西南部为冰川沉积土壤,东北部为加拿大盾地的前寒武纪基岩(Chapman和Putman,1984年)。我们选择了代表农业化、城市化和低干扰区域的采样地点。大多数被采样的溪流和河流及其栖息的动物群受到了道路建设(Wallace等人,2013年)、疏浚和强制改道(Moss,2008年;Ward-Campbell等人,2017年)以及农业和其他人类活动造成的污染(Liu等人,2018年;Moss,2008年;Xu等人,2020年)的严重影响。采样地点见图1A。此外,我们还在阿尔冈昆省立公园的溪流中采集了鱼类样本,以代表低干扰区域。尽管阿尔冈昆省立公园是安大略省最古老的省立公园,但它仍然受到游客频繁访问区域的人为干扰影响,并且自19世纪初以来一直有伐木活动(Helmers等人,2016年;McIntyre,2022年)。阿尔冈昆省立公园的两个采样点(SIC和COS)属于低干扰区域,而来自滑铁卢地区的三个采样点(CLC、LAP、LAC)属于城市化区域。图1展示了数据过滤后保留的个体之间的采样结果和系统发育关系。(A)采样地点地图,按采样年份着色(红色三角形=2019年,橙色圆圈=2022年,绿色菱形=采样区域附近的城市),n=25。插图显示了采样点周围的放大区域,并叠加了安大略水电网络的河道。(B)按表型分类的两年采样鱼类总数,n=731。(C)显示了本研究中所有九个物种的系统发育树,以及通过DNA条形码鉴定出的两个Pimephales物种。该系统发育树是根据NCBI GenBank的DNA序列数据使用The Fish Tree of Life数据库构建的(Chang等人,2019年)。我们主要在2022年夏季进行了采样。一些初步采样工作是由我们的合作者在2019年夏季为另一项研究进行的(Champagne等人,2022年;Gutgesell等人,2025年);溪流鰕虎鱼、西部黑鼻鲦鱼和普通闪光鱼的样本是从安大略省南部的农业溪流中收集的。2022年夏季,我们的合作者还在COS收集了更多的溪流鰕虎鱼样本。我们使用金属线鱼陷阱、直线围网或电捕鱼法捕捉小鱼。如果个体在视觉上看起来属于一个或多个目标物种,我们就选择它们进行采样。我们使用过量的MS-222(250 mg/L溶液,持续10分钟)对采样鱼类实施安乐死。2019年和2022年的所有野外工作中,我们共收集了1213条鱼(图1B)。我们使用安大略流域信息工具(OWIT,ontario.ca/page/ontario-watershed-information-tool-owit)获取每个采样地点的精确流域特征和土地覆盖信息。我们使用“社区基础设施”、“农业和未分类的农村用地”以及“砂砾矿尾矿提取”占总流域面积的百分比作为每个地点干扰程度的代理指标。

**2.2 基因组数据收集**

我们按照制造商的说明,使用QiAGEN DNeasy Blood & Tissue Kit(Qiagen Inc.)从每个样本中提取DNA。我们使用NanoDrop 8000分光光度计(ThermoFisher Scientific)来量化DNA浓度,并确保每个样本的DNA浓度大于或等于20 ng/μL。提取DNA后,我们使用减少表示的基于测序的基因分型方法(Parchman等人,2012年)准备基因组文库,以便进行高通量测序。我们用EcoRI和MseI限制性内切酶消化DNA,然后将含有接头序列、条形码、切割位点和保护基团的接头连接到DNA片段上,随后用PCR扩增这些片段,并在两端连接Illumina PCR引物(Parchman等人,2012年)。然后我们使用Sage Science PippinPrep软件选择长度为200–300 bp的片段。这一片段范围涵盖了限制性内切酶消化后产生的最常见DNA片段大小,这一点通过Tapestation(Agilent Technologies)的结果得到了验证。DNA样本在加拿大的多伦多应用基因组中心进行了测序。在那里,使用NovaSeq 6000(Illumina)仪器对单端100 bp的读段进行了测序,使用了两个S1流式细胞。

**2.3 原始序列数据的比对和过滤**

我们使用sabre(github.com/najoshi/sabre)软件对原始FASTQ文件进行解复用,设置-m参数为2以允许最多2个条形码错配。然后我们使用Burrows-Wheeler Alignment工具(BWA)(Li和Durbin,2009年,版本0.7.17)和BWA-MEM算法(Li,2013年)将FASTQ文件与溪流鰕虎鱼参考基因组进行比对。我们使用bcftools mpileup(Li和Durbin,2009年,版本1.11)识别变异位点;这些结果被输出到一个BCF文件中,然后我们使用SAMtools(Li等人,2009年,版本1.16)将其转换为VCF文件。我们将--max-missing参数设置为0.6——即,一个位点必须有至少40%的个体具有数据才能保留该位点,并将--mac参数设置为3,以仅包括次要等位基因计数大于或等于3的位点。之后,我们调整深度参数,仅保留深度值大于或等于--minDP值(3)的位点。然后,我们生成了一个.imiss文件,报告每个个体的缺失情况,并创建了一个名为lowDP.indiv的文件,其中包含缺失超过95%位点的个体,并将这些个体从VCF文件中移除。最后,我们通过将--maf参数设置为0.01来移除次要等位基因频率低于1%的位点。由于解复用过程中出现问题,我们还移除了69个个体,使得这些个体无法使用。这样,主数据集中剩下731个个体用于进一步分析。此外,我们还为溪流鰕虎鱼(CC)、普通闪光鱼(CS)和西部黑鼻鲦鱼(BND)这三组最丰富的物种及其种间杂交体创建了三个过滤后的VCF文件。这样做是为了研究源间的祖先关系,因为这种关系只能在物种对之间计算。我们使用VCFtools的--keep函数,并输入一个列表,以保留输出文件中的所有个体。这些个体是根据ENTROPY输出的结果中分类为亲本或两个亲本物种杂交体的个体选出的。

**2.4 使用ENTROPY分析杂交**

我们使用ENTROPY软件来评估每个采样鱼类物种之间的混合情况(Shastry等人,2021年)。ENTROPY估计了混合比例q(来自任一亲本物种的预测祖先)和源间祖先Q(每个个体中来自每个亲本群体的等位基因的比例)(Shastry等人,2021年)。ENTROPY与其他类似软件(如STRUCTURE或ADMIXTURE(Pritchard等人,2000年;Alexander等人,2009年)的不同之处在于,它使用基因型似然值而不是固定的基因型调用来进行估计。我们使用R脚本(inputdataformat.R)(Shastry等人,2021年;R Core Team,2021年)从VCF文件创建了多群体基因型似然(MPGL)、线性判别分析k-means聚类(LDAK)文件和点估计文件。首先,我们对所有800个个体进行了ENTROPY分析。由于我们已经通过表型鉴定出了9个物种,我们进行了3次K=1到K=15的重复实验,因为K=9可能并不一定是最佳拟合模型,因为我们的数据集中可能存在额外的祖先来源。我们使用8GB的RAM运行了该程序,总共有150,000个步骤,其中包括100,000个燃烧期步骤,并在燃烧期后每隔25个步骤对后验链进行稀疏处理。对于包含成对物种组合的3个数据集,我们进行了3次K=1到K=3的ENTROPY分析,因为每个数据集中应该有2个物种。对于这些特定的运行,我们还将-Q参数设置为1,以估计每个个体的来源间祖先值。在运行ENTROPY之后,我们计算了每个K值的偏差信息准则(DIC)(Spiegelhalter等人,2002年),并在每个数据集的三个重复链上进行了平均。对于每次ENTROPY运行,我们还通过视觉检查马尔可夫链蒙特卡洛平衡分布的子集来确认模型的适当混合和收敛性。一旦我们得到了最佳的K值,我们就绘制了所有个体的q值,按地点分组(图2)。我们为K=2的模型创建了三角形图,这些模型包含了溪鲈、普通闪光鱼和西部黑鼻鲦鱼的成对组合,使用了Q和q值(图3A、C、E)。

图2:结果显示按地点绘制。个体由水平条表示,x轴显示了来自每个群体的祖先比例。结果显示的是K=12簇的模型。

图3:展示了普通闪光鱼、西部黑鼻鲦鱼和溪鲈成对组合的杂交结果分解。三角形图中的个体根据它们在初始K=12熵运行中的基因组身份进行着色。(A、B)西部黑鼻鲦鱼和普通闪光鱼。总共有351个个体,其中30个是杂交种。在25个采样点中有21个点发现了杂交种和/或亲本。(C、D)溪鲈和普通闪光鱼。总共有220个个体,其中18个是杂交种。在所有25个采样点都发现了杂交种和/或亲本。(E、F)西部黑鼻鲦鱼和溪鲈。总共有378个个体,其中49个是杂交种。在所有25个采样点都发现了杂交种和/或亲本。确定哪些群体和个体属于哪个组的值可以在图S4和表S1中看到。

2.5 为个体分配基因组身份
我们使用自定义的R脚本为每个个体分配基因组物种身份。这是根据熵值的q值来完成的,最佳K值为K=12。然后我们使用平均q值数据将ENTROPY中的物种簇映射到表型物种,对于每个K值都是如此。我们假设我们使用表型特征正确地识别了大多数个体,因为表型鉴定是由有经验的人员完成的,因此,给定簇中最高平均祖先比例的物种应该是该祖先的来源(图S12)。然后我们根据每个簇的混合比例为每个个体分配了一个基因组身份——即一个物种名称或结合了两个或多个物种祖先的杂交种。如果一个个体有90%或更多的祖先来自一个物种,它就被分类为该物种的未混合个体(例如,溪鲈)。这个截止值在之前的杂交研究中已经被使用过(Hasselman等人,2014年),但比一些其他研究更为宽松,其他研究对分类亲本有更严格的限制(Mandeville等人,2017年;Natola等人,2022年)。如果一个个体有10%–90%的祖先来自恰好两个物种,它就被认为是这两个物种之间的杂交种(例如,溪鲈×普通闪光鱼)。如果一个个体有10%–90%的祖先来自超过两个物种,它就被认为是多物种杂交种。最后,一些个体的80%–90%的祖先来自单一来源,同时还有来自其他祖先来源的多个较小贡献,因此它们既不能被归类为两物种杂交种也不能被归类为亲本。这些个体根据它们最大的祖先来源命名,但被分类为不确定的杂交种,因为它们可能是与一个单一物种的多次回交的结果,同时也具有不同类型的杂交祖先。

2.6 DNA条形码
有11个个体通过ENTROPY鉴定出具有少量未知祖先。我们使用DNA条形码来尝试评估线粒体起源和母系祖先,以潜在地指示这些未知祖先来自哪个物种。DNA条形码涉及对线粒体基因组的一部分(动物中的细胞色素c氧化酶I (COI) 基因)进行测序,并将其与其他分类群的这一序列进行比较。选择这个线粒体区域作为标准条形码区域,因为它通常只显示每百万年隔离2%的序列差异(Hebert等人,2003年)。DNA条形码是由圭尔夫大学高级分析中心基因组设施使用上述相同方法提取的DNA进行的。线粒体基因组的COI-3区域的正链和反链都在MiSeq(Illumnina)上进行了扩增和测序,并使用Ivanova及其同事(Ivanova等人,2007年)提供的热循环条件和引物进行了准备。我们使用BOLD的Identification Engine(www.barcodinglife.org/index.php/IDS_OpenIdEngine;Ratnasingham和Hebert,2007年)检查了正向fasta序列,以确认线粒体DNA属于哪个物种。

2.7 主成分分析
我们使用主成分分析(PCA)作为ENTROPY祖先聚类的补充方法。PCA是一种无模型的方法,允许在多个维度上可视化个体之间的遗传差异,通常可以突出显示物种之间的关系,并可能观察到物种间的杂交现象。我们在R中使用RStudio(R Core Team 2021;Posit Team 2025)创建并可视化了主成分分析,使用了一个自定义的R脚本来计算每个位点的基因型协方差矩阵。

2.8 带有环境数据的逻辑回归
我们使用二项逻辑回归来检验采样点流域的环境如何预测鲦科杂交种的祖先,包括土地覆盖率和其他来自OWIT的特征。响应变量是在每个站点被分类为杂交种的个体比例,简化为将所有杂交种合并为一个组。我们从安大略流域信息工具中获得了33个环境数据预测变量。然后我们创建了一个相关图来检查哪些预测变量高度相关(图S13)。在两个高度相关的变量中,保留了被认为与杂交结果有更明确机制联系的那个变量。最终我们移除了33个变量中的10个。我们在图S14中绘制了剩余的23个变量。逻辑回归的趋势是由少数具有极大不同流域特征的异常站点驱动的,因此我们还将站点大致分为干扰类别,并进行了逻辑回归,将杂交种的比例与三个类别进行对比:农业化站点、城市化站点和低干扰站点。我们使用卡方检验(R Core Team 2021)进行了方差分析,以确定干扰类别在解释每个站点杂交种比例方面的作用强度。最后,我们为每个模型创建了四个图表来评估模型拟合度和残差的分布。

2.9 使用Fishtree的系统发育
我们使用了R包fishtree(Chang等人,2019)来采样所有辐鳍鱼类的现有系统发育树(Rabosky等人,2018),该包从其预先组装的在线数据库Fish Tree of Life(fishtreeoflife.org)中提取系统发育数据(图1C)。这个数据库是使用NCBI GenBank的DNA序列数据组装的,树搜索使用RAxML中的最大似然分析进行的。

3 结果
3.1 数据过滤
我们从测序中生成了90,283,210个原始读段。所有1213个个体和9个物种的读段与参考基因组的平均比对率为43.98%,中位比对率为50.94%。过滤前的原始VCF文件包含3,738,553个位点。过滤后,VCF文件包含1228个位点和731个个体,包括所有9个目标物种。过滤后的读段与参考基因组的平均比对率为59.30%,中位比对率为65.00%(图S3)。对于两个物种的交叉数据集,BNDxCC文件有351个个体,BNDxCS文件有220个个体,CSxCC文件有378个个体。

3.2 使用ENTROPY估计祖先
K=12的ENTROPY模型的DIC值最低(图S5),因此其DIC值为0。这标志着K=12是最佳模型,该模型的值被用于进一步的分析。在K=12模型中,每个表型鉴定的物种在单独的簇中都有相当高的平均q值(图S12K)。在不太理想的模型中,多个物种可能在同一列中有高q值(例如,图S12A–F)。然而,在K=12模型中,有3个簇中没有物种具有高q值:7、11和12。在图2中,簇11和簇12的祖先不常见,没有构成任何一个个体的重要部分。因此,它们都被标记为黑色。簇7的祖先(显示为灰色)可以在同时具有溪鲈、普通闪光鱼和西部黑鼻鲦鱼祖先的个体中看到。此外,有两个个体在两个不同的站点(图2;站点CLC和UH)被鉴定为具有这种祖先的亲本。通过为每个个体分配基因组身份,我们能够识别出两物种杂交种、多物种杂交种和亲本个体的数量,以及推断出在野外可能被错误鉴定的个体数量(图2和S15)。在总共731个个体中,有175个被鉴定为两物种杂交种(占个体的24.0%),40个被鉴定为多物种杂交种(占个体的5.47%),总共215个杂交种(占个体的29.4%)。在这些40个多物种杂交种个体中,28个被认为是真正的多物种杂交种,其中超过2个祖先来源占这些个体祖先的10%到90%,而12个只有1个祖先来源,占其祖先的10%到90%(图S16)。所有真正的多物种杂交种都有三个主要的祖先来源;没有发现4个或更多物种的杂交种。所有3物种杂交种都与它们的表型鉴定相匹配,而12个不确定的杂交种中有7个不匹配(图S15)。剩余的516个个体被鉴定为亲本物种(占个体的70.6%);其中,48个来自亲本物种的个体与其表型身份不匹配(占亲本个体的9.30%,图S15)。我们取了每个个体12个q值的95%可信区间(CIs)的平均值。这导致所有个体都有一个平均CI值。平均CI值为0.00078,最大值为0.03573(图S6)。有17个个体的平均CI值大于0.01,其中大多数(13/17)至少有10%的中央石滚鱼祖先。K=2物种对模型的q值的平均可信区间(图S7–S9)都比K=12模型中的要大得多。最常见的两物种杂交组合是溪鲈和普通闪光鱼(图4A),其次是溪鲈和西部黑鼻鲦鱼。西部黑鼻鲦鱼与其他8个物种中的大多数杂交,其次是普通闪光鱼和溪鲈,它们都与其他7个物种杂交。条纹闪光鱼与其他物种的杂交最少——只有3个,除了Pimephales物种。

图4:展示了所有物种交叉和站点的杂交结果分解。(A)热图显示了两物种杂交组合发生在哪些物种之间以及发现的数量。(B)每个采样点上的亲本和杂交个体的比例。使用ENTROPY,在每个采样点都识别出了杂交种(图4B)。大多数站点(16/25)既有多物种杂交种也有两物种杂交种。一个站点上具有杂交祖先的个体比例从0.108到0.556不等。具有最高和最低杂交比例的地点(分别是SWP和SCU)位于同一条小溪的两个不同位置。这些地点最初被视为一个地点,但出于分析目的,我们将其视为两个独立的地点,因为它们之间相隔超过1公里,而小溪鲦鱼很少扩散超过1公里的范围(Belica和Rahel 2008)。WA地点是唯一一个多物种杂交个体比例高于两物种杂交个体的地点,而SIC地点的两种类型杂交个体比例相同。

3.2.1 K=2 最常见物种的比较

当我们使用成对比较方法研究三种最常见的物种时,发现小溪鲦鱼与其他常见物种杂交的可能性非常高,而普通闪光鱼和黑鼻鲦鱼的杂交情况较少。具体来说,两种最常见物种——小溪鲦鱼和普通闪光鱼之间的杂交(CCxCS)产生了最多的杂交后代(49/378),并且杂交后代占亲本的比例也最高(13.0%)(表S2)。西方黑鼻鲦鱼和普通闪光鱼之间的杂交后代最少——只有18/220(8.2%,表S2)。显示这些物种对分析的三角图可以在图3A、C、E中看到。对于BNDxCS,q值的平均置信区间为0.013,Q值的平均置信区间为0.023;而对于CSxCC,q值的平均置信区间为0.025,Q值的平均置信区间为0.045;Q值的最大置信区间分别为0.196和0.536(图S8)。西方黑鼻鲦鱼和小溪鲦鱼之间的杂交后代数量介于两者之间——30/351个个体,占8.5%,与西方黑鼻鲦鱼和普通闪光鱼之间的杂交比例相似。西方黑鼻鲦鱼和小溪鲦鱼之间的平均置信区间分别为0.018和0.034;Q值的最大置信区间分别为0.195和0.873(图S9)。各地点杂交后代类型的分布情况可以在图3B、D、F中看到。尽管小溪鲦鱼和西方黑鼻鲦鱼在大多数地点都共同出现,但普通闪光鱼并不总是与这两种物种同时出现。然而,在大多数地点仍然发现了普通闪光鱼的杂交后代。

3.3 主成分分析

前两个主成分分别解释了个体间40.395%和26.81%的变异(图S17A、B)。玫瑰脸闪光鱼、角质头鲦鱼和河鲦鱼与主要个体群明显不同,表明这些群体之间的差异最大,与其他物种的差异也最大。在图S17的C、D、E和F面板中,PC2和PC3以及PC3和PC4分别将中央石滚鱼单独分组。最后,在图S17的G、H、I和J面板中,包含小溪鲦鱼、普通闪光鱼和西方黑鼻鲦鱼的群体在PC5上有所区分,尽管它们仅解释了3.185%的变异。普通闪光鱼、小溪鲦鱼和西方黑鼻鲦鱼之间的杂交后代数量介于两者之间——30/351个个体,占8.5%,与西方黑鼻鲦鱼和普通闪光鱼之间的杂交比例相似。西方黑鼻鲦鱼和小溪鲦鱼之间的平均置信区间分别为0.018和0.034;Q值的最大置信区间分别为0.195和0.873(图S9)。各地点杂交后代类型的分布情况可以在图3B、D、F中看到。虽然小溪鲦鱼和西方黑鼻鲦鱼在大多数地点都共同出现,但普通闪光鱼并不总是与这两种物种同时出现。尽管如此,在大多数地点仍然发现了普通闪光鱼的杂交后代。

4. 讨论

总体而言,这项研究发现了大量之前未被描述的鲤科鱼类杂交的基因组证据。在采样的个体中检测到了许多杂交个体(图2),并且在每个采样地点都发现了杂交个体(图4B),尽管没有通过野外技术鉴定出任何表型上的杂交个体。有些个体甚至是多物种杂交体(图S16),这表明杂交现象非常普遍。我们还发现了与我们采样时未故意包括的两种亲本物种的杂交个体(表S3);这些杂交组合(小溪鲦鱼×黑鼻鲦鱼和普通闪光鱼与胖头鲦鱼的线粒体DNA)在文献中尚未被记录。环境预测变量与杂交比例之间的关系均不显著,呈弱正相关或弱负相关(图5);这一复杂的结果表明,杂交可能不太受人为干扰的影响,或者可能是由于使用的数据无法检测到环境与杂交之间的关系。

4.1 几乎所有采样物种之间都存在杂交和混合现象

鲤科鱼类家族内的物种频繁发生杂交。ENTROPY的研究结果表明杂交现象非常普遍,类似于最近一项涉及重叠和相关物种的研究(Zbinden等人2023年),并且有许多物种之间的杂交(图2和图S16)。所有九个采样物种都至少与另外两种物种发生了杂交(图4A)。在所有45种可能的两种物种杂交组合中,有29种组合(64%)在我们的样本中被发现。西方黑鼻鲦鱼与最多的物种发生了杂交(其他八种加上Pimephales物种),而小溪鲦鱼和普通闪光鱼与次多的物种发生了杂交(另外七种)。条纹闪光鱼与其他物种的杂交最少——仅与普通闪光鱼、玫瑰脸闪光鱼和角质头鲦鱼杂交。尽管如此,它们的杂交后代占亲本的比例最高,因为实际上我们的数据集中没有纯种的条纹闪光鱼;所有条纹闪光鱼的祖先都出现在杂交后代中(图2和图S17)。这一发现与一项关于鲤科鱼类杂交的比较研究结果一致,该研究发现条纹闪光鱼的杂交现象最为频繁(Corush等人2020年)。我们的数据还显示,条纹闪光鱼最常与普通闪光鱼杂交。条纹闪光鱼与普通闪光鱼之间的杂交现象至少从更新世时期(260万至1万年前)就一直存在(Dowling和Hoeh 1991年;Duvernell和Aspinwall 1995年;Duvernell等人2025年)。这种杂交导致条纹闪光鱼种群中的线粒体DNA被普通闪光鱼的DNA所取代(Dowling和Hoeh 1991年,Duvernell和Aspinwall 1995年,Duvernell等人2025年)。Luxilus属具有有趣的杂交历史,这种线粒体DNA的替换至少发生了两次(Duvernell等人2025年)。虽然这项研究的采样地点位于条纹闪光鱼分布的最北端和已知的杂交区域(Duvernell等人2025年),但在安大略省南部,这两种物种之间仍然存在大量的杂交现象。此外,玫瑰脸闪光鱼似乎很少发生杂交,因为我们的数据集中发现的杂交个体很少(图2),并且它们是一个遗传上最独特的群体(图S17)。尽管如此,当它们发生杂交时,并不限于单一的杂交组合;玫瑰脸闪光鱼与五种其他物种发生了杂交——数量超过了条纹闪光鱼和长鼻鲦鱼。最后,由于许多中央石滚鱼的基因组身份结果的95%可信区间非常宽,因此应谨慎解释这些结果。在基因组身份着色图中,物种群体之间的重叠更为明显,因为群体间的大部分差异是由杂交个体造成的。

4.4 DNA条形码分析揭示了与Pimephales物种的杂交现象

有11个个体被发现具有隐秘来源种群的祖先(图2)。DNA条形码分析的结果显示在表S3中。在条形码分析的11个个体中,有两个个体——AMP22_0463和EGM19_0302——显示出来自两种未采样的Pimephales物种的线粒体DNA:胖头鲦鱼和钝鼻鲦鱼。

4.5 逻辑回归显示杂交与环境变量之间存在微弱关系

在用于逻辑回归的23个环境变量中,有8个变量在应用Bonferroni校正之前与每个地点的杂交比例存在统计学上的显著关系(图5)。这些环境变量包括:流域内被清澈开阔水域覆盖的土地百分比、流域内树木稀疏覆盖的土地百分比、流域内落叶树覆盖的土地百分比、流域内混合类型树木覆盖的土地百分比、流域内针叶树覆盖的土地百分比、流域内沙砾矿或开采区覆盖的土地百分比、流域内社区基础设施覆盖的土地百分比以及流域内湿地覆盖的土地百分比。然而,在考虑多重检验后,这些变量均不再具有统计学显著性。Bonferroni校正前后的估计值、标准误差、z值和p值可以在表S5中看到。图5展示了每个环境变量(流域内某种土地利用类型的覆盖百分比)与每个地点杂交比例之间的逻辑回归关系(A–F,H,I)。n=每个图中的25个地点。(A)清澈开阔水域。(B)树木稀疏覆盖。(C)社区基础设施。(D)湿地。(E)落叶树。(F)混合类型树木。(H)针叶树。(I)沙砾矿或开采区。(G)按干扰类型分组的25个采样地点的杂交比例。ANOVA分析表明,干扰类别在统计上显著地解释了响应变量内的变异(p=0.0009)。为了评估残差,创建的图表显示,包含三种干扰类别的模型比仅包含环境数据的模型更适合数据(图S10和S11)。

总体而言,这项研究发现了鲤科鱼类中广泛的、之前未被描述的杂交基因组证据。在采样的个体中检测到了许多杂交个体(图2),并且在每个采样地点都发现了杂交个体(图4B),尽管没有个体通过野外技术被鉴定为杂交个体。有些个体甚至是多物种杂交体(图S16),这表明杂交现象特别普遍。我们还发现了与我们采样时未故意包括的两种亲本物种的杂交个体(表S3);这些杂交组合(小溪鲦鱼×黑鼻鲦鱼和普通闪光鱼与胖头鲦鱼的线粒体DNA)在文献中尚未被记录。环境预测变量与每个地点杂交比例之间的关系均不显著,呈弱正相关或弱负相关(图5);这一复杂的结果表明,杂交可能不太受人为干扰的影响,或者可能是由于使用的数据无法检测到环境与杂交之间的关系。

4.1 几乎所有采样物种之间都存在杂交和混合现象

鲤科鱼类家族内的物种频繁发生杂交。ENTROPY的研究结果表明杂交现象非常普遍,类似于最近一项涉及重叠和相关物种的研究(Zbinden等人2023年),并且有许多物种之间的杂交(图2和图S16)。所有九个采样物种都至少与另外两种物种发生了杂交(图4A)。在所有45种可能的两种物种杂交组合中,有29种组合(64%)在我们的样本中被发现。西方黑鼻鲦鱼与最多的物种发生了杂交(其他八种加上Pimephales物种),而小溪鲦鱼和普通闪光鱼与次多的物种发生了杂交(另外七种)。条纹闪光鱼与其他物种的杂交最少——仅与普通闪光鱼、玫瑰脸闪光鱼和角质头鲦鱼杂交。尽管如此,它们的杂交后代占亲本的比例最高,因为实际上我们的数据集中没有纯种的条纹闪光鱼;所有条纹闪光鱼的祖先都出现在杂交后代中(图2和图S17)。这一发现与一项关于鲤科鱼类杂交的比较研究结果一致,该研究发现条纹闪光鱼的杂交现象最为频繁(Corush等人2020年)。我们的数据还显示,条纹闪光鱼最常与普通闪光鱼杂交。条纹闪光鱼与普通闪光鱼之间的杂交现象至少从更新世时期(260万至1万年前)就一直存在(Dowling和Hoeh 1991年;Duvernell和Aspinwall 1995年;Duvernell等人2025年)。这种杂交导致条纹闪光鱼种群中的线粒体DNA被普通闪光鱼的DNA所取代(Dowling和Hoeh 1991年,Duvernell和Aspinwall 1995年,Duvernell等人2025年)。Luxilus属具有有趣的杂交历史,这种线粒体DNA的替换至少发生了两次(Duvernell等人2025年)。虽然这项研究的采样地点位于条纹闪光鱼分布的最北端和已知的杂交区域(Duvernell等人2025年),但在安大略省南部,这两种物种之间仍然存在大量的杂交现象。此外,玫瑰脸闪光鱼似乎很少发生杂交,因为我们的数据集中发现的杂交个体很少(图2),并且它们是一个遗传上最独特的群体(图S17)。尽管如此,当它们发生杂交时,并不限于单一的杂交组合;玫瑰脸闪光鱼与五种其他物种发生了杂交——数量超过了条纹闪光鱼和长鼻鲦鱼。最后,由于许多中央石滚鱼的基因组身份结果的95%可信区间非常宽,因此应谨慎解释这些涉及中央石滚鱼的结果。我们的结果还揭示了超出研究设计预期的额外杂交组合。在没有特意针对胖头鲦鱼和钝鼻鲦鱼的情况下,我们意外地发现了这些物种的祖先。DNA条形码分析确认了这些Pimephales物种的线粒体DNA存在于具有隐秘祖先来源的个体中,这表明这些物种与普通闪光鱼、小溪鲦鱼和西方黑鼻鲦鱼发生了杂交(表S3)。这支持了ENTROPY的研究结果,表明在12个个体中至少有10%的Pimephales物种祖先——11个条形码个体加上一个多物种杂交体(图2)。仅在部分具有Pimephales祖先的个体中发现了Pimephales的线粒体DNA,这表明Pimephales物种可以是杂交后代的母本或父本,而不是单向杂交系统(Angers和Schlosser 2007年)。虽然已经发现了钝鼻鲦鱼和胖头鲦鱼之间的杂交以及与其他物种的杂交(Heithaus和Grame 1997年;Muller和Altadena 2000年;Zbinden等人2023年),但尚未在文献中记录到与普通闪光鱼、小溪鲦鱼和西方黑鼻鲦鱼的杂交。这些新发现的杂交组合可能是安大略省南部特有的生态现象,因为对该地区鲤科鱼类的研究较少。除了发现的Pimephales物种祖先外,熵分析还识别出两个额外的祖先来源(图2和图S12,簇11和12)。这两个祖先来源存在于五种物种中(小溪鲦鱼、普通闪光鱼、西方黑鼻鲦鱼、河鲦鱼和长鼻鲦鱼),并且任何一个个体的祖先比例都不超过1.2%,但根据DIC值,K=12的模型比K=11或K=10的模型更符合数据。这两个来源可能代表“幽灵混合”,即来自未采样来源群体的祖先(Beerli 2004年)。由于这些来源的祖先比例很小但仍然很重要,因此更倾向于使用包含更多簇的模型。在所有三种物种组合中,回交和后代杂交的比例大致相等,但与小溪鲦鱼的两种组合相比,与BNDxCS组合产生的F1杂交体更多(图S2)。BNDxCS组合产生的F1杂交体在三角图中的q值较低,并且似乎更倾向于普通闪光鱼的亲本(图3A)。最可能的解释是普通闪光鱼的数量比西方黑鼻鲦鱼更多,因为我们捕获的普通闪光鱼数量更多(图1B)。K=2模型中的三种物种都不是保护性物种,因此不太可能是行为差异导致了更大的生殖隔离。小溪鲦鱼和普通闪光鱼之间的回交非常普遍(图3C)。这些物种之间的许多杂交后代被归类为后代的回交,因为它们位于三角图形的边缘,尽管超出了第一代回交所描述的范围。杂交后代和高级回交的多样性表明,这些物种之间的杂合基因型以及不同程度的中间表型可能不会对这些杂交后代的适应性产生有害影响(Thompson等人,2021年)。这一点非常有趣,因为西部黑鼻鲦鱼和普通闪光鱼有一个更近的共同祖先,而它们与溪流鲦鱼的共同祖先要远古得多(图1C),通常情况下,分化程度较低的物种之间的杂交现象更为普遍(Bolnick和Near,2005年)。然而,鉴于在我们分析Q值的三个物种中,杂交后代数量最多的物种是那些最丰富的物种,而杂交后代数量最少的物种则是那些最稀有的物种,这可能意味着分化程度并不是一个重要的繁殖障碍,这与Centrarchidae鱼类中的情况不同(Bolnick和Near,2005年)。如果所有这些物种都能相互繁殖,那么最常见的物种可能最有可能发生杂交。这与鱼类物种的杂交频率可能受其环境影响这一观点相符(Hubbs,1955年)。这些数据中存在许多多物种杂交后代是一个有趣且不寻常的特征(图S16)。我们发现了40个多物种杂交后代(40/731,占所有个体的5.5%),这些杂交后代分布在25个采样点中的16个点(占采样点的64%)。所有这些杂交后代要么是由一个祖先来源贡献了大部分遗传信息,再加上多个较小的祖先来源(12/40),要么是由三个祖先来源贡献了10%到90%的遗传信息(28/40)。多物种之间的杂交在文献中经常被忽视,传统上都是以两个物种为一组进行研究。最近的研究在鸟类(Natola等人,2022年;Ottenburghs,2019年)、无脊椎动物(Satokangas等人,2023年;Dlouhá等人,2010年)和鱼类(Banerjee等人,2023年;Zbinden等人,2023年)中发现了多物种杂交的实例,而且可能还有许多多物种杂交复合体存在但尚未得到充分研究。目前尚不清楚某些物种的杂交后代是否与其他物种进行回交,或者某些物种是否作为“枢纽”物种在非杂交物种之间传递遗传信息(Ottenburghs,2019年)。然而,这是一个值得进一步研究的有趣方向。

4.2 所有采样点都存在杂交后代

与其他鱼类杂交研究(Banerjee等人,2023年;Mandeville等人,2017年;Zbinden等人,2023年)不同,这个系统中的所有采样点都存在杂交后代,并且每个采样点上的杂交个体比例相对一致(图4B)。虽然并非所有采样点都是独立的,但彼此靠近的采样点在杂交程度上存在差异,这表明局部因素可能是导致杂交率变化的原因。这一点从那些始终共存的物种并不总是发生杂交的事实中可以看出来(例如,普通闪光鱼和溪流鲦鱼:图3D)。这可能是由于环境、行为或群落动态,或者是随机采样的结果。我们的研究强调了在不同分布区域研究杂交动态的重要性,因为相同的杂交表型在不同的环境和地质条件下适应性会有所不同。我们的研究结果与Zbinden等人(2023年)在美国密苏里州和阿肯色州的White River Basin进行的杂交研究结果相似但有所不同。虽然Zbinden等人(2023年)还研究了其他五个鱼类家族,但他们发现的杂交后代主要来自Leuciscidae家族。Zbinden等人(2023年)研究的15种Leuciscidae物种中有4种与我们的研究相同,不过它们分布在西南边缘,而我们研究的是北部边缘。与我们的研究类似,Zbinden等人(2023年)发现所有Leuciscidae物种似乎都与至少另一种物种发生了杂交。他们还发现,每种物种的杂交后代数量与其在群落中的出现频率显著相关,就像我们研究中最常见的物种(溪流鲦鱼、西部黑鼻鲦鱼和普通闪光鱼)与其他物种的杂交数量最多一样。然而,不同的是,Zbinden等人(2023年)只在略超过一半的采样点发现了杂交后代,而我们在所有采样点都发现了杂交后代。他们还发现溪流鲦鱼与红侧鲦鱼聚集在一起,而与我们研究的结果不同,我们的研究中发现溪流鲦鱼与后两种物种发生了杂交(图4A)。这些相似性和差异表明,在试图理解杂交动态时,采样不同地理位置的样本点非常重要。

4.3 该系统中杂交后代的鉴定受益于基因组学

北美鲦鱼物种很难鉴定。即使有经验丰富的鱼类学家的帮助,也没有一个用于本项目的样本个体在形态上被鉴定为杂交后代。然而,基因组分析结果显示,29.4%的个体是杂交后代,它们至少有10%的遗传信息来自其他物种;9.3%的亲本物种被错误鉴定。当亲本物种难以区分或涉及多个物种时,杂交后代很容易被忽略(Dlouhá等人,2010年;Natola等人,2022年;Slager等人,2020年)。曾经有人认为,如果杂交后代具有完全中间的特征,那么这些物种之间就不可能发生回交,反之亦然(Hubbs,1955年;Greenfield等人,1973年)。然而,F1杂交后代并不一定在亲本物种之间看起来具有中间特征,这一观点已经在植物和鱼类中得到证实(Thompson等人,2021年;Stelkens和Seehausen,2009年)。通过实验杂交溪流鲦鱼、中央石滚鱼、角质头鲦鱼和红侧鲦鱼(Ross和Cavender,1981年)的研究表明,虽然杂交后代在某些特征上始终介于亲本之间,但有些杂交后代可能更像其中一个亲本。这种情况也可能发生在其他Leuciscidae鱼类中。

4.4 杂交与环境之间的关系仍不清楚

我们发现OWIT的环境数据与每个采样点的杂交后代比例之间存在较弱的相关性。大多数这种相关性是由一两个异常值驱动的,因为预测变量内部的变异非常小(图5)。由于多个环境变量之间存在明显差异,且每个采样点的杂交后代比例与环境变量本身之间缺乏强相关性,我们将每个采样点的杂交后代比例与分为三组的采样点进行对比,并进行了方差分析(ANOVA),以寻找总体趋势(图5G)。虽然农业化采样点和城市化采样点的个体比例平均值存在显著差异,但农业化采样点的杂交后代比例平均值较低。这与我们的预测相反,我们原本认为在受干扰更严重的采样点会发现更多的杂交后代。在更多样化的地点进行更多的采样可能会得到更明确的结果。实际上,在美国White River Basin进行的类似研究也显示,降水量与杂交现象之间存在正相关(Zbinden等人,2023年)。尽管该地区的环境条件可能与安大略省南部不同,但在许多其他鱼类物种中也观察到了环境与杂交现象之间的联系(Banerjee等人,2023年;Hasselman等人,2014年;Seehausen等人,1997年)。另一方面,影响安大略省南部Leuciscidae鱼类杂交率的干扰可能发生在比我们数据中包含的范围更局部的层面。河岸缓冲带对于维持溪流生态系统的健康非常重要,它们可以过滤径流并防止溪流边缘的侵蚀(Champagne和McCann,2020年;Rahel,2002年;Scott和Helfman,2001年)。Champagne和McCann(2020年)发现,局部农业活动的增加对溪流鲦鱼的能量利用和营养级的影响比流域层面的农业活动增加更为严重。反过来,这些对溪流鲦鱼代谢活动的影响也可能干扰它们的繁殖行为,此外还有农业活动的直接干扰(Corush等人,2020年;Hasselman等人,2014年;Seehausen等人,1997年)。杂交会产生不同的结果,尤其是在具有不同选择压力、遗传漂变率和迁移率的多种环境中(McFarlane等人,2022年)。在这种噪声背景下,人为干扰可能无法通过我们现有的数据检测到明显的趋势,尤其是考虑到找到真正“未受干扰”的采样点非常困难。尽管无法确定控制杂交结果的机制,我们仍然成功地研究了25个不同采样点上的杂交现象。我们强调了安大略省南部杂交结果的多样性,并为未来研究这些杂交结果背后的机制奠定了基础。

作者贡献
A.V.M.、A.R.P.和E.G.M.制定了采样策略并执行了采样工作。A.V.M.和A.R.P.进行了DNA提取和文库制备。A.V.M.和E.G.M.制定了基因组分析计划并执行了分析。A.V.M.和S.E.M.对杂交的环境相关因素进行了建模和统计分析。所有作者都参与了手稿的撰写和修订。

致谢
我们在安大略省北部发展、矿业、自然资源和林业部的许可#1100698以及圭尔夫大学的动物利用协议许可#4237下进行了采样。这项工作是作为加拿大第一研究卓越基金的一部分进行的,具体来说是圭尔夫大学的“Food from Thought”项目,该项目通过研究支持补助金资助给E.G.M。分析工作得到了加拿大数字研究联盟对E.G.M.的计算资源分配的支持。我们还要感谢自然资源和林业部、安大略省公园、Algonquin野生动物研究站、Humber River Heritage Trail、Holland Marsh排水系统联合市政服务委员会、rare Charitable Research Reserve、Pottageville Swamp保护区、Scanlon Creek保护区、Bruce Municipality、圭尔夫市以及多位私人土地所有者对我们野外工作的许可支持。同时,我们也感谢Scott Cocker在地图制作方面的专业知识。最后,我们要感谢McCann和Mandeville实验室的成员在野外工作和支持手稿编写过程中的帮助。本手稿在两位匿名审稿人的评论下得到了改进。

资金支持
这项工作得到了加拿大第一研究卓越基金的支持。

利益冲突
作者声明没有利益冲突。

数据可用性声明
用于分析的数据、元数据和脚本已在GitHub(github.com/amanda-meuser)、DataDryad(https://doi.org/10.5061/dryad.5mkkwh7kn)和NCBI Sequence Read Archive(BioProject编号PRJNA1291971)上公开。我们在采样过程中与省级公园和保护区以及当地土地所有者进行了合作。结果已与合作者和更广泛的科学界共享。基因组数据也已公开,有助于未来对这些物种的研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号