Calappa蟹线粒体基因组中的保守基因顺序与适应性进化:对生态特化及系统发育价值的启示

《Ecology and Evolution》:Conserved Gene Order and Adaptive Evolution in Mitochondrial Genomes of Calappa Crabs: Insights Into Ecological Specialization and Phylogenetic Utility

【字体: 时间:2026年03月25日 来源:Ecology and Evolution 2.3

编辑推荐:

  摘要 由于线粒体基因组具有母系单亲遗传、结构保守性和替换率异质性,它们成为阐明海洋无脊椎动物谱系分化和重建高分辨率系统发育树的关键分子标记。在本研究之前,Calappidae科仅有一个完整的线粒体基因组序列。我们首次获得了五种Calappa蟹物种的完整线粒体基因组序列。这些线粒

  摘要

由于线粒体基因组具有母系单亲遗传、结构保守性和替换率异质性,它们成为阐明海洋无脊椎动物谱系分化和重建高分辨率系统发育树的关键分子标记。在本研究之前,Calappidae科仅有一个完整的线粒体基因组序列。我们首次获得了五种Calappa蟹物种的完整线粒体基因组序列。这些线粒体基因组表现出特征性特征,包括37个基因、较高的AT核苷酸偏倚以及某些分类单元中的不完整终止密码子等结构变异。系统基因组分析证实了Calappa的单系性。正选择分析在能量代谢基因(ATP6、ND2、ND5)中发现了显著的适应性信号。具体而言,这些适应性突变可能增强了在缺氧埋藏条件下的质子传输效率和ATP合成能力,反映了它们对高能量需求环境的分子适应。值得注意的是,所有研究物种都保留了Brachyura类群的保守祖先基因顺序,尽管具有生态特化性,但线粒体基因组的组织结构仍表现出显著的稳定性。这种保守的基因排列可以作为可靠的系统发育标记,尽管其背后的分子机制需要通过更多Brachyura类群进行进一步研究。本研究为Calappidae科的系统分类和Brachyura类的进化历史提供了重要的分子资源,同时也强调了整合未来核基因组数据以完善更高层次系统发育树的必要性。

1 引言

线粒体基因组(mtDNA)作为一种细胞外遗传物质,具有母系遗传、基因组织紧凑和高核苷酸替换率的特点,使其在分子进化和系统发育研究中特别有价值(Boore 1999)。鉴于这些特性,本研究优先选择了线粒体基因组:其加速的进化速率不仅有助于解析Brachyura类群内的近期分化,还弥补了早期研究中核标记有限的区分能力(Ma等人2019)。通常,线粒体基因组呈闭合环状结构,长度在14至20 kb之间,包含13个蛋白质编码基因(如氧化磷酸化相关酶复合体的亚基cox1–3和nad1–6)、22个转运RNA基因、2个核糖体RNA基因(12S和16S rRNA)以及一个高度可变的富含AT的调控区域(Bernt, Bleidorn等人2013;Bernt, Braband等人2013)。与核基因组相比,线粒体基因组具有分子体积小、基因组成保守且无重组干扰等优点,有效规避了核假基因对系统发育推断的影响。这些特点使其成为物种鉴定和进化分析的高分辨率标记(Gissi等人2008)。下一代测序技术的快速发展使得线粒体基因组在物种进化和系统发育研究中发挥了关键作用(Tan等人2018;Ruan等人2020;Yang等人2021)。Brachyura亚目是甲壳纲中一个高度多样化的类群,包含超过7520种已描述的物种,分为大约100个科。它们的栖息地涵盖海洋、河口、淡水和陆地环境,在全球生态系统中扮演着重要角色(Marin和Tiunov 2023)。传统的分类系统主要依赖于螯肢结构和甲壳形态等形态特征来划分科和属单元。然而,最近的分子系统发育研究表明,传统甲壳类分类群内部存在广泛的多系性或并系性,表明形态趋同和生态适应辐射可能掩盖了真实的进化关系(Tsang等人2014, 2022;Wolfe等人2024)。Calappidae科以Calappa和Matuta等属为代表,通常被称为箱蟹,分布于热带至亚热带地区。在中国水域,该科记录有6个属和20种物种,约占印度-西太平洋地区已知物种总数的三分之二(Chen 1993)。Galil(1997)修订了Calappa属的分布范围,指出其分布于红海、索马里、南非,并向东延伸至印度洋和太平洋直至复活节岛(Galil 1997);Galil和Clark(1994)报道了Matuta属在红海、东非、日本和斐济的分布(Galil和Clark 1994)。尽管分布广泛,但这些螃蟹具有高度特化的埋藏习性以适应其生态位(Bellwood 2002)。它们能在几秒钟内反向钻入沙质基质中并长时间完全埋藏,同时通过特殊的呼吸结构(如辅助进水口和延长的出水口)保持与上方水体的连续水流。这种独特的埋藏生活方式对生物体的能量代谢和氧气利用效率提出了特定挑战,尤其是在完全埋藏在缺氧沉积物中的情况下(Bellwood 2002)。作为细胞的“动力工厂”,线粒体编码呼吸链复合体的关键亚基。其进化动态与能量代谢的适应性密切相关(Yang等人2019)。迄今为止,NCBI数据库已记录了超过500个Brachyura类的完整线粒体基因组(https://www.ncbi.nlm.nih.gov),但仅报道了两个Calappidae科的完整线粒体基因组。Calappidae科的分类和系统发育长期以来一直存在复杂性和争议,主要是由于该科内物种间形态的高度保守性与生态多样性(Ewers-Saucedo等人2016;Camargo 2018)。尽管分子研究已经结合了多个核基因组和线粒体位点(Tsang等人2014;Ewers-Saucedo等人2016;Wolfe等人2024),但该科内的系统发育关系尚未完全明确。先前的研究提出Calappoidea超科起源于晚白垩世(Tsang等人2014;Wolfe等人2024),但针对Calappidae科内部进化时间框架的详细系统发育研究仍然有限。同时,Calappidae科内部及之间的进化时间框架仍不确定,其起源和关键分化事件的时间需要进一步澄清。在本研究中,我们首次测序并分析了五种代表性Calappidae物种(Calappa clypeata、Calappa capellonis、Calappa hepatica、Calappa lophos和Calappa philargius)的完整线粒体基因组,并将其与其他Brachyura类群的线粒体基因组进行了比较。我们使用206个物种的13个PCGs重建了Brachyura类群的系统发育树,进行了选择压力分析,并估计了分化时间以阐明进化关系和适应机制。此外,通过估计分化时间和整合历史事件数据,我们更详细地揭示了Brachyura类的进化历史。

2 材料与方法

2.1 样本和DNA提取

从海南(南海)水域收集了五个形态学鉴定的Calappa属样本(C. clypeata、C. capellonis、C. hepatica、C. lophos、C. philargius)(图1)。C. clypeata和C. lophos采集于2022年10月9日,其余三种物种采集于2022年10月13日。肌肉组织迅速冷冻在液氮中,并储存在-80°C以提取总基因组DNA。使用Aidlab基因组DNA提取试剂盒(Aidlab Biotech,北京,中国)按照制造商提供的具体程序从肌肉组织中提取基因组DNA。通过电泳评估提取DNA的质量,随后将其储存在-20°C以备后续PCR扩增。

2.2 基因组测序和组装验证

使用下一代测序技术(Illumina HiSeq 4000;上海Origingene Bio-pharm Technology Co. Ltd.,中国)对五种螃蟹(C. clypeata、C. capellonis、C. hepatica、C. lophos、C. philargius)的线粒体基因组进行了测序。为了验证样本的准确性,在25 μL反应混合物中进行了PCR扩增,其中包含12.5 μL的2× F8 PCR MasterMix、0.5 μL的通用引物cox1(扩增711 bp片段)和16SrRNA(扩增568 bp片段)(Sanger和Coulson 1975;Simon等人2006)、1.5 μL的基因组DNA模板以及10 μL的超纯水。扩增在ABI9700热循环仪上进行,条件如下:初始变性94°C–95°C 4–5分钟;随后34–35个循环,每次变性94°C–95°C 30秒,退火52°C 30秒,延伸72°C 30秒;最后在72°C下延伸10分钟。结果确认测序序列与Illumina测序得到的序列一致。

2.3 序列分析和基因注释

为了分析无脊椎动物的线粒体基因组,使用NCBI(https://www.ncbi.nlm.nih.gov)和MITOS Web Server(https://mitos2.bioinf.uni-leipzig.de/index.py)的工具识别了完整的13个PCGs。此外,使用MITOS Web Server和tRNAscan–SE(http://lowelab.ucsc.edu/tRNAscan-SE/)分析了tRNA序列中的潜在茎-环二级结构。我们还使用MEGA 7计算了核苷酸含量,并利用以下公式分析了组成偏斜:AT–skew = (A – T)/(A + T) 和 GC–skew = (G – C)/(G + C)。使用在线线粒体可视化工具Organellar Genome DRAW和BRIG生成了五个物种线粒体基因组的基因图谱。RNAfold WebServer(http://rna.tbi.univie.ac.at/)用于预测rRNA和CR的二级结构,而Tandem Repeats Finder服务器(http://tandem.bu.edu/trf/trf.html)用于检测控制区域内的串联重复序列。

2.4 系统发育分析和基因重排

为了重建Brachyura类螃蟹的系统发育关系,我们使用了206个线粒体基因组(包括5个新测序的螃蟹物种、184个Brachyura物种和17个Anomura物种作为外群)重建了系统发育树(表S1)。除了新测序的物种外,其他物种的遗传数据来自GenBank。然后使用MEGA 5将13个PCGs的核苷酸序列连接并翻译成氨基酸序列。接着使用MEGA 5中的MUSCLE 3.8对206个物种的氨基酸序列进行了比对。最终连接的氨基酸序列数据集用于进一步的系统发育分析。选择了MtREV+ I + G + F模型作为最合适的进化模型。两个数据集分别使用IQ–Tree中的最大似然(ML)方法和MrBayes 3.2.6中的贝叶斯推断(BI)进行了分析(Huelsenbeck和Ronquist 2001;Nguyen等人2015)。对于BI分析,我们进行了两次并行运行,每次运行1000代,每1000代进行一次树采样。该设置包括一个冷链和三个热链,以促进马尔可夫链蒙特卡洛(MCMC)链之间的交换。使用Tracer 1.7软件检查了采样参数的收敛性和自相关性,确保有效样本量超过200。此外,监测了两次运行之间分裂频率的平均标准差,确保其保持在0.01以下。我们移除了最初的25%的树作为燃烧期。贝叶斯后验概率基于燃烧期后树木的50%多数规则共识得出。最终的系统发育树使用FigTree v1.4.2(De Bruyn等人2014)进行了可视化。在基因重排方面,使用MITOS和NCBI重新注释了所有不同的线粒体基因组以确保数据的准确性。对线粒体基因组中发现的任何差异进行了手动校正。为了研究潜在的进化机制,使用了CREx Web Server(http://pacosy.informatik.uni-leipzig.de/crex)进行计算。Common Interval Rearrangement Explorer(CREx)被用来通过数学建模动态计算复杂的重排过程。

2.5 选择压力检测

通过使用PAML4.7包中的基于密码子的最大似然(CodeML)方法比较非同义/同义替换比率(ω = dN/dS)来进行选择压力分析(Yang和Nielsen 2000;Welch等人2008)。ω < 1、ω = 1和ω > 1分别代表纯化选择、中性进化和正选择。我们使用分支-位点模型评估不同分支中的正选择,使用BEB分析以0.8的概率识别出正选择下的位点。并且使用TreeSAAP v3.2检测氨基酸的物理化学性质变化以支持PAML的结果。

2.6 分化时间估计

使用BEAST v2.5.2和uncorrelated relaxed clock及Yule树先验模型估计主要谱系的分化时间,以适应分支间的进化率变化(Drummond和Rambaut 2007)。基于已知最古老的支系出现情况应用了化石校准,20个化石被分配到对数正态先验分布中,以反映化石记录之前的分化事件(表S2)。数据集被划分以允许独立的替换率,分析包括5000万代的初步运行。使用Tracer 1.7软件检查了收敛性和自相关性,确保有效样本量超过200。此外,监测了两次运行之间分裂频率的平均标准差,确保其保持在0.01以下。我们移除了最初的25%的树作为燃烧期。贝叶斯后验概率基于燃烧期后树木的50%多数规则共识得出。最终的系统发育树使用FigTree v1.4.2(De Bruyn等人2014)进行了可视化。在基因重排方面,使用MITOS和NCBI重新注释了所有不同的线粒体基因组以确保数据的准确性。对线粒体基因组中发现的任何差异进行了手动校正。为了研究潜在的进化机制,使用了CREx Web Server(http://pacosy.informatik.uni-leipzig.de/crex)进行计算。Common Interval Rearrangement Explorer(CREx)被用来通过数学建模动态计算复杂的重排过程。

2.6 选择压力检测

通过使用PAML4.7包中的基于密码子的最大似然(CodeML)方法比较非同义/同义替换比率(ω = dN/dS)来进行选择压力分析(Yang和Nielsen 2000;Welch等人2008)。ω < 1、ω = 1和ω > 1分别代表纯化选择、中性进化和正选择。我们使用分支-位点模型评估不同分支中的正选择,使用BEB分析以0.8的概率识别出正选择下的位点。并且使用TreeSAAP v3.2检测氨基酸的物理化学性质变化以支持PAML的结果。

2.6 分化时间估计

使用BEAST v2.5.2和uncorrelated relaxed clock及Yule树先验模型估计主要谱系的分化时间,以适应分支间的进化率变化(Drummond和Rambaut 2007)。基于已知最古老的支系出现情况应用了化石校准,20个化石被分配到对数正态先验分布中,以反映化石记录之前的分化事件(表S2)。数据集被划分以允许独立的替换率,分析包括5000万代的初步运行。使用初始运行的时间图细化了拓扑约束。在Tracer中验证了收敛性(ESS > 200),并使用TreeAnnotator生成了最大分支可信度树。先前的设置已经通过无数据分析进行了验证,以防止偏差(Rambaut等人,2018年)。

3 结果与讨论

3.1 线粒体基因组组织与碱基组成

在这项研究中,对Calappa属中的五个物种(Calappa clypeata、Calappa capellonis、Calappa hepatica、Calappa lophos、Calappa philargius)的线粒体基因组进行了测序和全面注释。新物种的完整线粒体基因组呈环状分子形式,长度从C. lophos的15,587 bp到C. capellonis的16,331 bp不等,这一长度与其他来自Huananpotamon lichuanense(15,380 bp)到Eriocheir sinensis(16,353 bp)的短尾类(Brachyura)的线粒体基因组相似(Li等人,2016年;Bai等人,2018年)。这五个物种的线粒体基因组已存入GenBank,访问编号分别为PV686466(C. lophos)、PV686467(C. hepatica)、PV686468(C. clypeata)、PV686469(C. capellonis)和PV686470(C. philargius)。所有五个测序物种都拥有标准的37个线粒体基因:13个PCGs(蛋白质编码基因)、2个rRNAs(核糖体RNA)和22个tRNAs(转运RNA)以及一个控制区域(CR)。除了4个PCGs(ND5、ND4、ND4L、ND1)、8个tRNAs(tRNA-Cys、Tyr、Gln、Val、Leu、Pro、Phe和His)和2个rRNAs位于轻链(L-)上外,其余的37个基因都位于重链(H-)上(图2,表S4)。本研究中分析的五个Calappa物种的线粒体基因组显示出大量且广泛重叠的区域,这种现象可能是由基因组紧凑性、进化事件和功能限制共同作用的结果。线粒体基因组通常通过极端压缩非编码区域来优化遗传信息存储效率,基因重叠是提高遗传密度的关键策略,这一特征在进化过程中得到了广泛保守(Bernt、Bleidorn等人,2013年;Bernt、Braband等人,2013年)。具体来说,在Calappa的线粒体基因组中识别出13个重叠区域,长度从1 bp到25 bp不等。值得注意的是,所有物种中最长的重叠区域始终位于trnL1和rrnL基因之间,长度稳定为25 bp。这一保守特征可能表明其在基因表达调控或基因组结构稳定性中具有特殊的功能作用。C. capellonis中最长的基因间间隔区(165 bp)明显长于其他所有物种。除了C. hepatica和C. capellonis,其最长的基因间间隔区位于cob和nad1之间外,其余物种的这些间隔区位置各不相同(表S4)。

图2:Calappa的线粒体基因组图谱。蛋白质编码基因用颜色编码(cox:淡紫色;nad:黄色;atp:绿色;cob:Kelly色);rRNA基因用红色表示;tRNA基因用蓝色表示。蛋白质编码基因的缩写包括:ATP6和ATP8代表ATP合成酶亚基6和8,cox1-3代表细胞色素氧化酶亚基1-3,cob代表细胞色素b,nad1-6和nad4l代表NADH脱氢酶亚基1-6和4L,rrnL和rrnS代表大rRNA和小rRNA亚基,CR代表控制区域。在这项研究中分析的五个Calappa物种的线粒体基因组显示出高比例的广泛重叠区域,这可能是由基因组紧凑性、进化事件和功能限制共同作用的结果。线粒体基因组通常通过极端压缩非编码区域来优化遗传信息存储效率,基因重叠是提高遗传密度的关键策略,这一特征在进化过程中得到了广泛保守(Bernt、Bleidorn等人,2013年;Bernt、Braband等人,2013年)。具体来说,在Calappa的线粒体基因组中识别出13个重叠区域,长度从1 bp到25 bp不等。值得注意的是,所有物种中最长的重叠区域始终位于trnL1和rrnL基因之间,长度稳定为25 bp。这一保守特征可能表明其在基因表达调控或基因组结构稳定性中具有特殊的功能作用。C. capellonis中最长的基因间间隔区(165 bp)明显长于其他所有物种。除了C. hepatica和C. capellonis,其最长的基因间间隔区位于cob和nad1之间,其余物种的这些间隔区位置各不相同(表S4)。

3.2 蛋白质编码基因(PCGs)和密码子使用情况

这五个物种的蛋白质编码基因(PCGs)包括七个NADH基因(nad1-6和nad4L)、两个ATP合成酶基因(atp6和atp8)以及四个细胞色素基因(cox1-3和cob),这些基因在无脊椎动物的线粒体基因组中很常见。与典型的短尾类线粒体基因组一致,9个PCGs位于重链上(cox1-3、cob、atp6、atp8、nad2-3和nad6),而4个PCGs位于轻链上(nad1、nad4-5和nad4L)。这五个物种的大多数PCGs都以起始密码子ATN开始,并且主要使用TAA或TAG作为终止密码子。C. lophos、C. clypeata和C. philargius的cox2基因,以及所有五个物种的nad5基因,都以不完整的终止密码子T结束(表S4),据推测这是通过转录后多聚腺苷化完成的,以形成功能性的终止密码子。这种现象在甲壳类动物的线粒体基因组中已被多次报道,可能与基因组压缩进化或RNA编辑机制有关,反映了线粒体基因组的动态进化特征(Hassanin等人,2005年;Gissi等人,2008年)。在C. clypeata、C. capellonis、C. philargius和C. lophos的13个PCGs中,使用频率最高的氨基酸是丝氨酸(Ser),分别占12.8%、9.7%和16.0%(图3,表S3)。C. hepatica中使用频率最高的氨基酸是亮氨酸(Leu),占15.2%(图4,表S3)。异亮氨酸(Ile)和苯丙氨酸(Phe)的比例也相对较高,这些氨基酸都由T或TA密码子编码。这一现象与线粒体基因组中明显的AT偏向一致。

3.3 转运RNA、核糖体RNA和控制区域(CR)

所分析的五个物种的线粒体基因组包含22个tRNAs,长度从61 bp(五个物种中的trnR)到73 bp(C. capellonis中的trnQ)不等(表S4)。大多数tRNAs具有典型的三叶草形二级结构,但少数tRNAs缺乏TΨC环和DHU臂,例如C. capellonis中的trnT缺乏TΨC环,C. philargius中的trnS1缺乏DHU臂(图S1)。这些异常结构在后生动物的线粒体基因组中相当常见,先前的研究已经证实它们不影响trnA的功能(Schneider,2011年)。此外,在tRNA结构中还发现了许多非典型的碱基配对(G-U、A-C、U-U、C-U),其中G-U错配最为常见。这种错配在各种甲壳类动物的tRNA分子中很常见(Wang、Tang等人,2020年;Wang、Wang等人,2020年),通常通过转录后tRNA修饰过程得到纠正(Wang、Tang等人,2020年;Wang、Wang等人,2020年)。Calappa中的rRNAs长度从2163 bp(C. lophos)到2183 bp(C. hepatica)不等。小编码亚基(12S rRNA)和大编码亚基(16S rRNA)都由缬氨酸tRNA(trnV)分隔(表S4)。在所分析的五个短尾类物种中,rRNA基因的A + T组成显示出中等的AT偏向,比例从C. hepatica的68.37%到C. lophos的74.42%不等(表S5)。五个物种整个线粒体基因组的AT偏斜和GC偏斜均为负值,表明T相对于A和C相对于G更为常见(表S5,图3)。在Grapasidae科的Metopograpsus quadridentatus的线粒体基因组中也观察到了类似的现象,其AT偏斜和GC偏斜均为负值(Wang等人,2018年)。

3.4 转运RNA、核糖体RNA和控制区域(CR)

所分析的五个物种的线粒体基因组包含22个tRNAs,长度从61 bp(五个物种中的trnR)到73 bp(C. capellonis中的trnQ)不等(表S4)。大多数tRNAs具有典型的三叶草形二级结构,但少数tRNAs缺乏TΨC环和DHU臂,例如C. capellonis中的trnT缺乏TΨC环,C. philargius中的trnS1缺乏DHU臂(图S1)。这些异常结构在后生动物的线粒体基因组中相当常见,先前的研究已经证实它们不影响trnA的功能(Schneider,2011年)。此外,在tRNA结构中还发现了许多非典型的碱基配对(G-U、A-C、U-U、C-U),其中G-U错配最为常见。这种错配在各种甲壳类动物的tRNA分子中很常见(Wang、Tang等人,2020年;Wang、Wang等人,2020年),通常通过转录后tRNA修饰过程得到纠正(Wang、Tang等人,2020年;Wang、Wang等人,2020年)。Calappa中的rRNAs长度从2163 bp(C. lophos)到2183 bp(C. hepatica)不等。小编码亚基(12S rRNA)和大编码亚基(16S rRNA)都由缬氨酸tRNA(trnV)分隔(表S4)。在所分析的五个短尾类物种中,rRNA基因的A + T组成显示出中等的AT偏向,比例从C. hepatica的68.37%到C. lophos的74.42%不等(表S5)。线粒体基因组的控制区域是后生动物线粒体基因组中最多样化的区域之一,由于其高突变率和结构多样性,被广泛用于系统发育和群体遗传学研究(Zhang和Hewitt,1996年;Saccone等人,1999年)。CR通常位于tRNA-Pro和tRNA-Phe基因之间,是线粒体基因组中唯一不编码功能性蛋白质或RNA的区域(Sbisa等人,1997年)。研究表明,CR在调节线粒体DNA复制和转录起始中起关键作用,其核心区域包含保守的启动子序列和终止相关序列(TAS),这些序列在不同物种中高度保守(Boore,1999年;Saito等人,2005年)。此外,由于CR中腺嘌呤和胸腺嘧啶的含量较高,通常偏向于A + T核苷酸,因此也被称为AT富集区域。在本研究中检查的五个短尾类物种中,CR位于rrnS和trnI之间。与经典的CR结构相比,这些物种表现出某些结构变化。例如,CR的长度从C. lophos的699 bp到C. capellonis的1143 bp不等(表S4和S5)。AT含量从C. clypeata的60.04%到C. lophos的81.12%不等。值得注意的是,在所有五个物种的CR中都检测到了重复序列(图S2),这一特征与一些甲壳类动物中报告的经典紧凑CR结构的偏差一致(Liu等人,2022年)。这些重复序列可能会影响CR的结构稳定性和进化速率,进一步反映了短尾类物种中线粒体控制区域的结构多样性。

3.4 系统发育分析

为了进一步探索Calappoidea在短尾类中的系统发育位置,我们基于189种短尾类螃蟹和17种异尾类(Anomura)作为外群进行了系统发育分析。构建的两棵系统发育树(ML树和BI树)在拓扑结构上大体一致。因此,只显示了一个具有支持值(BI)的拓扑结构,包括最大似然树的自助值和支持贝叶斯分析的后验概率。本研究中研究的Calappa物种(C. clypeata、C. capellonis、C. lophos、C. hepatica和C. philargius)表现出高度的系统发育一致性(图5)。这些物种与C. bilineata一起构成了Calappoidea超科的核心分支,代表了一个得到强烈支持的单系群(BPP/ML = 1/100)。C. capellonis作为该属的基部谱系,而C. clypeata和C. hepatica形成了一个姐妹群(BPP/ML = 1/100),C. lophos和C. philargius与C. bilineata一起形成了另一个得到高度支持的支系(BPP/ML = 1/100)。系统发育结果支持Calappa属的单系性;然而,鉴于当前数据的局限性,Calappidae科的整体单系性仍需要通过更多属级数据进一步验证。

图5:根据13个PCGs的氨基酸序列,使用ML和BI分析的189种短尾类物种和17个外群的系统发育树。分支上的数字表示后验概率(BI)和自助值(ML)。在这项系统发育分析中,大多数42个科形成了具有高节点支持值的单系群。在更高的分类水平上,大多数短尾类超科是单系的,而Ocypodoidea和Grapsoidea被发现是多系的。这些结果与最近的分子系统发育研究一致(Guinot等人,2013年;Tsang等人,2014年;Wolfe等人,2024年)。Ocypodoidea、Grapsoidea、Cryptochiroidea和Pinnotheroidea超科一起构成了Potamoidea的姐妹群。这一发现与Wang、Tang等人(2020年)和Wang、Wang等人(2020年)的结果大体一致,尽管早期的研究没有包括Cryptochiroidea和Pinnotheroidea超科(Wang、Tang等人,2020年;Wang、Wang等人,2020年)。Mictyridae科相对于Grapsoidea和Ocypodoidea谱系处于基部位置,代表了最早分化的群体,这也与Wang、Tang等人(2020年)和Wang、Wang等人(2020年)的结果一致。Ocypodoidea被划分为三个主要支系:Ocypodidae + ((Mictyridae + Xenophthalmidae + Dotillidae + Camptandriidae) + Macrophthalmidae)。在这个结构中,Xenophthalmidae始终嵌套在Dotillidae内。这一结果与Tsang等人(2022年)基于更广泛分类样本提出的胸甲类系统发育框架一致,从而为这两个科之间的系统关系提供了强有力的证据(Tsang等人,2022年)。此外,我们的数据表明Dotillidae是并系的,这与Wang、Tang等人(2020年)和Wang、Wang等人(2020年)基于两个物种得出的单系结果相反。在我们的系统发育树中,Dotillidae(Ocypodoidea)和Xenophthalmidae(Ocypodoidea)形成姐妹支系,这两个支系又与Camptandriidae(Ocypodoidea)聚类。这三个科共同形成了一个群体,该群体又与Sesarmidae(Grapsoidea)聚类。然而,在Tan等人(2018年)的研究中,Sesarmidae(Grapsoidea)首先与Dotillidae(Ocypodoidea)聚类,然后这个组合群体才与Gecarcinidae(Grapsoidea)形成姐妹关系。在Zhang等人(2023年)的系统发育树中,Sesarmidae(Grapsoidea)与Gecarcinidae(Grapsoidea)密切相关,而Dotillidae(Ocypodoidea)与Grapsoidea形成姐妹支系。Grapsoidea和Ocypodoidea的超科分类一直存在争议。传统的分类系统基于形态特征,将它们归为单系群。基于12个蛋白质编码基因(PCGs),Sung等人(2016年)支持这两个超科的单系性,而Tsang等人(2022年)使用两个线粒体基因(12S rRNA和16S rRNA)和核组蛋白H3基因,证明了Grapsoidea和Ocypodoidea的多系性。这项研究以及其他分子系统发育研究表明,Grapsoidea、Ocypodoidea和Xanthoidea超科表现出显著的多系特征,它们的系统发育关系需要通过整合多个分子标记来进一步解决。现有研究已经证实,线粒体基因组分析在蟹类的系统发育重建中具有重要价值。然而,目前的样本代表性有限——某些科级单元仅包含一个代表性物种,这可能导致拓扑结构的不稳定性。因此,未来的研究需要扩大样本覆盖范围,特别是通过对更多代表性物种进行完整的线粒体基因组测序,以便更好地探索短尾亚目的系统发育关系。

3.5 分化时间估计
BEAST分析表明,在Calappa属内部存在显著的分化模式。具体来说,C. capellonis首先分化,随后是Calappa clypeata和Calappa hepatica。这两种物种之间的分化时间估计为17.73 Ma(95%可信区间=6.25–29.16 Ma),表明它们的物种形成可能起源于早中新世(图6)。相比之下,C. lophos、C. philargius和C. bilineata之间的分化时间非常近期(0.21 Ma,95% HPD=0.02–0.73 Ma),表明后两者可能是通过快速物种形成或微生境适应在更新世到全新世期间出现的姐妹物种(图6)。这些发现与Wolfe等人(2019年)关于蟹类近期分化的研究结果一致,他们指出气候变化和海平面波动可能加速了浅水蟹类的生殖隔离(Wolfe等人,2019年)。图6使用206个物种数据集构建的时间树,节点条形表示节点年龄的95%置信区间。分子钟分析表明,短尾下目起源于早侏罗世(大约182.83 Ma),这与早期线粒体基因组和形态学研究的结果一致,后者认为其起源于侏罗纪冠群(Tsang等人,2014年)。在更高的分类水平上,主要总科的多样化表现出明显的时间聚集:Grapsidoidea和Ocypodoidea的分化发生在大约66–80 Ma(晚白垩世到古新世),Portunoidea出现在71.39 Ma(晚白垩世),Potamoidea在59.32 Ma(古新世/始新世边界)分化,Xanthoidea在61.90 Ma从Pilumnoidea分离。这些时间节点集中在白垩纪-古新世(K-Pg)边界附近,表明主要短尾下目谱系的分化与白垩纪末的大规模灭绝和随后的生态重组密切相关。这一时间框架与基于转录组和核基因的最新大规模系统发育研究相当。Luque等人(2024年)整合了36个化石校准点,支持主要科级分化发生在晚白垩世到古新世之间(Luque等人,2024年)。Pan等人(2024年)基于56个物种的转录组数据,同样推断主要短尾下目总科和科的多样化集中在白垩纪-古新世过渡期(Pan等人,2024年)。Wolfe等人(2024年)使用多基因分析也表明,主要谱系的分化发生在晚白垩世到早古新世(大约66 Ma)(Wolfe等人,2024年)。尽管这些基于核基因组或转录组的研究可能估计出更早的冠群起源时间,但它们在科级和总科级别的分化时间估计(59–80 Ma)与我们的线粒体基因组推断结果非常一致,共同支持短尾下目在K-Pg边界附近的快速辐射。应当注意的是,线粒体和核基因组之间的进化动态差异可能导致估计深层分化时间的系统偏差。线粒体蛋白质编码基因进化更快,并受到种群遗传过程的影响,可能在深层节点产生轻微的速率异质性,从而得出比转录组数据稍年轻的估计结果(Tsang等人,2014年)。此外,化石校准的选择和放松的分子钟模型的应用可能会影响三叠纪-侏罗纪深层分化的分辨率。尽管如此,我们的科级和总科分化估计与最新的化石校准框架(Luque等人,2024年)和转录组分子钟(Pan等人,2024年;Wolfe等人,2024年)一致,证实了主要短尾下目谱系在晚白垩世到早古新世期间的多样化。

3.6 基因重排
在短尾下目中,线粒体基因排列被广泛认为受到强烈的进化约束,大多数科保留了祖先的排列模式(Bernt, Bleidorn等人,2013年;Bernt, Braband等人,2013年)。本研究对Calappoidea总科的基因排列分析进一步证实了这一趋势,发现所有检查的物种(包括五个Calappidae物种和三个Matutidae物种)都符合短尾下目的祖先基因顺序,未检测到任何重排事件。从生态学角度来看,Matutidae物种以活跃的游泳和捕食能力为特征,而Calappidae物种则专门适应于底栖挖掘生活方式(Bellwood 2002)。尽管存在这些差异,两组在线粒体基因排列上表现出高度一致性,这与Anomura中记录的频繁重排事件形成鲜明对比(Tan等人,2018年)。基于Calappoidea中的保守性,我们的结果表明,该总科所属的谱系可能继承了短尾下目的共享基因组稳定性特征。因此,其保守的基因排列可以作为可靠的系统发育标记,尽管驱动这种稳定性的分子机制需要在其他短尾下目类群中进行进一步研究。

3.7 选择压力
为了研究短尾下目蟹类中线粒体基因的适应性进化,我们使用了CodeML软件,并应用分支位点模型分析了206种蟹类中的PCGs的选择压力,同时确定了非同义替换率与同义替换率的比例(dN/dS,表示为ω)。我们发现ATP6、ND2和ND5基因显示出显著的选择进化信号,并具有多个正选择位点(图7,表S6)。ATP6基因在ma模型中表现出极高的选择压力(ω2=157.543,p=0.002),显著超过了中性模型(ma0,ω2=1.0)(表S6)。该基因编码线粒体ATP合酶的一个亚基,直接参与质子跨膜运输和ATP合成(Ballard和Whitlock 2004)。观察到的强烈正选择可能反映了代谢抑制和能量保存的适应性需求,特别是与十足目甲壳动物的缺氧耐受性相关。同样,ND2(2ΔlnL=5.947,p=0.0147;ω2=999.0)和ND5(2ΔlnL=37.394,p<1e-9;ω2=11.923)的显著测试结果进一步证实了正选择的存在(表S6)。升高的ω值表明,这些基因中特定位点的适应性功能分化可能源于非同义突变(Kosakovsky等人,2011)。ND2的高ω值(ω2=999.0)表明,这些位点的非同义突变可能提高了线粒体呼吸效率,促进了Calappidae物种特有的沉积物埋藏和硬食性喂养等能量密集过程的ATP产生(McGaw 2005;Seed和Hughes 1995)。此外,我们发现大多数正选择位点聚集在跨膜域,这些区域在功能上非常重要,因为它们对于质子转运和呼吸链复合体的结构完整性至关重要(Dhar等人,2021)。图7显示了ATP6(A)、ND2(B)和ND5(C)蛋白的三维表示,检测到的正选择位点用红色标记。值得注意的是,ND5基因中的适应性进化信号特别显著(ω2=11.923,2ΔlnL=37.394,p=9.65e–10),并且检测到了多个高置信度的正选择位点(表S6)。ND5是线粒体呼吸链复合体I的核心亚基,其功能与氧化磷酸化的效率密切相关。正选择可能反映了该基因对不同环境压力的动态能量代谢调节(Ballard和Whitlock 2004)。相比之下,COX1基因的ω2值(1.25)略高于中性阈值(ω=1),但统计测试不显著(p=0.746),表明其进化模式可能主要由纯化选择主导,这与保守线粒体基因的典型特征一致(Gissi等人,2008)。

4 结论
本研究首次完成了Calappidae科五个代表性物种的完整线粒体基因组测序,揭示了它们的基本特征(包括典型的37个基因、高AT偏置)。系统发育分析结合分化时间估计确认了Calappa属的单系性,并表明该属的主要多样化发生在中新世。选择压力分析在关键能量代谢基因(ATP6、ND2、ND5)中检测到显著的正选择信号,为理解甲壳动物对高能量需求环境的分子适应机制提供了证据。此外,Calappidae中的保守基因顺序表明了强烈的进化约束,而呼吸基因中的正选择反映了对缺氧沉积物的适应。

作者贡献
王正飞:概念化(平等),数据管理(平等),正式分析(平等),资金获取(平等),调查(平等),方法论(平等),项目管理(平等),资源(平等),软件(平等),监督(平等),验证(平等),可视化(平等),写作——原始草稿(平等),写作——审阅和编辑(平等)。吴慧文:数据管理(平等),正式分析(平等),调查(平等),方法论(平等),软件(平等),监督(平等),验证(平等),可视化(平等),写作——原始草稿(平等),写作——审阅和编辑(平等)。姜伟杰:正式分析(平等),调查(平等),方法论(平等),软件(平等),监督(平等),验证(平等),可视化(平等),写作——原始草稿(平等),写作——审阅和编辑(平等)。徐志文:数据管理(平等),调查(平等),方法论(平等),可视化(平等)。郑玉清:数据管理(平等),调查(平等),方法论(平等)。王志轩:正式分析(平等),软件(平等)。唐军:正式分析(平等),软件(平等)。陈欣:正式分析(平等)。

致谢
我们感谢郑玉清、陈火火和郝思佳在样本收集方面的贡献和努力。

资助
本研究由中国国家自然科学基金(项目编号32370436)和江苏省青兰项目对王正飞的支持。

伦理声明
本研究中使用的五种Calappa属物种(C. clypeata、C. capellonis、C. lophos、C. hepatica和C. philargius)未列入国际自然保护联盟濒危物种名录(https://www.iucnredlist.org/)。标本的收集和保存严格遵循中国动物护理质量保证指南的建议。所有实验方案均获得了盐城师范学院动物伦理委员会的批准(YCTU221009)。

利益冲突
作者声明没有利益冲突。

数据可用性声明
所有所需数据已上传为图S1和S2,表S1–S7。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号