西沙群岛圆柱珊瑚(Porites cylindrica)的完整线粒体基因组:该属的基因组特征与比较基因组学研究
《Ecology and Evolution》:Complete Mitochondrial Genome of Porites cylindrica From the Xisha Islands: Characterization and Comparative Mitogenomics of the Genus
【字体:
大
中
小
】
时间:2026年03月20日
来源:Ecology and Evolution 2.3
编辑推荐:
摘要
研究造礁珊瑚的线粒体基因组对于理解它们的系统发育关系和进化历史具有重要意义。Porites属珊瑚在印度-太平洋地区广泛分布。然而,针对Porites属线粒体基因组特征的分析却相对较少。本文报道了Porites cylindrica这种在印度-太平洋地区占主导地位的造礁珊瑚
摘要
研究造礁珊瑚的线粒体基因组对于理解它们的系统发育关系和进化历史具有重要意义。Porites属珊瑚在印度-太平洋地区广泛分布。然而,针对Porites属线粒体基因组特征的分析却相对较少。本文报道了Porites cylindrica这种在印度-太平洋地区占主导地位的造礁珊瑚的线粒体基因组的测序和从头组装过程。随后,利用这一新组装的基因组以及来自10个Porites物种的12个公开可用的线粒体基因组进行了比较系统发育分析。线粒体基因组的大小高度保守,范围在18,628至18,658 bp之间,包含13个蛋白质编码基因、2个rRNA基因以及1-12个不同数量的tRNA。鉴定出16个突变热点区域(ND5-exon1、trnE-ND1、ND1、ND1-CYTB、CYTB、CYTB-trnM、trnM、ATP6、ATP6-ND4、ND4、ND4-rrnS、rrnS、rrnS-COX3、COX3、COX2和ND5-exon2),这些区域可以作为进一步系统发育分析和物种鉴定的有效分子标记。此外,线粒体基因组中的微卫星位点在不同物种间也表现出高度保守性。在Porites的13个蛋白质编码基因中观察到了强烈的纯化选择现象。系统发育结果支持Porites属属于石珊瑚类的单系群,并且该属已经分化为两个分支。本研究首次完成了P. cylindrica的线粒体基因组的组装和注释,为未来关于Porites属线粒体基因组的研究提供了宝贵的数据。
1 引言
线粒体在细胞代谢和能量转换过程中起着关键作用,是生物体应对环境变化的重要细胞器(Baris等人,2016;Chan,2020;Shang等人,2022)。除了核基因组中的遗传物质外,线粒体还拥有自己独立的遗传物质——线粒体基因组。探究线粒体基因组的遗传变化不仅有助于我们理解物种的进化和系统发育(Bernt、Braband等人,2013;Bernt、Donath等人,2013),也为探索生物适应性提供了有价值的见解(Luz等人,2017;Tsilingiris等人,2021)。然而,尽管线粒体基因组的多样性、进化和适应性非常重要,但我们对石珊瑚类中这些因素的了解仍然有限。Porites属属于Poritidae科,是造礁珊瑚中多样性最高的属之一。迄今为止,根据《世界海洋物种名录》(World Register of Marine Species,https://www.marinespecies.org/aphia.php?p=taxlist,访问日期2025-10-10)的记录,共有68个有效的Porites物种被认可。尽管已有许多关于Porites线粒体基因组的报道(Celis等人,2016;Niu、Lin等人,2016;Terraneo等人,2018),但针对其基因组结构和特征的研究仍然有限(Paz-García等人,2016)。Porites cylindrica Dana 1846广泛分布于印度-太平洋的热带和亚热带地区,是该地区的主要造礁珊瑚物种(Combosch等人,2024;Kitano等人,2014)。虽然已经获得了P. cylindrica的线粒体基因组序列(斐济;登录号:OQ037789),但其作为线性分子的注释与石珊瑚的标准环状模型相矛盾,因此在验证之前应谨慎解读这些数据。此外,NCBI中缺乏对该物种的线粒体基因组的结构注释。总体而言,针对该物种和Porites属的比较线粒体基因组分析仍然不足。因此,为了解决其线粒体结构的不确定性并促进属水平的全面比较,我们对来自西沙群岛的P. cylindrica的线粒体基因组进行了测序、组装和特征分析。通过将这一新的线粒体基因组与公共数据库中所有可用的Porites线粒体基因组整合,我们对10个物种的13个线粒体基因组进行了详细的比较分析。本研究首次提供了P. cylindrica的环状线粒体基因组,并为Porites属内的结构保守性和进化关系提供了新的见解。
2 材料与方法
2.1 样本采集与DNA提取
2023年8月12日,潜水员使用凿子和锤子在西沙群岛(112.2384687 E,16.97453230 N)手动采集了5个P. cylindrica样本(长度为5厘米),并根据《世界珊瑚》(http://www.coralsoftheworld.org/)中对P. cylindrica的描述进行了鉴定。采集的样本用过滤后的海水清洗后迅速冷冻在液氮中,并储存在-80°C的冷冻柜中。使用Universal Genomic DNA Kit(Kangwei Century Biotechnology Co. Ltd.,北京,中国)从珊瑚组织中提取总DNA,并使用Agilent Fragment Analyzer 5400(Agilent Technologies,Santa Clara,CA,美国)检查了珊瑚DNA的完整性。
2.2 高通量测序、线粒体基因组组装与注释
P. cylindrica的总DNA被送往Huitong Biotechnology(深圳,中国)进行文库测序。使用Nextera XT DNA文库制备试剂盒(Illumina,San Diego,CA,美国)构建DNA文库,然后使用MGIDNBSEQ-T7平台进行测序。共获得了25.67G的原始碱基和171,110,472个原始读段(GenBank登录号PRJNA1191632)。数据使用fastp v 0.23.4(https://github.com/OpenGene/fastp;Chen等人,2018)进行过滤。随后使用GetOrganelle v1.7.7.0(Jin等人,2020)进行线粒体基因组的从头组装,k-mer设置为21、45、65、85和105。通过将组装序列与Porites lobata Dana 1846的参考基因组(NC_030186)比对,识别出线粒体contigs。使用Bandage v 0.8.1(Wick等人,2015)处理组装图以去除冗余contigs。剩余的contig被编辑成环状分子,确定为完整的线粒体基因组。为了评估组装质量和覆盖率,使用BWA v 0.7.17-r1188(Li,2013)将清洁读段映射回组装的线粒体序列,并使用samtools v 1.9(Li等人,2009)计算测序深度。使用Python脚本生成覆盖图,以线粒体基因组位置为x轴,测序深度为y轴(图S1)。通过MITOS2(https://usegalaxy.eu/?tool_id=toolshed.g2.bx.psu.edu%2Frepos%2Fiuc%2Fmitos2%2Fmitos2%2F2.1.9%2Bgalaxy0&version=latest)对组装得到的完整线粒体基因组进行注释,并手动完善了注释结果。最后,使用Organellar Genome DRAW v1.2(Greiner等人,2019)在线生成线粒体基因组的环状图。使用MEGA v 6.0(Tamura等人,2013)分析了线粒体基因组的碱基组成和氨基酸含量。本研究获得的线粒体基因组序列已上传至NCBI数据库,登录号为PQ666634。
2.3 线粒体基因组特征分析
从GenBank下载了10个Porites物种的12个线粒体序列(P. cylindrica OZ037789;P. lobata NC_030186.1;P. lobata KU761954.1;Porites okinawensis Veron, 1990 NC_015644.1;Porites harrisoni Veron, 2000 NC_037435.1;Porites lutea Milne Edwards & Haime, 1851 NC_029695.1;Porites rus Forsk?l, 1775 LN864762.1;Porites fontanesii Benzoni & Stefani, 2012 NC_037434.1;Porites porites Pallas, 1766 NC_008166.1;Porites panamensis Verrill, 1866 KU761953;P. panamensis NC_024182.1;以及Porites sverdrupi Durham, 1947 KU956960.1)。使用与P. cylindrica PQ666634相同的方法对未注释的P. cylindrica OZ037789序列进行了注释(图S2)。以P. cylindrica PQ666634的线粒体基因组为参考,使用Blast v 2.10.1(Cock等人,2015)比较了13个线粒体基因组的序列。使用CodonW v1.3(Sharp等人,1986)计算了相对同义密码子使用率(RSCU)和线粒体基因的数量。使用MISA(https://webblast.ipk-gatersleben.de/misa/)识别微卫星序列或单序列重复序列(SSRs),分别设置了单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸序列的最小重复次数为10、5、4、3、3和3(Beier等人,2017)。使用REPuter(https://bibiserv.cebitec.uni-bielefeld.de/reputer/;Kurtz等人,2001)识别长重复序列,最小重复长度设置为15 bp。通过两种互补策略尝试定位和表征假定的线粒体控制区域(CR)。首先,使用MITOS2(Donath等人,2019)进行从头预测,参数设置为-c 4 -r refseq89m。其次,基于甲壳类线粒体基因组学中的共同结构标准(Baeza,2022),即CR通常构成最大的非编码区间,我们识别了组装中最长的基因间间隔。这个位于tRNA-Glu和ND5之间的区域(位置8520–9088,569 bp)被指定为结构候选CR。然后对该候选CR进行了详细的特征分析。接着使用MISA(Beier等人,2017)和之前描述的参数扫描该候选CR以寻找微卫星(SSRs)。使用Tandem Repeats Finder v4.09(Benson,1999)进行串联重复检测,参数设置为:2 7 7 80 10 50 2000 -f -d -m。使用RNA fold web服务器在默认设置下评估了形成稳定二级结构的潜力。
2.4 线粒体基因组选择压力分析
以P. cylindrica PQ666634为参考,使用MAFFT v7.429(Katoh和Standley,2016)和FFT-NS-2策略对10个Porites物种的线粒体基因组进行了比对。使用DnaSp v6(Rozas等人,2017)基于300 bp的滑动窗口长度和25 bp的步长分析了整个线粒体基因组的核苷酸变异性(Pi)。首先使用Blastn v2.9.0+处理13个蛋白质编码基因(PCGs)的序列,参数设置为-evalue 1e-5和-max_target_seqs 1,以将目标物种的蛋白质序列与参考序列对齐,并保留最佳匹配的同源基因对。然后使用ParaAT v2.0(Zhang等人,2012)结合目标物种和参考物种的蛋白质和核苷酸序列并进行格式化。使用KaKs_Calculator v2.0(Wang等人,2010)和Yang及Nielsen(2000)模型(YN方法)估计了非同义(Ka)和同义(Ks)替换率。该模型考虑了转换/颠换率偏差和密码子使用偏差,为密切相关的序列提供了可靠的估计。最后,使用R v 4.2.0构建了Ka/Ks热图。
2.5 基因组共线性与系统发育分析
为了确定P. cylindrica的系统发育位置,进行了基于线粒体基因组的系统发育分析。根据最近的线粒体基因组学研究(Tian等人,2022;Jia等人,2025)的分类框架,将Corallimorphus profundus和Corynactis californica指定为外群。从60个样本(58个石珊瑚和2个外群)中提取了13个蛋白质编码基因(ATP6、ATP8、COX1、COX2、COX3、CYTB、ND1、ND2、ND3、ND4、ND4L、ND5和ND6)的核苷酸序列。使用MAFFT v 7.429(Katoh和Standley,2016)和FFT-NS-2策略独立地对每个PCG进行了比对。为了获得稳健的系统发育推断,使用Gblocks v 0.91b(Castresana,2000)处理每个基因的比对结果。程序运行时指定了-t=DNA选项,同时保持所有其他参数的默认设置,以去除模糊对齐的区域,主要是那些包含间隙的区域。然后将所有基因的高置信度比对结果连接成一个超级矩阵。使用Maximum Likelihood(ML)和Bayesian Inference(BI)方法重建了系统发育树。ML分析使用IQ-TREE v 1.6.12(Nguyen等人,2015)进行。最佳拟合的核苷酸替换模型由内置的ModelFinder程序根据贝叶斯信息准则(BIC)确定。为整个连接的数据集选择的模型是TVM+F+I+G4。使用MrBayes v 3.2.6在PhyloSuite v1.2.1平台(Zhang等人,2020)进行了1000次标准非参数自助法复制来评估分支支持。BI分析使用PhyloSuite的ModelFinder在BIC下独立选择了GTR+F+I+G4作为最佳模型。使用MCMC分析(四个冷链和两个热链)进行了600,000代的运行,每1000代采样一次树。前25%的采样树被丢弃作为燃烧期,从剩余的树中构建了一个多数规则共识树以估计贝叶斯后验概率。将ML和BI分析的拓扑结构结合起来,并使用Adobe Illustrator CS6进行了可视化注释。使用Python脚本获得了10个Porites物种的rRNA基因位置。使用IQ-TREE的内置ModelFinder确定了最佳碱基替换模型,根据BIC最优核酸替换模型,结果是K3Pu+F+I。自助法设置为Ultrafast,自助法次数设置为1000。最后,使用AliTV(https://alitvteam.github.io/AliTV/d3/AliTV.html)(Ankenbrand等人,2017)构建了共线性分析图。使用Python脚本确定了13个线粒体基因组的排列顺序,并在Adobe Illustrator CS6中准备了基因重排图。
3 结果
3.1 Porites物种线粒体基因组的特征
使用GetOrganelle v1.7.7.0(Jin等人,2020)成功将P. cylindrica的完整线粒体基因组(登录号:PQ666634)组装成一个环状分子。线粒体基因组的总长度为18,648 bp,GC含量为36.25%,碱基组成分别为A(25.97%)、T(37.78%)、C(13.23%)和G(23.02%)(图1;表1)。所有基因都编码在重链上,包括13个蛋白质编码基因、2个tRNA基因和2个rRNA基因。覆盖度分析证实了组装的高质量和完整性,显示出均匀的测序深度,平均为843.68倍,最低为281倍(图S1)。图1(在图查看器中打开)。
**Porites cylindrica完整线粒体基因组的圆形图**。具有不同功能的基因用不同的颜色区分(NADH脱氢酶:黄色;细胞色素c氧化酶:紫色;ATP合成酶:绿色;tRNA基因:蓝色;rRNA基因:红色)。内圈的浅灰色区域代表GC含量,深灰色区域代表AT含量。
**表1. 10种Porites物种的13个线粒体基因组的组成**:
| 物种 | 长度/ bp | GC含量/% | 基因数量 | PCG数量 | tRNA数量 | rRNA数量 |
|--------------|------------|-----------|---------|---------|---------|
| Porites cylindrica PQ666634 | 18,648 | 36.25 | 17 | 13 | 2 | 2 |
| Porites cylindrica OZ037789 | 18,647 | 36.22 | 18 | 13 | 3 | 2 |
| Porites harrisoni NC_037435.1 | 18,630 | 36.34 | 17 | 13 | 2 | 2 |
| Porites fontanesii NC_037434.1 | 18,658 | 36.64 | 17 | 13 | 2 | 2 |
| Porites lutea NC_029695.1 | 18,646 | 36.26 | 23 | 13 | 8 | 2 |
| Porites porites NC_008166.1 | 18,648 | 36.27 | 17 | 13 | 2 | 2 |
| Porites lobata NC_030186.1 | 18,647 | 36.24 | 17 | 13 | 2 | 2 |
| Porites lobata KU761954.1 | 18,647 | 36.20 | 16 | 13 | 1 | 2 |
| Porites panamensis NC_024182.1 | 18,628 | 36.28 | 16 | 13 | 1 | 2 |
| Porites panamensis KU761953 | 18,644 | 36.27 | 16 | 13 | 1 | 2 |
| Porites sverdrupi KU956960.1 | 18,628 | 36.29 | 17 | 13 | 2 | 2 |
| Porites okinawensis NC_015644.1 | 18,647 | 36.20 | 16 | 13 | 1 | 2 |
| Porites rus LN864762.1 | 18,647 | 36.23 | 27 | 13 | 12 | 2 |
Porites物种的13个线粒体基因组长度在18,628至18,658 bp之间,其中Porites panamensis和Porites sverdrupi的线粒体基因组最小(18,628 bp),而Porites fontanesii的线粒体基因组最大(18,658 bp)。基因组的GC含量在36.2%到36.64%之间,其中Porites lobata和Porites okinawensis的线粒体基因组GC含量最低,Porites fontanesii的线粒体基因组GC含量最高。Porites物种的基因数量在16到27个之间,包括13个PCG、2个rRNA和1到12个tRNA基因(表1)。
**3.2 Porites物种线粒体基因组中的重复序列**
在这项研究中,在13个Porites物种的线粒体基因组中检测到96个SSR位点(图2;表S1)。不同物种之间的SSR总数没有显著差异,除了Porites fontanesii仅检测到5个SSR位点,而其他物种的SSR数量在7到8个之间。这些线粒体SSR大多数是单核苷酸,占所有SSR的61.46%,其次是四核苷酸(25.00%)和三核苷酸(13.54%)。没有检测到二核苷酸、五核苷酸或六核苷酸重复序列。A/T单核苷酸重复序列是最丰富的SSR位点,占单核苷酸的94.92%。仅检测到3个G/C重复单核苷酸序列,占存在的单核苷酸的5.08%。大多数SSR(79.17%)分布在PCG中,而只有20.83%位于基因间间隔区。在13个线粒体基因组中检测到242个长重复序列,包括30个正向重复、193个反向重复和19个互补重复(图2;表S2)。
**3.3 Porites线粒体基因组密码子的使用偏好**
对10种Porites物种的线粒体蛋白质编码基因的分析显示了保守的密码子使用模式。如图3和表S3所示,所有物种的密码子使用偏好高度保守。与线粒体基因组的高AT含量一致,大多数首选密码子(RSCU > 1)以A或T结尾。亮氨酸的偏好最为明显,主要使用UUA密码子(RSCU范围:2.85–2.92)。精氨酸(AGA,RSCU:2.42–2.61)和丝氨酸(UCU,RSCU:2.36–2.39)也表现出显著的密码子偏好。
**3.4 线粒体基因组的比较分析**
对10种Porites物种的线粒体基因组分析显示,该属内没有发生基因重排(图4)。然而,序列差异主要体现在tRNA的类型和数量上。在Porites属中识别出四种tRNA的类型和数量模式。P. harrisoni、P. fontanesii、P. lobata(NC_030186.1)、P. porites和P. sverdrupi的模式是一致的,并且在13个线粒体基因组中最常见。P. cylindrica和P. lutea的tRNA模式也是一致的。值得注意的是,同一物种的不同样本中的线粒体基因可能表现出不一致的模式;例如,P. lobata NC030186.1和P. lobata KU761954.1的模式不同。以P. cylindrica PQ666634为参考物种的13个线粒体基因组的共线性分析结果显示,同一物种的序列并不一定聚集在一起(图5)。
**3.5 Porites的系统发育分析**
使用ML和BI方法,基于10种Porites物种的13个线粒体蛋白质编码基因的串联序列重建了系统发育树,以确定P. cylindrica的进化位置。ML和BI分析得出了高度一致的系统发育树(图6),并且在所有节点上都得到了强烈的支持。所有Porites物种形成了一个最大支持的单系群(BP = 100,PP = 1.0),其中包含两个谱系。第一个谱系包括P. panamensis、P. sverdrupi、P. porites和P. fontanesii。第二个谱系包括P. lobata、P. okinawensis、P. cylindrica、P. rus、P. lutea和P. harrisoni。在这个后一个谱系中,P. cylindrica与P. okinawensis和P. lobata的关系最为密切(图6)。
**3.6 核苷酸多样性分析**
核苷酸多样性(Pi)表示基于具有高变异性的基因组区域选择的物种和种群之间的核苷酸序列差异,这些区域作为潜在的种群分子标记。Pi分析的结果显示,变异最大的线粒体片段是CYTB-trnM。在10种Porites物种中,识别出16个高变异区域(Pi值 > 0.010):ND5-exon1、trnE-ND1、ND1、ND1-CYTB、CYTB-trnM、trnM、ATP6、ATP6-ND4、ND4、ND4-rrnS、rrnS、rrnS-COX3、COX3和ND5-exon2(图7;表S4)。
**3.7 PCG选择压力分析**
为了表征13个Porites线粒体基因组中PCG的进化压力,计算了13个PCG的Ka/Ks值(表S5)。所有基因的Ka/Ks值都小于1,表明这些基因经历了净化选择,表明它们表现出相对稳定的蛋白质功能。其中,P. okinawensis和P. lobata的COX1的Ka/Ks值最高,为0.49。ND3和ND4L的Ka/Ks值最低,几乎无法检测到。
**4.1 P. cylindrica的线粒体基因组组装和注释**
本研究提供了新测序、准确组装和全面注释的P. cylindrica线粒体基因组,解决了之前该物种唯一可用序列的结构歧义。之前在GenBank中可用的序列(登录号OQ037789)被注释为线性分子,这与普遍报道的石珊瑚的典型圆形结构相矛盾。此外,它缺乏详细的结构注释。为了解决这个问题,我们从西沙群岛的样本中进行了从头组装,明确证实了其圆形拓扑结构。然后我们提供了完整且经过验证的结构注释,精确地映射了所有13个蛋白质编码基因、2个rRNA和2个tRNA(GenBank登录号PQ666634)。这一努力不仅纠正了档案记录,还提供了一个可靠的高质量参考基因组。确认的圆形结构强化了这种在造礁珊瑚中保守的基因组特征,并且为本文中后续的所有比较线粒体基因组分析奠定了重要而准确的基础。
**4.2 Porites线粒体基因组的特征**
10种Porites物种的线粒体基因组在大小(18,628–18,658 bp)、GC含量(36.20%–36.64%)以及13个PCG和2个rRNA的典型集合方面表现出高度保守性,与其他造礁珊瑚的报告一致(Jia等人2025;Niu等人2016;Niu等人2016;Niu等人2020;Tian等人2022;Wang等人2013)。Porites线粒体基因组的强AT丰富性为观察到的PCG中A和T结尾密码子的偏好提供了潜在的背景。这种偏好可能部分归因于整个线粒体基因组的AT丰富环境,这种模式在其他造礁珊瑚中也很常见(Dixon等人2016;Jia等人2025;Niu等人2020;Tian等人2021,2022;Tian和Niu 2017;Tong等人2019;Shi等人2016)。这一解释进一步得到了大多数造礁珊瑚在线粒体基因组中只有两个tRNA基因的事实的支持(Jia等人2025)。在这种极简系统中,不能应用针对tRNA丰度优化的经典密码子使用模型(Gissi等人2008;Lavrov和Pett 2016)。相反,突变偏好本身成为通过用A和T核苷酸饱和简并第三位来系统地塑造密码子选择的主要进化力量(Dixon等人2016;Tian等人2021)。这两个tRNA的主要作用可能是通过广泛的摆动配对来确保基本的翻译功能,而不是驱动选择性的密码子偏好(Elahi和Prigge 2025;Yu和Li 2011)。值得注意的是,我们在13个线粒体基因组中观察到tRNA基因拷贝数的异质性,范围从1到12。这种变异独立于物种的地理分布范围,因为许多广泛分布的物种(例如P. lobata)仅保留了最小的典型对。维持这种多样性的进化力量尚不清楚,但可能是历史种群规模、突变压力和线粒体-核共进化的综合效应的结果。
**4.3 系统发育关系和隐秘多样性**
Porites的分类传统上基于形态特征;然而,由于该属的表型变异性和形态可塑性极高,也需要分子证据(Emblem等人2011;Forsman等人2017)。先前的研究基于核基因和线粒体基因片段研究了Porites的系统发育关系(Combosch等人2024;Prada等人2014);然而,关于南海P. cylindrica样本的信息不足。在我们的研究中,基于57种造礁珊瑚物种构建了ML和BI系统发育树,并使用分子序列确定了P. cylindrica的系统发育位置。Porites是单系的,属内的物种分为两个支系,支持率极高(BS = 100%,PP = 1),其中P. cylindrica与P. lobata NC_030186和P. okinawensis聚类在一起。然而,我们观察到P. cylindrica PQ666634和P. cylindrica OZ037789形成了两个分支,这表明分布在不同地区的P. cylindrica之间存在遗传差异。在基因重排分析中,属于同一物种的样本的基因排列模式存在差异,例如在P. lobata中。在共线性分析中,属于同一物种的样本并没有聚类在一起。这可能是由于基于Porites形态的物种分类存在困难,或者从不同地区收集的样本之间存在显著的遗传分化(Fukami等人,2004年;Ladner和Palumbi,2012年)。这意味着当前的基于形态的分类学可能低估了Porites中的真实生物多样性。这些隐秘的谱系可能代表了具有独特适应其局部环境的进化重要单元。因此,将形态物种视为同质单元的保护策略可能无法保护这种隐藏的遗传多样性,而这对于该属对环境变化的抵抗力可能是至关重要的。
4.4 Porites中可变线粒体标记的比较
由于Porites的线粒体DNA进化速度较慢,确定有效的分子标记以用于该珊瑚属的物种界定仍然是一个重大挑战。DNA条形码,如细胞色素c氧化酶I(COI)基因,可以作为标准短基因区域标记,用于快速、准确和高效地识别许多动物物种(Dawnay等人,2007年;Che等人,2012年;Porter和Hajibabaei,2018年)。然而,在石珊瑚中,线粒体DNA的缓慢进化速度往往使得COI基因不足以区分亲缘关系密切的物种(Huang等人,2008年;Wares,2014年)。这一限制需要探索其他更具变异性的线粒体区域。在这项研究中,发现了16个高度变异的区域(Pi > 0.010),这些区域可以作为Porites的有效分子标记。Combosch等人(2024年)和Paz-García等人(2016年)也报告了这些高度变异的线粒体区域作为多样性位点。首先,本研究观察到的ND5(外显子1、外显子2)、ND4(包括ND4-rrnS)、rrnS(包括rrnS-COX3)和COX3-COX2的高变异性直接对应于Combosch等人(2024年)选择的四个核心条形码标记(MT20:ND5-ATP8;MT12:ND4-12S rRNA;MT16:COX3-COX2;MT09:ND6-ATP6)。其次,这里识别出的ND1和CYTB的高度变异区域与Paz-García等人(2016年)指出的“Porites线粒体基因组的四个核心高度变异区域(16S rRNA、ND5、ND4、COX1、ND1、CYTB)”一致。他们的团队强调,这些区域的变异水平是其他造礁珊瑚(如Acropora和Pocillopora)的3-10倍,突显了这些区域在Porites物种鉴定和系统发育研究中的普遍价值(Paz-García等人,2016年)。来自独立研究的集体证据表明,这些线粒体基因组区域是用于该分类学上具有挑战性的属的物种界定和群体遗传分析的有希望的分子工具。
5 结论
本研究提供了来自西沙群岛的P. cylindrica的新组装和注释的线粒体基因组(PQ666634)。它纠正了先前记录中的错误线性注释,并确认了在石珊瑚中保守的典型环状结构。对10种Porites物种的线粒体基因组的比较分析显示,在大小、结构和核心基因内容方面存在深刻的保守性,同时强烈的AT偏向突变压力影响了密码子的使用。此外,我们的系统发育分析揭示了在地理上分离的、形态上被识别为同一物种的种群之间存在显著的遗传差异(例如,P. cylindrica、P. lobata)。这些发现强烈表明该属内部存在广泛的隐秘多样性,表明基于形态的分类学可能低估了Porites中的真实物种边界和进化单元。最后,我们识别并交叉验证了16个高度变异的线粒体区域作为该分类学上具有挑战性的属的物种界定的有希望的分子标记。我们的结果与独立研究的结果一致,强调了这些标记在未来系统发育和群体遗传研究中的稳健性。总体而言,这项工作提供了一个重要的线粒体基因组资源,揭示了隐秘多样性的模式,并为Porites的系统学精炼提供了实用工具。
作者贡献
贾书文:概念化(同等贡献)、数据管理(同等贡献)、正式分析(同等贡献)、资金获取(同等贡献)、调查(同等贡献)、方法学(同等贡献)、项目管理(同等贡献)、资源(同等贡献)、软件(同等贡献)、监督(同等贡献)、验证(同等贡献)、可视化(同等贡献)、写作——初稿(同等贡献)、写作——审阅和编辑(同等贡献)。沈同同:数据管理(同等贡献)、正式分析(同等贡献)、写作——初稿(同等贡献)。蔡文琪:调查(同等贡献)、资源(同等贡献)。张健:调查(同等贡献)、资源(同等贡献)。王毅:数据管理(同等贡献)、正式分析(同等贡献)。蔡泽福:数据管理(同等贡献)、正式分析(同等贡献)。沈杰:数据管理(同等贡献)、正式分析(同等贡献)。陈世全:概念化(同等贡献)、数据管理(同等贡献)、正式分析(同等贡献)、资金获取(同等贡献)、调查(同等贡献)、方法学(同等贡献)、项目管理(同等贡献)、资源(同等贡献)、软件(同等贡献)、监督(同等贡献)、验证(同等贡献)、可视化(同等贡献)、写作——初稿(同等贡献)、写作——审阅和编辑(同等贡献)。
致谢
本研究得到了中国海南省自然科学基金(424RC538、ZDYF2024SHFZ146、321MS0810、421RC1106)和2024年海南省部门预算项目(热带典型海洋生态系统研究中心的运营和维护项目)以及中国国家自然科学基金(42166006)的支持。
利益冲突
作者声明没有利益冲突。
数据可用性声明
本研究生成的数据已存放在GenBank中,线粒体基因组的访问号为PQ666634,原始测序数据存放在SRA中,访问号为PRJNA1191632和SRX26937562。用于分析的自定义Python脚本可在GitHub仓库中找到:https://github.com/jiashuwen/Draw_SequencingDepth。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号