《Frontiers in Plant Science》:Phylogenomics, divergence time estimation, and biogeography of Iris species from Kazakhstan using plastome sequence analysis
编辑推荐:
摘要引言:鸢尾属(Iris Tourn. ex L.,鸢尾科Iridaceae Juss.)包含300多个被承认的物种,分布北半球,并因其药用和观赏价值而备受重视。然而,鸢尾属是一个分类复杂的属,其范围界定存在争议,系统发育关系尚未解决,这强调了开展全面系统研
摘要引言:鸢尾属(Iris Tourn. ex L.,鸢尾科Iridaceae Juss.)包含300多个被承认的物种,分布北半球,并因其药用和观赏价值而备受重视。然而,鸢尾属是一个分类复杂的属,其范围界定存在争议,系统发育关系尚未解决,这强调了开展全面系统研究的必要性。方法:在本研究中,研究人员对采自哈萨克斯坦的14种鸢尾属物种的质体基因组(plastome)进行了测序、组装和注释。基于完整的质体基因组数据,进行了比较基因组分析、分歧时间估计和生物地理重建。结果:所有质体基因组均呈现典型的四分环状结构,基因组大小范围为150,612 bp(I. tenuifolia)至155,046 bp(I. kuschakewiczii)。所研究物种的基因含量高度保守,共鉴定出133个基因,包括87个蛋白编码基因(PCGs)、38个tRNA基因和8个rRNA基因。其中,8个PCGs(ndhB、rpl2、rpl23、rps7、rps12、rps19、ycf1和ycf2)、7个tRNA基因(trnA-UGC、trnH-GUG、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG和trnV-GAC)以及全部4个rRNA基因(rrn4.5、rrn5、rrn16和rrn23)均存在重复。鉴定出十个高变区,即rps16、rps16-trnQ(UUG)、trnS(GCU)-trnG(UCC)、trnG(UCC)、trnY(GUA)、trnD(GUC)、rpl32、rps15、clpP和ycf1,其中大部分位于大单拷贝区(LSC)。在14个质体基因组中共检测到2,401个简单重复序列(SSRs),平均每个物种171.5个SSRs。单核苷酸重复是最丰富的类型,占所有SSRs的65.7%,且强烈偏向A/T基序。系统发育分析解析出三个主要分支,分别对应于鸢尾属(Iris)、蝎尾鸢尾亚属(Scorpiris)、溪荪亚属(Limniris)和网脉鸢尾亚属(Hermodactyloides)。分子定年提示鸢尾属起源于约49.31 Ma(95% CI:40.13–59.60 Ma),冠群分化始于约41.43 Ma(95% CI:33.97–50.97 Ma)。祖先区域重建表明该属的起源地是东亚-中亚联合区域。讨论:总体而言,本研究提供了基于质体基因组的全面见解,可能有助于解决系统发育关系、改进群体遗传研究,并阐明鸢尾属的进化历史和生物地理学。
**论文解读:基于质体基因组序列分析的哈萨克斯坦鸢尾属物种系统发育基因组学、分歧时间与生物地理学**
**研究背景与问题**
鸢尾属(Iris Tourn. ex L.)是鸢尾科(Iridaceae Juss.)中最大的属,包含300多个被承认的物种,广泛分布于北半球。该属植物具有重要的观赏、药用及经济价值,其花色多样源于花色苷和类胡萝卜素等色素积累,根茎具有抗氧化、抗癌、抗炎和抗菌活性,并应用于烹饪、香水和化妆品领域。然而,鸢尾属在分类学上极其复杂,其范围界定存在争议,系统发育关系长期未解。传统分类主要基于形态特征,虽经多次修订(如Mathew 1989年提出的六亚属系统),但后续分子研究并未完全支持该分类,特别是亚属和组的划分仍不明确。近年来基于质体DNA短片段的研究虽有所推进,但受限于位点数量,解析能力有限。此外,鸢尾属的群体遗传学研究相对薄弱,缺乏稳健且可转移的分子标记(如简单重复序列SSRs)。中亚地区的鸢尾属研究多集中于生物地理、植物化学和形态学,而基于完整质体基因组的系统发育基因组学、分歧时间和生物地理学综合研究尚属空白。因此,研究人员开展本研究,旨在(1)对14种哈萨克斯坦鸢尾属物种的质体基因组进行比较分析;(2)鉴定高变区作为潜在分子标记;(3)利用多种方法重建系统发育关系;(4)估算分歧时间并推断生物地理起源。论文发表在《Frontiers in Plant Science》。
**主要关键技术方法**
研究人员从哈萨克斯坦不同地区采集了14种鸢尾属植物(I. glaucescens、I. halophila、I. lactea、I. pumila、I. ruthenica、I. sibirica、I. sogdiana、I. songarica、I. tenuifolia、I. kolpakowskiana、I. kuschakewiczii、I. orchioides、I. subdecolorata、I. willmottiana)的叶片样本。采用改良CTAB法提取总DNA,利用Illumina NovaSeq X平台进行双端150 bp高通量测序。使用SPAdes 3.15.5进行从头组装,GeSeq v2.03进行注释,并用OGDRAW绘制环形图谱。通过mVISTA进行全基因组比对,IRscope分析边界区,DnaSP滑动窗口(窗口600 bp,步长200 bp)计算核苷酸多样性(Pi)以鉴定高变区。使用MISA v2.1识别简单重复序列(SSRs),阈值设为单核苷酸重复≥8、二/三核苷酸重复≥4、四/五/六核苷酸重复≥3。基于65个编码序列(CDS)构建数据集,利用IQ-TREE和MrBayes分别进行最大似然(ML)和贝叶斯推断(BI)系统发育分析(包括32个内群和2个外群Moraea物种)。采用PAML v4.9中的MCMCtree进行分歧时间估计,利用二次校正点(兰科茎龄102–120 Ma,A1stelia冠龄23.2 Ma,Hemerocallidoideae冠龄38.0–47.8 Ma,鸢尾科茎龄73.0–94.5 Ma)。利用RASP v4.1中的BioGeoBEARS(最优模型BAYAREALIKE+J)进行祖先区域重建,物种分布编码为七个生物地理区:东亚(A)、南亚及东南亚(B)、中亚(C)、伊朗-图兰地区(D)、欧洲及地中海(E)、黎凡特(F)和北美(G)。
**研究结果**
**3.1 质体基因组特征**
14种鸢尾属植物的质体基因组均呈现典型的四分环状结构,包括大单拷贝区(LSC)、小单拷贝区(SSC)和一对反向重复区(IR)。基因组总长度在150,612 bp(I. tenuifolia)至155,046 bp(I. kuschakewiczii)之间,GC含量为37.8%–38.9%。共注释到133个基因,包括87个蛋白编码基因(PCGs)、38个tRNA基因和8个rRNA基因。8个PCGs(ndhB、rpl2、rpl23、rps7、rps12、rps19、ycf1、ycf2)、7个tRNA基因(trnA-UGC、trnH-GUG、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC)以及全部4个rRNA基因(rrn4.5、rrn5、rrn16、rrn23)均存在重复。15个基因含一个内含子,3个基因(rps12、clpP、ycf3)含两个内含子。
**3.2 IR区扩张与收缩**
边界分析显示四个连接处(JLB、JSB、JSA、JLA)在物种间高度保守,仅相邻基因范围有微小变化。ycf1基因跨越SSC/IR边界,部分重复于IR区;ndhF靠近SSC/IRb边界;rps19靠近LSC/IRb边界;trnH和psbA位于LSC/IRa边界附近。
**3.3 质体基因组比较与热点区鉴定**
mVISTA比对表明LSC区变异程度高于SSC和IR区,非编码区变异高于编码区。滑动窗口分析(Pi)共鉴定出10个高变区:rps16、rps16-trnQ(UUG)、trnS(GCU)-trnG(UCC)、trnG(UCC)、trnY(GUA)、trnD(GUC)、rpl32、rps15、clpP和ycf1。ycf1的Pi值最高(0.0727),绝大多数高变区位于LSC区,仅rpl32、rps15和ycf1位于SSC区。
**3.4 简单重复序列鉴定**
14个质体基因组中共检测到2,401个SSRs,平均每物种171.5个。单核苷酸重复最为丰富(1,577个,占65.7%),其次为二核苷酸重复(668个,27.8%)。A/T基序在单核苷酸重复中占绝对优势(96.7%)。SSRs主要分布于LSC区,SSC区次之,IR区最少。
**3.5 密码子使用**
相对同义密码子使用度(RSCU)分析显示,31个密码子为偏好性使用(RSCU>1),31个为不偏好(RSCU<1),2个(AUG Met和UGG Trp)无偏倚。偏好密码子多末端为A或U,整体呈 A/T 偏向,符合被子植物质体基因组特征。所有物种中UUA(Leu)、AGA(Arg)和GCU(Ala)是前三最偏好密码子。
**3.6 系统发育分析**
基于完整质体基因组的ML和BI分析得到高度一致且多数节点支持率高的拓扑结构。鸢尾属形成单系群,清晰区分于外群。属内分为三个主要分支,对应亚属Iris、Scorpiris、Limniris和Hermodactyloides。其中,亚属Hermodactyloides的物种与Limniris亚属物种聚为一支,表明Limniris亚属为并系群。本研究新测序的14个物种均正确归属于各自亚属。
**3.7 分子定年与生物地理学**
基于65个CDS的分子定年显示,鸢尾属茎龄约49.31 Ma(95% CI: 40.13–59.60 Ma),冠群分化始于约41.43 Ma(95% CI: 33.97–50.97 Ma)。亚属Scorpiris冠龄18.19 Ma,亚属Iris冠龄19.19 Ma。与Scorpiris相关的Limniris谱系冠龄23.23 Ma,与Hermodactyloides相关的Limniris谱系分化时间约37.90 Ma。生物地理重建(BAYAREALIKE+J模型)表明鸢尾属起源于东亚-中亚联合区域(AC),之后发生多次扩散事件,例如亚属Iris向西扩散至伊朗-图兰地区,Scorpiris起源于中亚,一个Limniris谱系从东亚扩散至南亚,而Limniris+Hermodactyloides分支中出现长距离扩散导致I. missouriensis到达北美。
**讨论与结论**
**讨论总结**
研究人员讨论了质体基因组的一般特征和结构,指出所有质体基因组结构保守,IR边界区高度保守,但存在微小扩张和收缩,且IR区保守性高于单拷贝区。通过高变区鉴定,研究人员确认了10个潜在分子标记,其中多数与先前研究报道的鸢尾属多态性区域一致,支持其在系统发育和物种鉴定中的实用价值。在简单重复序列方面,SSRs以A/T单核苷酸重复为主,LSC区密度最高,这些标记可为群体遗传和保护遗传学提供资源。密码子使用分析表明A/U末端偏好是质体基因组的普遍特征,且物种间保守。系统发育结果方面,亚属Limniris的并系性得到证实,与多数分子研究一致,但研究人员强调质体系统树仅反映叶绿体基因组历史,可能受杂交、叶绿体捕获等影响,未来需结合核基因组数据。分歧时间估计中,茎龄49.31 Ma大于先前某些研究(如Joyce等2018年的37.7 Ma),但与其他研究(Goldblatt等2008年的45 Ma)大致相符,差异可能源于数据和方法。生物地理重建支持东亚-中亚联合起源,与Rodionenko(1987)的亚洲起源假说一致,并指出新生代地质和古气候变化(如帕米尔-天山造山、副特提斯海退缩)可能驱动了物种形成和扩散。同时,研究承认由于物种取样不全(仅88种,属内超300种)和模型局限性(BAYAREALIKE+J中的“+J”参数存在争议),结论应视为初步假设。
**研究结论翻译**
在本研究中,研究人员分析了14种鸢尾属物种的质体基因组核苷酸序列,进行了比较基因组学、分子定年和生物地理学研究。鉴定出多个高变区(rps16、rps16–trnQ(UUG)、trnS(GCU)–trnG(UCC)、trnG(UCC)、trnY(GUA)、trnD(GUC)、rpl32、rps15、clpP和ycf1),这些区域可作为属内系统发育研究的有用标记。此外,检测到的微卫星(SSRs)为群体遗传分析(特别是稀有和特有物种)提供了宝贵资源,并有助于制定有效保护策略。系统发育分析显示鸢尾属形成一个支持度高的单系分支,清晰区分于外群,但亚属Limniris被恢复为并系类群。由于可比数据有限,分子定年和生物地理分析的结果仍属初步。然而,研究发现表明鸢尾属的茎龄约为49.31 Ma,且该属可能起源于一个涵盖东亚和中亚的广泛祖先区域。总体而言,本研究为未来鸢尾属的系统发育基因组学、分歧时间和生物地理研究奠定了基础。需进一步结合质体基因组和核基因组数据,并扩大分类取样,以更全面理解这一复杂属的进化历史和多样化过程。