编辑推荐:
推荐:为破解茄科分类体系因传统等级命名导致的名称不稳定与使用混乱,研究者整合1474种植物的10个质体与核基因标记,并结合Angiosperms353靶向测序数据,构建了迄今最全面的茄科系统树,据此首次提出遵循《PhyloCode》的谱系命名方案,定义了38个无等级分支名称,旨在促进名称稳定与精准沟通。该成果发表于《TAXON》。
茄科(Solanaceae)是一个全球分布、具有重要经济价值的植物大科,其成员包括番茄、马铃薯、辣椒、茄子等重要作物,以及烟草、曼陀罗等具有药用或文化意义的物种。这个家族拥有约103个属和3000个被接受的物种,其中近一半的多样性都集中于一个庞然大物般的属——茄属(Solanum)。长久以来,植物学家们都认识到这些植物之间的亲缘关系,但如何清晰、稳定地描绘和命名其内部的“家族谱系”,却一直是个令人头疼的难题。传统的林奈等级分类体系(如科、属、种)在遇到像茄科这样演化关系复杂、谱系树层级丰富的类群时,常常捉襟见肘。随着DNA测序技术的发展,基于分子数据的系统发育研究在过去三十多年里揭示了茄科内部许多新的演化支系(clade)。然而,这些新发现的支系往往缺乏合适的正式名称,或者被冠以各种非正式的称呼,导致在学术交流和数据库中使用时出现混淆和不一致。更麻烦的是,依据传统《国际藻类、真菌和植物命名法规》进行的分类修订,有时仅仅因为等级调整就迫使人们改变一个广为人知类群的名称,这无疑不利于知识的积累与传播。为了解决这些由命名带来的困扰,建立一个既反映真实演化历史、又具备名称稳定性的分类系统,就成了当务之急。这正是本项研究核心的出发点。
为此,一个由R. G. Olmstead、S. Knapp、R. Deanna、S. D. Smith、A. Orejuela、L. Bohs、L. L. Giacomin、T. S?rkinen、E. Gagnon等多位学者组成的国际团队,在《TAXON》期刊上发表了他们的最新成果。他们完成了一项迄今为止规模最大的茄科系统发育分析,并以此为基础,首次为该科构建了一套遵循《国际系统发育命名法规》(PhyloCode)的谱系命名分类系统。这套系统摒弃了固定的分类等级,直接依据演化树上的分支(clade)来定义和命名类群,旨在实现“一个演化支,一个稳定名”的目标,从根本上规避因等级变动导致的名称更迭。
为了构建可靠的系统发育框架,研究者采用了双管齐下的策略。首先,他们利用PyPHLAWD流程从GenBank中搜集了10个常用的质体和核基因标记(包括ITS、LEAFY、matK、ndhF、ndhF-rpl32、psbA、rbcL、trnLF、trnSG、waxy)的序列,涵盖了茄科100个属的1474个物种(约占科内多样性的一半),并以番薯属(Ipomoea)的一个物种作为外类群。在清理掉不稳定分类单元后,他们使用RAxML软件进行了最大似然法(Maximum Likelihood)建树分析,并通过1000次自举(bootstrap)重复评估分支支持率。其次,为了验证和补充上述基于少数标记的结果,并获取基因组层面的信息,研究者对代表97个茄科属的110个分类单元(包括外类群Ipomoea purpurea)进行了高通量测序。他们利用Angiosperms353(A353)探针组进行靶向富集,获取了353个核基因的数据。经过严格的质控、组装和比对,最终使用227个基因进行系统发育分析。他们不仅进行了基因序列的拼接(concatenation)分析(使用IQ-TREE),还利用ASTRAL软件基于多物种溯祖模型(multi-species coalescent model)构建了物种树(species tree)。此外,研究还计算了基因一致性因子(gCF)和位点一致性因子(sCF)来评估基因树之间的冲突(discordance),并使用PhyParts软件将单个基因树映射到物种树上,以可视化全基因组水平的谱系不一致性。
1. 基于标记的家族系统树
对1475个分类单元(1474个茄科物种+1个外类群)的10基因分析,恢复并强有力地支持了此前研究中发现的大部分主要演化支系。例如,包含大量染色体基数为x=12类群的大支系/Dodecachroma获得了88%的自举支持率;许多传统上被处理为亚科的类群,如/Cestroideae、/Goetzeoideae、/Nicotianoideae和/Solanoideae,其支持率在93%到100%之间。智利的小属Reyesia被明确地与形态相似的Salpiglossis归在一起。然而,该分析中茄科系统树的“根”的位置(即最早分化的支系)依然不稳定,最大似然树将/Goetzeoideae置于其余所有茄科植物的姐妹群位置,但支持率较低(35%)。在茄属内部的分析结果与先前使用类似标记集的研究基本一致,一些主要和次要分支得到强支持,但许多内部节点因短的分支长度和低支持率而未能解析,这可能与快速的物种形成及不完全谱系分选有关。
2. A353基因的获取效率
从110个样本中获取的A353基因数据恢复情况因样本而异,平均每个样本比对到322个基因,范围在202到349之间。大多数样本(110个中的85个)至少有100个基因的覆盖度达到50%,为后续的系统发育推断提供了可靠的数据基础。
3. 基于A353数据的系统基因组学分析
基于A353数据的拼接最大似然树和物种树分析结果,与上述10基因标记树表现出了高度的一致性。本分类方案中包含的所有分支在两个树中都被恢复。然而,对基因树一致性的评估揭示了一个普遍现象:物种树的拓扑结构通常只得到一部分基因组数据的支持。在许多节点上,大部分基因呈现出与物种树不同的拓扑结构,且具有中等以上的支持度,另有一部分基因则无法提供信息。值得注意的是,许多在拼接分析中自举支持率极高(>95%)的节点,其基因和位点一致性因子却显示存在显著的冲突。这表明,拼接分析的高支持率可能源于那些既包含信息又与物种树一致(且彼此一致)的(有时是少量的)基因组区域。这种模式在系统基因组学分析中常见,可能源于不完全谱系分选、杂交或多倍化等因素。
4. 茄科的分支命名
基于上述系统发育研究,研究者最终提出并定义了38个无等级的分支名称,包括21个传统分类中的属上级分类单元、1个属级名称(/Solanum)以及16个茄属内的属下分类单元。其中33个是“转换分支名称”,即基于传统命名法规下已发表的名称或先前系统发育研究中非正式使用的名称转换而来;5个是本研究首次提出的新名称。所有名称均按照《PhyloCode》的原则,通过“分支定义”与特定的演化支绑定。定义主要采用两种形式:“最小冠分支”(minimum crown clade),即包含两个或多个指定物种(specifiers)的最小分支;“最大冠分支”(maximum crown clade),即包含一个指定物种但不包含其他一个或多个指定物种的最大分支。这些定义均以本研究构建的包含1474个物种的10基因标记树作为主要参考系统树。
结论与讨论
本研究构建的茄科系统发育框架,为建立一个稳定且信息丰富的分类系统奠定了坚实基础。10基因分析以其空前的取样规模,强有力地支持了众多主要分支,而A353系统基因组学数据则从基因组层面验证了这些关系的可靠性。尽管茄科的系统发育大框架已较为清晰,但本研究也揭示了一些尚未解决的难题,例如科内最早分化的分支(即系统树“根”的位置)仍未最终确定,某些类群的取样覆盖率也有待提高。未来的研究,特别是结合化石证据的分子钟分析以及更广泛的基因组学方法,将有助于厘清这些早期分化和复杂的演化历史。
更重要的是,本研究利用这一可靠的系统发育框架,首次为茄科系统性地建立了一套基于《PhyloCode》的谱系命名分类方案。这套方案通过精确定义分支范围,将分类单元的名称与演化支直接挂钩,从而保证了名称的稳定性,不会因未来对类群等级认识的改变而被迫变更。它并非要取代传统的林奈命名体系,而是作为一种补充,特别适用于那些在传统等级体系下难以妥善安置、或需要稳定名称以便于学术交流的演化支。本研究聚焦于定义那些在茄科内部以及茄属内部得到广泛研究和公认的主要分支,包括一些具有重要经济价值的类群(如包含番茄的/Lycopersicon、包含马铃薯的/Petota等),并将一些广泛使用但非正式的名称(如“x=12” clade被正式命名为/Dodecachroma)予以正式化。这为全球从事茄科分类学、系统学、进化生物学、生态学以及育种学研究的学者提供了一套稳定、精确的命名与沟通工具,有望从根本上解决长期以来因命名混乱带来的交流障碍,促进对该重要植物类群多样性及其演化历史的深入理解和有效管理。