一种无需比对的框架,用于从密码子及密码子对的使用情况中推断分类信息

《Ecology and Evolution》:An Alignment Free Framework for Taxonomic Inference From Codon and Codon-Pair Usage

【字体: 时间:2026年03月25日 来源:Ecology and Evolution 2.3

编辑推荐:

   摘要 编码序列中的无序列比对信号为分类推断、大型系统发育树的质量控制以及基因组数据的快速筛选提供了一种可扩展的方法。我们提出了一个与模型无关的框架,该框架使用密码

  

摘要

编码序列中的无序列比对信号为分类推断、大型系统发育树的质量控制以及基因组数据的快速筛选提供了一种可扩展的方法。我们提出了一个与模型无关的框架,该框架使用密码子使用情况(64维)和密码子对使用情况(4096维)的谱型来表示基因组或编码序列集合,并引入了“分类一致性”(Taxonomic Consistency, TC)这一简单的外部指标,用于评估基于层次分类法的监督预测或无监督聚类结果。在多个分类等级(如域、目等)上,通过内部(Silhouette)和外部(TC)验证方法对紧凑型监督模型和标准聚类方法进行了评估。在大规模实验中,处理类别不平衡问题以及应用基于原则的标准化方法对性能的影响大于序列级别的预处理;密码子使用情况谱型获得了最高的分类一致性(TC)和连贯的无监督结构,而密码子对特征则在特定分支中提供了补充性的分辨率。我们发布了相关代码。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号