
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一个用于比较评估人类蛋白质组中低复杂性区域检测工具的基准测试框架
《Scientific Reports》:A benchmarking framework for comparative evaluation of low-complexity region detection tools in the human proteome
【字体: 大 中 小 】 时间:2026年04月16日 来源:Scientific Reports 3.9
编辑推荐:
摘要低复杂性区域(LCRs)是蛋白质中在分子识别、结构柔韧性和相分离过程中起关键作用的成分偏移部分。然而,由于不同计算工具之间的方法差异,它们的准确检测仍然具有挑战性。在这项研究中,我们对八种广泛应用于人类(Homo sapiens)蛋白质组的LCR检测方法进行了全面的基准测试(
低复杂性区域(LCRs)是蛋白质中在分子识别、结构柔韧性和相分离过程中起关键作用的成分偏移部分。然而,由于不同计算工具之间的方法差异,它们的准确检测仍然具有挑战性。在这项研究中,我们对八种广泛应用于人类(Homo sapiens)蛋白质组的LCR检测方法进行了全面的基准测试(涵盖多种参数设置)。我们开发了一个模块化的计算框架,用于系统地比较LCR的特征,包括基于残基的分析如长度分布和覆盖百分比。以蛋白质为中心的分析包括成分偏移、氨基酸组成和香农熵。一致性分析显示,被多种工具检测到的区域通常更长、更重复且成分更纯,这表明它们具有更强的结构或功能相关性。杰卡德相似性矩阵揭示了基于共享检测原理的各种算法之间的不同聚类模式。此外,熵和纯度分析突出了每种工具所捕捉的序列复杂性的根本差异。这些结果共同提供了一个统一、可复制的框架,用于评估LCR检测性能,并为在蛋白质组规模研究中可靠注释低复杂性区域提供了实用指南。
生物通微信公众号