
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于路径的分层结构成分模型的参数假设检验
《Genes & Genomics》:Parametric hypothesis testing for pathway based hierarchical structural component models
【字体: 大 中 小 】 时间:2026年04月10日 来源:Genes & Genomics 1.7
编辑推荐:
HisCoM模型通过参数检验方法替代传统置换检验,显著降低计算成本,其中全自由度改进卡方检验在功效和稳健性上表现最优。
层次结构组分模型(HisCoM)是一种用于通路分析的统计工具,它能够在单一模型中同时评估多个通路。传统上,HisCoM 使用排列检验来评估通路与感兴趣的表型之间的显著性。尽管在渐近分布未知的情况下,排列检验能够有效生成零假设下的精确分布,但它们在计算上非常耗费资源,尤其是对于高维数据集,因为计算 p 值需要大量时间。
本研究的目的是为 HisCoM 开发参数化检验方法,以确定通路的显著性,而无需依赖排列检验。这些参数化检验旨在提高统计性能,同时显著降低计算负担。
所提出的参数化检验基于高维框架下的渐近理论,这些框架包含大量的生物标志物和通路。具体来说,我们引入了标准卡方(χ2)渐近检验、非中心性检验、自由度(df)调整、鞍点近似以及具有完整自由度和一个自由度的修正渐近检验等方法。
模拟和真实数据结果表明,与基于排列的检验相比,计算时间大幅减少。通过模拟研究,具有完整自由度的修正卡方(χ2)渐近检验的检验功效高于其他方法。真实数据分析进一步证实了其稳健性和实际优势。
本研究提出了计算效率高的 HisCoM 参数化检验方法。根据模拟结果和真实数据分析,建议使用具有完整自由度的修正卡方(χ2)渐近检验作为评估通路显著性最可靠和有效的方法。
层次结构组分模型(HisCoM)是一种用于通路分析的统计工具,它能够在单一模型中同时评估多个通路。传统上,HisCoM 使用排列检验来评估通路与感兴趣的表型之间的显著性。尽管在渐近分布未知的情况下,排列检验能够有效生成零假设下的精确分布,但它们在计算上非常耗费资源,尤其是对于高维数据集,因为计算 p 值需要大量时间。
本研究的目的是为 HisCoM 开发参数化检验方法,以确定通路的显著性,而无需依赖排列检验。这些参数化检验旨在提高统计性能,同时显著降低计算负担。
所提出的参数化检验基于高维框架下的渐近理论,这些框架包含大量的生物标志物和通路。具体来说,我们引入了标准卡方(χ2)渐近检验、非中心性检验、自由度(df)调整、鞍点近似以及具有完整自由度和一个自由度的修正渐近检验等方法。
模拟和真实数据结果表明,与基于排列的检验相比,计算时间大幅减少。通过模拟研究,具有完整自由度的修正卡方(χ2)渐近检验的检验功效高于其他方法。真实数据分析进一步证实了其稳健性和实际优势。
本研究提出了计算效率高的 HisCoM 参数化检验方法。根据模拟结果和真实数据分析,建议使用具有完整自由度的修正卡方(χ2)渐近检验作为评估通路显著性最可靠和有效的方法。