利用细胞类型特异性和相似性提升单细胞eQTL精细定位

《Nature Communications》:Leveraging cell-type specificity and similarity improves single-cell eQTL fine-mapping

【字体: 时间:2026年04月23日 来源:Nature Communications 15.7

编辑推荐:

  为了准确识别细胞类型特异性eQTL,以解析基因表达在细胞层面的遗传调控及其与复杂性状的关联,研究人员开发了名为CASE的贝叶斯框架。该研究通过同时分析多种细胞类型,有效捕捉跨细胞类型的效应共享模式,并克服连锁不平衡的混杂效应。结果表明,CASE在模拟中超越了现有单性状(SuSiE)与多性状(mvSuSiE)eQTL方法,并在OneK1K数据分析中鉴定出更多遗传调控,更好地捕获了细胞类型特异性、功能富集及与疾病相关的eQTL。这项工作为单细胞、多组织及多性状遗传研究提供了强大工具。

  
在探索人类复杂疾病和性状背后的遗传奥秘时,遗传变异如何调控基因表达是一个核心问题。表达数量性状位点(Expression Quantitative Trait Loci, eQTL)研究正是连接遗传变异与基因表达水平的关键桥梁。随着单细胞测序技术的发展,科学家们得以在更精细的细胞类型层面探索eQTL,这有望揭示以往在组织整体水平研究中被掩盖的细胞类型特异性调控机制。然而,机遇与挑战并存。当研究人员试图为每一种细胞类型单独进行eQTL精细定位(fine-mapping)时,他们常常面临统计效力不足和准确性有限的困境。这是因为单独分析每种细胞类型,无法充分利用不同细胞类型间可能存在的调控相似性,同时也难以有效区分真正的因果变异与由于连锁不平衡(Linkage Disequilibrium, LD)而与之紧密相连的其他变异。现有的方法,无论是针对单一性状的SuSiE,还是针对多性状的mvSuSiE,在应对多细胞类型场景时,都未能最优地平衡特异性与相似性的利用。为了突破这一瓶颈,一项发表在《Nature Communications》上的研究提出了一个创新的解决方案。
研究者采用的计算生物学和统计遗传学方法主要包括:开发了一种新的贝叶斯统计框架CASE,用于联合分析多个细胞类型的单细胞RNA测序(scRNA-seq)数据与基因型数据,以进行细胞类型特异性和共享eQTL的精细定位;利用综合模拟研究,将CASE与现有方法(SuSiE, mvSuSiE)在统计效能和准确性方面进行系统比较与验证;将CASE应用于真实的单细胞数据集——OneK1K队列(一个包含大量个体外周血单核细胞scRNA-seq数据的资源),以鉴定新的eQTL并分析其生物学特性。
CASE模型框架与模拟验证
通过构建一个灵活的贝叶斯分层模型,CASE能够同时分析多个相关细胞类型。该模型的核心优势在于,它不仅能推断每个细胞类型中独立的eQTL信号,还能主动识别和利用跨细胞类型的效应共享模式。例如,一个遗传变异可能以相似的强度影响多种免疫细胞中某个基因的表达(共享效应),也可能仅特异性地影响其中一种细胞(特异性效应)。CASE通过引入共享度先验分布,自动化地学习和推断这些模式。在复杂的模拟实验中,研究人员设置了多种真实的遗传架构场景,包括存在共享效应、特异性效应以及两者混合的情况。结果表明,无论面对何种场景,CASE在识别真实因果变异(即精细定位的准确性)和统计效力方面,均一致且显著地优于单独应用SuSiE于每个细胞类型,也优于旨在处理多性状相关性的mvSuSiE方法。这证明CASE能更有效地利用跨细胞类型的信息,同时抵抗LD结构带来的混淆。
在OneK1K数据中的应用与生物学发现
为了评估CASE在真实数据中的表现,研究将其应用于OneK1K项目的scRNA-seq数据,涵盖了来自多个个体的多种免疫细胞类型。分析显示,CASE鉴定出的与基因表达显著相关的遗传变异(eQTL)数量,超过了基于SuSiE方法得到的结果。更重要的是,CASE所发现的eQTL在生物学上显示出更强的特异性。具体而言,在CASE鉴定出的、仅针对特定细胞类型有作用的eQTL(细胞类型特异性eQTL)中,有更高比例的其靶基因在该细胞类型中本身就高表达,这符合生物学直觉。相比之下,SuSiE发现的所谓“特异性”eQTL中,这种关联要弱得多。这表明CASE能更真实、更灵敏地捕捉到细胞类型特异的遗传调控信号。进一步的功能富集分析揭示了CASE eQTL的重要生物学意义。这些eQTL的基因组位置在染色质开放区域(ATAC-seq峰值)和组蛋白修饰标记(如H3K27ac)上显著富集,提示它们位于功能性的调控元件附近。更为关键的是,通过与全基因组关联研究(Genome-Wide Association Study, GWAS)数据的整合,研究人员发现CASE鉴定出的eQTL与自身免疫性疾病(如类风湿关节炎、狼疮)的GWAS风险位点存在显著的重叠。这意味着CASE能够更有效地定位出那些可能通过调控特定免疫细胞基因表达来影响复杂疾病风险的遗传变异,为从分子机制上解读GWAS发现提供了更精确的线索。
综上所述,这项研究成功开发了CASE这一全新的计算框架,专门用于从单细胞数据中进行跨细胞类型的eQTL精细定位。其主要结论是,通过联合分析多种细胞类型并显式地建模效应共享模式,CASE能够显著提升eQTL发现的效能与准确性,特别是增强了对细胞类型特异性信号的检测能力。在讨论中,作者强调了该方法的普适性价值:CASE的框架不仅限于单细胞eQTL研究,其核心思想——在利用性状间相似性的同时解析其特异性——可广泛应用于多组织、多条件、多分子表型(多组学)的遗传学整合分析。该工作为在日益复杂的多维度生物数据中,精准绘制遗传调控图谱并阐释其与疾病的关联提供了强有力的方法论支持,推动了遗传学向更精细、更整合的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号