《PLOS Computational Biology》:Deciphering cell type-specific causal genetic effects on brain imaging-derived phenotypes and disorders with single-cell Mendelian randomization
编辑推荐:
解析从遗传效应到特定细胞类型中复杂表型的因果路径,对于理解脑影像衍生表型(IDPs)及脑疾病与行为(DBs)等脑相关表型背后的生物学机制至关重要。研究人员开发了一种单细胞孟德尔随机化(MR)框架,通过整合单细胞表达数量性状位点(cis-eQTLs)和全基因组关
解析从遗传效应到特定细胞类型中复杂表型的因果路径,对于理解脑影像衍生表型(IDPs)及脑疾病与行为(DBs)等脑相关表型背后的生物学机制至关重要。研究人员开发了一种单细胞孟德尔随机化(MR)框架,通过整合单细胞表达数量性状位点(cis-eQTLs)和全基因组关联研究(GWAS)结果,推断基因表达与多种脑相关复杂表型之间的细胞类型特异性因果关系。研究人员鉴定出254个和217个cis-eQTL靶基因(eGenes),它们可能分别在八种细胞类型中对112个IDPs和26个DBs具有因果效应。这些因果eGenes表现出强烈的细胞类型特异性,并在不同类别的脑相关表型中呈现多变的pleiotropy(多效性)。进一步的整合分析揭示了细胞类型特异性因果eGenes与脑相关复杂表型之间的推定因果路径。最后,研究人员表征了这些因果eGenes的时空表达模式,并强调了基于其因果eGenes表达表达的脑相关表型之间的协调关联。总体而言,该研究呈现了对脑结构、疾病和行为遗传效应的大规模分析,提供了细胞类型特异性因果eGenes的目录。
研究背景方面,近年来大规模全基因组关联研究(GWASs)已鉴定出数千个与脑相关复杂表型关联的遗传变异位点,但解读这些位点的调控作用仍具挑战性,因为大多数变异位于非编码区,不能直接指向特定基因。表达数量性状位点(eQTLs)将遗传变异与靶基因的表达水平相联系,为弥合这一差距提供了强大工具。通过整合cis-eQTL数据与GWAS发现,孟德尔随机化(MR)——一种遗传因果推断框架——可以精准定位其表达水平因果影响复杂神经、精神和行为表型的基因。既往MR研究主要依赖组织水平的cis-eQTL来识别复杂表型的因果基因,但细胞类型水平的cis-eQTL比其组织水平对应物具有更大的效应量,并且靶向更多进化上受约束的基因,提示细胞分辨率对于准确因果推断至关重要。近期单细胞eQTL图谱揭示了遗传变异对基因表达调控的细胞类型特异性效应。例如,大多数与阿尔茨海默病(AD)风险相关的遗传变异似乎通过小胶质细胞中的cis-eQTL发挥作用,而精神分裂症(SCZ)则表现出更具多基因性的架构,信号跨越多种细胞类型。这些观察表明,细胞水平调控与疾病发病机制的联系比整体水平调控更为紧密。然而,遗传变异如何在细胞类型水平贡献于因果基因-表型关系仍知之甚少,这促使本研究开展细胞类型特异性因果推断。此外,脑影像衍生表型(IDPs)与脑疾病与行为(DBs)之间的遗传和细胞联系增加了另一层复杂性。IDPs和DBs的遗传遗传性在共同细胞类型中显著富集,如少突胶质细胞对于白质微结构和抑郁,兴奋性神经元对于总表面积和精神分裂症。这些发现提示共享的细胞水平遗传架构可能介导脑结构表型与脑疾病之间的关系,表征这些推定路径有助于推进机制性治疗靶点的发展。
研究人员系统推断了基因表达与多种脑相关复杂表型之间的细胞类型特异性因果关系。他们开发了单细胞MR框架,整合来自八种脑细胞类型的最新发表cis-eQTL图谱与大规模GWAS发现,涵盖26种DBs(8种行为认知表型、10种精神障碍和8种神经退行性疾病)和123种IDPs(101种脑区体积和22种白质纤维束)。
研究结果部分,"研究概述"显示,研究人员通过整合26种DBs和123种IDPs的GWAS汇总统计数据与涵盖八种脑细胞类型的最新发表细胞类型特异性cis-eQTL图谱,进行了两样本孟德尔随机化。八种细胞类型为星形胶质细胞、内皮细胞、兴奋性神经元、抑制性神经元、小胶质细胞、少突胶质细胞、少突胶质前体细胞(OPCs)和壁细胞。考虑到脑疾病与影像表型之间存在双向因果效应的证据,研究人员首先使用全转录组关联研究(TWAS)筛选潜在的eGene-表型关联,保留43,494对eGene-DB对和284,927对eGene-IDP对用于后续MR分析。为确保工具变量有效性,仅选择在cis-eQTL数据中达到全基因组显著性(P < 5×10
-8)的单核苷酸多态性(SNPs)作为工具变量。研究人员手动验证了所有数据集的样本描述,确认cis-eQTL目录与GWAS队列之间不存在参与者重叠。为增强因果推断的稳健性,应用了四种互补的MR方法:SMR、Wald ratio、PMR-Egger和GSMR。这些方法在工具变量选择策略、对水平pleiotropy的容忍度和分析假设方面存在差异,从而为每个推断的关联提供趋同证据。
"eGenes对IDPs和DBs的推定因果效应"方面,研究人员鉴定出254个eGenes对112种IDPs具有推定因果效应,涉及760个显著的eGene-细胞类型-IDP组合。其中,184个和112个eGenes分别与90种脑区体积和22种白质微结构表型相关。为评估可重复性,使用BrainMeta皮层eQTLs和brainSCOPE细胞类型特异性eQTLs进行复制分析。eGene-IDP对的复制率分别为64.9%和49.2%。这些关联具有强烈的细胞类型特异性:91.4%的eGene-IDP对仅在一种细胞类型中显著。白质微结构表型在少突胶质细胞和星形胶质细胞中的因果eGenes多于脑区体积,与既往证据一致。
对于DBs,研究人员鉴定出217个eGenes对26种DBs具有推定因果效应,包含298个eGene-细胞类型-DB组合。其中109个、61个和85个eGenes分别与10种精神障碍、8种神经退行性疾病和8种行为认知表型相关。使用BrainMeta皮层eQTLs、PsychENCODE差异表达数据和GWAS目录进行验证。eGene-DB关联同样高度细胞类型特异性:82.1%的对仅限于单一细胞类型。兴奋性神经元在几乎所有表型组中 harbored 最多数量的因果eGenes,特别是在SCZ、双相情感障碍(BIP)和失眠(INS)中。
"因果eGenes的广泛表型多效性"方面,研究人员系统比较了因果eGenes在表型类别(IDPs vs DBs)和表型组之间的共享模式。每对表型组之间均观察到显著的eGene重叠。IDP类别内,脑区体积与白质微结构表型之间的重叠最强(42个共享eGenes,37.5%)。DB类别内,四个eGenes在所有三个DB组中表现出多效性效应。类别间多效性同样广泛,17个eGenes被两个IDP组和一个DB组共享,9个被一個IDP组和两个DB组共享。共享因果eGenes表现出不同的进化约束模式和功能富集特征。
"不同表型类别间因果eGenes共享的细胞类型特异性"方面,研究人员检查了介导IDPs和DBs之间共享关联的具体细胞类型。SCZ和每周饮酒量(DPW)各与脑区体积在广泛细胞类型谱中共享因果eGenes,而神经发育障碍如自闭症谱系障碍(ASD)、创伤后应激障碍(PTSD)和注意力缺陷多动障碍(ADHD)的共享则局限于抑制性神经元。星形胶质细胞中的MAPT基因成为突出共享信号,与SCZ及26种脑区体积和15种白质微结构表型相关。兴奋性神经元中的三个eGenes(ZSCAN31、SYT14和ICA1L)被AD和多种IDPs共享。
"基于细胞类型信息的表型聚类揭示生物学意义模式"方面,研究人员基于共享因果eGenes及其对应细胞类型计算了表型×表型Jaccard相似性矩阵。层次聚类鉴定出12个稳健的表型聚类,其中八个包含IDP和DB两种表型。这些分子定义的聚类与临床观察到的共病模式相吻合:BIP与SCZ和焦虑障碍(ANX)聚类,癫痫(EPI)和PTSD共聚类,缺血性卒中(IS)和强迫障碍(OCD)共享聚类,帕金森病(PD)和酒精使用障碍(AUD)聚类。
"细胞类型特异性因果eGenes与脑相关复杂表型之间的推定因果路径"方面,研究人员进行了IDPs和DBs之间的双向孟德尔随机化,鉴定出从IDPs到DBs的六种因果效应和从DBs到IDPs的三种因果效应。通过叠加这些双向表型关系与上述细胞类型特异性eGene-表型关联,重建了四条eGene-IDP-DB路径和七条eGene-DB-IDP路径。例如,兴奋性神经元中ICA1L表达连接ACR微结构和多发性硬化(MS),星形胶质细胞中ZSCAN31表达连接SCZ和后丘脑辐射(PTR)微结构。通过SNP级别的精细定位、共定位和调控注释,鉴定了56条SNP-细胞类型-eGene-表型链。
"IDPs和DBs因果eGenes的时空表达模式"方面,研究人员检查因果eGenes在人脑单细胞数据中的表达模式。DBs的因果eGenes在胶质细胞相对于神经元中显著富集,星形胶质细胞中富集最强。精神障碍和行为认知因果eGenes在产前表现出比产后更高的神经元表达,而胶质细胞显示相反模式。 lifespan轨迹显示,精神障碍eGenes在胶质细胞中于妊娠中期后下降,幼儿期再次上升,而神经元表达单调下降。对于IDPs,白质微结构表型的因果eGenes在成年胶质细胞(特别是星形胶质细胞和小胶质细胞)中强烈富集。
"因果eGenes表达指示脑相关复杂表型的关联"方面,研究人员使用STAB2的细胞类型特异性表达数据检查脑区体积和白质微结构表型之间的关联。区域体积和白质表型形成基本不同的聚类,同源区域被分配到不同模块。DBs的因果eGene表达谱携带功能和脑疾病的关联,教育程度和智力与AD的表达特征高度相关。后丘脑辐射(PTR)和额枕下束(IFO)的各向异性分数分别与SCZ和一般风险承受能力(GRT)显著相关,重度抑郁障碍(MDD)与左喙侧额中皮层的相关性最强。
讨论部分,研究人员使用单细胞孟德尔随机化框架剖析了基因表达与脑相关复杂表型之间的潜在因果关系,鉴定了254个和217个分别对112种IDPs和26种DBs具有推定因果效应的eGenes。这些因果eGenes表现出强烈的细胞类型特异性,, widespread phenotype pleiotropy,并在不同类别的脑相关表型中呈现不同的进化约束和细胞类型富集模式。研究人员进一步表征了连接细胞类型特异性因果eGenes与IDPs和DBs的推定因果路径,并通过独立单细胞数据中的时空表达动力学,揭示了支撑脑相关复杂表型关系的协调转录程序。
细胞类型特异性因果eGenes的调控方面,既往研究指出了兴奋性神经元在AD病因学中重要但被低估的作用。本分析中,六个eGenes与AD在兴奋性神经元中因果相关,其中五个显示一致的阳性因果效应。ZSCAN31是目录中最多效性的基因之一,在星形胶质细胞中对11种关联表型显示阳性因果效应,而在兴奋性神经元中对右侧海马和总白质体积施加阴性因果效应。这一跨细胞类型的效应方向分歧表明ZSCAN31受细胞类型特异性调控控制。
风险行为与IDPs之间共享遗传信号方面,分析支持风险行为与多种IDPs在细胞水平的遗传驱动联系。抑制性神经元中风险行为与脑区体积和白质微结构表型之间存在显著因果eGenes共享,XKR6是其中的关键共享信号。
细胞类型特异性关联的解释方面,观察到的高细胞类型特异性率应谨慎解读,这些比率反映的是TWAS和MR过滤后的显著eGene-表型关联的特异性,而非eQTL效应的固有效应。方法学因素如显著性过滤和跨细胞类型cis-eQTL可用性的不均匀可能夸大表观特异性。cis-eQTL数据来自有限脑区域而非影像结果所代表的全部解剖区域,涉及不匹配区域的关联应谨慎对待。
局限性方面,内皮细胞和壁细胞中cis-eQTL数量相对较少限制了这些细胞类型中因果基因的鉴定数量。IDPs和DBs之间的MR中,一半DB GWAS因包含UK Biobank参与者而被排除,限制了推断因果路径的完整性。此外,GWAS数据集之间不可避免地存在样本重叠可能影响共享因果eGenes。尽管研究结果突出推定因果关系,但尚未确立确定性因果,需要随机对照试验验证。
研究结论部分,该研究提供了对脑相关复杂表型的细胞类型特异性因果基因的系统调查,以及脑结构与疾病/行为在细胞水平共享遗传基础的证据。研究人员期望基因、细胞类型和复杂表型之间鉴定的联系将作为开发针对脑结构异常、疾病和行为的靶向治疗策略的起点。