《International Journal of Genomics》:Integrative Analysis of Genetic Risk Factors for Acute Myeloid Leukemia Using Mendelian Randomization and Single-Cell RNA Sequencing Validation
编辑推荐:
背景:急性髓系白血病(AML)是一种异质性血液恶性肿瘤,具有复杂的遗传学基础。理解遗传因素与AML风险之间的因果关系对于开发靶向治疗策略至关重要。方法:研究人员开展了一项全面的孟德尔随机化(MR)分析,以评估10种遗传暴露对AML风险的因果效应,采用了包括逆方
背景:急性髓系白血病(AML)是一种异质性血液恶性肿瘤,具有复杂的遗传学基础。理解遗传因素与AML风险之间的因果关系对于开发靶向治疗策略至关重要。方法:研究人员开展了一项全面的孟德尔随机化(MR)分析,以评估10种遗传暴露对AML风险的因果效应,采用了包括逆方差加权法、加权中位数法、简单模式法、加权模式法和MR-Egger回归在内的多种分析方法。随后,进行了单细胞RNA测序(scRNA-seq)分析以验证基因表达模式并研究AML中的细胞异质性。通过质量控制、聚类分析和细胞类型注释,表征了所鉴定风险基因的表达谱。结果:MR分析揭示了不同遗传暴露间异质的因果效应。三个基因显示出显著的保护效应:COL11A2(OR:0.425–0.481)、MTHFD1(OR:0.142–0.151)和SERPINA10(OR:0.426–0.560)。七个基因显示出增加风险的效应:SPATA20、PDE5A、ANXA11、FUT10、TXNL4B、RNASET2和TCL1A,其中PDE5A表现出最强的风险关联(OR > 8.0)。单细胞分析鉴定出17个不同的细胞群和14种细胞类型,揭示了这些风险基因在不同造血谱系中的细胞特异性表达模式。结论:该整合方法为特定遗传因素与AML风险之间的因果关系提供了有力证据,在细胞水平上为疾病机制和潜在治疗靶点提供了见解。
急性髓系白血病(AML)是成人最常见的急性白血病,其特征是髓系原始细胞的克隆性增殖和造血分化受损。尽管对AML生物学的理解已取得显著进展,但该疾病仍具有高度异质性,临床结局多变,且许多患者的治疗选择有限。AML复杂的遗传图谱涉及多个分子通路,包括转录调控、表观遗传修饰和参与白血病发生及疾病进展的细胞信号级联。传统的观察性研究在调查AML遗传风险因素时,常受未测量变量和反向因果关系的困扰,限制了确立真实因果关系的能力。孟德尔随机化(MR)已成为一种强大的流行病学方法,它利用遗传变异作为工具变量来推断暴露与结局之间的因果关系。通过利用遗传变异在受精时的随机分配,MR分析可以最大限度地减少混杂,并为因果性提供有力证据,这对于理解疾病病因学尤为重要。近年来,单细胞RNA测序(scRNA-seq)技术的进步彻底改变了研究人员对血液恶性肿瘤细胞异质性的理解。单细胞分析使得在前所未有的分辨率上表征不同细胞群、鉴定罕见细胞亚群以及重建发育轨迹成为可能。在AML背景下,scRNA-seq已揭示了显著的瘤内异质性,发现了新的治疗靶点,并提供了对耐药机制的见解。将MR研究中来自群体水平的遗传证据与单细胞分子谱分析相结合,为弥合遗传关联与细胞机制之间的鸿沟提供了独特机会。尽管MR分析可以确立遗传因素与疾病风险之间的因果关系,但单细胞分析可以在细胞水平上验证这些发现,并为遗传变异如何影响疾病发病机制提供机制性见解。在本研究中,研究人员进行了一项综合分析,结合MR方法与scRNA-seq,以研究遗传暴露对AML风险的因果效应,并表征其在不同细胞类型中的表达模式。该方法旨在鉴定稳健的AML遗传风险因素,并阐明它们在疾病细胞生态系统中的作用,潜在地揭示新的治疗靶点并增进对AML发病机制的理解。本研究结果发表在《International Journal of Genomics》上。
为开展本研究,研究人员主要运用了两种关键技术方法。首先,利用公开的全基因组关联研究(GWAS)汇总统计数据,对10个候选基因作为遗传暴露进行了系统的孟德尔随机化分析。研究使用了包括逆方差加权法、加权中位数法在内的多种统计方法进行因果推断,并通过散点图、漏斗图和留一法分析进行了严格的质量控制和敏感性分析,以验证结果的可靠性。所使用的样本队列主要来自欧洲裔人群(85%-95%),暴露数据来源于白细胞计数、红细胞参数和血小板计数的GWAS,结局数据则来自FinnGen联盟(包含412,181名个体,其中676例AML病例)及其他欧洲队列。其次,对AML样本进行了单细胞RNA测序数据分析。通过对细胞进行严格的质量控制、高变基因鉴定、主成分分析(PCA)降维和UMAP非线性降维,随后进行了无监督聚类和基于标记基因的细胞类型注释。最后,对MR分析鉴定出的关键基因进行了细胞类型特异性表达分析和铁死亡通路相关性研究。
以下是对论文主体部分研究结果的详细介绍。首先,在3.1节“MR分析检测遗传暴露对AML风险的因果效应”中,研究人员通过森林图呈现了全面的MR分析结果。该分析评估了10种不同遗传暴露对AML风险的因果效应,采用了加权中位数法、逆方差加权法(IVW)、简单模式法、加权模式法和MR-Egger回归等多种方法。结果显示不同暴露表现出异质的因果效应。其中,COL11A2在所有方法中均显示出一致的保护性关联,其比值比(OR)范围为0.425至0.481,表明疾病风险降低52%-76%。MTHFD1也表现出强大的保护效应,OR值在0.142至0.151之间,提示风险降低约85%。SERPINA10同样显示出保护效应,OR值范围为0.426至0.560。相反,SPATA20、PDE5A、ANXA11、FUT10、TXNL4B、RNASET2和TCL1A这七个基因均显示出增加风险的效应,其OR值大于1.0。值得注意的是,PDE5A表现出最强的风险效应,部分OR值超过8.0,而TXNL4B和TCL1A也显示出显著的风险增加,OR值在2.8至4.5之间。在对10个独立检验进行Bonferroni校正(α = 0.05/10 = 0.005)后,五个基因保持统计学显著性:COL11A2、MTHFD1、SERPINA10、PDE5A和TCL1A。
在3.2节“AML的MR分析综合结果”中,研究人员通过图2A至图2H详细展示了MR分析的综合结果,包括展示不同MR方法因果效应估计的森林图、展示SNP效应关系的散点图、用于检测发表偏倚和水平多效性的漏斗图以及留一法敏感性分析结果。这些质量控制图表明分析满足核心MR假设,且多种分析方法结果的一致性增强了因果推断的可信度。
在3.3节“AML单细胞RNA测序数据的质量控制和聚类分析”中,研究人员展示了scRNA-seq数据的质量控制和预处理结果。通过小提琴图展示过滤前的质量控制指标,包括每个细胞检测到的基因数、总读数计数和线粒体基因百分比。随后进行了基因变异性分析,鉴定出高变基因。方差比图用于确定主成分分析(PCA)的最佳主成分数量。最终的细胞聚类结果通过UMAP降维可视化,显示出17个不同的细胞群(聚类0-16),不同颜色代表不同的细胞类型或状态。
在3.4节“AML单细胞中关键标记基因的表达分析”中,研究人员展示了scRNA-seq数据中关键标记基因的表达模式。点图展示了九个重要基因在17个细胞聚类中的差异表达,点的大小代表表达该基因的细胞比例,颜色强度反映平均表达水平。UMAP投影图显示了这九个标记基因(包括造血干细胞标记CD34、髓系分化相关转录因子IRF8、SPI1、SPIB以及成熟粒细胞标记基因ELANE、MPO和LYZ)在所有细胞中的空间表达分布。这些表达模式揭示了从原始造血干细胞到成熟髓系细胞的分化轨迹。
在3.5节“AML单细胞基因表达谱的系统分析”中,研究人员通过点图展示了大量基因在17个细胞聚类中的差异表达模式。这些分析揭示了AML中细胞异质性的复杂性,不同的基因表达程序在不同的细胞群中被激活。通过鉴定群体特异性标记基因,可以更好地表征每个细胞亚群的生物学功能及其在疾病进展中的作用。
在3.6节“AML单细胞中关键基因的细胞类型特异性表达分析”中,研究人员首先通过UMAP降维可视化展示了14种不同的细胞类型注释。随后,热图展示了九个关键基因(SPATA20、PDE5A、ANXA11、FUT10、COL11A2、MTHFD1、TXNL4B、RNASET2和TCL1A)在不同细胞类型中的平均表达水平。这些基因在细胞类型间表现出显著的差异表达模式。详细的单细胞水平表达谱和每个基因在UMAP空间中的表达分布图,揭示了这些关键基因在AML细胞生态系统中的特异性表达模式。
在3.7节“AML细胞中的铁死亡通路分析和表达动态”中,研究人员为探讨MR鉴定基因与铁死亡调控的关系,进行了综合的铁死亡通路分析。轮廓流图揭示了沿细胞轨迹的表达动态和铁死亡评分分布。细胞类型分布分析显示了AML样本的组成。GPX4表达分析揭示了其在细胞聚类间的异质性空间分布。基因评分分布分析展示了不同聚类间的通路活性差异。夜莺玫瑰图比较了AML患者、正常骨髓(BM)和细胞系中包括铁死亡标志在内的多种通路成分。细胞层次旭日图可视化了样本类型、个体样本和细胞类型之间的关系。
在3.8节“MR风险基因与铁死亡通路分析的整合”中,研究人员首先通过Marimekko/马赛克图分析了不同AML样本和对照组的样本组成差异。铁死亡评分分布在具有活力发光风格的UMAP上可视化。MR风险基因表达分析使用山脊图展示了SPATA20、PDE5A等基因在不同样本类型中的差异表达模式。保护性与风险基因评分的相关性分析显示二者相关性较弱。差异表达分析以曼哈顿图风格进行可视化。最后,构建了基因-基因相互作用网络,使用力导向布局和边捆绑技术,展示了MR鉴定的保护性基因(COL11A2, MTHFD1)、风险基因(SPATA20, PDE5A等)和铁死亡调控因子(GPX4, ACSL4等)之间的复杂关系,揭示了遗传风险因素与AML中铁死亡调控之间潜在的机制联系。
讨论部分对本研究的整合方法进行了情境化分析。研究解决了两个互补但不同的问题:一是哪些生殖系遗传因素因果性地影响AML易感性(MR分析);二是这些易感基因在已建立的AML中如何在不同细胞区室表达(scRNA-seq分析)。单细胞表达数据并非“验证”因果效应,而是表征这些基因在已建立疾病中的作用细胞环境。研究人员将本研究的发现置于AML遗传学的背景中进行了讨论。与此前通过全基因组关联研究(GWAS)鉴定的已知AML风险位点相比,本研究鉴定的基因不重叠,可能代表了在血液特征选择人群中的新易感位点或情境特异性效应。研究人员详细讨论了COL11A2、MTHFD1、SERPINA10等保护性基因以及PDE5A、SPATA20、ANXA11、TCL1A等风险基因的潜在功能机制及其在单细胞分析中观察到的表达模式。此外,讨论了研究结果的临床和转化意义,包括风险分层、预防性干预(如针对MTHFD1的叶酸补充)和治疗靶向(如PDE5A抑制剂的潜在再利用),同时强调了从发现到临床应用所需的阶段性验证过程。
研究结论部分明确指出:本研究通过整合孟德尔随机化(MR)与单细胞RNA测序(scRNA-seq)分析,为特定遗传因素与AML风险之间的因果关系提供了令人信服的证据。既鉴定出保护性基因也鉴定了风险相关基因,这为理解AML发病机制和潜在治疗靶点提供了新的见解。