利用差异剪接频率分析鉴定阿尔茨海默病相关基因

《Cells》:Investigating Alzheimer’s Disease-Associated Genes Using Differential Splicing Frequency Analysis

【字体: 时间:2026年06月17日 来源:Cells 5.2

编辑推荐:

  精确量化单个转录本异构体(transcript isoform)的表达仍然是一项艰巨挑战,尤其是在神经退行性疾病和癌症等具有高异构体多样性的背景中。该研究提出了一种基于剪接连接(splice junction)的方法,命名为差异剪接频率分析(DSFA),可利用

  
精确量化单个转录本异构体(transcript isoform)的表达仍然是一项艰巨挑战,尤其是在神经退行性疾病和癌症等具有高异构体多样性的背景中。该研究提出了一种基于剪接连接(splice junction)的方法,命名为差异剪接频率分析(DSFA),可利用RNA测序(RNA-seq)数据更敏感地检测差异剪接。与现有基于外显子、异构体和事件的方法不同,DSFA定量的是剪接连接使用情况。研究人员将DSFA应用于阿尔茨海默病(AD)相关基因的大规模RNA-seq数据挖掘。该研究首次确立:编码APP770、APP751、APP695和APP752的异构体构成APP基因的主要异构体。三项重要发现包括:(1)编码APP752的异构体表现出免疫细胞特异性;(2)在诱导多能干细胞(iPSC)向小胶质细胞分化过程中,编码APP752的异构体相对比例升高,类似于iPSC向神经元分化过程中编码APP695的异构体相对比例升高;(3)编码APP751的异构体在癌细胞和免疫细胞中均占优势。此外,研究人员分别在人和小鼠中鉴定出APP/58417N与App/52804N为差异表达的剪接连接。通过在人胚胎干细胞(hESC)来源神经元中过表达U1小核RNA(U1 snRNA),研究发现U1 snRNA过表达会降低神经元中APP/58417N的使用率,这一点与AD样本中观察到的效应相似。该研究强调,同一基因的主要异构体可在不同组织和细胞类型间表现出显著不同的表达格局。
该文发表于《Cells》,核心目标是针对传统差异基因表达分析(DGEA)难以捕捉的异构体层面变化,建立一种基于剪接连接定量的新分析框架,并将其用于阿尔茨海默病(AD)相关基因的系统研究。研究背景在于:RNA测序(RNA-seq)虽然已广泛用于转录组分析,但由于短读长测序难以直接分辨复杂转录本结构,很多研究仍将基因视为单一表达单位,从而忽略了总基因表达不变但异构体构成显著改变的情况。尤其在神经退行性疾病和癌症中,可变剪接(alternative splicing)高度复杂,现有基于外显子、事件或异构体推断的方法仍存在灵敏度与准确性限制。因此,开展一项能够直接从短读长RNA-seq数据中提取剪接连接变化信息的研究具有明确必要性。

研究人员据此开发了差异剪接频率分析(DSFA)。该方法不直接推断完整异构体,而是以剪接连接(splice junction)为基本定量单位,通过剪接连接读段计数构建矩阵,并在同一基因内部比较不同样本间连接使用频率差异,以识别差异表达剪接连接。研究首先围绕6个AD相关基因展开,包括APP、MAPT、PSEN1、PSEN2、APOE和CLU,并对公开数据库中的大规模RNA-seq项目进行再分析。结果显示,在这些基因中,APP表现出最丰富的剪接连接变化,也承载了大多数差异与新型剪接连接。进一步结合PacBio cDNA-seq数据,研究人员验证了APP主要异构体的真实构成,提出APP770、APP751、APP695和APP752构成APP的主要异构体,而部分数据库注释的低频异构体虽然存在,但表达量极低,难以成为主要生物学效应承担者。

为开展本研究,作者主要采用了以下几类关键技术方法:其一,基于117个公开bulk RNA-seq项目的人与小鼠大规模数据再分析,排除单细胞与无关课题数据,对原始测序数据进行质控、比对与剪接连接读段计数;其二,使用edgeR对基因表达矩阵与剪接连接矩阵分别实施DGEA和DSFA;其三,利用PacBio全长转录组测序(PacBio cDNA-seq)数据验证APP主要异构体组成及组织细胞特异性;其四,构建hESC来源神经元并实施U1 snRNA慢病毒过表达,结合RNA-seq与RT-qPCR进行功能验证。样本来源包括AD患者、转基因小鼠模型、iPSC分化神经元、小胶质样细胞以及人脑、心、肝组织和MCF-7细胞等公共数据队列。

**3.1. Differential Splicing Frequency Analysis and APP Isoforms**
本节首先建立了DSFA所依赖的新命名体系,即以基因名加长度标记外显子、内含子和剪接连接,从而避免传统注释中同一连接在不同异构体间编号混乱的问题。研究人员以APP为例,系统展示了其20个已知外显子、24个内含子和24个已知剪接连接,并定义APP/58417N等连接名称。通过RNA-seq中的剪接连接读段,DSFA能够量化每个连接的“使用率”,即其相对剪接频率。基于APP转录结构,作者将APP异构体分为两类:一类编码含信号肽的分泌型APP蛋白,另一类缺乏信号肽、对应非分泌型蛋白。研究指出,APP/58417N或APP/80491N等首个剪接连接与分泌型APP异构体相关,因此这些连接的使用率可反映分泌型APP异构体的相对比例。

**3.2. Large-Scale RNA-Seq Data Mining Using DSFA**
在大规模公开RNA-seq数据再分析中,传统DGEA未能在不同研究间得到一致的上调或下调AD差异基因结果,且6个经典AD相关基因多被归为非差异表达基因。DSFA则在这些“非差异基因”内部揭示出稳定的剪接变化。研究识别人APP/58417N及其小鼠同源连接App/52804N为差异剪接连接,且在相当一部分AD来源神经元、小胶质细胞与海马样本中,其使用率下降。这提示编码信号肽的首外显子纳入比例降低。另一方面,APP/14067N在人类免疫细胞中高表达,尤其在单核细胞中显著高于神经元和iPSC,因此作者提出编码APP752的异构体具有免疫细胞特异性,这是全文第一项重要发现。进一步分析显示,iPSC向神经元分化时,APP695对应连接使用率升高而APP770下降;iPSC向小胶质细胞分化时,APP752对应连接使用率升高,提示不同细胞谱系形成过程中APP主要异构体构成发生方向性重塑。

**3.3. Differential Expression of APP Isoforms and Splice Junctions**
基于既往研究中U1 snRNA过表达可诱导AD样表型,作者检验其是否影响APP关键剪接连接。研究人员在人hESC来源神经元中过表达U1 snRNA,DGEA仅检出100个差异基因或长链非编码RNA(lncRNA),其中富集于细胞群体增殖负调控和Notch信号通路,但6个AD相关基因并未表现为基因整体差异表达。进一步应用DSFA后发现,U1 snRNA过表达显著降低APP/58417N使用率至对照组的85.26%,RT-qPCR验证结果为82.9%,与AD样本中的变化方向一致。这一结果支持U1 snRNA可通过影响APP剪接连接使用参与AD相关分子改变。作者还观察到APP/14067N与APP/39362N使用率上升趋势,但统计学未达显著。除此之外,研究还发现U1 snRNA过表达倾向增加低频剪接连接使用,促进APP695和APP751相对于APP770的生成,提示RNA剪接调控可能改变APP主要蛋白产物谱。

借助PacBio cDNA-seq数据,研究人员进一步确认:在脑、心、肝组织与MCF-7细胞中,仅稳定检测到APP770、APP751、APP695、APP752和APP714编码异构体。APP695在神经组织中占主导,APP770在非神经组织中占主导,而APP751在癌细胞与免疫细胞中占主导,这是本文第三项重要发现。APP752则位列第四丰富异构体,并在免疫细胞中居第二位。研究还识别出APP存在两个转录终止位点(TTS),提示APP末端加工也具有复杂性。

**3.4. Expanded Analysis of APP/58417N and App/52804N Usage**
本节对APP/58417N和App/52804N变化进行扩展分析。作者指出,尽管PacBio数据未直接证实分泌型APP异构体总体比例下降,但多个独立证据支持这一方向:一是若干RNA-seq数据集中,尤其携带家族性AD(FAD)突变的细胞模型中,APP/58417N使用率降低;二是U1 snRNA过表达具有直接降低该连接使用率的因果证据。再分析显示,不同AD来源iPSC模型间结果存在差异,晚发散发性AD来源细胞未见显著变化,而携带APP/V717I、PS1/A79V、PS2/N141I等FAD突变来源细胞则出现下降。作者还在APOE背景不同的小胶质细胞模型中观察到APOE3与APOE4相对APOE-KO伴随APP/58417N使用率下降,而APOE2未见此现象。组织水平分析则揭示强烈异质性:海马、小脑及不同脑区中的变化方向和幅度并不一致,提示组织平均信号易受细胞组成差异影响,难以解析精细剪接机制。

讨论部分指出,DSFA提供了一种“DSFA驱动发现”的研究路径,尤其适用于传统DGEA忽略的非差异表达基因内部剪接改变识别。该方法在APP研究中显示出明显价值,并经PacBio数据支持其对主要异构体代表连接的定义。不过,DSFA目前主要应用于6个非差异表达基因,其在差异表达基因中的适用性仍需验证。作者同时强调,尽管Nanopore RNA-seq或常规RNA-seq可发现大量新异构体或新连接,但真正可能具有生物学意义的仍主要是少数高丰度异构体。APP752作为免疫细胞中高丰度且长期被忽视的主要异构体,可能对Aβ(β-淀粉样蛋白)加工研究带来新问题。至于APP/58417N和App/52804N使用率下降的分子机制,研究尚未完全阐明,可能还涉及转录起始、转录终止或mRNA降解差异等因素,但现有证据不足以作出进一步判断。

研究结论部分可译为:就异构体鉴定而言,PacBio全长转录组测序目前仍是唯一可靠的技术。尽管Nanopore RNA-seq或传统RNA-seq已鉴定出大量新异构体或剪接连接,但每个基因真正具有生物学意义的很可能仅是少数主要异构体。将DSFA应用于大规模RNA-seq数据挖掘,能够有效检测不同组织、细胞及其他条件(如AD)下的异构体差异表达,从而促进潜在生物标志物和治疗靶点的发现。该研究首次认识到,同一基因的主要异构体可在不同组织和细胞类型间表现出如此显著的表达差异。因此,与组织特异性基因表达这一已被广泛研究的领域相比,差异异构体表达研究具有更高价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号