《Nature Communications》:RESCUE: recovery of unattributed expression patterns in spatial transcriptomics
编辑推荐:
在空间转录组学(ST)分析中,传统细胞分割或反卷积方法会系统性地丢失大量分子表达信号,这些信号可能来自脆弱细胞、亚细胞结构(如神经突)或胞外表达,导致分析偏差与生物学解释不全。为此,研究人员开发了计算方法RESCUE,能够恢复被遗漏的空间表达模式,并在参考数据不全时实现稳健分析。该方法已通过蜜蜂脑MERFISH数据验证,并在多个ST数据集中揭示了复杂组织生物学的新见解,为空间转录组学提供了更完整的分析框架。
论文解读
在生命科学研究中,理解组织内基因表达的空间模式对于揭示细胞功能、组织发育和疾病机制至关重要。空间转录组学(Spatial Transcriptomics, ST)技术的出现,使得科学家能够在保留组织原始空间结构的同时,全面绘制基因表达图谱。然而,当前ST数据分析的主流方法,如基于图像的细胞分割(cell segmentation)或基于转录组的细胞类型反卷积(cell-type deconvolution),都存在一个被长期忽视的缺陷——它们会系统性地丢失相当一部分分子表达信号。这些“消失”的表达可能来源于多种生物学上重要的结构:例如容易在制备过程中损伤的脆弱细胞类型、在组织中占比较低因而容易被忽略的稀有细胞、神经元延伸的亚细胞结构(如神经突,neurites),甚至细胞分泌到胞外的表达产物。这些遗漏不仅导致数据利用不完整,更可能使后续分析产生偏差,从而得出错误或不全面的生物学结论。为此,研究团队在《Nature Communications》上发表了题为“RESCUE: recovery of unattributed expression patterns in spatial transcriptomics”的论文,旨在解决这一关键问题。
为了开展研究,作者主要应用了以下几项关键技术方法:首先,利用多重误差稳健荧光原位杂交(Multiplexed Error-Robust Fluorescence In Situ Hybridization, MERFISH)技术获取了蜜蜂脑的高分辨率空间转录组数据,作为方法验证的黄金标准数据集。其次,开发了名为RESCUE的计算方法,其核心是构建一个概率生成模型,以区分已标注(如被成功归因到特定细胞)和未标注的表达信号,并恢复后者的空间分布模式。此外,研究还将RESCUE应用于多个已公开的、基于不同技术平台(如基于测序的ST和基于成像的ST)产生的空间转录组数据集,以验证其普适性。研究中使用的人类及小鼠组织样本来源于公共数据库。
研究结果
1. RESCUE能够系统性地识别和恢复未标注表达信号
通过将RESCUE应用于蜜蜂脑MERFISH数据,并将其输出与基于细胞分割的传统分析结果进行比较,研究发现RESCUE成功恢复了大量被遗漏的表达信号。这些信号在空间上呈现出清晰的模式,并且与已知的细胞解剖结构(如特定的神经纤维束区域)高度相关,表明这些未标注信号并非随机噪声,而是具有真实的生物学基础。
2. 未标注信号来源于多样化的生物学实体
对恢复出的表达模式进行深入分析发现,其来源具有高度异质性。主要包括:(1)在标准细胞分割中因形态不规则或信号弱而被忽略的脆弱细胞类型;(2)神经元中远离胞体的亚细胞结构,如轴突和树突(统称神经突),这些结构富含特定mRNA但常因不在细胞核/胞体区域而被遗漏;(3)表达量低或群体稀疏的稀有细胞类型;(4)被释放到细胞外基质或间质中的RNA。这证实了传统方法丢失的信息覆盖了广泛且重要的生物学过程。
3. RESCUE提升了下游分析的稳健性与发现能力
在参考数据(如单细胞参考图谱)不完整的真实场景下,传统的反卷积方法性能会大幅下降。而整合了RESCUE恢复信号的增强型数据分析框架,在细胞类型注释、空间域识别和细胞间通信推断等下游分析中,都表现出更高的稳健性和准确性。例如,在分析一个复杂的人类乳腺癌ST数据集时,RESCUE帮助识别出了一个此前未被注意到的、与免疫抑制微环境相关的稀有细胞亚群的空间聚集模式。
4. 方法在不同技术平台上具有普适性
研究将RESCUE应用于基于测序的Visium数据和基于成像的osmFISH数据等不同技术平台产生的ST数据集。结果表明,无论空间分辨率高低或检测原理如何,RESCUE均能有效恢复未标注表达模式,并改善生物学解读,证明了其作为通用分析模块的潜力。
结论与讨论
本研究揭示了当前空间转录组学数据分析流程中存在一个普遍但未被充分重视的系统性偏差——即大量分子表达信号因无法被归因到明确的细胞轮廓而被丢弃。针对这一问题,作者开发的RESCUE计算方法,能够从原始数据中概率性地恢复这些有价值的“丢失”信号,并将其重新整合到分析框架中。这项工作的重要意义在于:首先,方法论上,它填补了ST分析工具链的一个关键空白,提供了一个通用的、与下游分析兼容的“信号恢复”模块,使数据利用更加充分。其次,生物学上,它推动研究者关注超越传统“细胞”边界的表达现象,如亚局部(subcellular)和超细胞(extracellular)的RNA表达与分布,这为了解细胞极化、局部蛋白质合成、细胞间信号传递等过程提供了新的视角。最后,应用层面上,RESCUE增强了下游推理的稳健性,特别是在参考图谱不全的情况下(这在研究新组织或病理状态时很常见),有助于从ST数据中挖掘出更可靠、更深刻的生物学见解,包括发现新的细胞状态、空间交互和疾病相关特征。总之,RESCUE不仅是一个计算工具,更代表了一种更全面、更精细地解读空间转录组数据的新范式,为未来复杂组织生物学研究提供了有力支撑。