scPlantReg:用于复杂牧草单细胞表观基因组学的工具

《Visual Neuroscience》:scPlantReg for single-cell epigenomics in complex forage grasses

【字体: 时间:2026年06月02日 来源:Visual Neuroscience 2.3

编辑推荐:

   单细胞染色质可及性测序(scATAC-seq)极大地推进了基因调控景观的研究,支持在细胞类型水平上对染色质状态和顺式调控元件活性进行高分辨率分析。牧草是全球重要的农作物,具有庞大而复杂的基因组、高杂合性以及不完整的基因组资源。这些特性使得单细胞表观基因组分析尤其具有挑战性。目前

  
  • 单细胞染色质可及性测序(scATAC-seq)极大地推进了基因调控景观的研究,支持在细胞类型水平上对染色质状态和顺式调控元件活性进行高分辨率分析。牧草是全球重要的农作物,具有庞大而复杂的基因组、高杂合性以及不完整的基因组资源。这些特性使得单细胞表观基因组分析尤其具有挑战性。目前大多数可用的scATAC-seq工具都是为哺乳动物系统开发的。这些工具基于的假设与植物基因组的特征不符,通常需要大量的手动[1]调整。为了将染色质可及性与真实的生物学功能联系起来,许多[2]植物需要专门的计算工具和统一的参考资源。这些计算挑战阻碍了牧草研究的进展,并限制了单细胞数据在提高产量和增强抗逆性育种中的应用。为了填补这一空白,Yan等人开发了一个可靠且集成的分析框架scPlantReg(图1),用于研究植物的单细胞表观遗传调控,特别是针对模式牧草珍珠粟(Pennisetum glaucum[3]

    图1. scPlantReg平台中的六个关键应用特性。(a) scPlantReg提供了一个端到端的植物相关单细胞染色质可及性分析框架,整合了数据处理、质量控制、聚类、细胞类型注释、基序富集、调控预测以及通过Socrates2模块进行的跨物种比较。该平台针对植物scATAC-seq数据进行了优化,提高了重现性和稳定性,尤其是在珍珠粟等非模式物种中。(b) ScATACtor是一个基于机器学习的工具,利用全基因组可及性模式进行准确的细胞类型注释,并支持跨模态整合。(c) 在珍珠粟中的应用使得构建单细胞染色质可及性图谱成为可能,识别了特定于细胞类型的调控区域,并验证了WRKY22等转录因子在木质部发育中的功能。(d) 该框架还支持应激响应分析,揭示了热应激下的细胞类型特异性染色质动态。(e) scPlantReg托管了一个标准化的多物种scATAC-seq数据库,整合了主要草类的数据集,从而实现了比较分析。(f) 跨物种分析突出了即使在序列保守性不强的情况下,染色质可及性和转录因子基序层面的保守调控程序。总体而言,该平台将单细胞表观基因组数据与功能调控见解联系起来,支持牧草的基因发现和分子育种。使用BioRender创建。(https://BioRender.com/a16u6sj

    scPlantReg网站为植物相关单细胞染色质可及性分析提供了完整的端到端解决方案。该框架将许多关键分析步骤整合到一个一致且可重复的流程中,由核心Socrates2模块支持。Socrates2模块包括原始数据处理、质量控制、细胞聚类、细胞类型注释、转录因子基序富集、调控区域的功能预测以及跨物种比较的工具。这种集成设计特别适合植物特有的scATAC-seq数据,这类数据通常噪声水平较高,且对处理方法敏感[4]。通过使用标准化程序和植物特定参数,Socrates2有助于减少技术变异,提高结果稳定性,并降低非模式植物高质量scATAC-seq分析的门槛。即使在基因组复杂且注释有限的珍珠粟中,其表现也非常好。其在珍珠粟中的成功应用证明了该方法的可靠性,并支持scPlantReg在其他草类分析中的广泛可行性。

    scPlantReg的另一个重要技术组成部分是ScATACtor,这是一个用于植物scATAC-seq数据细胞类型注释的工具。在植物单细胞数据注释中的一个关键难点是,许多组织包含难以区分的密切相关的细胞类型,部分原因是非模式物种可用的标记基因有限。ScATACtor利用基于全基因组染色质可及性模式的监督机器学习来识别细胞类型。该方法使用在高质量参考数据上训练的随机森林分类器,不依赖于少量的标记区域。ScATACtor的性能优于几种现有的注释工具,并在不同数据集中实现了高准确性和稳定的表现。此外,该方法还支持scATAC-seq和scRNA-seq数据之间的跨模态注释。自动化预测和基于标记的验证的结合使用提供了可靠的细胞类型标签,支持非模式草类在不同组织和处理条件下的统一注释。

    作者使用具有强耐热性的重要牧草和谷物——珍珠粟来测试scPlantReg。珍珠粟具有复杂的基因组、高杂合性以及与主要作物相比有限的公共基因组资源。研究团队应用scPlantReg成功构建了珍珠粟的首个单细胞染色质可及性图谱,包括叶片和根部的多个发育阶段。该分析识别出了不同的细胞类型和超过70,000个可及的染色质区域,其中许多区域显示出细胞类型特异性模式。该框架进一步支持了功能发现。例如,WRKY转录因子被确定为木质部发育的潜在调控因子。WRKY的这一功能在草类中尚未得到广泛报道。作者重点关注WRKY22,并预测了其在木质部细胞中的目标调控区域。这些区域与参与木质素生物合成和细胞壁形成的基因相关。此外,这些调控作用通过实验验证得到了证实。这些结果表明,scPlantReg可以将单细胞表观基因组数据转化为有意义的生物学见解,支持发现关键基因和调控元件以改善牧草。作者还使用scPlantReg研究了珍珠粟在热应激下的染色质动态。他们为对照组和热处理后的幼苗生成了scATAC-seq数据,经过严格的质量过滤和批量校正,仅保留了用于下游分析的高质量细胞。研究人员分析了细胞类型组成的变化,发现维管细胞类型在热应激下表现出中等程度的富集。由于重复实验间质量指标一致且细胞类型注释稳定,这些结果表明观察到的变化很可能是由真实的生物学反应引起的,而非技术偏差。该框架还识别出了应激特异性的可及染色质区域。增殖细胞显示出最多的处理特异性区域,在热应激下更多区域获得了可及性。这项分析表明,scPlantReg可以可靠地解析细胞类型特异性的调控响应,为研究牧草的非生物胁迫适应提供了实用模型。

    这项工作对植物相关单细胞研究社区最重要的贡献之一是,scPlantReg网站包含了一个标准化的植物scATAC-seq数据统一数据库。该数据库整合了来自水稻(Oryza sativa)、玉米(Zea mays)、高粱(Sorghum bicolor)和珍珠粟等重要草类的多种组织和发育阶段的重新处理数据。来自植物的公共单细胞表观基因组数据往往分散且处理不一致,这些问题阻碍了有效重用和比较。scPlantReg通过使用相同的流程处理所有数据解决了这个问题。它统一了细胞类型注释并整合了额外的表观遗传信息。该网站支持可视化探索、基因可及性分析、动态轨迹分析、转录因子基序富集以及跨物种比较,支持植物和草类的大规模比较调控分析。为了展示网站的实用性,作者使用该数据库比较了不同草类间的调控模式,以识别进化过程中的保守调控程序。结果表明,调控保守性在功能模式上比在精确DNA序列相似性上更为明显。即使序列保守性较低,细胞类型特异性的可及性和相关的转录因子基序也在物种间得到保留。例如,一些共享的可及区域富集了AP2/EREBP家族基序,这些区域与跨草类保守的细胞壁形成途径相关。细胞类型特异性共享区域显示出与相应细胞身份匹配的基序一致富集。这些发现表明,单细胞表观基因组学可以揭示传统方法遗漏的功能保守性,为研究牧草的核心发育程序提供了新方法。

    scPlantReg代表了植物scATAC-seq数据整合和功能分析的重要进展。它将多个分析层次整合到一个针对植物基因组优化的系统中,并在基因组复杂的非模式物种中可靠运行。这项工作展示了在关键牧草珍珠粟中对发育和应激响应数据的稳健分析。大型数据集和计算分析使得关键调控因子的发现和实验验证成为可能。对于单细胞研究社区而言,scPlantReg提供了一个用于跨物种研究的统一数据库,并将单细胞染色质可及性数据转化为支持作物改良的细胞类型特异性调控见解。未来,该网站将有助于识别可用于精准基因组编辑的候选调控元件,以提高产量、质量和抗逆性。该平台是支持牧草单细胞研究持续发展的起点,并为功能调控基因组学和分子育种开辟了新的机会。

  • 作者对本文的贡献如下:撰写手稿:Li S;绘制图表:Xia M。两位作者都审阅了结果并批准了手稿的最终版本。

  • 由于在本研究中未生成或分析任何数据集,因此本文不适用数据共享。

    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号