在模式极端微生物Schrenkiella parvula中对DNA甲基转移酶的基因组范围分析:发育过程中及盐胁迫条件下的转录动态
《Annals of Applied Biology》:Genome-wide analysis of DNA methyltransferases in a model extremophyte, Schrenkiella parvula: Transcriptional dynamics during development and under salt stress
【字体:
大
中
小
】
时间:2026年04月23日
来源:Annals of Applied Biology 1.8
编辑推荐:
摘要
DNA甲基转移酶(DMTs)参与植物的应激反应和发育。Schrenkiella parvula是一种极端微生物模型,在多种逆境条件下仍能茁壮成长。然而,极端微生物中应激耐受性与表观遗传机制之间的相互作用仍不清楚。在这项研究中,我们首次在S. parvula中鉴定出DNA甲
摘要
DNA甲基转移酶(DMTs)参与植物的应激反应和发育。Schrenkiella parvula是一种极端微生物模型,在多种逆境条件下仍能茁壮成长。然而,极端微生物中应激耐受性与表观遗传机制之间的相互作用仍不清楚。在这项研究中,我们首次在S. parvula中鉴定出DNA甲基转移酶,并将其分为4个亚家族:两种甲基转移酶(METs)、三种染色体甲基转移酶(CMTs)、三种结构重排的甲基转移酶(DRMs)以及一种DNA甲基转移酶2(DNMT2)。预测的分子量(MW)范围从43.54(SpDNMT2)到176.58(SpMET2)kDa。进化选择压力的分析表明,Ka/Ks值低于1,表明在进化过程中存在强烈的负选择。顺式元件与应激反应、激素调节、光反应和发育相关。时空RNA-seq分析显示,在NaCl压力下DMTs的表达存在差异。在开花前用150 mM NaCl处理的果实中,MET1、MET2、CMT1和DRM2的表达下调;而在开花后处理的果实中,DRM1和DRM2的表达也下调。MET1基因在果实中特异性表达。基因表达模式取决于组织类型、发育阶段和盐胁迫的持续时间。SpDMT基因在NaCl压力下的转录本水平差异,以及顺式元件的存在,表明SpDMTs可能参与盐胁迫的适应。
1. 引言
DNA甲基化是最被充分研究的表观遗传修饰之一,参与细胞调节基因表达和抑制转座子活性的众多生物过程(Finnegan & Kovac, 2000; Zhang et al., 2023)。这一过程由称为DNA甲基转移酶(DMTs)的酶催化,它们将S-腺苷-L-甲硫氨酸(S-AdoMet)的甲基转移到胞嘧啶的C5或N4位点或腺嘌呤的N6位点。DNMT1负责将DNA链中建立的甲基化模式传递到新链,而DNMT3A和DNMT3B则是从头甲基化的酶,负责甲基化模式的建立和维持(Denis et al., 2011; Goll & Bestor, 2005)。在植物中,DNA甲基化由四个亚家族的DMTs控制:甲基转移酶(MET,哺乳动物DNMT1的同类物)、染色体甲基转移酶(CMT,植物特异性)、结构重排的甲基转移酶(DRM,哺乳动物DNMT3的同类物)和DNA甲基转移酶2(DNMT2)(Finnegan & Kovac, 2000; Genger et al., 1999; Yang et al., 2024)。MET1负责维持异染色质区域中的对称CG甲基化,这是主要的胞嘧啶甲基化类型。据报道,水稻中的两个MET1基因(OsMET1A和OsMET1B)在生长和发育过程中维持CG甲基化(He et al., 2011)。MET1B突变导致全基因组CG甲基化的丧失、发育异常,发芽的幼苗迅速出现坏死(Hu et al., 2014)。MET1的功能已在多个植物物种中得到阐明,包括拟南芥(Finnegan et al., 1996; Finnegan & Kovac, 2000)、玉米(Steward et al., 2000)、水稻(Teerawanichpan et al., 2004)、芸苔属植物(Fujimoto et al., 2006)和小麦(Li et al., 2021; Thomas et al., 2014)。拟南芥有三种CMT基因:AtCMT1、AtCMT2和AtCMT3,其中AtCMT3是主要的CHG/CHH甲基转移酶,负责维持CHG和CHH甲基化并稳定异染色质(Finnegan & Kovac, 2000; Frost et al., 2024; He et al., 2011)。芸苔属植物中有两个CMT基因,是CMT1和CMT2的同类物(Genger et al., 1999)。CMT1、CMT2和CMT3基因在营养组织和花组织中均有表达(Finnegan & Kovac, 2000; Genger et al., 1999)。大豆中的CMT编码基因在分生组织(如胚尖分生组织SAM)、根尖、幼叶、幼荚和种子等活跃复制的细胞中表达(Garg et al., 2014)。在植物物种中,DRMs(DRM1-3)对RNA导向的DNA甲基化(RdDM)至关重要(Read et al., 2022),它催化非CHG位点的胞嘧啶甲基化(Shaikh et al., 2022; Yang et al., 2024; Zhong et al., 2014)。DRM2催化RdDM位点的CHH甲基化,而CMT2已知能维持异染色质组蛋白H1区域的CHH甲基化(Matzke et al., 2015; Zhang et al., 2018)。DNMT2是一种tRNA甲基转移酶,在酵母、动物和植物中均有发现(Garg et al., 2014)。先前的研究表明,植物的DNA甲基化与生长、发育、次生代谢、胚胎发生以及对盐、寒冷和干旱等非生物胁迫的响应有关(Finnegan et al., 1996; Frost et al., 2024; Lodhi & Srivastava, 2025; Sharma et al., 2009; Skorupa et al., 2021; Wei et al., 2025; Yang et al., 2024)。关于DNA甲基化的研究主要集中在甘陆型模式植物(如拟南芥)以及水稻、棉花和小麦等作物上(Wei et al., 2025)。尽管关于DNA甲基化相关基因调控的信息有限,但盐生植物被认为是一个有价值的研究资源(Wei et al., 2025; Yang & Lan, 2026)。植物中DNA甲基化的损伤会导致DNA低甲基化以及发育异常,如植株变小、开花时间改变、叶片大小异常、番茄无法成熟和胚胎发生缺陷(Finnegan et al., 1996; Frost et al., 2024; Kim et al., 2008; Zhang et al., 2018)。拟南芥的drm1drm2cmt3三重突变体在植物发育方面表现出多效性效应,如植株变小、生长缓慢(Cao & Jacobsen, 2002)。GhDMT6沉默的棉花幼苗表现出表型改变和增强的耐逆性(Yang et al., 2024)。在盐胁迫条件下,拟南芥和小麦显示DNA甲基化调节HKT转运蛋白的转录(Baek et al., 2011; Kumar et al., 2017)。AtHKT1的远端启动子区域包含一个小的RNA靶向区域,在CHG和CHH区域发生甲基化。拟南芥的DNA甲基化缺陷突变体met1-3表现出胞嘧啶甲基化的丧失和对盐胁迫的敏感性增加(Baek et al., 2011)。Zhang等人(2023)报道了一种野生 Pear(Pyrus betulaefolia)中假定的DMT基因表达水平的变化,该品种具有环境胁迫耐受性。AtMYB74转录因子受RdDM的调控,以响应盐胁迫(Xu et al., 2015)。NaCl处理的向日葵叶片在CG位置的DNA甲基化水平高于根部(Liu et al., 2023)。在最近的一项研究中,长时间盐胁迫下,盐生植物Paspalum vaginatum的基因组元件中5-甲基胞嘧啶(5mC)的甲基化水平增加(Wei et al., 2025)。一种采用C4光合作用的盐生植物Suaeda aralocaspica表现出全局甲基化模式的降低,以及DNA甲基化介导的参与光合作用和盐胁迫响应的基因调控(Yang & Lan, 2026)。这些发现表明DNA甲基化在盐生植物的盐胁迫响应中起着关键作用。大约10.7%的世界陆地面积受到盐度的影响(FAO, 2024),盐度是严重影响作物生长和产量的主要非生物胁迫之一(Hajiboland et al., 2018)。极端微生物被定义为能在其他植物无法生存的极端环境中生存的植物(Eshel et al., 2017)。Schrenkiella parvula(同义词:Eutrema parvulum, Thellungiella parvula)是十字花科的一个著名极端微生物模型,以其短生命周期和完整的基因组序列而著称。它是土耳其Tuz G?lü(盐湖)岸边的特有物种(Oh et al., 2014; Tran et al., 2023)。它能在高盐度(高达600 mM NaCl)(He et al., 2016; Tran et al., 2023)、干旱、低温和高温条件下生存,以及锂和硼的暴露下也能存活(Oh et al., 2014; Wang et al., 2021)。S. parvula与盐敏感的拟南芥(Arabidopsis thaliana)有亲缘关系,代表了对多种同时存在的高浓度有毒离子的适应性(Jarvis et al., 2014; Oh et al., 2014)。S. parvula的耐逆性得益于多种特征的结合,包括幼苗时期主根的生长、木质部导管扩张、发展出更厚的多肉叶片以维持组织水分水平,以及从营养阶段到生殖阶段的成功过渡(在盐胁迫下早期开花)(Tran et al., 2023)。基因组研究表明,S. parvula拥有一组比其甘陆型亲缘植物更丰富的糖转运蛋白基因。此外,S. parvula在长期盐胁迫条件下能迅速增加并维持大量的渗透调节物质和渗透保护剂(Li et al., 2023)。Jarvis等人(2014)报告称,cation/Proton Antiporter-1(CPA1)基因家族可能有助于S. parvula的盐耐受性。CPA1家族中的一个成员Na+/H+反转运蛋白基因Salt Overly Sensitive 1(SOS1)由SOS2和SOS3激活,从而赋予比拟南芥SOS1更高的盐耐受性(Jarvis et al., 2014)。在盐胁迫下,Schrenkiella的主根生长减少程度小于拟南芥(Sun et al., 2022)。例如,S. parvula在125 mM NaCl下的主根生长增加,而在175 mM NaCl下减少。与此相反,拟南芥的根在125 mM NaCl压力下生长减少。这种植物与其甘陆型亲缘植物(拟南芥)相比的另一个优势是在高盐度条件下能降低叶片表面温度(Tran et al., 2023)。S. parvula根中的脱落酸(ABA)水平在3小时NaCl胁迫后迅速增加,并且高于拟南芥根中的ABA水平,尽管两种植物都观察到了NaCl胁迫诱导的ABA增加(Li et al., 2023)。众所周知,表观遗传修饰,包括DNA甲基化和组蛋白修饰,在应激耐受性、适应性和进化过程中起着重要作用。极端微生物也从这些修饰中受益(Cao et al., 2012; Qiao et al., 2025; Zhang et al., 2024)。因此,了解生物和非生物胁迫下表观遗传标记的作用一直是研究的重点领域(Qiao et al., 2025; Talarico et al., 2024)。在一株耐碱的盐生植物Chloris virgata中,盐胁迫处理导致根部DNA甲基化变化增加(5.29%),而叶片仅为0.75%,这表明DNA甲基化可能在盐耐受性的形成和遗传中起关键作用(Cao et al., 2012)。Skorupa等人(2021)报道,在盐胁迫处理的甜菜(Beta vulgaris L.)的启动子位置CpG位点观察到DNA低甲基化,而在盐生甜菜Beta vulgaris ssp. maritima中观察到DNA高甲基化,这表明DNA甲基化与盐生植物的盐耐受性有关。基于盐生植物的研究可以为提高作物的非生物胁迫耐受性提供有价值的信息(Moinoddini et al., 2023; Rengasamy, 2006)。了解盐生植物适应盐环境的进化过程和相关表观遗传机制有助于我们开发耐逆性作物(Jarvis et al., 2014)。尽管已知极端微生物能在盐度和其他非生物胁迫下茁壮成长,但它们的应激适应机制,特别是涉及DNA甲基化的机制,仍不甚清楚。为了更好地理解S. parvula的盐耐受性机制,需要进一步研究表观遗传修饰在应激响应中的作用。我们推测DNA甲基化可能对其耐盐能力有显著影响。使用生物信息学工具/数据库对S. parvula的DMT基因进行了计算机分析,包括两种METs、三种CMTs、三种DRMs和一种DNMT2。在这项研究中,我们旨在鉴定和表征S. parvula中的DNA甲基转移酶,并研究它们的物理和化学性质、系统发育关系、亚细胞定位、染色体位置、基因组一致性、Ka/Ks比值、保守基序、基因结构、启动子区域的顺式作用调控元件以及蛋白质3D结构。此外,还分析了不同发育阶段和盐胁迫条件下的基因表达谱型。这些分析可以为理解极端微生物中表观遗传调控与应激响应转录行为之间的关系提供重要框架。未来,可以将SpDMT基因转移到作物物种中,以提高其对极端条件的耐受性。
2. 材料与方法
2.1 在S. parvula中鉴定DMT基因
从拟南芥信息资源(TAIR;https://www.arabidopsis.org/)(表S1)和Phytozome(版本13;https://phytozome.jgi.doe.gov/pz/portal.html)中检索到了20个拟南芥和水稻的DMT蛋白序列。这些序列用于使用BLASTP工具在Phytozome中搜索S. parvula v2.2基因组(Phytozome基因组ID:574,NCBI分类ID:98039)的SpDMTs。BlastP方法用于筛选合适的候选者(Safder et al., 2021)。使用了三个关键参数进行基因鉴定,包括E值、%身份和比对长度(align len)。常用的E值截止范围是从≤1 × 10^-10到1 × 10^-5(Safder et al., 2021)。如果SpDMT候选者的序列与拟南芥DMT蛋白的序列身份超过63%且e < 10^-10,则接受为同源蛋白序列。通过在基于HMMER的SMART(Simple Modular Architecture Research Tool,网址:http://smart.embl-heidelberg.de/)(Letunic等人,2012年)和NCBI CDD(网址:https://www.ncbi.nlm.nih.gov/cdd/)数据库中检索,确认了S. parvula候选蛋白质的几个域,包括DNMT1-RFD、BAH、DNA_methylase、CHROMO、UBA和SCOP d1dcta_。如果缺乏保守的DMT域,其他候选基因就被排除在外。根据染色体位置,这九个DMT基因分别被命名为SpMET1、SpMET2、SpCMT1、SpCMT2、SpCMT3、SpDRM1、SpDRM2、SpDRM3和SpDNMT2。九个SpDMT蛋白的理化特性,如等电点(pI)、理论分子量(MW)和Hydropathy平均值(GRAVY),是在ExPASy ProtParam服务器(网址:https://web.expasy.org/protparam/)上在线预测的(Gasteiger等人,2005年)。
2.2 细胞内定位预测
使用两个在线预测工具对DMT蛋白的细胞内定位进行了预测,包括Cellular Localization(CELLO)服务器(网址:http://cello.life.nctu.edu.tw/)(Yu等人,2006年)和基于加权k最近邻的蛋白质细胞内定位预测工具WoLFPSORT(网址:https://wolfpsort.hgc.jp/)(Horton等人,2007年;Nakai & Horton,1999年)。使用的查询序列是预测的SpDMT蛋白序列。
2.3 系统发育树
为了了解9个SpDMT与其他DMT之间的进化关系,从拟南芥信息资源(TAIR)、国家生物技术信息中心(NCBI)和Ensembl Plants(网址:https://plants.ensembl.org/index.html)(Bolser等人,2017年)中检索了来自不同植物物种(如拟南芥和水稻)的共计29个DMT蛋白序列。使用MEGA11(分子进化遗传学分析)软件中的ClustalW算法进行了多序列比对。使用MEGA11软件中的最大似然(ML)方法和Poisson模型构建了系统发育树(网址:https://www.megasoftware.net/)。树拓扑结构通过最近邻交换(NNI)进行了优化,并使用1000次自助法复制来估计分支的可靠性(Tamura等人,2021年)。
2.4 保守基序和SpDMT基因的结构
使用MEME(Multiple Expectation maximizations for Motif Elicitation)工具套件(网址:http://meme-suite.org/tools/meme)确定了SpDMT的保守基序,设置如下:最大基序数量为10个;每个序列中基序出现的次数为0次或1次(zoops);以及经典的基序发现模式(Bailey & Elkan,1994年)。使用Gene Structure Display Server(GSDS 2.0,网址:http://gsds.gao-lab.org/)(Hu等人,2015年)分析了基因的外显子-内含子组织。输入的序列格式为FASTA,提交了两种类型的序列(编码序列-CDS和基因组序列)进行解析。
2.5 染色体分布
从Phytozome数据库中检索了S. parvula基因组中每个染色体上SpDMT基因的物理位置,并使用在线工具Mapgene2chrom 2.1(MG2C v2.1,网址:http://mg2c.iask.in/mg2c_v2.1/)(Chao等人,2021年;Chao等人,2015年)绘制了染色体分布图。染色体位置、染色体编号以及基因的起始和结束位置是从Phytozome和NCBI中提取的(Sayers等人,2025年)。
2.4 基因组同线性分析和非同义/同义替换比率(Ka/Ks)的计算
为了研究Schrenkiella、水稻和拟南芥DMT之间的进化关系,使用了基于Circo的在线工具Circoletto(网址:https://bat.infspire.org/circoletto/)(Krzywinski等人,2009年)和TBtools-II(Chen等人,2023年)进行了基因组同线性比较。Circoletto提供了BLAST序列比较结果以显示序列相似性。根据得分/max比率使用蓝色(≤0.25)、绿色(≤0.50)、橙色(≤0.75)和红色(>0.75)进行着色。将S. parvula的9个DMT蛋白序列和拟南芥及水稻的20个DMT蛋白序列分别以FASTA格式包含在查询和数据库文件中。对于共线性测试,从Phytozome数据库中检索了S. parvula、A. thaliana和Oryza sativa的基因组信息(gene.gff3和组装文件)。使用TBtools-II工具包中的Dual Synteny plotter(MCScanX,Chen等人,2023年)确定了共线性关系。为了识别进化过程中对SpDMT基因的选择压力,使用TBtools-II中的简单Ka/Ks计算器计算了非同义(Ka)和同义(Ks)替换率以及S. parvula中DMT基因对之间的Ka/Ks值(Chen等人,2023年)。Ka/Ks比率小于1表示负选择或稳定选择(Zhao等人,2025年)。基于每年每个同义位点的替换率(T,百万年;MYA)使用以下公式计算了分歧时间:T = Ks/2λ(其中λ = 1.5 × 10^-8,这是十字花科植物的分歧率)(Pu等人,2018年)。
2.7 蛋白质3D结构分析
从Phytozome数据库获取的氨基酸序列用于预测所有鉴定出的SpDMT蛋白的三维(3D)结构。使用SWISS-MODEL(网址:https://swissmodel.expasy.org/interactive)生成3D蛋白质模型,该工具通过选择合适的模板应用基于同源性的建模。模型选择根据序列身份、覆盖率和全局模型质量估计(GMQE)得分进行。每个蛋白质序列被加载到SWISS-MODEL服务器中,获得了蛋白质的3D模板(Waterhouse等人,2018年)。为了进一步确认和注释蛋白质结构,使用Phyre2.2网络工具(Protein Homology/analogY Recognition Engine V 2.2,网址:http://www.sbg.bio.ic.ac.uk/phyre2)独立分析了SpDMT蛋白序列。使用Phyre2.2检测了百分比覆盖率、β螺旋和β折叠片层(Kelley等人,2015年)。SWISS-MODEL和Phyre 2.2工具的结合使用提供了3D和二级蛋白质结构的稳健预测和确认。
2.8 启动子中的顺式作用调控元件
使用Phytozome数据库从S. parvula基因组中提取了每个基因转录起始位点上游1500 bp的序列(基因的启动子区域)。使用PlantCARE数据库分析了提取的启动子区域,该数据库基于整理的数据确定了植物的已知顺式元件。记录了顺式元件的数量和类型(网址:http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)(Lescot等人,2002年)(表S3)。顺式元件包括核心启动子基序(例如CAAT-box和TATA-box)以及与激素信号传导、应激反应和植物发育相关的调控元件。为了进行比较分析和可视化,使用Shinyheatmap软件(Khomtchouk等人,2017年)对顺式元件进行了功能分类。这种启动子分析和顺式元件的功能分类提供了与基因转录相关的潜在调控机制的见解。
2.9 植物材料及胁迫处理
从在?MS琼脂平板上生长4天的S. parvula幼苗的根组织中获得了RNA-seq数据,并将其转移到含有0或175 mM NaCl的新鲜培养基中,分别处理3小时、24小时和48小时(n=3组,每组45根)(图8a)。每种条件使用了三个生物学重复(Li等人,2023年)。此外,在S. parvula的基因表达图谱项目中,不同发育阶段的多种植物器官(根、茎、叶、花和角果)也接受了150 mM NaCl的处理(Wijesinghege等人,2022年)(图7和8b)。Wijesinghege等人(2022年)报告了S. parvula在盐胁迫下超过30种组织和发育阶段的转录组图谱。该研究揭示了在高盐度条件下,组织间和发育阶段间基因表达模式的时空调控机制。在土壤中生长的植物接受了150 mM NaCl浓度的处理,每种条件使用了3-5个生物学重复。对于S. parvula的基因表达,8天大的幼苗暴露于NaCl中3天,然后收获其茎和根进行基因表达分析(样本名称:Shoot_D8_3DAT, Root_D8_3DAT)。12天后的幼苗接受了150 mM NaCl处理7天(样本名称:Shoot_D12_7DAT, Root_D12_7DAT)。在NaCl处理的第7天收获了成熟和幼叶(样本名称:Mature leaves_1WAT, Young leaves_1WAT),而在第二周收集了花和角果(样本名称:Flowers_salt-AF, Flowers_salt-BF, Silique_saltBF, Silique_saltAF,AF:开花后的盐处理,BF:开花前的盐处理)。在第3周收集了7周大的植物的茎(样本名称:Stem)。从收获的茎、根、成熟叶、幼叶、茎、花和角果中获取的数据用于评估NaCl处理下SpDMT基因的转录水平(Wijesinghege等人,2022年)。
2.10 RNA-seq分析
从NCBI Sequence Read Archive(SRA,Li等人,2023年)下载了根组织的表达数据。重新分析了总共21个文库,包括12个对照样本和9个NaCl处理样本(对照:ERR10557989, ERR10557990, ERR10557991, ERR10557992, ERR10557993, ERR10557994, ERR10557995, ERR10557996, ERR10557997, ERR10557998, ERR10558000;NaCl处理:ERR10558001, ERR10558002, ERR10558003, ERR10558004, ERR10558005, ERR10558006, ERR10558007, ERR10558008, ERR10558009)(图8a)。简要地,使用FastQC评估了21个SRA数据集的质量,包括GC含量、每个碱基的序列质量和适配器污染情况。随后使用Trimmomatic版本v0.39(Bolger等人,2014年)进行了适配器去除和基于质量的修剪,具体步骤如下:首先使用ILLUMINACLIP函数和TruSeq3-PE-2.fa适配器库以及2:30:10的参数去除适配器序列;其次应用SLIDINGWINDOW修剪,当平均质量在4碱基窗口内降至Phred分数20以下时切割读段;第三,从每个读段的起始(LEADING)和末端(TRAILING)去除低质量碱基(Phred分数<3);最后,使用MINLEN参数丢弃修剪后长度小于36个碱基的读段。使用FastQC对处理后的读段进行了最终的质量评估,以便进行后续分析。使用Salmon(一种轻量级的方法,用于量化转录本水平,Patro等人,2017年)将清理后的读段映射到S. parvula的转录组(Dassanayake等人,2011年;Oh等人,2014年)。使用自动库类型推断(?l A)量化了转录本丰度,并进行了GC和序列特异性偏置校正以提高准确性。根的转录本丰度以每百万转录本(TPM)表示,并以原始计数表示。使用R/Bioconducter包DESeq2(Love等人,2014年开发的用于基因排序和可视化的统计框架)进行了对照样本和NaCl处理样本之间的差异表达基因(DEGs)分析。DESeq2包提供了标准化(中位数比率方法)、分散性评估、FDR校正和收缩计算(Love等人,2014年)。在分析之前,过滤了表达量较低的基因。使用调整后的p值(假发现率,FDR)阈值<.05来确定DEGs,同时设置了≥1的绝对log2倍数变化截止值。除非另有说明,否则使用Benjamini–Hochberg(BH)程序计算了调整后的p值(Haynes,2013年)。DESeq2分析中的DMT基因表达数据显示在表S4中(Dawadi等人,2025年;Haynes,2013年;Love等人,2014年)。统计显著性通过Padj值表示,这些Padj值在DESeq2中计算(表S4)。为了研究组织和发育阶段特异性的表达水平,从Phytozome v13数据库(Wijesinghege等人,2022年)提取了时空基因表达图谱数据。使用Joint Genome Institute Genome门户(网址:https://genome.jgi.doe.gov/portal/SchparEProfiling/SchparEProfiling.info.html)探索了时空基因表达谱(项目ID:1263770)。使用GraphPad Prism v9基于标准化表达值创建了热图(图8b)来可视化DMT基因的表达(图8b)。
3 结果
3.1 在Schrenkiella parvula基因组中鉴定DNA甲基转移酶(METs、CMTs、DRMs和DNMTs)
拟南芥和水稻分别有11个和9个DMT(表S1),而异源六倍体物种如小麦(52个)和棉花(33个)的DMT基因数量更多(Gahlaut等人,2020年;Yang等人,2024年),这可能是由于全基因组复制或多倍体化事件导致基因家族的扩展。在S. parvula中检测到总共9个DMT(SpMET1、SpMET2、SpCMT1、SpCMT2、SpCMT3、SpDRM1、SpDRM2、SpDRM3和SpDNMT2),并根据它们在染色体上的位置进行了命名(表1)。表1显示了S. parvula中DNA甲基转移酶的理化特性。序列ID
基因名称
染色体位置
链 strands
CDS (bp)
长度 (aa)
分子量 (kDa)
等电点 (pI)
Hydropathy平均值 (GRAVY)
PhytozomeDMT基因和DMT蛋白的物理化学性质,包括染色体位置、链类型、CDS(碱基对)、氨基酸长度(aa)、分子量(MW)、等电点(pI)和平均疏水性(GRAVY),是使用在线工具Expasy ProtParam提取的(表1)。DMT蛋白的长度从382(SpDNMT2)到1571(SpMET2)个氨基酸不等。预测的分子量范围从43.54(SpDNMT2)到176.58(SpMET2)千道尔顿(kDa),等电点值在4.98(SpDRM1)到6.68(SpCMT3)之间。所有S. parvula的DMT蛋白都显示负的GRAVY值和低的pI值,其中SpDRM1的酸性最强。这些发现表明这些蛋白是亲水性的且通常呈酸性,这可能表明它们与染色质相关复合物有相互作用。
3.2 系统发育分析和亚细胞定位预测
使用ClustalW和MEGA11软件分析了S. parvula的DMT蛋白与A. thaliana(At)和O. sativa(Os)的DMT蛋白之间的系统发育关系。拟南芥有11种DMT蛋白,而水稻有9种。来自三种植物的29种DMT蛋白被分为四个主要亚家族:MET(蓝色)、CMT(紫色)、DRM(红色)和DNMT(绿色),如图1所示。最大似然树表明SpMET1和SpMET2与AtMETs和OsMETs有关,而SpCMT1、SpCMT2和SpCMT3分别与AtCMT1、AtCMT3和AtCMT2位于同一支系,这表明S. parvula和拟南芥之间的CMT谱系具有很强的保守性。同样,S. parvula的DRM蛋白与拟南芥和水稻的DRM蛋白也密切相关。系统发育树显示,SpDNMT2与AtDNMT2有密切的关系。
3.3 S. parvula基因的染色体定位
为了研究SpMET、SpCMT、SpDRM和SpDNMT2基因的染色体位置,使用MG2C v2.1工具将其在染色体上可视化(图2)。属于不同亚家族的DNA甲基化相关基因都位于一个基因组区域。例如,来自不同亚家族的MET1、CMT2和DNMT2基因分别分布在2-4号染色体上。尽管这三个基因属于同一个亚家族,但它们的染色体位置不同。属于DRM亚家族的三个基因(DRM1-3)分布在3-1、5-6和6-6号染色体上。这种染色体组织表明,SpDMT基因主要通过复制事件和染色体重排而多样化。DMT亚家族在多个染色体上的分布表明,S. parvula拥有多样化的DNA甲基化机制,这可能有助于其适应极端环境。
3.4 基因结构和保守基序
基因结构和保守基序分别在图3和图4中展示了。MET、CMT、DRM和DNMT2基因的外显子和内含子组织已经进行了全面分析。外显子用黄色框表示,内含子用黑色线条表示(图3)。在S. parvula的MET1和MET2基因中,有12个外显子和11个内含子。CMT亚家族的基因包含18-23个外显子和17-22个内含子。在DMT基因中,DRM1的外显子数量最少(8个),内含子数量也最少(7个),而DRM2和DRM3基因分别有10-9个外显子和9-8个内含子。DNMT2基因有10个外显子和9个内含子(图3)。
3.5 基因组和Ka/Ks比率
Circoletto工具使用‘score/max’比率进行着色,其中蓝色≤0.25,绿色≤0.50,橙色≤0.75,红色≥0.75(Darzentas,2010)。根据位点得分对RNA序列进行了着色。Circoletto图显示了拟南芥和水稻中SpDMTs和DMTs之间的序列相似性(图5)。研究表明,S. parvula的9个DMT基因和A. thaliana的DMT基因具有相似的进化起源。例如,SpMET1-AtMET1、SpMET2-AtMET1和SpCMT3-AtCMT2蛋白对之间的序列相似度超过75%。SpDRM1与AtDRM3之间的序列相似度为50%-75%。S. parvula和A. thaliana之间的五种蛋白对(包括SpCMT1-AtCMT1、SpCMT2-AtCMT3、SpDRM2-AtDRM1、SpDRM3-AtDRM1和SpDNMT2-AtDNMT2)的相似度在25%-50%之间。拟南芥和拟南芥之间的序列相似性表明这些核心甲基化酶具有很强的保守性。有趣的是,使用Circoletto工具未能检测到S. parvula和O. sativa DMT蛋白之间的序列相似性。这一结果揭示了双子叶植物和单子叶植物之间的进化距离,或者单子叶植物/双子叶植物特有的分化,这可能会减少可检测到的序列相似性。
3.6 SpDMT蛋白的3D结构
为了预测所有SpDMT蛋白的3D结构,将每个蛋白序列加载到SWISS-MODEL(https://swissmodel.expasy.org/interactive)程序中,并在图6中展示了这些蛋白的3D分析结果。结构预测为了解DNA甲基转移酶的功能进化和保守性提供了有价值的见解,因为它们的酶活性依赖于保守的催化折叠和相关染色质伙伴的相互作用。当蛋白序列对齐后,只有氨基酸1425(Leu)是保守的。由于MET、CMT、DRM和DNMT2蛋白包含不同的结构域,因此保守性较低也是预期结果。
3.7 启动子区域的顺式作用调节元件
为了预测SpDMT基因的功能特性,通过搜索所有SpDMT基因转录起始位点上游1500 bp的区域来分析启动子区域的顺式元件。PlantCARE数据库显示了66种类型的顺式作用元件,它们被分为五组:光响应(17种)、胁迫响应(15种)、常见或未知的启动子元件(14种)和植物发育相关元件(10种)(图S1)。从PlantCARE软件中提取的MET1、MET2、CMT1、CMT2、CMT3、DRM1、DRM2和DNMT2基因的启动子中顺式作用调节元件的总数在表S3中显示。启动子分析共检测到993个顺式元件:光响应元件(ATC基序、ATCT基序、Box 4、Box-II、CAG基序、chs-CMA1a、chs-CMA2a、GA基序、GATA基序、G-box、GT1基序、I-box、LAMP元件、MRE、Sp1、TCCC基序、TCT基序)、脱落酸(ABRE)响应元件、生长素(AuxRR-core、TGA元件)、赤霉素/MeJA(GARE基序、P box、TGACG基序、TATC-box、CGTCA基序)、水杨酸(SA)响应元件、乙烯(ERE)响应元件、低温(WRE3)响应元件、高温(WRE3)响应元件、干旱(ABRE、MYB、MYC、MBS)响应元件以及应激响应元件(TC-rich repeats、STRE)、厌氧诱导(ARE)响应元件、伤口响应(WUN基序)元件、病原体响应(W box)元件、分生组织表达(CAT-box)元件、发育相关元件(AAGAA基序、CCGTCC基序)、α-淀粉酶启动子中保守的序列(A-box)、MYBHv1结合位点(CCAAT基序、F-box)、胚乳表达(GCN4基序)、种子特异性调控(RY元件)、栅栏组织叶肉细胞分化(O2元件)以及黄酮类生物合成(MBSI)响应元件。其中最大的一组是常见的或未知的顺式元件,共有661个成员。第二大组包含了143个与应激响应相关的元件,这些元件为了解SpDMT基因在耐盐性中的潜在作用提供了重要线索。研究发现,S. parvula的CMT3基因与启动子区域和激素响应相关的顺式元件数量最多。与其他DMT类相比,SpCMTs的启动子中常见的/未知顺式元件数量最多(205个),而SpDRM1中含有最多的CAAT-box元件(35个),SpCMT3中含有最多的AT-TATA-box元件(14个)和TATA-box元件(84个)。在DRMs(53个)和CMTs(35个)的启动子中观察到了最多的与应激和激素相关的顺式元件。最丰富的应激响应特异性元件是MYB、MYC和ABA响应元件(ABRE)。这些DMT亚家族可能比其他DMT亚家族更受应激因子和植物激素的转录调控,这有助于S. parvula适应盐胁迫。SpMET2基因缺乏ABRE,而SpCMT3含有最多的ABRE。ABRE的存在可能表明DMT基因参与了脱落酸(ABA)介导的调控途径。除了SpMET1和SpDRM3之外,所有SpDMT基因中都确定存在一个用于厌氧诱导的顺式调节元件ARE。预测SpMET2、SpDRM1和SpDRM3的启动子中存在低温特异性LTR元件,这表明这些基因可能受低温胁迫的转录调控。然而,在任何SpMET基因中均未检测到高温特异性WRE3基序,但PlantCARE预测CMT1、CMT3、DRM1和DNMT2基因中可能存在该基序。所有DMT基因中都检测到了与非生物胁迫响应相关的MYB和MYC基序,但CMT3基因除外。另外,在CMT3、DRM1和DNMT2的启动子中还检测到了MYB结合位点(MBS)。此外,MET1、MET2和DNMT2三个基因中存在TC-rich重复序列。应激响应元件(STRE)仅存在于MET2、CMT1、DRM2和DNMT2基因中。除了CMT1和DRM1基因外,S. parvula的所有DMT基因都含有与病原体响应相关的W-box。SpCMT2基因中同时存在与赤霉素响应相关的GARE基序和P box。在SpMET1的启动子区域中还发现了一个与赤霉素响应相关的TATC-box。SpDRM2的启动子区域中存在两个与MeJA响应相关的基序,即CGTCA基序和TGACG基序。SpMET2的启动子中还存在与生长素相关的AuxRR-core和TGA元件。SpCMT3中也含有AuxRR-core。MET1、CMT2和CMT3的启动子中存在一个与水杨酸(SA)响应相关的TCA元件。在SpMET2和SpCMT2基因中都检测到了乙烯响应元件ERE。S. parvula的DNMT2基因中含有三个ABRE和一个TGACG基序,表明其可能在ABA和MeJA响应中发挥作用。S. parvula的DMT基因包含光响应元件,其中G-box元件(21个)和Box-4元件(20个)的数量最多。例如,SpCMT3含有五个G-box元件,而SpDNMT2含有五个Box-4元件。LAMP元件和Sp1仅存在于SpDNMT2的启动子中。每个DMT基因包含不同的光响应顺式元件。TCCC基序仅存在于SpCMT1基因中。与MET1、MET2、CMT1、CMT2、DRM1和DRM2基因相比,SpDNMT2基因含有最多的光响应顺式元件。发育相关元件中,AAGAA基序(10个)和CCGTCC基序(8个)的水平最高。与黄酮类生物合成基因调控相关的MYB结合位点(MBSI)以及与种子特异性调控相关的RY元件仅存在于SpMET1的启动子中。参与zein代谢调控的O2元件存在于SpDRM1基因中。在SpCMT3的启动子中存在一个与分生组织表达相关的CAT-box。在SpDRM3的启动子中检测到了与胚乳表达相关的GCN4基序。总体而言,使用PlantCARE工具识别的顺式元件表明DMT基因在S. parvula中具有不同的潜在功能,包括应激响应、激素响应、光响应和发育相关功能。
3.8 在盐胁迫条件下的基因表达分析
为了研究S. parvula DMTs的表达水平,我们从Li等人(2023年)的研究中提取了在175 mM NaCl处理后3小时、24小时和48小时的根部的RNA-seq数据。此外,我们还从Wijesinghege等人(2022年)的时空基因表达图谱中提取了在150 mM NaCl处理下S. parvula不同器官和发育阶段的RNA-seq数据。我们首先基于每百万转录本(TPM)值分析了S. parvula DMTs在不同发育阶段(根、茎、叶、花、角果和幼苗)中的表达水平(图7)。结果显示,MET1仅在角果中表达,而在其他器官或发育阶段未检测到其表达。DRM2在角果(TPM:9.54)和花(TPM:2.31)中表达,而在其他组织和阶段中的表达量很小或不存在。其余的DMTs在所有组织中都有表达。这些发现表明某些DMTs(如MET1和DRM2)表现出组织特异性表达模式(图7)。此外,我们还在150 mM NaCl处理下评估了DMTs在不同发育阶段和组织中的表达水平(Wijesinghege等人,2022年),以确定它们的表达在盐胁迫下发生改变的具体发育阶段和组织。因此,RNA-seq数据来自两个项目(Li等人,2023年;Wijesinghege等人,2022年)。图7显示了在150 mM NaCl处理下S. parvula(n=3–5)的器官和发育阶段的DMTs平均表达水平(Wijesinghege等人,2022年)。处理细节如下:Shoot_D8:8天大的幼苗,用150 mM NaCl处理3天;Root_D8:8天大的根,用150 mM NaCl处理3天;Shoot_D12:12天大的幼苗,用150 mM NaCl处理7天;Root_D12:12天大的根,用150 mM NaCl处理7天;Mature_leaves:5周大的成熟叶,用150 mM NaCl处理1周;Young_leaves:5周大的幼叶,用150 mM NaCl处理1周;Stem:7周大的茎,用150 mM NaCl处理3周;Flowers:花朵接受150 mM NaCl处理;Silique:角果接受150 mM NaCl处理;Seedling_D4:4天大的幼苗,用150 mM NaCl处理(Wijesinghege等人,2022年)。统计显著性通过DESeq2计算的调整后p值(Padj)显示(表S4b)。根据DMTs在NaCl处理下的表达变化,将九个感兴趣的基因分为三组。第一组包括表达变化大于1的DMTs,这些基因被认为是表达变化较大的。这组包括MET2(Log2FC:?1.9)和CMT1(Log2FC:?1.2),在175 mM NaCl处理后3小时;以及CMT2(Log2FC:?1.14),在175 mM NaCl处理后24小时(图8a和表S4)。此外,在开花前用150 mM NaCl处理的角果的时空RNA-seq数据中,MET1、MET2、CMT1和DRM2的Log2FC值分别为?1.9、?2.3、?1.6和1.9。在开花后处理的角果中,DRM1和DRM2的Log2FC值分别为?1.2和?2.4(图8b和表S4)。
在盐胁迫条件下,我们对S. parvula中的DNA甲基转移酶(DMTs)进行了RNA-seq分析。(a)比较了在盐胁迫(175 mM NaCl)和对照条件(0 mM NaCl)下S. parvula根部的MET1、MET2、CMT1、CMT2、CMT3、DRM1、DRM2和DNMT2基因的平均表达水平(Li等人,2023年)。每种条件使用了三个重复样本(Li等人,2023年)。(b)在盐胁迫(150 mM NaCl)和对照条件(Wijesinghege等人,2022年)下,不同组织和发育阶段的DMTs表达谱。组织样本和处理细节如下:Root_D8和Shoot_D8:8天大的植物,处理后3天;Root_D12和Shoot_D12:12天大的植物,处理后7天;Mature leaves:5周大的植物,处理后1周;Young leaves:5周大的植物,处理后1周;Seedling_D4:7周大的植物,处理后2周;Stem:7周大的植物,处理后3周;Flowers_SAF:6周大的植物,开花后的盐处理;Silique_SAF:7周大的植物,开花前的盐处理;Silique_SBF:7周大的植物,开花前的盐处理。每种条件使用了3–5个生物学重复样本(Wijesinghege等人,2022年)。第二组包括表达变化中等的DMTs(0.5至1)。在根部,这包括MET2(在处理后24小时和48小时的Log2FC分别为0.57和0.69),以及CMT2(在处理后3小时和48小时的Log2FC分别为?0.78和?0.8)。在4天大的植物的根部,处理后3小时、24小时和48小时的DRM3和DNMT2基因被归为第三组,表明它们在盐胁迫下的表达变化较弱(图8b)。在时空RNA-seq数据中,第二组(表达变化中等)包括在开花前用150 mM NaCl处理的角果中的MET1(Log2FC:?0.55),在年轻叶片中的MET2和CMT1(Log2FC分别为?0.59和?0.56),以及在用150 mM NaCl处理前后处理的8天大的根、8天大的幼苗和角果中的CMT2(Log2FC分别为0.55、0.63、0.62、0.51、?0.91和0.64)。在开花后用150 mM NaCl处理的角果中的CMT3的Log2FC为?0.63,而在开花前处理的成熟叶片和花朵中的DRM2的Log2FC分别为?0.53和0.94。在各种发育阶段的其余DMTs被归为第三组,表明它们在盐胁迫下的表达变化最小(Log2FC < 0.5)(图8b)。值得注意的是,MET1在NaCl处理下的任何器官或时间点都没有显示出统计学上显著的表达变化,除了在角果中,这表明其转录调控主要限于生殖组织。这一结果与其在控制种子生长的亲本印记基因中的核心调控作用一致(FitzGerald等人,2008年)。同样,DRM1仅在开花后处理的角果中显示出统计学上显著的表达变化(adj. p < .001,Wald测试)。这一发现表明DRM1可能在响应盐度的晚期生殖表观遗传调控中起作用,这可能导致种子成熟期间的应激反应性染色质修饰,而不是在初始生长阶段。此外,DRM3和DNMT2的表达在NaCl处理下的所有器官和时间点都保持不变。DRM3和DNMT2转录本的丰度可能表明这些基因在盐胁迫下持续表达以维持表观遗传调控,或者它们的作用可能与其它应激因素有关。总体而言,DMT基因的表达分析表明这些基因在较年轻的幼苗(如4天大的植物)中对盐胁迫更敏感。此外,在开花前用150 mM NaCl处理的角果的时空RNA-seq数据中,它们的表达显示出统计学上的显著变化(adj. p < .1,Wald测试),Log2FC值分别为?1.9(MET1)、?2.3(MET2)、?1.6(CMT1)、?0.91(CMT2)和1.9(DRM2)。在开花后用150 mM NaCl处理的角果中,Log2FC值分别为?0.55(MET1)、0.64(CMT2)、?0.63(CMT3)和?2.4(DRM2)。
4 讨论
DNA甲基化是一种保守的表观遗传修饰,参与基因转录、DNA修复、复制和基因组稳定性(Finnegan & Kovac,2000;Zhang等人,2018)。许多研究表明,DNA甲基化会对环境应力作出反应,并在维持基因组稳定性的同时调节下游基因的表达(Qiao等人,2025;Yang等人,2024;Zi等人,2024)。两种广泛研究的甲基化类型,即6 mM和5mC(对称的CG和CHG,不对称的CHH),已被证明在植物的环境应力响应中起作用(Steward等人,2000;Zhang等人,2024)。根据Flowers和Colmer(2008)的研究,作为耐盐植物,盐生植物能够在200 mM NaCl或更高的盐浓度下存活。极端环境微生物S. parvula能够在多种环境应力条件下生长,包括盐度、干旱、低温和高温以及锂和硼的存在(Tran等人,2023)。现在,由于S. parvula的基因组已经被测序,因此可以进行全基因组研究,以更深入地了解该物种耐盐性的进化过程(Dassanayake等人,2011)。在本研究中,我们在S. parvula中鉴定出了总共9种DMTs(DNA甲基转移酶),根据系统发育分析和结构域特征将它们分为4个亚家族(2个METs、3个CMTs、3个DRMs和1个DNMT2)。对S. parvula的DMT基因与拟南芥(A. thaliana)和油菜(O. sativa)的DMT基因进行详细系统发育分析后发现,SpDMT基因与这些模式物种中的对应基因密切相关,这表明DMT基因在S. parvula的进化过程中保持保守性。DMT基因已在包括拟南芥、水稻、烟草、番茄、玉米、棉花、小麦和豆科植物在内的多种植物中被发现(Dai等人,2005年;Finnegan和Kovac,2000年;Gahlaut等人,2020年;Garg等人,2014年;Moglia等人,2019年;Sharma等人,2009年;Steward等人,2000年;Yang等人,2024年)。与我们的发现类似,基于系统发育分析,水稻中的DMTs也被分为4个亚家族:3个CMTs(OsCMT1–3)、1个OsDNMT2、4个DRMs(OsDRM1a、OsDRM1b、OsDRM2和OsDRM3)以及2个MET1s(OsMET1-1和OsMET1-2)。此外,在芸苔属、大豆、鹰嘴豆、苜蓿和莲属等5种豆科植物中也鉴定出了4个DMT亚家族(Garg等人,2014年)。拟南芥中有4个MET同源基因(MET1、MET2、MET3、MET4)(Finnegan和Kovac,2000年;Genger等人,1999年)。与S. parvula的MET基因类似,胡萝卜和玉米中也鉴定出了2个MET同源基因(Bernacchia等人,1998年)。与S. parvula不同,拟南芥、水稻和豆科植物中鉴定出的DMT数量更多——3种棉花中有33种,小麦中有52种(Gahlaut等人,2020年;Yang等人,2024年)。异源六倍体植物中的DMT数量多于二倍体植物(Gahlaut等人,2020年)。与S. parvula的DMT特性一致,水稻和3种棉花中所有假定的DMT的开放阅读框长度分别在1152至4584碱基对和1035至4734碱基对之间,相应产生的蛋白质含有383至1527个和344至1585个氨基酸(Sharma等人,2009年;Yang等人,2024年)。Schrenkiella和棉花中的MET蛋白含有最多的氨基酸(分别为1514个和1571个)。这些拟南芥中的MET基因可能是通过一系列基因复制事件起源的(Genger等人,1999年)。基因结构分析是研究遗传进化的重要方法。在本研究中,外显子和内含子的数量因DMT亚家族的不同而有所差异,这与以往的研究结果一致(Gahlaut等人,2020年;Garg等人,2014年;Moglia等人,2019年;Yang等人,2024年)。这种亚家族特异性差异可能是由于MET、CMT、DRM和DNMT2成员不同的调控和催化特性以及影响其结构组织的不同选择压力所致。某些植物物种中的DMT基因结构可能非常复杂。例如,在棉花中GhDMT11和GhDMT14基因中外显子数量最多(Yang等人,2024年)。SpDNMT2和SpDRM2基因长度最短,分别包含10个外显子和9个内含子(Garg等人,2014年,研究豆科植物)。与AtMET和T. aestivum的MET2a基因类似(Dai等人,2005年),它们都包含11个内含子。较短基因结构可能表明具有较少内含子的酶结构更为保守,这可能有利于高效表达和稳定功能,尤其是与关键表观遗传过程相关的基因。大多数S. parvula中的DMT蛋白呈现核定位,如在水稻、烟草、鹰嘴豆和大豆中的研究报道(Dangwal等人,2013年;Garg等人,2014年;Wada等人,2003年)。由于DMT的主要底物是基因组DNA和染色质,因此它们预计会定位在细胞核中。最近的一项研究表明,棉花中的CMT、DRM、MET和DNMT型蛋白分别定位在细胞核、叶绿体/细胞核、细胞膜和内质网中。棉花中的GhDMT6和GaDMT7蛋白被发现在细胞膜和内质网中定位(Yang等人,2024年)。使用CELLO程序预测了小麦DMT的亚细胞定位,并通过实验证实了它们既位于细胞核也位于细胞质中(Gahlaut等人,2020年)。通过蛋白质的3D分析可以揭示其功能、三级或四级结构以及活性位点的信息(Filiz和Ko?,2014年;Karlin和Zhu,1996年)。我们的研究发现,同一亚家族的基因具有相似的蛋白质结构。DNA甲基transferase结构域是DMT家族中所有蛋白质的保守结构域。除了DNMT2蛋白外,S. parvula中的所有DMT都含有C末端催化区,这表明在长期的应激条件下维持甲基化能力方面存在强烈的进化压力。S. parvula的MET亚家族保守结构域与CMT亚家族相似,这表明CMT亚家族可能起源于MET亚家族(Gahlaut等人,2020年;Yang等人,2024年)。当对S. parvula的蛋白质序列进行比对时,只有第1425位的亮氨酸(Leu)是保守的。各蛋白质的结构模型彼此不同。玉米CMT3同源基因ZMET2的晶体结构显示,它通过BAH和CHROMO结构域与H3K9me2结合,这两个结构域中存在一个芳香笼状结构,作为捕获H3K9me2的相互作用界面(Du等人,2012年)。对豆科植物中CMT和MET蛋白的结构分析也表明,CHROMO和BAH结构域中的保守残基在识别组蛋白甲基化标记方面起着关键作用(Garg等人,2014年)。此外,MET蛋白中的两个BAH结构域作为蛋白质-蛋白质相互作用的位点(Filiz和Ko?,2014年;Karlin和Zhu,1996年)。水稻和棉花中的MET蛋白含有最多的氨基酸(分别为1514个和1571个)。拟南芥中的这些MET基因可能是通过一系列基因复制事件起源的(Genger等人,1999年)。基因结构分析是研究遗传进化的重要方法。在本研究中,外显子和内含子的数量因DMT亚家族的不同而有所差异,这与以往的研究结果一致(Gahlaut等人,2020年;Garg等人,2014年;Moglia等人,2019年;Yang等人,2024年)。这种亚家族特异性差异可能是由于MET、CMT、DRM和DNMT2成员不同的调控和催化特性以及影响其结构组织的不同选择压力所致。某些植物物种中的DMT基因结构可能非常复杂。例如,在棉花中GhDMT11和GhDMT14基因中外显子数量最多(Yang等人,2024年)。SpDNMT2和SpDRM2基因长度最短,分别包含10个外显子和9个内含子(Garg等人,2014年)。与AtMET和T. aestivum的MET2a基因类似(Dai等人,2005年),它们分别包含11个和10个内含子,SpMET基因也包含11个内含子。较短的基因结构可能表明具有较少内含子的酶结构更为保守,这可能有助于高效表达和稳定功能,尤其是对于与关键表观遗传过程相关的基因。大多数S. parvula中的DMT蛋白显示核定位,如在水稻、烟草、鹰嘴豆和大豆中的研究报道(Dangwal等人,2013年;Garg等人,2014年;Wada等人,2003年)。由于DMT的主要底物是基因组DNA和染色质,因此它们预计会定位在细胞核中。最近的一项研究表明,棉花中的CMT、DRM、MET和DNMT型蛋白分别定位在细胞核、叶绿体/细胞核、细胞膜和内质网中。小麦中的GhDMT6和GaDMT7蛋白被发现在细胞膜和内质网中定位(Yang等人,2024年)。使用CELLO程序预测了小麦DMT的亚细胞定位,并通过实验得到验证,结果显示它们既位于细胞核也位于细胞质中(Gahlaut等人,2020年)。通过蛋白质的3D分析可以揭示其功能、三级或四级结构以及活性位点的信息(Filiz和Ko?,2014年;Karlin和Zhu,1996年)。我们的研究发现,同一亚家族的基因具有相似的蛋白质结构。DNA甲基化酶结构域是DMT家族中所有蛋白质的保守结构域。除了DNMT2蛋白外,S. parvula中的所有DMT都含有C末端催化区,这表明在长期应激条件下维持甲基化能力方面存在强烈的进化压力,这对于甲基化机制的完整性可能很重要。S. parvula的MET亚家族保守结构域与CMT亚家族相似,这表明CMT亚家族可能起源于MET亚家族(Gahlaut等人,2020年;Yang等人,2024年)。当对S. parvula的蛋白质序列进行比对时,只有第1425位的亮氨酸是保守的。每种蛋白质的结构模型各不相同。玉米CMT3同源基因ZMET2的晶体结构显示,它通过BAH和CHROMO结构域与H3K9me2结合,这两个结构域中存在一个芳香笼状结构,作为与H3K9me2相互作用的界面(Du等人,2012年)。对豆科植物中CMT和MET蛋白的结构分析也表明,CHROMO和BAH结构域中的保守残基在识别组蛋白甲基化标记方面起着关键作用(Garg等人,2014年)。此外,MET蛋白中的两个BAH结构域已知具有蛋白质-蛋白质相互作用的功能。水稻中的每种DMT蛋白在羧基末端含有高度保守的甲基转移酶催化结构域,同时在氨基末端含有UBA、CHROMO和BAH结构域(Sharma等人,2009年)。豆科植物中DRM的独特特征是它们的保守基序呈环状排列(Garg等人,2014年)。先前的研究表明,OsDRM3与拟南芥的DRM3的相似性大于AtDRM2和AtDRM1(Sharma等人,2009年)。在我们的研究中,SpDRM1与AtDRM3的相似性高于OsDRM3,这一点通过同线性分析和系统发育树得到了证实。OsDRM1a和OsDRM1b蛋白与拟南芥的AtDRM1的相似度分别超过90%和60%。所有水稻DRM(OsDRM1a和OsDRM1b)显示的基序与拟南芥、玉米和烟草中的DRM基序相似(Sharma等人,2009年)。进行共线性分析是为了预测遗传模式和基因功能。多个S. parvula区域与不同的拟南芥染色体相连,这表明自分化以来发生了染色体重排。由于S. parvula和油菜是进化上相距较远的谱系,较少且更为破碎的同线性连接可能表明自分化以来发生了重复或物种特异性的重排。因此,全基因组范围内的共线性分析表明S. parvula和拟南芥之间存在同线性保守性。相反,水稻染色体中破碎的同线性连接反映了双子叶植物和单子叶植物之间的进化分歧。SpMET1-SpMET2基因对的Ka/Ks值高于SpDRM2-SpDRM3基因对,这表明SpDRM基因经历了更强的纯化选择,意味着其功能分歧较大,遗传多样性较低。拟南芥和Schrenkiella大约在1200万年前分化,由于它们最近的分化,两者之间保留了大量的宏观同线性区域。然而,结构变异,包括串联重复、基因易位和转座元件插入,导致了全基因组范围内的共线性受损。这些结构重排尤其在负责离子稳态、应激适应以及Na+、K+、Li+和硼调节的基因中普遍存在(Oh等人,2014年)。顺式作用调控元件是调控植物生长、发育和应激反应的重要成分,它们在启动子区域的分布反映了基因功能的变化(Kaur等人,2017年)。由于RNA-seq、微阵列和RNA干扰等实验方法的技术挑战和高成本,计算方法被用来鉴定目标基因启动子区域中的顺式元件(Lescot等人,2002年)。在S. parvula中,MET、CMT、DRM和DNMT2基因的启动子区域发现了特定于应激、激素、光响应和发育的顺式元件。这些顺式元件的数量和组织在MET、CMT和DRM同源基因的启动子之间有所不同,表明这些基因具有不同的调控功能。与我们的发现一致,棉花中的DMT启动子含有与激素响应、MeJA、光响应(昼夜节律和光周期)、厌氧诱导、干旱和低温响应相关的各种顺式元件(Yang等人,2024年)。SpDRM基因主要包含与应激响应和发育相关的顺式元件,而SpDNMT2启动子则主要含有与光响应相关的元件,这表明它们在各种适应机制中发挥作用。在DMT基因中,SpCMT2和SpDRM2含有最多的应激响应特异性元件,这与T. aestivum的CMT3b-6A类似(Gahlaut等人,2020年)。所有SpCMT基因的启动子以及SpDNMT2的启动子中都检测到了与应激相关的ARE元件(Gahlaut等人,2020;Zhu等人,2020)。ABRE基序参与应对盐、干旱和寒冷等非生物胁迫(Gómez-Porras等人,2007年),在所有DMT基因中均有发现,除了SpMET2。研究表明,在不同植物物种中,DMT基因在应激条件下表达不同,例如在盐度和干旱条件下(Sun等人,2022年;Yang等人,2024年)。拟南芥中的几个DMT基因(包括MET1、CMT3和DRM2)在盐度和干旱条件下上调,表明它们在调节基因表达以增强应激耐受性方面发挥作用(Sun等人,2022年)。正如在鹰嘴豆中DRM1基因的研究(Garg等人,2014年)中所示,S. parvula根部的DRM1和DRM3在盐度处理后3小时表达上调。在鹰嘴豆茎部,CMT2的表达对盐度、干旱和寒冷的反应下调(Garg等人,2014年)。在受到伤害、脱水、盐度和寒冷应激的玉米植株中,根部ZmMET1的转录减少(Steward等人,2000年)。同样,在盐度应激后3小时,SpMET2和SpCMT1在根部的转录水平也下降。在T. aestivum杂交株中,TaMET1、TaMET2a、TaMET2b、TaCMT、TaMET3在叶片、茎和根部中的转录水平有上升或下降(Dai等人,2005年)。胡萝卜和玉米中的MET基因表现出不同的表达水平,表明它们具有不同的功能(Bernacchia等人,1998年)。此外,B. rapa的MET1a基因在营养器官和生殖器官中均有表达,而BrMET1b仅在雌蕊中表达,这表明BrMET1a和BrMRT1b基因具有不同的功能(Fujimoto等人,2006年)。水稻中DMT基因在幼苗期的冷盐胁迫下的转录增加(Sharma等人,2009年)。然而,我们对两个不同RNA-seq数据集中的SpDMT基因表达的分析表明,这些基因在所检查的特定时间和发育阶段未在茎部表达,这表明DNA甲基化活性可能以器官特异性方式调节。与我们的发现一致,鹰嘴豆中的DMT基因在成熟叶片中的表达水平较低(Garg等人,2014年),而在营养器官和花器官中AtMET基因的转录水平较低(Genger等人,1999年)。在盐度胁迫下,不同组织和植物品种中的DNA甲基化水平存在差异(Chang等人,2020年)。由于Schrenkiella是一种极端嗜盐植物,其基因表达网络经过精细调节以应对盐胁迫,某些基因可能在特定条件或特定组织中表达,以优化植物的应激反应。在极端嗜盐植物(如S. parvula)中,主要的盐感知和离子吸收部位是根部(Sun等人,2022年)。因此,根部的表观遗传调控可能对应激响应转录至关重要。在盐胁迫下,S. parvula保持根部细胞扩张并增加木质化(Li等人,2023年)。在ABA处理下,S. parvula中PIN2(生长素外排载体成分2)和生长素调节基因XTH3、XTH18、XTH33(木葡聚糖内转糖苷酶/水解酶)的表达水平增加(Oh等人,2014;Tran等人,2023)。生长素相关的顺式元件存在于SpMET2和SpCMT3基因的启动子中,这表明这些基因可能参与了S. parvula根系对盐度的响应。有趣的是,在DMTs(DNA甲基转移酶)中,只有MET1在S. parvula的角果中表达,显示出组织特异性表达。尽管其在大多数组织中面对盐胁迫时并未被激活,但在盐胁迫条件下,角果中的表达水平显示出统计学上的显著变化。值得注意的是,三种棉花物种(raimondii、Shixiya 1和TM-1)中的DMTs表达水平随物种和非生物胁迫类型的不同而变化。raimondii和Shixiya 1的叶片部分比根茎部分有更多的基因上调,而TM-1的叶片部分比根茎部分有更多的基因下调。在棉花DMTs中,GhDMT6(一种DNMT2类型的DMT)在胁迫条件下表达显著增加(Yang等人,2024年)。S. parvula中的DNMT2基因转录在盐胁迫下的第3、24和48小时也呈现出逐渐增加的趋势。此外,在时空RNA-seq数据中,DNMT2基因在开花阶段和角果中的表达水平也有所增加,这与鹰嘴豆DNMT2基因在干旱和盐胁迫下的响应相似(Garg等人,2014年)。除了与胁迫响应相关的基序(如ABRE、MYB和MYC)外,我们还在CMT1、DRM2和DRM3的启动子中发现了A-box(一种在α-淀粉酶启动子中保守的序列)。α-淀粉酶属于糖苷水解酶家族,参与细胞的渗透调节和减轻胁迫引起的碳消耗(Yang等人,2023年)。CCGTCC基序具有分生组织特异性激活功能,仅存在于小麦的MET基因中(Gahlaut等人,2020年);然而,这一基序在S. parvula的MET基因中不存在。GCN4基序在种子贮藏蛋白基因中保守,仅在SpDRM3基因中发现,表明其可能在控制种子特异性基因表达中发挥作用(Wu等人,1998年)。同样,在Medicago中,三个DRM基因(MtDRM1、MtDRM2和MtDRM3)在种子发育过程中显著上调(Garg等人,2014年)。与这些观察结果一致,S. parvula的种子比拟南芥种子对盐胁迫更为敏感(Tran等人,2023年),表明种子萌发的DNA甲基化相关调控可能在盐生植物和非盐生植物之间存在差异。总体而言,需要进一步研究来验证这些基因的功能,了解它们在胁迫适应中的具体作用,并探索其在作物改良中的潜在应用。S. parvula在不同发育阶段的器官中DMT基因转录水平的变化以及顺式元件的存在表明了它们在胁迫响应、激素响应、光响应和发育中的角色。总的来说,与胁迫相关的顺式元件、DMT基因的组织特异性表达、结构域模式、外显子-内含子结构以及系统发育关系为理解S. parvula的胁迫耐受机制提供了线索。未来的研究将探讨DNA甲基化如何调节极端环境植物的基因表达,极端环境植物与非盐生植物之间的差异,以及SpDMT基因在作物植物耐胁迫中的潜在应用。
**5 结论**
DNA甲基化是一种表观遗传修饰类型,调控着许多过程,如基因转录、基因组稳定性和基因印记。在本研究中,使用生物信息学工具和数据库,在模式极端环境植物S. parvula中鉴定并表征了9个参与DNA甲基化的基因(MET1、MET2、CMT1、CMT2、CMT3、DRM1、DRM2、DRM3和DNMT2)。此外,还评估了这些基因在175 mM NaCl胁迫下根部的表达水平,以及在不同器官(根、 shoot、茎、叶、花、角果、幼苗)和发育阶段对150 mM NaCl处理的响应。S. parvula的DMTs根据在拟南芥和水稻DMTs中发现的蛋白质基序进行分类,如DNA_methylase、DNMT1-RFD、BAH、CHROMO、RFD和UBA结构域。系统发育关系和保守结构域表明,S. parvula的DMTs与其在拟南芥和水稻中的对应基因聚类。这一发现表明,DNA甲基化介导的基因调控在物种间以类似的方式进化。共线性分析显示拟南芥和Schrenkiella之间存在同源保守性,而水稻和Schrenkiella之间存在片段化的同源连接。PlantCARE分析预测了与启动子区域、激素响应、光响应、胁迫响应和植物发育相关的5个独特顺式元件。大量的胁迫响应相关顺式元件表明S. parvula的DMT基因可能在非生物胁迫抵抗中发挥作用。SpDRM和SpCMT基因的启动子区域主要包含分别特异性于胁迫和激素响应的顺式元件。这种启动子结构表明,不同的DMT亚家族可能通过不同的信号通路被选择性调控,从而在高盐浓度下实现灵活的转录调控。RNA-seq数据分析揭示了NaCl胁迫下根系中DMT基因的表达变化。根系对于感知盐分和离子稳态至关重要。这些发现提出了一个潜在的调控模型:(1)顺式元件组成决定了DMT基因对胁迫因子和激素的响应性;(2)这种调控导致组织特异性的基因表达;(3)DNA甲基化的协调调控与S. parvula的盐胁迫响应机制相关。顺式元件、盐度下的表达谱、保守基序和系统发育的整合分析为理解DNA甲基化如何有助于极端环境植物的耐受性提供了基础。S. parvula中的DMT酶可能有助于开发耐胁迫的作物品种。
**利益冲突声明**
作者声明没有利益冲突。
**数据可用性声明**
本研究中的不同植物物种的DMT数据可以在国家生物技术信息中心(NCBI)、Ensembl Plants、拟南芥信息资源(TAIR)和Phytozome版本13中找到。本研究中分析的所有数据已包含在手稿中(表S1)。