《Metabolites》:Identification and Transcriptomic Analysis of Mitochondria-Related Gene Signatures in Obesity
编辑推荐:
目的(Objectives):本研究旨在识别与线粒体相关转录组特征相关联的核心基因,并评估其作为计算性生物标志物、免疫特征、调控机制及潜在治疗靶点的价值。方法(Methods):从基因表达综合(GEO)数据库获取肥胖相关转录组数据集,将差异表达基因(DEGs)
目的(Objectives):本研究旨在识别与线粒体相关转录组特征相关联的核心基因,并评估其作为计算性生物标志物、免疫特征、调控机制及潜在治疗靶点的价值。方法(Methods):从基因表达综合(GEO)数据库获取肥胖相关转录组数据集,将差异表达基因(DEGs)与线粒体相关基因(Mitochondria-Related Genes, MRGs;来自MitoCarta3.0数据库)取交集以鉴定肥胖相关MRGs。采用功能富集分析、蛋白质-蛋白质相互作用(PPI)网络分析、CytoHubba插件、最小绝对收缩与选择算子(LASSO)回归及随机森林(Random Forest, RF)算法筛选核心基因。进一步进行外部验证、受试者工作特征(ROC)分析、免疫浸润分析、调控网络构建、候选药物预测及分子对接。结果(Results):共鉴定527个DEGs和15个差异表达的MRGs。富集分析表明这些线粒体相关基因主要与线粒体能量代谢障碍、脂质代谢重塑及底物利用改变相关。ECHDC2、FASN、NAT8L和AASS被确定为核心MRGs,分别参与线粒体代谢调节、新生脂肪酸合成、N-乙酰天门冬氨酸相关线粒体代谢及赖氨酸降解;这些基因在肥胖中显著下调且具有良好的诊断效能。免疫浸润分析显示免疫微环境发生改变,核心基因与多种免疫细胞类型呈负相关。分子对接显示染料木素(Genistein)与NAT8L结合能最低(?8.89 kcal/mol),提示在测试配体-靶点对中结合较优。结论(Conclusions):ECHDC2、FASN、NAT8L和AASS可作为候选计算性生物标志物,其中FASN为已知的脂质代谢相关基因,支持了本研究流程的生物学合理性。
论文解读:肥胖中线粒体相关基因特征的识别与转录组学分析
本研究发表于《Metabolites》期刊。肥胖是一种由多因素交互作用驱动的慢性复杂疾病,已成为全球重大公共卫生问题,其与2型糖尿病、心血管疾病及非酒精性脂肪肝等慢性病密切相关。现有研究表明肥胖不仅是能量摄入与消耗失衡,还涉及脂肪组织功能障碍、慢性低度炎症及器官间信号异常。线粒体作为真核细胞脂肪酸氧化、三羧酸循环(tricarboxylic acid cycle, TCA cycle)及氧化磷酸化的中心场所,其功能障碍被认为是肥胖及相关代谢异常的关键病理基础——肥胖状态下脂肪组织可出现线粒体脂肪酸氧化受损、活性氧(reactive oxygen species, ROS)蓄积及线粒体生物发生缺陷,进而影响脂肪细胞分化、脂质代谢及胰岛素敏感性,并通过调节氧化还原稳态参与慢性炎症微环境形成。然而,目前关于肥胖脂肪组织中具体哪些线粒体相关基因(Mitochondria-Related Genes, MRGs)持续失调、能否作为转录组水平区分指标、及其与免疫微环境重塑和治疗的关联尚不清楚。为此,研究人员整合GEO数据库肥胖相关转录组数据集与MitoCarta3.0策选的MRGs,通过生物信息学与机器学习筛选核心MRGs,并评估其功能特征、免疫关联、调控网络及潜在治疗相关性,最终鉴定出ECHDC2、FASN、NAT8L、AASS四个核心MRGs,其在肥胖皮下脂肪组织中显著下调且具良好诊断潜力,为肥胖线粒体相关转录组特征提供了候选计算性生物标志物。
主要关键技术方法:
研究人员选取GEO数据库中来源于人皮下脂肪组织的肥胖与正常体重对照转录组数据集——GSE94752与GSE55200合并作为训练集(经limma包进行背景校正、分位数标准化及removeBatchEffect去除批次效应),GSE151839作为外部验证集;将训练集差异表达基因(differentially expressed genes, DEGs;adj. p<0.05,|log2FC|>0.5)与MitoCarta3.0收录的1136个人类MRGs取交集获得差异表达MRGs;对其进行GO与KEGG富集分析;通过STRING数据库构建蛋白质-蛋白质相互作用(protein–protein interaction, PPI)网络并用Cytoscape中CytoHubba插件的MNC、Degree、EPC、DMNC、MCC五种拓扑算法筛选枢纽(hub)基因;采用LASSO回归(十折交叉验证选lambda.min)与随机森林(random forest, RF;500棵树)筛选特征基因,二者交集再与PPI来源hub基因取交得到核心MRGs;在训练集与外部验证集用pROC绘制ROC曲线计算AUC评估诊断效能;用ssGSEA估算24种免疫细胞相关转录组特征富集分数并分析核心MRGs与免疫细胞的相关性;通过NetworkAnalyst平台(JASPAR和miRTarBase数据库)构建转录因子(transcription factor, TF)–mRNA–miRNA调控网络;用Enrichr/DSigDB预测靶向核心MRGs的小分子化合物;用AutoDock Vina对候选化合物与靶蛋白(PDB或AlphaFold模型)进行分子对接评估结合自由能。
研究结果:
3.1. Data Preprocessing and Identification of Differentially Expressed Genes(数据预处理与差异表达基因鉴定): 合并并批次校正后训练集含29例肥胖与16例健康对照,鉴定527个DEGs(386上调、141下调);DEGs与MRGs取交集得15个差异表达MRGs(多数为下调),热图与箱线图显示其在肥胖与对照组间表达谱明显不同。
3.2. Identification and Functional Enrichment Analysis of Differentially Expressed MRGs(差异表达MRGs的功能富集分析): GO分析显示这些MRGs主要富集于羧酸分解代谢、小分子分解代谢、乙酰辅酶A/酰基辅酶A代谢过程(biological process, BP),定位于线粒体基质及内外膜(cellular component, CC),具氧化还原酶、乙酰转移酶/酰基转移酶活性(molecular function, MF);KEGG分析富集于丙酮酸代谢、TCA循环、脂肪酸生物合成、丙氨酸/天冬氨酸/谷氨酸代谢、辅因子生物合成、叶酸介导一碳池及凋亡等通路,提示肥胖相关线粒体异常涉及多通路代谢重塑。
3.3. Construction of the PPI Network and Screening of Hub Genes(PPI网络构建与枢纽基因筛选): STRING构建含13节点26边的PPI网络,经CytoHubba五种算法取前10交集得10个hub基因:PC、FASN、ALAS2、MOCS1、AASS、NAT8L、ALDH1L1、ECHDC2、LDHD、BCL2A1。
3.4. Machine Learning-Based Screening of Candidate Feature Genes(机器学习筛选候选特征基因): LASSO回归筛选出9个候选基因,随机森林筛选出13个候选基因,二者交集得8个基因:ECHDC2、COX14、PLD6、FASN、NAT8L、BOK、NIPSNAP3B、AASS。
3.5. Integrated Screening of Core MRGs(核心MRGs整合筛选): 机器学习交集基因与PPI hub基因再取交集,最终确定4个核心MRGs——ECHDC2、FASN、NAT8L、AASS;训练集与独立验证集(GSE151839)中四者在肥胖组表达均显著低于正常体重组(p<0.05),四者间呈正相关。
3.6. Evaluation of Transcriptome-Based Discriminatory Performance in Training and External Validation Datasets(训练集与外部验证集中转录组区分效能评估): 训练集四者AUC分别为ECHDC2 0.966、FASN 0.864、NAT8L 0.950、AASS 0.957;外部验证集AUC分别为1.000、0.930、0.870、0.990;嵌套交叉验证结果与上述一致,表明四基因在所用转录组数据中具区分肥胖与正常体重个体的潜力(需更大队列与实验验证方可确立临床诊断性能)。
3.7. Construction of the miRNA–MRG–TF Regulatory Network(miRNA–MRG–TF调控网络构建): 基于miRTarBase获71个上游miRNA(hsa-miR-16-5p、hsa-miR-17-5p、hsa-miR-484、hsa-miR-193b-3p、hsa-miR-615-3p可同时调控多个核心MRGs),基于NetworkAnalyst获26个TF(NFIC、PRRX2、FOXC1、FOXL1、TFAP2A可调控多个核心MRGs),最终网络含101节点108边,呈稀疏拓扑,为假设生成性上游调控线索。
3.8. Results of Immune Cell Infiltration Analysis(免疫细胞浸润分析结果): 用ssGSEA推断的免疫相关转录组特征评分显示肥胖组多数免疫细胞特征评分升高,提示皮下脂肪组织免疫微环境重塑。
3.9. Correlation Analysis Between Immune Cell Subsets and MRGs(免疫细胞亚群与MRGs的相关性分析): 核心MRGs(ECHDC2、FASN、NAT8L、AASS)与aDCs、DCs、iDCs、巨噬细胞、肥大细胞、中性粒细胞、T细胞、γδ T细胞(Tgd cells)、Th1细胞等均呈显著负相关,提示核心MRGs可能通过影响代谢-免疫串扰参与肥胖进展。
3.10. Candidate Small-Molecule Screening and Molecular Docking(候选小分子筛选与分子对接): Enrichr预测到10个候选小分子,多靶向FASN(如槲皮素Quercetin、表没食子儿茶素没食子酸酯(?)-Epigallocatechin gallate、鞣花酸Ellagic Acid等),染料木素(Genistein)靶向FASN与NAT8L,坎尼达诺(Cianidanol)靶向ECHDC2与NAT8L。分子对接显示Genistein–NAT8L结合自由能最低(?8.89 kcal/mol),Cianidanol–ECHDC2(?8.317 kcal/mol)、Cianidanol–NAT8L(?8.033 kcal/mol),多个FASN配体结合能≤?8.03 kcal/mol,为后续靶向干预研究提供初步计算线索。
讨论与结论总结:
讨论指出,肥胖脂肪组织线粒体功能障碍常伴膜电位下降、脂肪酸氧化受损及ROS蓄积;本研究GO/KEGG富集印证差异表达MRGs涉及羧酸分解、乙酰辅酶A代谢、TCA循环及脂肪酸生物合成等多通路紊乱。FASN编码脂肪酸合酶(新生脂肪酸合成限速酶),本研究中皮下脂肪组织FASN在肥胖时下调,与既往报道内脏脂肪或细胞模型中FASN变化不一致,可能反映皮下脂肪在肥胖进程中出现生脂能力下降或适应性代谢重编程,FASN下调也可能反映应激适应或代谢功能障碍而非单纯脂质储存减少。NAT8L催化乙酰辅酶A与天冬氨酸生成N-乙酰天门冬氨酸(N-acetylaspartate, NAA),在棕色脂肪中有报道参与脂质周转与线粒体代谢,本研究发现其在肥胖皮下脂肪下调应谨慎解读为NAA代谢、乙酰辅酶A利用或线粒体代谢状态改变的转录信号。AASS为赖氨酸通过酵母氨酸(saccharopine)途径降解的关键双功能酶(定位于线粒体),其下调提示肥胖脂肪组织可能存在氨基酸分解代谢与线粒体底物代谢受损;ECHDC2为线粒体蛋白,参与支链氨基酸调节与应激易感性,二者在肥胖中直接功能证据有限但具潜在生物学意义。免疫方面,核心MRGs与多种免疫细胞特征负相关,提示线粒体功能紊乱与肥胖免疫微环境重塑紧密偶联,FASN等脂质合成代谢可影响免疫细胞活化状态。调控网络中NFIC(调控成脂/成骨平衡)、PRRX1同源物、FOXC1、TFAP2A等有脂肪生物学相关性但需实验验证;miR-16-5p、miR-17-5p、miR-484、miR-193b相关调控为较高优先级待验证候选。候选小分子具抗炎抗氧化潜能,分子对接仅反映静态结合倾向。研究局限性包括样本量较小、仅来自皮下脂肪组织、批次校正残余偏倚、特征筛选存在循环论证风险、缺乏蛋白及功能实验验证、免疫浸润为bulk转录组建模推断、调控网络及分子对接为计算预测。
结论(Conclusions):本研究确定ECHDC2、FASN、NAT8L和AASS为优先排序的线粒体相关候选基因;除证实线粒体代谢紊乱参与肥胖外,结果凸显了涉及脂质代谢、氨基酸分解代谢及免疫微环境重塑的协调转录组特征。需经蛋白水平、代谢流、细胞及临床队列研究确认其功能角色与转化相关性,目前应视为假设生成性候选而非经验证诊断生物标志物或治疗靶点。