《International Journal of Chronic Obstructive Pulmonary Disease》:Identification of ERN1 as a Potential Context-Dependent Biomarker in Chronic Obstructive Pulmonary Disease Based on Bioinformatics Analysis of GSE57148 Dataset
编辑推荐:
目的:鉴定慢性阻塞性肺疾病(COPD)肺组织中内质网应激相关候选基因,并评估其内部区分性能及跨队列可重复性。患者与方法:该生物信息学研究使用GSE57148肺组织数据集(98例COPD和91例肺功能正常受试者;均为接受肺切除术的男性吸烟者)。使用limma对l
目的:鉴定慢性阻塞性肺疾病(COPD)肺组织中内质网应激相关候选基因,并评估其内部区分性能及跨队列可重复性。患者与方法:该生物信息学研究使用GSE57148肺组织数据集(98例COPD和91例肺功能正常受试者;均为接受肺切除术的男性吸烟者)。使用limma对log2(每千碱基转录本每百万映射读取的片段数[FPKM] + 1)进行差异表达分析,随后进行富集分析和蛋白质?蛋白质相互作用分析。通过文献指导的事后多标准框架优先考虑内质网到核信号1(ERN1)。通过接受者操作特征(ROC)分析,结合重复分层10折交叉验证和bootstrap乐观校正评估内部区分度。在独立队列中进行外部敏感性分析。结果:共鉴定出308个差异表达基因。ERN1在COPD中显著上调(log2FC = 0.75,校正后P = 1.98 × 10-15)。在发现队列中,ERN1显示出内部区分度(ROC曲线下面积[AUC] = 0.853;交叉验证AUC = 0.848)。然而,外部复制结果异质性较大;在最大的混合性别队列(GSE47460)中,区分度有限(AUC = 0.477),且校正后的外部模型仍无统计学意义。结论:在GSE57148中,ERN1在COPD肺组织中上调,代表了一种内质网应激相关、情境依赖性候选信号。当前证据尚属初步,需要在独立、性别平衡的队列和临床可获取的生物样本中进行前瞻性验证。
慢性阻塞性肺疾病(chronic obstructive pulmonary disease, COPD)是一种以持续性气流受限和慢性气道炎症为特征的常见慢性呼吸系统疾病,全球患病率和死亡率居高不下。目前COPD诊断主要依赖肺功能检测,但早期阶段肺功能变化不显著,易导致漏诊和治疗延迟,因此筛选可靠的分子生物标志物对改善早期诊断和治疗效果至关重要。内质网应激(endoplasmic reticulum stress, ER stress)及其激活的未折叠蛋白反应(unfolded protein response, UPR)在COPD发病机制中发挥关键作用,包括香烟烟雾诱导的上皮细胞凋亡、炎症反应和黏液高分泌。内质网到核信号1(endoplasmic reticulum to nucleus signaling 1, ERN1,亦称IRE1α)是UPR最保守的感受器,调控细胞存活、凋亡和炎症反应,但其作为COPD生物标志物的研究尚不明确。该研究发表于《International Journal of Chronic Obstructive Pulmonary Disease》。研究人员基于GSE57148数据集(98例COPD和91例肺功能正常受试者;均为接受肺切除术的男性吸烟者)进行生物信息学分析:通过limma对log
2(FPKM + 1)进行差异表达分析,筛选差异表达基因(differentially expressed genes, DEGs);利用Enrichr进行基因本体论(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析;通过STRING数据库构建蛋白质?蛋白质相互作用(protein?protein interaction, PPI)网络,计算度中心性识别hub基因;采用文献指导的事后多标准框架优先选择ERN1作为机制候选;通过接受者操作特征(receiver operating characteristic, ROC)分析、重复分层10折交叉验证和bootstrap乐观校正评估内部区分度;在独立队列(GSE47460、GSE38974等)中进行外部验证和协变量校正分析。
主要结果如下:
**DEGs的鉴定**:在COPD肺组织中鉴定出308个DEGs,包括183个上调基因和125个下调基因(|log
2FC| > 0.5,校正后P < 0.05)。ERN1是统计学上最显著的上调基因之一(log
2FC = 0.75,校正后P = 1.98 × 10
-15)。
**上调DEGs的功能富集**:GO富集分析显示上调DEGs显著富集于转录调控、凋亡信号通路、脂多糖应答等生物学过程,以及胶原蛋白?细胞外基质、分泌颗粒腔等细胞组分和转录激活活性、蛋白酶结合等分子功能。KEGG通路富集分析显示上调DEGs主要参与白介素?17(IL?17)、肿瘤坏死因子(TNF)、JAK?STAT、PI3K?Akt等信号通路,这些通路与COPD的炎症和重塑核心病理过程密切相关。
**PPI网络与hub基因**:上调DEGs的PPI网络包含134个节点和557条边。度中心性排名前十的hub基因为IL6、STAT3、CXCL8、PTGS2、EGFR、EGR1、SOCS3、THBS1、ATF3和CXCL1,主要涉及炎症信号和转录调控。ERN1在PPI网络中排名第57位(度=6),但因其差异表达显著性和内质网应激机制相关性,被选择作为机制候选。
**ERN1表达验证**:在发现队列中,ERN1在COPD肺组织中的表达水平(2.89 ± 0.55)显著高于肺功能正常组(2.12 ± 0.52)(Welch t检验,P = 8.9 × 10
-18),验证了其差异表达结果。
**内部区分性能**:ROC分析显示ERN1在发现队列中的曲线下面积(area under the curve, AUC)为0.853(95%置信区间:0.796–0.903,P < 0.001),Youden最佳截断值下灵敏度81.6%、特异度76.9%。重复分层10折交叉验证的AUC为0.848,bootstrap乐观校正后AUC为0.853,表明内部区分度稳健。
**外部队列验证**:在主要外部队列GSE47460(含145例COPD和91例对照,男女性别比例均衡)中,ERN1未见显著病例?对照差异(P = 0.571),AUC为0.477(95%置信区间:0.400–0.552),性别校正后仍无显著关联。在补充队列GSE38974中,ERN1单探针分析无显著差异(P = 0.785,AUC = 0.459),但探针平均后呈现方向性但非显著的分离趋势(P = 0.132,AUC = 0.681)。额外年龄?性别校正分析(GSE47460、GSE76925)中ERN1仍无统计学意义。这些结果提示ERN1的区分效果存在跨队列异质性和探针敏感性。
**敏感性分析**:采用limma?trend和非参数Wilcoxon检验均复现了ERN1在COPD中的显著上调,支持结果的稳健性。
讨论部分指出,该研究创新性在于定义了ERN1作为可检验的机制候选,并通过预定义外部验证和文献三角分析描绘了其可重复性的边界条件。研究局限性包括:发现队列为单中心男性吸烟者,缺乏年龄和吸烟暴露的个体水平协变量,外部复制异质性较大,以及缺乏功能实验验证。结论翻译如下:总之,在GSE57148数据集中,ERN1在COPD肺组织中高表达,可合理解释为内质网应激相关候选基因。鉴于单队列发现设计和不一致的外部复制结果,当前证据尚属初步,需要在确认性解释前进行进一步验证。