转录组学驱动CDK1鉴定为三阴性乳腺癌核心致癌驱动因子:基于计算机模拟结构建模与分子动力学模拟的策略

《Frontiers in Bioinformatics》:Transcriptomics-driven identification of CDK1 as a central oncogenic driver in TNBC: an in silico structural modeling and MD simulation approach

【字体: 时间:2026年04月08日 来源:Frontiers in Bioinformatics 3.9

编辑推荐:

  本研究针对三阴性乳腺癌(TNBC)缺乏靶向治疗的难题,通过转录组分析锁定CDK1为核心枢纽基因,结合虚拟筛选从天然产物库中挖掘出候选化合物CID17584963。该化合物与CDK1结合能达-8.09 kcal/mol,优于对照药紫杉醇,且500 ns分子动力学模拟证实复合物稳定性更优,为TNBC天然药物研发提供了新方向。

  
三阴性乳腺癌(TNBC)就像乳腺癌家族里最棘手的“刺头”——它既不像激素受体阳性乳腺癌那样能被内分泌治疗“驯服”,也不像HER2阳性乳腺癌那样有靶向药“精准打击”。由于缺乏雌激素受体(ER)、孕激素受体(PR)和人类表皮生长因子受体2(HER2)这三大治疗靶点,化疗成了它的“唯一选择”,但化疗耐药和早期复发却像挥之不去的阴影,让患者的5年生存率始终徘徊在低水平。科学家们一直在寻找新的突破口,而细胞周期调控的核心玩家——周期蛋白依赖性激酶1(CDK1),逐渐进入了研究视野。
CDK1是调控细胞从G2期进入M期的关键“开关”,它的异常激活会让癌细胞像脱缰的野马般疯狂增殖。更重要的是,TNBC细胞的生长高度依赖这种异常的CDK1活性,理论上抑制它就能按下癌细胞的“暂停键”。但问题来了:如何找到既能精准结合CDK1、又兼具良好成药性的天然化合物?毕竟,合成药物的毒副作用和经济负担始终是患者难以承受之重,而天然产物凭借其多样的生物活性和较低的毒性,正成为抗癌药物研发的“宝藏库”。
带着这样的疑问,来自多个研究团队的研究人员开展了一项整合转录组学与计算生物学的研究,试图从天然产物中挖掘CDK1的潜在抑制剂。他们的研究成果最终发表在了《Frontiers in Bioinformatics》上,为TNBC的治疗提供了新的思路和候选分子。
为了回答上述问题,研究人员采用了多组学整合与计算机模拟相结合的策略。他们首先从GEO数据库获取了GSE61724、GSE45827和GSE65194三个TNBC数据集,同时结合TCGA-BRCA队列数据,通过GEO2R和GEPIA2工具筛选出差异表达mRNA(DE-mRNAs),并利用InteractiVenn工具找到了85个共同上调的基因。随后,通过SRplot平台进行GO(Gene Ontology,基因本体论)和KEGG通路富集分析,并用STRING数据库构建蛋白-蛋白相互作用(PPI)网络,锁定CDK1为关键枢纽基因。在靶点验证方面,他们从Protein Data Bank(PDB)获取了CDK1的3D结构(PDB ID: 5LQF),通过CASTp 3.0预测其活性位点。接着,从SuperNatural 3.0数据库提取100种抗癌天然产物(ANPs),经Open Babel能量优化后,利用PyRx和AutoDock Vina进行虚拟筛选,并通过SwissADME和ProTox-II评估化合物的ADMET(吸收、分布、代谢、排泄和毒性)特性。最后,对筛选出的候选化合物与CDK1进行分子对接,并利用GROMACS软件开展500 ns的分子动力学模拟(MDS),通过RMSD(均方根偏差)、RMSF(均方根波动)、Rg(回转半径)、SASA(溶剂可及表面积)、氢键分析、PCA(主成分分析)、FEL(自由能景观)和DCCM(动态交叉相关矩阵)等方法评估复合物的稳定性。
研究结果部分,研究人员通过一系列分析逐步揭示了CDK1在TNBC中的核心作用及候选化合物的潜力:
3.1 差异表达mRNA的鉴定
通过对三个GEO数据集和TCGA-BRCA数据的联合分析,研究人员绘制了火山图展示基因表达差异,并通过韦恩图确定了85个在TNBC中共同上调的DE-mRNAs。这些基因成为了后续功能分析的基石。
3.2 功能富集分析与PPI网络
GO分析显示,这些DE-mRNAs显著富集于细胞器分裂、微管结合等生物学过程(BP)、分子功能(MF)和细胞组分(CC)。KEGG通路富集则突出了细胞周期通路的核心地位,而PPI网络进一步证实CDK1是该网络中的关键枢纽基因,与其他调控因子存在广泛相互作用。
3.3 蛋白结构获取与准备
研究人员获取了CDK1的3D结构(PDB ID: 5LQF,分辨率2.06 ?),并通过CASTp预测了其活性位点。TISIDB和TNMplot分析显示,CDK1在乳腺癌免疫亚型中表达存在差异,且在肿瘤和转移样本中表达显著高于正常组织,为其作为治疗靶点提供了临床相关性依据。
3.4 配体检索、虚拟筛选与ADMET预测
从SuperNatural 3.0数据库筛选出的100种ANPs中,经过ADMET评估,3种化合物符合无Lipinski规则违反、低毒性的标准。这三种化合物的3D结构分别如图3E-G所示,其中CID17584963的结构最为引人注目。
3.5 分子对接
分子对接结果显示,三种候选化合物与CDK1的结合能均优于对照药紫杉醇(结合能-5.59 kcal/mol)。其中,CID17584963的结合能最低(-8.09 kcal/mol),其与CDK1形成的相互作用最为丰富:包括与TRP228的常规氢键、与GLU168和PRO184的碳氢键,以及与THR183、SER182等多个残基的范德华力,还有酰胺-π堆积、π-阳离子等多种非共价相互作用。相比之下,紫杉醇仅形成3个氢键,相互作用较少。
3.6 CDK1蛋白的分子动力学
500 ns的MDS结果显示,CDK1-CID17584963复合物与CDK1-紫杉醇复合物的RMSD均在0.1-0.2 nm范围内波动,表明两者均具有良好稳定性。但前者在Rg(1.95-2.10 nm)和SASA(140-160 nm2)指标上表现更优,提示其结构更紧凑、溶剂暴露更少。氢键分析显示,CID17584963复合物能维持2-4个氢键,多于紫杉醇复合物的1-3个。PCA分析进一步表明,两种配体均能限制CDK1的构象变化,但CID17584963复合物的运动范围略窄,稳定性更高。
3.7 自由能分析与动态交叉相关发现
FEL分析显示CDK1-CID17584963复合物存在明确的全局最小能量盆地,自由能扰动(FEP)也证实了该复合物的热力学稳定性。DCCM分析则揭示,配体结合后CDK1残基间呈现出更强的正相关运动,表明其功能区域的协调性增强,结构更加稳定。
在讨论部分,研究人员强调了本研究的多重意义。首先,通过整合转录组学和生物信息学分析,明确了CDK1是TNBC中上调的关键致癌驱动因子,其功能涉及细胞周期调控、DNA修复等核心通路,这为靶向治疗提供了坚实的理论基础。其次,从天然产物中筛选出的CID17584963表现出优于紫杉醇的CDK1结合能力和复合物稳定性,且ADMET特性良好,有望成为TNBC治疗的新型先导化合物。此外,研究采用的“转录组驱动-虚拟筛选-动力学验证”的计算框架,为天然产物的抗肿瘤药物研发提供了可借鉴的模式。
当然,研究人员也客观指出了研究的局限性:这是一项完全基于计算机模拟的研究,CID17584963的实际生物活性仍需通过体外(如qRT-PCR、Western blot、细胞功能实验)和体内动物模型进行验证。同时,CDK1在正常分裂细胞中也发挥重要作用,其抑制剂可能存在潜在毒性,且化合物对其他CDK家族成员的 selectivity(选择性)也有待进一步评估。未来,通过结构优化提高CID17584963的效价和选择性,并开展系统的临床前研究,将是推动其走向临床应用的关键步骤。
总体而言,这项研究不仅为TNBC的靶向治疗提供了新的候选靶点和先导化合物,也为利用计算生物学方法挖掘天然产物药物资源提供了成功范例,具有重要的科学意义和潜在的临床应用价值。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号