《Thrombosis Research》:LY96–CCNT1–IFI44L core molecular features characterize VTE-associated inflammatory prothrombotic risk in elderly cancer patients
编辑推荐:
Jie Wu|Baoji Hu|Lingyi Shao|Jinhuo Wang|Yujia Wang|Lukun Wang|Yue Ju|Jianrong Guo中国上海200093,上海科技大学公理医院医学技术学院摘要背景静脉血栓栓塞症是老年癌症患者常见的严重并发症,现有的临床
Jie Wu|Baoji Hu|Lingyi Shao|Jinhuo Wang|Yujia Wang|Lukun Wang|Yue Ju|Jianrong Guo
中国上海200093,上海科技大学公理医院医学技术学院
摘要
背景
静脉血栓栓塞症是老年癌症患者常见的严重并发症,现有的临床评分系统无法充分体现其分子层面的差异性。本研究旨在为老年癌症患者构建与VTE相关的分子风险分层框架,识别在不同数据集中均保持稳定的分子特征,并阐明高风险状态背后的炎症-凝血相互作用机制。
方法
首先从基因表达组数据库中整合外周血发现队列GSE19151和验证队列GSE48000,筛选出稳定差异表达的基因。接着在癌症基因组图谱的老年泛癌队列中,利用这些基因及相关通路特征构建VTE相关分子风险分层框架。通过LASSO和随机森林递归特征消除法进行特征选择,比较多种机器学习模型,并用SHAP分析评估各特征的贡献度。同时通过GO/KEGG富集分析、GSVA以及加权基因共表达网络分析,探讨高分子风险状态的生物学机制。最后运用Kaplan-Meier分析、时间依赖型ROC曲线和Cox回归分析,研究分子风险评分与预后的关联。
结果
在GSE19151队列中共发现了427个与VTE相关的差异表达基因,经过GSE48000队列的交叉验证后,有38个基因被保留。进一步通过机器学习分析确定了11个核心特征,其中LY96、CCNT1和IFI44L在特征重要性排序、SHAP分析及相互作用分析中表现最为突出。模型比较显示XGBoost和随机森林的分类性能较好。功能富集分析表明,这些差异表达基因主要与先天免疫、炎症反应、细胞因子信号传导以及补体-凝血相关过程有关。GSVA和WGCNA分析进一步显示,高VTE分子风险组的补体-凝血级联反应、IL-6/JAK/STAT信号传导以及免疫-炎症网络均存在显著激活。生存分析结果显示,高风险组的总生存期和无进展生存期明显更差,且VTE分子风险评分在多变量Cox模型中仍具有独立的预后价值。
结论
本研究明确了以LY96-CCNT1-IFI44L为代表的老年癌症VTE相关核心分子特征,构建了一个可解释的分子风险分层框架。该框架揭示了高风险状态下免疫炎症与凝血通路的协同激活机制,为评估老年癌症患者的VTE分子差异性和预后提供了依据。
引言
静脉血栓栓塞症是癌症患者最常见的严重并发症之一,会显著增加治疗中断风险、住院负担以及死亡风险[1]、[2]。这一问题在老年癌症患者中更为突出。血管老化、内皮功能障碍、慢性低度炎症以及多重疾病共同导致这类人群处于高凝状态,而抗凝预防则又会带来更高的出血风险,且利弊权衡更为复杂[3]、[4]。目前的临床风险评估主要依赖于表型信息,如癌症类型、血细胞计数和治疗史,其中Khorana评分等模型被广泛用作参考[5]。然而现有证据表明,这类评分的区分能力在不同癌症类型和临床场景中并不稳定,也无法完全解释老年癌症患者之间的显著生物学差异[6]。也就是说,传统评分虽能提示哪些患者属于高风险群体,但难以解释其高风险的原因,以及哪些分子机制导致了这种高风险状态。
近年来,炎症-凝血相互作用被认为是癌症相关VTE的重要生物学基础[7]。肿瘤和宿主免疫反应可诱导组织因子表达、补体活化、血小板活化以及纤溶抑制,从而促进血栓的形成与维持[8]。由F3编码的组织因子是外源性凝血途径的关键起始节点,而SERPINE1介导的纤溶抑制则与血栓稳定性密切相关;先前的研究已表明,这些因素与癌症相关VTE风险的升高存在独立关联[9]、[10]。此外,中性粒细胞外陷阱作为免疫血栓形成的重要效应物质,也被认为参与了癌症相关血栓形成的启动和加剧过程[11]。不过,老年癌症患者VTE的分子机制尚未得到系统研究。现有研究多聚焦于单个因素或特定癌症类型,目前仍缺乏一种能在不同数据集中重复使用、并在复杂的泛癌背景下保持稳定的分子特征框架。尽管机器学习模型逐渐被应用于VTE风险评估,但许多模型仍主要依赖结构化的临床变量,机制可解释性较差,且在偏差控制、可重复性和外部泛化能力方面也存在挑战[12]、[13]。对于异质性更强的老年癌症患者而言,缺乏与分子病理过程相关的风险分层系统仍是一个重要的知识空白。
基于以上考虑,本研究整合了公开的可转录组数据、多层特征选择方法、机器学习建模技术以及网络分析手段,从机制层面探讨老年癌症相关VTE的风险特征。首先在外周血发现队列中识别出与VTE相关的差异表达基因,然后在独立的验证队列中确认这些基因的表达方向一致,从而获得在不同数据集中都稳定的分子特征。随后在癌症基因组图谱的老年泛癌队列中,利用这些稳定特征构建VTE相关分子风险分层框架。再通过LASSO特征选择、模型比较、GSVA、WGCNA以及中心基因网络分析等方法,系统研究该框架背后的生物学机制。这一策略的核心目的不仅仅是提升预测性能,更是将风险分层与分子机制解析整合到统一的分析框架之中。
因此,本研究旨在识别并验证在不同数据集中均保持稳定的与VTE相关的分子特征,基于这些特征在癌症基因组图谱的老年癌症队列中构建分子风险分层框架,进一步阐明导致高分子风险状态的炎症-凝血相互作用机制、关键通路、共表达模块以及核心分子轴。通过这些分析,本研究试图从分子层面揭示老年癌症患者VTE相关的生物学差异,为未来结合临床变量和分子特征进行风险评估提供依据。
章节节选
数据来源与队列构建
为确保研究的透明度、可重复性以及跨情境适用性,本研究使用了公开的可转录组数据和临床数据构建了多层分析队列。首先从基因表达组数据库中获取GSE19151作为VTE发现队列,该队列包含70例VTE阳性样本和63例健康对照样本,将其分为VTE阳性组和对照组,用于初步识别与VTE相关的分子特征[14]。此外还纳入了GSE48000队列作为
跨队列分析识别并验证稳定的VTE相关基因
发现队列GSE19151包含70例VTE阳性样本和63例健康对照样本。经过标准化处理和批次校正后,整体数据分布较为稳定,异常样本比例低于1%,为后续的差异分析提供了可靠的基础。以VTE状态作为分组变量,运用limma线性模型进行差异表达分析,共识别出330个显著上调的基因和97个显著下调的基因(见图1A)。
火山图
讨论
本研究针对静脉血栓栓塞症高发人群——老年癌症患者,通过多组学整合和机器学习技术构建了与VTE相关的分子风险分层框架。研究结果显示,外周血发现队列和验证队列之间存在方向一致且跨平台稳定的分子特征,最终共筛选出38个稳定差异表达基因。在癌症基因组图谱的老年泛癌队列中,这些分子特征被进一步整理为
CRediT作者贡献声明
Jie Wu:论文撰写——初稿撰写、可视化、资源获取、研究实施、正式分析、数据整理、概念构建。Baoji Hu:论文撰写——初稿撰写、可视化、软件使用、资源获取、研究实施、正式分析、数据整理。Lingyi Shao:论文撰写——初稿撰写、可视化、软件使用、研究实施、正式分析、数据整理。Jinhuo Wang:论文撰写——初稿撰写、可视化、资源获取、研究实施、正式分析、数据整理。Yujia Wang:论文撰写——初稿撰写
资金支持
本研究得到了中国国家自然科学基金(编号:82470236)以及上海市浦东卫生健康委员会重点学科群建设项目(编号:PWZxq 2022-05)的支持。
利益冲突声明
作者声明不存在任何可能影响本文研究结果的已知财务利益关系或个人关系。