人类心脏与脑部血管及微血管功能障碍:基于人工智能方法对其底层通路的研究

《Array》:Vascular and microvascular dysfunction in the human heart and brain: investigating the underlying pathways using an AI-based approach

【字体: 时间:2026年06月12日 来源:Array 4.5

编辑推荐:

  血管功能障碍与微血管功能障碍共同促进心血管疾病与脑血管疾病的发生,但连接这些疾病的共享分子通路目前仍仅得到部分阐明。该研究应用人工智能(AI)辅助文献挖掘流程,以识别心血管与脑血管疾病中血管及微血管功能障碍所共有的基因与通路。 研究人员系统检索了2000年1

  
血管功能障碍与微血管功能障碍共同促进心血管疾病与脑血管疾病的发生,但连接这些疾病的共享分子通路目前仍仅得到部分阐明。该研究应用人工智能(AI)辅助文献挖掘流程,以识别心血管与脑血管疾病中血管及微血管功能障碍所共有的基因与通路。

研究人员系统检索了2000年1月至2024年11月期间发表于PubMed的血管与微血管疾病基因组学研究,采用Entrez API,并结合严格的医学主题词(MeSH)与文本过滤策略。随后,借助大语言模型辅助提取流程,对基因关联进行提取与标准化,并进一步开展Reactome通路富集、基因集交集分析以及网络分析。为降低候选基因偏倚,分析仅限于大规模基因组研究设计,包括全基因组关联研究(GWAS)、全外显子组测序(WES)和全基因组测序(WGS)。

在与血管疾病相关的690个基因中(其中心血管疾病398个,脑血管疾病292个),有24个基因为两类疾病所共享,提示除存在有限的共享分子成分外,还伴随显著的系统特异性异质性。富集通路包括炎症与代谢过程、NOTCH、血管内皮生长因子(VEGF)及转化生长因子-β(TGF-β)信号传导、免疫调节、脂质转运以及细胞衰老。网络分析显示存在一个紧密互联的核心网络,其中APOE、NOTCH3、EPHB4、MYLK、ZFHX3和HDAC9表现为高连接度枢纽。由于纳入研究中相当一部分涉及大血管表型,因此这些共享基因与微血管的相关性主要是推断所得,仍需进一步验证。

研究结果支持存在一个受限的跨器官血管基因集合,并提供了一个人工智能辅助框架,用于跨器官系统对基因组学证据进行大规模整合与优先级排序。上述发现仍需实验验证及进一步的正交验证。
该文发表于《Array》,围绕心脑轴(HBA,指心血管系统与中枢神经系统之间的双向生物学通讯网络)中的血管异常这一核心问题,系统探讨了心血管疾病与脑血管疾病之间是否存在共享的分子基础。研究背景在于,随着人口老龄化加剧,心血管疾病、脑血管疾病以及神经退行性疾病的共病日趋普遍,而血管功能障碍被认为是连接心脏与脑部病变的关键桥梁。既往研究表明,高血压、糖尿病、血脂异常、吸烟、肥胖、衰老以及慢性炎症负荷等风险因素,不仅推动大血管病变,也会造成微血管损伤。冠状动脉微血管疾病与脑小血管病被视为这一全身性过程在不同器官中的代表性表现。然而,尽管组学技术和机器学习快速发展,心脏与脑部血管损伤之间究竟共享哪些基因与通路,目前仍缺乏系统性的整合证据,尤其缺乏兼顾心血管与脑血管两大系统的大规模、可重复分析框架。因此,研究人员开展本研究,目的在于借助人工智能(AI)辅助文献挖掘和通路整合分析,从跨器官视角识别心脑血管功能障碍的共享基因集及其潜在生物学程序,并为后续生物标志物筛选和治疗靶点优先排序提供依据。

在方法上,研究人员首先通过PubMed/Entrez API对2000年1月1日至2024年11月3日期间公开发表的人类血管疾病基因组学研究进行系统检索,并依据医学主题词(MeSH)及自由文本关键词进行严格过滤。为减少候选基因研究带来的偏倚,纳入范围限定为全基因组关联研究(GWAS)、全外显子组测序(WES)和全基因组测序(WGS)等大规模、假设非驱动型研究。随后,研究人员利用基于GPT-4o的大语言模型流程,从摘要中结构化提取基因—疾病关联、变异信息、统计学证据、表型、样本特征等内容,并采用HGNC标准化基因命名;之后按心血管与脑血管系统进行分类,开展基因交集分析、Reactome通路富集分析及Cytoscape/GeneMANIA网络分析。为进一步提供生物学背景支持,研究还调用CellxGene Census公开单细胞RNA测序数据,对人类心脏和脑组织中的血管相关细胞进行表达映射,并计算τ指数评估细胞类型特异性。样本来源并非原始临床队列,而是公开文献与公开单细胞转录组数据库。

研究结果部分首先在“Overview of Retrieved Genetic Studies”中给出整体检索与筛选结果。研究人员最初通过增强型MeSH检索从PubMed获得87,551条与血管及微血管疾病遗传变异相关的记录;去重并限定时间范围后,剩余58,308条唯一摘要。经过基于MeSH和关键词的基因组学方法过滤后,共保留1,060项采用GWAS、WGS或WES的大规模研究,形成后续分析的基础数据集。这一结果表明,在庞大的血管疾病文献中,真正符合严格基因组学纳入条件的研究比例相对有限,为后续高质量整合奠定了基础。

在“Screening and Structuring of Genetic Associations”部分,研究人员显示,在1,060篇摘要中,经AI辅助筛查后保留769篇,剔除了缺乏明确或可解释遗传关联的研究。结构化数据不仅包含基因,还包括蛋白、长链非编码RNA(lncRNA)、转录因子、基因位点和生物标志物等实体;但在进一步严格过滤后,仅保留具备明确遗传关联、统计支持和方法学可靠性的基因层面证据。最终,心血管类别中鉴定出398个唯一基因,常见表型包括冠状动脉疾病、静脉血栓栓塞、冠心病和高血压等;脑血管类别中鉴定出292个唯一基因,常见表型包括缺血性卒中、颅内动脉瘤、白质高信号和血管性痴呆等。该部分说明,心血管与脑血管遗传图谱在规模和表型构成上均具有明显复杂性与异质性。

在“Shared Cardiovascular and Cerebrovascular Genes”部分,研究人员基于标准化基因符号对心血管和脑血管数据集进行交集分析。在398个心血管相关基因与292个脑血管相关基因之间,最终仅保留24个共享基因,且这些基因均经过统计支持、方法学严格性与原始证据多重过滤。研究据此认为,心血管与脑血管疾病之间并不存在广泛一致的分子基础,而是更可能共享一个“受限的核心分子组分”。这一发现尤为关键,因为它既支持心脑轴中的系统性血管联系,也提示两大系统仍具有显著的器官特异性病理机制。

在“Gene pathway analysis of the Intersecting genes”部分,研究人员对这24个共享基因进行了Reactome通路富集分析,发现其显著富集于多个功能类别,包括信号转导、免疫反应、代谢过程、转录调控以及细胞反应相关通路。其中,NOTCH信号、VEGF信号和TGF-β信号是突出的信号转导模块;免疫相关通路涉及白细胞介素信号和抗原呈递;代谢相关通路涉及脂质转运与辅因子代谢;转录调控则包括AP-2转录因子复合体、Notch相关转录复合体和SMAD介导的TGF-β下游信号;细胞反应通路则包括细胞衰老及衰老相关分泌表型(SASP)。这一结果说明,共享基因并非集中于单一通路,而是分布于调控血管稳态、炎症、代谢与衰老的多个核心生物学网络中。

在“Network analysis”部分,研究人员利用Cytoscape和GeneMANIA构建24个共享基因的功能关联网络,结果显示该网络高度互联。网络边主要由通路共属关系支持,占59.1%,其次为共表达关系,占35.7%;共定位、遗传互作和物理互作占比较低。APOE、EPHB4、MYLK、NOTCH3、ZFHX3和HDAC9是连接度较高的枢纽节点,提示这些基因可能在跨器官血管功能异常中具有更高的优先级。研究还指出,MYLK与EPHB4在多个数据集中表现出稳定共表达,APOE则与NOTCH3、ZFHX3、FURIN和ALDH1L1等多个基因存在共表达关联。该部分结果支持共享基因并非随机集合,而是参与了部分重叠的功能程序。

在“Single-cell expression and cell-type specificity of intersecting genes”部分,研究人员进一步将24个共享基因映射至人类心脏和脑组织单细胞转录组中的血管相关细胞类型,包括内皮细胞、周细胞和平滑肌细胞。结果显示,这些基因在两种组织的多类血管细胞中均有表达,且心脏与脑对应细胞类型之间的表达模式总体相似,并未出现明显的器官特异性分离。通过τ指数评估,24个基因中有19个在两种组织中均呈中度至高度细胞类型特异性(τ > 0.5);其中PITX2、ALDH1L1、GRIA1和MYLK表现出较高特异性(τ > 0.75)。此外,心脏与脑内皮细胞/周细胞平均表达谱之间存在较强一致性,Spearman ρ = 0.807,p < 0.0001。该结果从单细胞层面为这些共享基因在心脑血管区室中的生物学合理性提供了正交支持,但研究人员同时强调,这并不能直接证明其在微血管疾病中的因果作用。

讨论部分围绕上述发现的意义与局限进行了归纳。研究人员认为,本研究最重要的贡献不在于发现全新的血管生物学机制,而在于建立了一个可扩展、可重复的AI辅助整合框架,用于从海量且异质的基因组学文献中筛选、标准化、整合并优先排序跨器官共享的血管相关证据。24个共享基因提示心血管与脑血管功能障碍之间确实存在有限但重要的分子交集,这些交集主要集中于内皮调控、血管生成、血管张力、细胞外信号传导和血脑屏障完整性等过程。NOTCH3作为脑小血管病尤其是CADASIL的经典致病基因,在本研究中处于核心地位,强化了Notch相关信号在跨器官血管功能失衡中的重要性;APOE则连接脂质代谢、血管损伤与神经退行性改变;VEGFA和EPHB4支持血管生成与血管重塑异常的共同作用;MYLK提示平滑肌收缩与内皮屏障调控可能参与心脑共同血管易损性;ZFHX3与HDAC9则提示转录和表观遗传调控可能构成共享血管风险的一部分。与此同时,研究也明确指出,许多原始研究聚焦于大血管表型,因此这些共享信号与微血管病理之间的关系目前仍多为间接推断,需要在专门的微血管表型和外部数据集中进行验证。研究还指出,摘要层面提取不可避免存在信息不完整问题,当前流程尚未经过严格的人机双重标注基准评估,也未按性别或临床亚型分层分析,因此未来仍需通过全文本系统校验、外部GWAS汇总统计、共定位分析、组织特异性表达数量性状位点(eQTL)整合以及更同质化表型分层研究来完善结论。

研究结论可概括为:这项人工智能辅助整合分析支持心血管与脑血管血管功能障碍之间存在一个受限的共享分子成分。所鉴定出的24个交集基因,以及与NOTCH、VEGF、TGF-β信号、免疫过程、脂质代谢和细胞衰老相关的富集通路,提示心脏和脑部血管疾病可能在部分共同生物学程序上汇聚。然而,这些发现更适合作为后续研究的优先排序框架,而非统一微血管机制已经被证实的直接证据。未来仍需在外部数据集和专门的微血管表型中开展进一步验证,以明确这些共享信号在多大程度上真正反映跨器官微血管生物学。若获得验证,该框架有望为未来生物标志物发现、血管表型分层以及跨器官预防或治疗策略开发提供方向。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号