利用基于深度学习的复合分子指纹技术发现新型黄嘌呤氧化酶抑制剂:筛选、生物活性评估及结合行为分析
《Bioorganic Chemistry》:Discovery of novel xanthine oxidase inhibitors using deep learning-based composite molecular fingerprint: Screening, bioactivity assessment and binding behavior analysis
【字体:
大
中
小
】
时间:2026年06月05日
来源:Bioorganic Chemistry 4.7
编辑推荐:
赵普成|杨灿|尹琴|孙巧梅|刘燕|李彦芳四川大学化学工程学院,成都610065,中国摘要黄嘌呤氧化酶(XO)被确认为治疗高尿酸血症(HUA)的关键靶点。目前临床使用的黄嘌呤氧化酶抑制剂(XOIs)受到不良反应或生物利用度不佳的限制,因此需要发现新的抑制剂。在这项研究中,我们利用深
赵普成|杨灿|尹琴|孙巧梅|刘燕|李彦芳
四川大学化学工程学院,成都610065,中国
摘要
黄嘌呤氧化酶(XO)被确认为治疗高尿酸血症(HUA)的关键靶点。目前临床使用的黄嘌呤氧化酶抑制剂(XOIs)受到不良反应或生物利用度不佳的限制,因此需要发现新的抑制剂。在这项研究中,我们利用深度学习(DL)技术生成了复合分子指纹,并训练了一个XOI分类模型,用于高通量虚拟筛选,结合了分子对接、ADME预测和预测构象的手动筛选。我们发现了三种活性XOI:Hit 3、Hit 5和Hit 6(IC??分别为2.08?±?0.19?μmol·L?1、0.62?±?0.02?μmol·L?1和3.05?±?0.24?μmol·L?1)。通过动力学分析、光谱技术和计算模拟研究了最强效候选物Hit 5的抑制动力学和结合行为,并在草酸钾/次黄嘌呤诱导的高尿酸血症小鼠模型中评估了其降尿酸效果。结果表明Hit 5是一种可逆的混合型XOI,通过静态猝灭过程表现出强烈的荧光猝灭效应。它在XO催化活性位点的钼蝶呤腔内形成稳定复合物,从而阻断底物黄嘌呤的结合并诱导构象变化。同时,它可以直接与钼蝶呤辅因子形成稳定键,从而影响XO的催化能力。在结合过程中,它能够显著竞争8-氨基萘-1-磺酸(ANS)。推测它占据了XO的疏水腔并产生了足够的相互作用。分子动力学(MD)模拟也显示了其与XO的稳定结合。此外,Hit 5显著降低了血清尿酸水平。在初步的生物安全性评估中,Hit 5表现出相对可接受的生物安全性,包括低剂量下的低细胞毒性、肝脏和肾脏安全性,以及高剂量下的轻度肝脏毒性。上述发现验证了当前DL辅助虚拟筛选策略的有效性,为Hit 5作为治疗高尿酸血症的有希望的先导化合物提供了有价值的信息。
引言
高尿酸血症(HUA)是一种代谢紊乱,其特征是血清尿酸水平异常升高,是由于嘌呤代谢失衡或肾脏尿酸排泄受损导致的尿酸过度产生或排泄不足[1]。作为嘌呤氧化的最终产物,尿酸具有抗氧化作用,但其在关节、肾脏和血管壁中的过度沉积可引起病理损伤[2]、[3]。在这种情况下,血清尿酸升高不仅是痛风的主要原因,还与高血压、心血管疾病、慢性肾病等多种并发症相关[4]。随着现代生活方式和饮食习惯的变化,近年来HUA的发病率稳步上升,已成为一个重要的公共卫生挑战[4]。
在嘌呤代谢途径中,黄嘌呤氧化酶(XO)催化次黄嘌呤依次氧化为黄嘌呤,再氧化为尿酸。由于这一过程是尿酸生成的限制步骤,XO已被确认为治疗高尿酸血症的关键靶点[5]。临床常用的黄嘌呤氧化酶抑制剂(XOI)见图1。别嘌醇是第一个(XOI),已临床使用数十年。然而,其使用与皮肤、肝脏和胃肠道系统的多种不良反应相关,并且在某些具有遗传倾向的个体中可能引发危及生命的过敏反应[6]。非嘌呤类XOI非布司他则与严重的心血管事件有关[7]。另一种获批的抑制剂托吡索他汀由于口服生物利用度低,限制了其长期使用[8]。因此,迫切需要开发具有更好选择性和安全性的新型XOI。
在先导化合物发现过程中,高通量筛选(HTS)是一项关键技术,通过利用自动化技术和检测方法的小型化,可以快速评估庞大的化合物库,从而加速具有潜在活性的候选分子的识别。自20世纪90年代以来,虚拟筛选(VS)作为一种重要的HTS方法出现,因其效率更高、成本更低[9]。根据输入信息,VS通常分为两大类:基于配体的虚拟筛选(LBVS)和基于结构的虚拟筛选(SBVS)[10]。LBVS依赖定量结构-活性关系(QSAR)来挖掘现有活性数据,找出与已知活性化合物具有相似分子性质的化合物。
由于LBVS不需要三维受体结构,因此速度快且非常适合早期的大规模筛选。不幸的是,它对先前活性数据的依赖性限制了其骨架跳跃能力[11]。相比之下,SBVS强调预测配体-靶标相互作用,并通过估计结合亲和力对候选物进行排序。尽管SBVS可以提出结合模式,适用于后期先导化合物优化,但它依赖于高质量的目标结构,且计算强度高于LBVS,尤其是在使用高精度评分函数时[12]、[13]。实践中,LBVS和SBVS经常结合使用。例如,可以先用LBVS快速筛选大量化学库,然后通过精细的SBVS对接来提高命中率。这种策略在XOI的虚拟筛选中也已被证明是有效的,多项研究证实了这种组合方案的可行性[14]、[15]。
近年来,机器学习(ML)和深度学习(DL)的出现彻底改变了虚拟筛选。与传统VS技术不同,ML可以自动学习分子结构和生物活性之间的复杂非线性关系,从而超越了手工制定规则的局限,大大增强了筛选能力并揭示了更深层次的规律[16]、[17]。因此,ML方法在VS中表现出优越的性能,尤其是在以QSAR为导向的LBVS领域。陈倩等人(2024年)和阮玉安等人(2025年)开发了基于ML的VS工作流程,从肽和天然产物中发现XOI,并取得了令人鼓舞的结果[18]、[19]。然而,大规模、合成可获取的小分子库显然更具吸引力。因此,我们建立了一个集成工作流程,将基于ML的VS与SBVS相结合,以发现新型、有前景的小分子XOI。
特征工程是ML的关键组成部分:它将输入信息转换为机器可读的描述符,这些描述符的完整性在很大程度上决定了模型的最终性能[20]。在LBVS中,常用的策略是使用分子指纹训练分类模型[21]。分子指纹将结构特征压缩为二进制或整数字符串,从而实现快速的相似性搜索和比较。其中,Morgan指纹应用最广泛;它有效地编码了二维拓扑和原子属性,在许多基于ML的VS任务中表现良好。然而,它缺乏对三维取向和电子效应的明确表示。为了弥补这一点,研究人员经常使用额外的描述符来创建复合指纹[22]。由于DL模型强大的特征提取能力,它们越来越多地用于分子指纹设计[23]、[24]。特别是BERT类型的架构可以在相对较小的数据集上进行微调,以用于下游任务;这种迁移学习能力在标记数据稀缺的药物筛选场景中具有明显优势[25]、[26]。
在这项研究中,基于简化分子输入格式(SMILES)的化学语言模型ChemBERTa在标注有XOI数据的数据库上进行了微调,使其能够生成捕获XOI相关化学特征的分子信息。将这些信息与Morgan指纹结合,生成了丰富的复合指纹。利用这种复合指纹,我们训练了一个XOI ML分类器。结合分子对接构象和得分的全面分析以及ADME预测,构建了一个多阶段虚拟筛选工作流程(图2),并将其应用于包含168万个合成可获取分子的库。最终,发现了三个候选化合物。对于最有前景的候选物Hit 5,进行了体外和体内的生物活性评估。此外,还使用光谱技术和计算模拟探讨了其与XO的结合机制。
章节片段
用于复合指纹的深度学习模型
77M的ChemBERTa模型使用包含10,939个标记SMILES序列的数据集进行了微调,并实施了提前停止策略以减轻过拟合。训练在18个周期后收敛,最终训练损失为0.2674,验证损失为0.2064,验证准确率为0.9469。通过网格搜索获得的最佳训练超参数见表S3。
消融研究是通过随机打乱标签序列进行的
材料和试剂
黄嘌呤氧化酶(XO,牛乳;6?U?mg?1,PCode 1,003,591,239,来源SLPC2785)从Sigma-Aldrich购买,黄嘌呤(纯度>98%,目录号X104264)从上海Aladdin Bio-Chem Technology Co., Ltd.购买。两者在使用前均立即溶解在50?mmol?L?1磷酸盐缓冲液(PBS,pH?7.4)中。别嘌醇(纯度>99.8%)从上海Yuanye Biotechnology Co., Ltd.购买;ANS(纯度>95%)从TCI(上海)购买;噻唑蓝四唑溴化物(MTT)
结论
在这项研究中,我们用一组药物化学描述符调整了ChemBERTa语言模型,并将得到的DL指纹与传统的ECFP4向量融合,创建了一个高性能的复合分子表示。将这种指纹应用于XOI ML分类器的训练,我们构建了一个HTS工作流程,查询了168万个商业化合物。结合分子对接的能量数据、预测的结合模式和ADME预测,我们
CRediT作者贡献声明
赵普成:撰写——原始草稿、可视化、软件、方法学、数据管理、概念化。杨灿:撰写——审阅与编辑、概念化。尹琴:验证、方法学。孙巧梅:资源获取。刘燕:资源管理、项目协调。李彦芳:撰写——审阅与编辑、资金获取、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
致谢
四川大学西药学院提供。中国四川省科学技术厅(资助编号2022YFS0433)对财务支持表示感谢。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号