今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

一个用于蛋白质-蛋白质相互作用预测的强大框架,该框架结合了多目标集成学习和基于嵌入的表示方法

《Scientific Reports》:A robust framework for protein-protein interaction prediction with multi-objective ensemble learning and embedding-based representations

【字体: 大 中 小 】 时间:2026年06月01日 来源:Scientific Reports 3.9

编辑推荐:

   摘要 蛋白质-蛋白质相互作用(PPIs)在几乎所有细胞过程中都起着关键作用。然而,实验性地识别PPIs仍然成本高昂、耗时较长,且常常不够全面。为了解决这些挑战,本研究提出了一种混合自适应框架,用于PPI预测,该框架将现代蛋白质语言模型与进化优化和集成学习相结合

  

摘要

蛋白质-蛋白质相互作用(PPIs)在几乎所有细胞过程中都起着关键作用。然而,实验性地识别PPIs仍然成本高昂、耗时较长,且常常不够全面。为了解决这些挑战,本研究提出了一种混合自适应框架,用于PPI预测,该框架将现代蛋白质语言模型与进化优化和集成学习相结合。该框架使用Prot-T5-XL-Uniref-50语言模型对蛋白质序列进行编码,从而捕捉丰富的上下文信息、结构信息和物理化学信息。随后,通过均匀流形近似和投影技术对高维表示进行压缩,以降低计算复杂性。进一步提出了一种结合多目标非支配排序遗传算法-II(NSGA-II)和随机森林的混合方法,以提高分类器的鲁棒性。这种进化策略在估计集成所需的最优树数量的同时,最大化了预测准确性和分类器多样性。通过与最先进方法的比较实验,验证了所提出方法在四个基准数据集(人类、大肠杆菌、果蝇和秀丽隐杆线虫)上的优越性能。最后,利用Shapley加性解释方法量化并可视化了每个特征对模型预测的贡献,便于对关键嵌入维度进行排序和分析。总体而言,所提出的框架提供了一种基于蛋白质序列数据的大规模PPI预测的可靠且鲁棒的解决方案。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:蛋白质相互作用|蛋白质语言模型|进化优化|集成学习|多目标优化|特征解释

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号