今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

PSCSE:基于提示的对比学习结合样本过滤技术,用于无监督的句子嵌入

《Scientific Reports》:PSCSE: prompt-based contrastive learning with sample filtering for unsupervised sentence embedding

【字体: 大 中 小 】 时间:2026年05月28日 来源:Scientific Reports 3.9

编辑推荐:

  摘要无监督的句子表示学习在自然语言处理中至关重要。最近,对比学习方法通过优化嵌入空间的对齐性和一致性取得了显著的性能提升。然而,现有的主要方法主要集中在对正样本的数据增强上,而忽视了对负样本的采样方法。大多数方法依赖于随机批量采样来生成负样本,这可能导致误判(即产生假阴性)并影响

  

摘要

无监督的句子表示学习在自然语言处理中至关重要。最近,对比学习方法通过优化嵌入空间的对齐性和一致性取得了显著的性能提升。然而,现有的主要方法主要集中在对正样本的数据增强上,而忽视了对负样本的采样方法。大多数方法依赖于随机批量采样来生成负样本,这可能导致误判(即产生假阴性)并影响模型的判别能力。为了解决这个问题,我们提出了一种基于提示的对比学习方法——带样本过滤的无监督句子嵌入(PSCSE)。在所提出的模型中,我们使用“NOT”风格的提示(例如:“这句话:[X] 并不意味着 [MASK]”)生成的合成负样本来优化学习到的表示的一致性。此外,我们还使用了辅助编码器来进行样本过滤,以减少误判的情况。我们在语义文本相似性数据集上进行了实验,结果在平均斯皮尔曼相关系数评分上超越了现有的主流方法 SimCSE、E-SimCSE 和 PromptBERT,最高提升了 1.0 分。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:无监督句子表示学习|对比学习方法|负采样优化|样本过滤机制|假阴性误判|语义相似度提升

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号