今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

何时保持沉默更安全:面向医疗领域大型语言模型回避行为的综述与决策理论框架

《npj Digital Medicine》:When silence is safer: a review and decision-theoretic framework for LLM abstention in healthcare

【字体: 大 中 小 】 时间:2026年06月17日 来源:npj Digital Medicine 15.1

编辑推荐:

  摘要大型语言模型旨在为用户的问题生成答案,这往往使它们在存在高度不确定性、信息不完整或应当拒绝回应时仍会给出答复。在医疗领域,这种倾向可能十分危险:错误但看似可靠的医疗建议可能会造成严重危害,因此具备拒绝回应的能力尤为重要。本文综述了有关大型语言模型在医疗场景中拒绝回应行为的研究

  

摘要

大型语言模型旨在为用户的问题生成答案,这往往使它们在存在高度不确定性、信息不完整或应当拒绝回应时仍会给出答复。在医疗领域,这种倾向可能十分危险:错误但看似可靠的医疗建议可能会造成严重危害,因此具备拒绝回应的能力尤为重要。本文综述了有关大型语言模型在医疗场景中拒绝回应行为的研究。现有研究主要指出两种动机:一是基于不确定性的拒绝,即当模型对答案的置信度较低时会选择不回应;二是基于安全考虑的拒绝,即模型会避免提供可能有害的信息。目前大多数相关机制都是外在的,依赖辅助工具来决定何时拒绝回应。我们发现,最先进的大型语言模型仍然难以拒绝不合适的请求,而且很少有评估标准是在真实的医疗场景下测试拒绝行为的,这类场景下的模型表现往往不如其他领域。基于这些发现,我们提出了一种基于决策理论的拒绝行为建模方法,用于分析在存在不确定性及潜在危害时回应与不回应之间的权衡。以此为基础,我们设计了MedSAFE框架,用于评估临床对话中的拒绝行为,并通过基于现有研究案例设计的概念验证试验展示了该框架的实际应用效果。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:大型语言模型医疗场景拒绝|决策理论建模|MedSAFE框架|不确定性响应|安全问题评估|临床对话测试

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号