今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

预测性元认知:一种用于大型语言模型自我监控的神经计算框架

《Scientific Reports》:Predictive metacognition: a neuro-computational framework for self-monitoring in large language models

【字体: 大 中 小 】 时间:2026年05月27日 来源:Scientific Reports 3.9

编辑推荐:

  摘要大型语言模型展现了卓越的能力,但存在严重的元认知缺陷,表现为过度自信和幻觉,这严重限制了它们在高风险应用中的使用。我们提出了“预测性元认知”(Predictive Metacognition)框架,该框架借鉴了神经生物学的原理,将预测处理机制和前扣带回皮层的监控功能整合到了T

  

摘要

大型语言模型展现了卓越的能力,但存在严重的元认知缺陷,表现为过度自信和幻觉,这严重限制了它们在高风险应用中的使用。我们提出了“预测性元认知”(Predictive Metacognition)框架,该框架借鉴了神经生物学的原理,将预测处理机制和前扣带回皮层的监控功能整合到了Transformer架构中。我们的方法通过专门的微调实现了“错误驱动学习”(Error-Driven Learning)和“双过程监控”(Dual-Process Monitoring),使模型能够同时生成响应并评估自身的性能可靠性。我们使用LoRA(排名=8,\(\alpha =16\))对Llama-3-8B-Instruct和Phi-3-Mini-4k-Instruct进行了微调,训练数据包含4000个精心设计的示例,涵盖了不同的信心水平。与包括GPT-4o和Claude-3.5-Sonnet在内的最先进模型进行对比评估后,发现我们的模型在信心校准方面取得了统计学上的显著提升。这些元认知模型将布里尔分数(Brier Score)降低了11.6%和17.2%,预期校准误差(Expected Calibration Error)显著降低(\(p < 0.023\)),Cohen’s \(d\) 值为1.456)。重要的是,这些改进在跨领域任务中也能保持稳健性,并且任务准确率依然具有竞争力。这项工作为大型语言模型建立了一种计算上可行的、基于生物学的元认知架构实现方法,为开发能够可靠地进行自我监控的AI系统提供了理论基础,使这些系统能够更准确地评估自身的知识边界并表达适当的不确定性。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:微调 LoRA 模型 预测性元认知框架 神经学原理 Llama-3 幻觉校准 评估不确定性自我监控 错误驱动学习 模型自信缺陷 置信度提升 跨领域稳健性

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号