
-
生物通官微
陪你抓住生命科技
跳动的脉搏
预测性元认知:一种用于大型语言模型自我监控的神经计算框架
《Scientific Reports》:Predictive metacognition: a neuro-computational framework for self-monitoring in large language models
【字体: 大 中 小 】 时间:2026年05月27日 来源:Scientific Reports 3.9
编辑推荐:
摘要大型语言模型展现了卓越的能力,但存在严重的元认知缺陷,表现为过度自信和幻觉,这严重限制了它们在高风险应用中的使用。我们提出了“预测性元认知”(Predictive Metacognition)框架,该框架借鉴了神经生物学的原理,将预测处理机制和前扣带回皮层的监控功能整合到了T
大型语言模型展现了卓越的能力,但存在严重的元认知缺陷,表现为过度自信和幻觉,这严重限制了它们在高风险应用中的使用。我们提出了“预测性元认知”(Predictive Metacognition)框架,该框架借鉴了神经生物学的原理,将预测处理机制和前扣带回皮层的监控功能整合到了Transformer架构中。我们的方法通过专门的微调实现了“错误驱动学习”(Error-Driven Learning)和“双过程监控”(Dual-Process Monitoring),使模型能够同时生成响应并评估自身的性能可靠性。我们使用LoRA(排名=8,\(\alpha =16\))对Llama-3-8B-Instruct和Phi-3-Mini-4k-Instruct进行了微调,训练数据包含4000个精心设计的示例,涵盖了不同的信心水平。与包括GPT-4o和Claude-3.5-Sonnet在内的最先进模型进行对比评估后,发现我们的模型在信心校准方面取得了统计学上的显著提升。这些元认知模型将布里尔分数(Brier Score)降低了11.6%和17.2%,预期校准误差(Expected Calibration Error)显著降低(\(p < 0.023\)),Cohen’s \(d\) 值为1.456)。重要的是,这些改进在跨领域任务中也能保持稳健性,并且任务准确率依然具有竞争力。这项工作为大型语言模型建立了一种计算上可行的、基于生物学的元认知架构实现方法,为开发能够可靠地进行自我监控的AI系统提供了理论基础,使这些系统能够更准确地评估自身的知识边界并表达适当的不确定性。
生物通微信公众号