**SAPIENT:一种多智能体框架,用于通过哨兵监控和基于大语言模型的合成人群模拟来收集企业声誉情报**
作者:Alper Ozpinar 和 Saha Baygul Ozpinar
《Systems》:SAPIENT: A Multi-Agent Framework for Corporate Reputation Intelligence Through Sentinel Monitoring and LLM-Based Synthetic Population Simulation
Alper Ozpinar and
Saha Baygul Ozpinar
【字体:
大
中
小
】
时间:2026年04月14日
来源:Systems 3.1
编辑推荐:
摘要:企业声誉管理团队依赖媒体监控和定性研究来收集信息,但在数字叙事快速发展的情况下,这两种方法的效率和覆盖范围都存在局限性。本文提出了一种名为SAPIENT(Sentinel-Augmented Population Intelligence for Emerging Narr
摘要:企业声誉管理团队依赖媒体监控和定性研究来收集信息,但在数字叙事快速发展的情况下,这两种方法的效率和覆盖范围都存在局限性。本文提出了一种名为SAPIENT(Sentinel-Augmented Population Intelligence for Emerging Narrative Tracking)的多智能体系统,该系统将公共文本流的监控层与模拟层相结合,模拟层通过受控的、可重复的虚拟焦点小组会议进行数据收集。监控层负责收集社交媒体、新闻和论坛文本,生成包含主题、情感分析、异常评分和风险标签的紧凑信号状态,这些信息通过协调器传递给模拟层。系统中的角色代理和主持人遵循“代理焦点小组”(Agentic Focus Group, AFG)协议,包括多次运行、结果差异报告以及人工审核环节。我们研究了四种可持续性沟通场景:绿色洗白行为的负面反应预测、绿色沉默风险的评估、活动预测试以及危机沟通模拟。实验共涵盖了280次AFG运行,涉及20种不同条件、三种大型语言模型(Claude Sonnet 4、GPT-4o和Gemini 2.5 Flash),以及一项有54名参与者参与的预先注册的试点验证研究。信号处理显著提高了模拟结果的准确性(p = 0.012)。跨语言实验发现英语和土耳其语在情感表达上存在不对称性(p = 0.001),但角色之间的排名顺序保持一致(r = 0.81, p = 0.015)。跨模型比较显示,三种语言模型在角色区分能力上表现一致(皮尔逊相关系数r > 0.92,所有组合的p值均小于0.002)。情感分析对提示语的改写具有较好的鲁棒性(p = 0.061,无统计学显著性),但可信度对提示语的表述非常敏感(p < 0.001)。实验1至8的所有显著结果均通过了Benjamini–Hochberg校正。另一项有54名参与者参与的Prolific平台上的试点研究验证了预测的可信度排名在不同框架下的稳定性(p = 0.004),但情感排名结果并未重复,这为未来的研究指明了具体的校准方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号