基于大语言模型(LLM)结合检索增强生成(RAG)、图神经网络(GNN)与多智能体(Multi-Agent)系统的金融新闻事件级情感分析综合框架

《Information》:Event-Based Sentiment Analysis of Financial News Using Large Language Models: A Comprehensive Framework Integrating RAG, GNNs, and Multi-Agent Systems

【字体: 时间:2026年06月10日 来源:Information 2.9

编辑推荐:

  数字金融新闻的激增为市场驱动事件的自动化分析提供了前所未有的机遇。本文提出一种利用大语言模型(Large Language Model, LLM)进行金融新闻事件级情感分析(Event-Based Sentiment Analysis)的框架,该方案融合三种互

  
数字金融新闻的激增为市场驱动事件的自动化分析提供了前所未有的机遇。本文提出一种利用大语言模型(Large Language Model, LLM)进行金融新闻事件级情感分析(Event-Based Sentiment Analysis)的框架,该方案融合三种互补技术:用于上下文增强的检索增强生成(Retrieval-Augmented Generation, RAG)、用于建模事件间关系的图神经网络(Graph Neural Network, GNN)以及用于协同推理的多智能体集成(Multi-Agent Ensemble)。该方法针对金融文本处理中已知的难点——领域专用术语、隐式事件检测及时序推理——将基于Transformer的事件抽取与经外部知识检索增强的情感分类相结合。研究人员在由14,851条金融新闻样本聚合而成的语料库上对六种模型配置进行评估。在事件检测任务中,所有配置的加权F1值均达到100%;研究人员指出此为高度不平衡数据集上二分类(事件/非事件)设定导致的天花板效应(Ceiling Effect),而非难解问题被攻克,并讨论了其对系统评估方式的启示。在三分类情感分析(正面/负面/中性)中,最优配置——多智能体集成——准确率达87.4%,略高于RoBERTa(Robustly Optimized BERT Pretraining Approach)基线87.2%;由于模型间差异微小且未做显著性检验,结果仅作趋势性参考而非定论。GNN组件作为设计提案描述但未做实验验证,文中明确说明了此局限。该框架可生成适用于算法交易、风险评估及投资决策支持的可解释结构化输出,并提供可复用金融NLP流水线及对本研究证据强弱的坦诚说明。
《Information》刊载论文解读:基于LLM整合RAG、GNN与多智能体系统的金融新闻事件级情感分析框架
一、研究背景与立项依据
传统金融文本分析依赖基于规则的系统与词典方法,存在泛化能力差、难以适应不断演化的市场术语等缺陷。尽管基于Transformer架构的大语言模型(Large Language Model, LLM)如BERT、GPT及其金融变体FinBERT在自然语言处理(Natural Language Processing, NLP)领域表现卓越,但在应用于金融领域事件级情感分析时仍面临四大挑战:一是金融文本含大量领域专用术语(Technical Jargon)、缩略语及隐式指代;二是金融新闻中事件常跨句表述,需理解因果关系与时序依赖;三是金融语境下情感具有细微差别,同一事件对不同市场参与者意味不同;四是为满足可解释性与合规要求需避免黑盒预测。现有研究缺乏将事件抽取与情感分析有机整合并能透明报告局限性的端到端评估框架,因此研究人员开展了此项结合检索增强生成(Retrieval-Augmented Generation, RAG)、图神经网络(Graph Neural Network, GNN)及多智能体系统(Multi-Agent System)的综合框架研究并在《Information》期刊发表。
二、主要关键技术方法
研究人员构建了含14,851个标注样本(来源于Twitter Financial News、Financial PhraseBank、FiQA-2018等公开数据集及SEC EDGAR文件)的不平衡金融新闻语料库(中性86.9%、正面8.8%、负面4.3%),按7:1.5:1.5分层划分。核心技术方法包括:(1)基于Transformer(BERT-base、RoBERTa-base、FinBERT)微调的事件触发词检测与二分类事件/非事件判定;(2)RAG模块使用all-MiniLM-L6-v2句向量模型与FAISS索引从训练集采样的3000条金融 passage 中检索Top-k=3相关知识增强情感判断;(3)提出的GNN模块以事件、实体为节点,时序/因果/共现关系为边做消息传递传播情感信号(本研究中未实验验证);(4)多智能体系统由三个独立专用智能体分别处理输入,通过多数投票(Majority Voting)产生最终标签并记录一致性得分作为置信度信号;(5)对比六种配置——Transformer-BERT、Transformer-DistilBERT、Transformer-RoBERTa、Transformer-FinBERT、RAG增强FinBERT及Multi-Agent集成,采用加权F1与准确率评估,针对类别不平衡使用逆频率加权损失函数。
三、研究结果
6.1. Event Extraction Performance(事件抽取性能)
所有模型在二分类事件检测任务上均获加权F1值100.0%。研究人员分析指出这是因"无事件(No_Event)"类占64%主导,模型仅靠预测多数类即可在加权指标下得满分,属二分类加主导多数类造成的天花板效应,不能反映真实抽取能力。回应研究问题RQ4:标准加权指标在此设定下几近无效,应报告微平均F1(Micro-averaged F1)、少数类(事件类)精确率/召回率或AUC。该结果不作为强事件抽取能力的证据。
6.2. Sentiment Analysis Performance(情感分析性能)
三分类情感分析结果显示:多智能体系统集成准确率87.4%(加权F1 87.4%)、RoBERTa 87.2%、FinBERT 86.4%、RAG增强FinBERT 86.6%、BERT-base 86.2%、DistilBERT 84.6%。因未做k折交叉验证与显著性检验(McNemar检验等),微小差距(≤0.2%)不具统计确证性,仅作指示性参考。回应RQ3:在此数据集上通用预训练RoBERTa至少匹配领域自适应FinBERT效果。回应RQ2:多智能体优势更多体现在可靠性——情感分类一致性达90.9%,分歧样本多为模糊难例,提供可解释置信信号。回应RQ1:RAG仅带来0.2%提升,未达需增加复杂度的显著收益,小且同源的知识库可能是原因。每类指标显示中性类F1在90%以上,正面类较低,负面类召回普遍低于50%,说明模型偏向预测中性,少数类尤其是负面情感检测偏弱。
6.3. Analysis of Model Characteristics(模型特性分析)
类别不平衡致所有模型倾向判为中性以最大化整体准确率,逆频率加权损失未能完全消除此偏倚。FinBERT未明显优于RoBERTa的可能原因包括评估数据与FinBERT预训练语料(财报文本)文体差异大、RoBERTa更大多样性预训练已覆盖金融词汇、目标数据微调削弱领域预训练优势(后两点为假设未实证)。RAG对依赖局部语言线索的情感分类增益有限。
6.4. Practical Implications(实际意义)
推荐RoBERTa或多智能体系统作最优选择(高精度且无领域预训练/RAG开销);高吞吐场景可用DistilBERT(84.6%,参数量少40%);多智能体共识提供置信度量;RAG对情感分类助益有限但对需事实验证或实体消歧任务或有价值。
6.5. Computational Efficiency(计算效率)
单样本推理耗时15 ms(DistilBERT)至45 ms(全共识多智能体),批处理(Batch=32)吞吐500~1500样本/秒,显存占用2~8 GB,适合消费级GPU部署。
四、讨论与结论总结
研究人员坦陈本研究局限:仅用单次分层切分解未做交叉验证与显著性检验;GNN组件未实验验证;事件抽取简化为二分类未评估论元抽取与角色标注;RAG知识库小且未做规模敏感性分析;隐式事件检测仍具挑战;仅限英文。未来工作方向含多语言扩展、时序推理增强、多模态(图表)融合并与实时金融系统集成。
结论翻译:本文提出了一种结合大语言模型(LLM)、检索增强生成(RAG)、图神经网络(GNN)组件及多智能体集成(Multi-Agent Ensemble)的金融新闻事件级情感分析框架,旨在解决金融文本处理中领域术语、隐式事件检测及关系推理等公认难点。在14,851份样本聚合语料上的实验给出了审慎而非夸大的结果:事件检测中所有六种配置加权F1达100%,研究人员将其归因于主导多数类上的二分类任务设定而非真正强抽取能力,建议后续评估采用逐类及微平均指标;三分类情感分析中最佳配置(多智能体集成)准确率87.4%,仅略高于RoBERTa基线87.2%,因未做显著性检验与交叉验证这些差距仅作指示性参考;检索增强较FinBERT仅产生0.2个百分点变化(可能在噪声范围内);GNN虽属设计一部分但未在本研究中验证故不作为已证实贡献。该框架仍为算法交易支持、风险评估及投资决策提供实用可解释流水线,含带溯源的结构化输出及可适应机构需求的模块化设计。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号