NEXUS:一个多模态框架,用于捕捉金融市场预测中的金融新闻互动

《Expert Systems with Applications》:NEXUS: A Multi-Modal Framework for Capturing Financial News Interactions in Market Forecasting

【字体: 时间:2026年04月15日 来源:Expert Systems with Applications 7.5

编辑推荐:

  新闻事件与市场价格的交互建模及实证研究。提出NEXUS多模态框架,融合新闻文本与市场数值信号,捕捉新闻间依赖及市场动态关联,在标普500和纳斯达克100数据集上使日度夏普比率分别提升0.427和0.338。发现市场信息吸收存在延迟效应(平均滞后3.2个交易日)、长期记忆效应(持续影响达14个交易日)及情感模型局限(对专业术语识别准确率低于75%)。

  
作者:Tian Guangyang | Bao Wuzhida | Cao Yuting | Yang Yin | Wen Shiping
澳大利亚悉尼科技大学工程与信息技术学院人工智能研究所,澳大利亚新南威尔士州乌尔蒂莫,2007年

摘要

将财经新闻融入市场价格是一个复杂且多阶段的过程,这增加了评估新闻中的具体事件与后续市场走势之间关系的难度。我们提出了NEXUS(News-Exchange Unified Signal Framework,新闻-交易所统一信号框架),这是一个全面的架构,旨在捕捉财经新闻与市场行为之间的内在联系,以及多个新闻事件之间的上下文关系。NEXUS结合了来自市场的数值信号和新闻报道的文本信号。我们在两个大规模数据集上评估了这一方法,这些数据集涵盖了标普500指数和纳斯达克100指数十五年的数据,包含超过200万篇新闻文章。在这些数据集中,NEXUS将两个市场的日夏普比率分别提高了0.427和0.338,表明其具有更优的风险调整性能。除了准确性之外,研究结果还揭示了新闻与市场互动中的三个显著现象:价格吸收的延迟、信息效应的持续性,以及基于情感的模型在捕捉更深层次上下文线索方面的局限性。通过明确建模新闻事件之间的日内关联关系,并估计它们在市场价格条件下的影响,NEXUS提供了对财经信息传播的结构性理解,超越了传统的多模态融合方法。

引言

长期以来,财经新闻和媒体叙事一直被认为是影响市场表现的重要因素。然而,信息转化为价格变化的机制是复杂且非线性的(Chaudhary, Vuleti?, Prenzel, Cucuringu, 2024)。每条新闻的影响可能因市场状况、交易者行为和发布时间而异。现有研究通常采用汇总处理新闻数据的方法,评估其对市场的整体影响,而忽略了单个报道的细微影响(Pallotta & Ciciretti, 2024)。因此,更详细地理解信息如何从具体新闻事件流向市场价格,可能会导致更准确的市场预测模型(Li et al., 2024a)。
由于新闻持续不断,并且会随时间与其他信息互动(Zhang, Sjarif, & Ibrahim, 2024),评估单条新闻的影响仍然具有挑战性。先前的研究表明,金融市场中的信息传播是渐进的而非瞬时的,新闻具有长期记忆效应,其影响会持续到发布日期之后很久(Lazcano, Jaramillo-Morán, & Sandubete, 2024)。在这个传播过程中,一篇报道的重要性可能会被后续的相关新闻削弱或增强(如图1所示)。在信息量庞大的环境中,确定每篇报道的市场影响变得越来越困难(Tian, Yang, & Wen, 2025)。
本研究旨在应对这些挑战。财经新闻领域为提高预测准确性以及探索如何最佳整合异构的市场相关数据提供了理想的平台。对新闻事件之间的互动进行建模需要利用文本和数值数据源,同时保持与金融理论的一致性。
我们提出了NEXUS,这是一个新闻-交易所统一信号框架,它可以明确捕捉新闻报道之间的依赖关系,并评估它们对市场趋势的多样化影响。该框架包括两个主要模块:多模态表示融合模块和新闻-市场互动模块。多模态表示融合模块通过分别编码文本和数值信号,然后将它们组合成每个市场快照和新闻报道的连贯特征。新闻-市场互动模块基于金融原理分析新闻内部的关系以及新闻与市场价格之间的跨领域联系,最终估计每条新闻在更广泛市场背景下的贡献。
在标普500指数和纳斯达克100指数上的实证结果证实了NEXUS的优越性能。与最近直接处理新闻标题的大型语言模型(LLM)方法相比,我们的方法表明,通用LLM并不适合处理大规模的财经文本流。虽然LLM在情感提取方面表现出色,但NEXUS能更好地捕捉新闻信息与市场走势之间的定量关系。
我们的分析还揭示了市场吸收信息的三个关键方面:首先,我们观察到财经新闻定价存在可测量的延迟,表明市场效率并不完美;其次,我们确认了新闻影响在较长时间范围内的持续性,支持了长期记忆效应的存在(Shi, Hu, Mo, & Wu, 2022);第三,我们指出了基于情感的模型的不足,并展示了互动建模如何增强对财经新闻的预测理解。

基于新闻的市场预测

多项研究表明,财经新闻会反复影响投资者的预期、情绪和交易决策,从而影响市场波动性和价格走势(Hossen, Hoque, Aziz, Ramanathan, & Raja, 2024)。早期研究指出,新闻的语气和媒体关注度可能会推动超额回报或引发市场行为偏差。随着数据挖掘和自然语言处理(NLP)的发展,新闻数据(如新闻稿、在线文章和推文)已成为重要的信息来源。

数学公式和符号说明

d表示一个交易日。对于每一天,我们用M_d表示市场数据集,用R_d表示新闻报道集合。每个来源都提供文本和数值成分,分别用(·)^((t)和(·)^((n))表示。 M_d表示为Md=(md(t), md(n)),其中m(t)包括市场描述和公司名称,R_d包含价格和交易量等定量指标。每日新闻语料库Rd={Rd,1,,,,,,Rd,Nd包含N_d条新闻报道。

方法

所提出的NEXUS框架旨在衡量财经新闻如何影响价格变化,同时考虑报道之间的相互关系。其架构由两个主要模块组成:多模态表示融合模块和新闻-市场互动模块。多模态表示融合模块通过分别编码文本和数值信号,然后将它们组合成每个市场快照和新闻报道的连贯特征。新闻-市场互动模块基于金融原理分析新闻内部的关系以及新闻与市场价格之间的跨领域联系,最终估计每条新闻在更广泛市场背景下的贡献。

语言模型用于文本编码

财经文本与通用语言有显著差异,通常包含专业术语、缩写和领域特定的表述。为了研究文本编码器如何影响市场-新闻互动建模,我们在NEXUS框架中评估了四种代表性语言模型(LM)作为文本编码器:RoBERTa、FinBERT、BGE和Llama2。这些模型代表了不同的设计理念:通用型、领域适应型、以嵌入为中心型和生成型。

语言模型比较

为了评估不同的文本编码器对新闻-市场关系学习的影响,我们将四种代表性语言模型(RoBERTa、FinBERT、BGE和Llama2)集成到NEXUS中。这些模型分别代表了通用型、领域适应型、以嵌入为中心型和生成型架构。所有模型都在相同的配置下使用标普500指数数据集进行训练,其性能在表1中进行了总结。
结果表明,RoBERTa始终产生最强的效果

结论

本研究提出了NEXUS,这是一个统一的框架,旨在量化和解释财经新闻与市场行为之间的互动。与传统的情感驱动模型不同,NEXUS将每条新闻视为独立的信息源,并分析新闻项目如何集体影响价格动态。通过整合多模态特征和基于注意力的影响量化方法,该模型捕捉到了新闻内部依赖关系

CRediT作者贡献声明

Tian Guangyang:撰写、概念化、方法论、验证 Bao Wuzhida:可视化 Cao Yuting:调查、验证 Yang Yin:撰写、软件开发、调查 Wen Shiping:编辑、监督

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号