融合自适应频域分解与增强型Transformer编码器的股指预测混合模型——一种集成自适应多尺度频域分解(Frequency-Aware Adaptive Multi-Scale Decomposition)与改进Transformer编码器(Enhanced Transformer Encoder)的混合预测框架(FAMS-Transformer)
《Mathematics》:A Hybrid Model for Stock Index Forecasting Integrating Adaptive Frequency-Domain Decomposition and Enhanced Transformer Encoder
编辑推荐:
股价指数价格序列由长周期趋势、周期性波动与随机噪声等多频率分量叠加而成,有效解耦这些异质分量并分别建模是提升预测精度的关键。现有"分解—预测"范式多采用固定尺度分解,且预测模型未针对金融数据的非平稳性与高噪声特性进行专门适配,导致在自适应性与局部动态捕捉方面存
股价指数价格序列由长周期趋势、周期性波动与随机噪声等多频率分量叠加而成,有效解耦这些异质分量并分别建模是提升预测精度的关键。现有"分解—预测"范式多采用固定尺度分解,且预测模型未针对金融数据的非平稳性与高噪声特性进行专门适配,导致在自适应性与局部动态捕捉方面存在局限。本文提出一种频域感知自适应多尺度分解Transformer混合模型(Frequency-Aware Adaptive Multi-Scale Decomposition Transformer, FAMS-Transformer)。在分解层面,利用快速傅里叶变换(Fast Fourier Transform, FFT)动态识别主导周期,从而自适应解耦趋势项与波动项,克服固定尺度分解的局限性。在预测层面,在Transformer编码器(Self-Attention)与前馈网络(Feed-Forward Network, FFN)之间嵌入轻量级深度可分离卷积(Depthwise Separable Convolution),增强模型捕捉局部时序动态的能力,实现全局依赖与局部信息的协同建模。研究人员在沪深综合指数、深证成份指数及中小板100指数三个代表性中国市场指数上,设置1步至15步共四种预测步长,与包括LSTM、Transformer、TimesNet及FreTS在内的15种基线模型进行对比实验,结果表明FAMS-Transformer在所有场景下均取得最优预测精度,15步预测的确定系数(Coefficient of Determination, R2)稳定介于0.730与0.928之间。该模型在标普500(S&P 500)数据集上同样表现良好。消融实验(Ablation Study)与显著性检验进一步验证了各核心模块的有效性及性能提升的统计显著性。
论文解读:融合自适应频域分解与增强型Transformer编码器的股指预测混合模型(FAMS-Transformer)
研究背景与问题提出
股价指数时间序列具有非平稳性(Non-stationarity)、高噪声及多频率分量(长期趋势、周期波动、随机噪声)叠加的特性。传统统计模型(如ARIMA、GARCH)依赖线性假设,机器学习模型(如LSTM、SVR)难以区分异质分量的演化规律。现有的"分解—预测"(Decomposition–Forecasting)混合范式虽通过经验模态分解(Empirical Mode Decomposition, EMD)族或变分模态分解(Variational Mode Decomposition, VMD)降低了非平稳性,但存在两点不足:一是分解尺度多为预设固定值,无法根据股价序列固有的周期结构自适应调整;二是预测端采用的Transformer编码器标准自注意力机制(Self-Attention Mechanism)对局部时序模式(如短期趋势反转、波动集聚)敏感度不足。此外,通用时序模型(如TimesNet、FEDformer)未专门针对金融数据非平稳与重噪特点设计。因此,研究人员开展了结合频域自适应分解与增强Transformer编码的FAMS-Transformer混合预测框架研究。
主要关键技术方法
研究人员选用2014年4月10日至2025年3月19日的上证综指(Shanghai Composite Index, SSE)、深证成指(Shenzhen Component Index, SZSE)及中小板100指数(SME 100)日频收盘价为研究对象,并按6:1:3划分训练/验证/测试集,同时引入碳交易价、原油价、全球股指、汇率、宏观经济变量及情绪指标作为多元外生特征,并在S&P 500上做跨市场验证。方法上:①频域自适应分解模块——对输入序列标准化后做FFT得到频谱幅值,选取幅值最大的前k个频率映射为主导周期,取最大周期为移动平均窗口提取趋势分量(Trend Component),残差为波动分量(Fluctuation Component),周期识别仅基于历史输入窗避免数据泄露;②增强型Transformer预测模块——在多头自注意力(Multi-Head Self-Attention)与FFN之间嵌入轻量级一维深度可分离卷积(Depthwise Separable 1D Convolution, groups=dmodel)进行局部时序约束;趋势与波动分支分别经Patch嵌入(Path Length=P, Stride=S)送入上述编码器独立预测;③频域感知特征融合模块——利用FFT幅值经Softmax归一化构造动态权重,结合可学习参数对趋势与波动预测结果进行自适应加权融合,最后反标准化输出。对比15种基线模型(LSTM、SVR、Transformer、Autoformer、Informer、iTransformer、PatchTST、TimesNet、FreTS、DLinear、Koopa、LightTS、FEDformer、TiDE、FiLM),设1/5/10/15步多步预测,评价指标为MAE、RMSE、MAPE(%)及R2,辅以配对t检验与Wilcoxon符号秩检验、波动率区间分层分析及模块消融实验。
研究结果
5.1. Comparison with Baseline Models(与基线模型对比)
研究人员通过在三个A股指数上四组预测步长的对比实验发现,FAMS-Transformer在MAE、RMSE、MAPE及R2上均取得最优或近优值。最具挑战性的15步预测中,FAMS-Transformer的R2稳定在0.730(SSE)~0.928(SME 100)之间,误差随步长延长的衰减幅度明显小于基线模型;传统LSTM与SVR在多步预测下性能严重退化甚至R2为负。结论:自适应分解提供趋势基准、波动分支捕捉局部动态,频域感知融合使模型在长步长与高波动场景下仍保持较高精度。
5.2. Verification of S&P 500 Data Set(S&P 500数据集验证)
研究人员在S&P 500上复现相同实验设置,FAMS-Transformer四项误差指标均领先基线,证明该自适应分解与增强编码机制在成熟市场同样有效,具跨市场鲁棒性。方向准确率(Directional Accuracy, DA)各模型均接近0.50~0.53,FAMS-Transformer微幅优于基线但无显著突破,说明仅依托历史价格的点预测改进不直接等价于方向预测能力提升。
5.3. Significance Testing(显著性检验)
经Wilcoxon符号秩检验(91.3%显著)与配对t检验(88.8%显著,α=0.05),FAMS-Transformer预测误差分布系统性低于基线。少数不显著情形集中在与最强基线(PatchTST、iTransformer)的1步预测及与Autoformer的5步预测,研究人员解释为短步长下局部形态捕捉优势部分重叠,中等步长下Autoformer内置分解亦能部分分离趋势—周期。
5.4. Volatility-Regime Analysis(波动率区间分析)
按历史波动率将测试样本划分为低/中/高波动区间,FAMS-Transformer在12种区间—数据集组合中11种获最高R2(唯一例外为中波动SZSE仅次PatchTST且差距仅0.001),且在低波动区间R2不降反持平或略升。结论:模型优势不局限于高波动环境,未过拟合特定波动模式。
5.5. Ablation Experiment(消融实验)
模块必要性消融显示完整模型R2高于单独去除分解模块(w/o Decomp)、去除卷积模块(w/o Conv)及同时去除(w/o Both),两模块联合贡献大于各自独立贡献之和,呈互补关系。深度可分离卷积相比标准卷积参数量与FLOPs更低且误差更优;扩张深度可分离卷积无持续增益。周期选取策略消融表明自适应FFT周期略优于固定周期,随机周期致系统性能下降,证实FFT提取的是真实周期结构而非噪声拟合。相邻测试窗主导周期集Jaccard相似度均值>0.92(中位数=1.0),表明自适应识别的周期具时间连续性。
讨论与结论翻译(Conclusion部分浓缩总结)
研究人员提出并验证了FAMS-Transformer框架,该框架通过FFT动态识别股价序列主导周期实现自适应趋势—波动解耦,并在Transformer编码器自注意力与FFN间嵌入深度可分离卷积以增强局部动态感知,两分支预测后经频域强度加权融合。在多市场、多步长实验中全面优于15种先进基线,证实自适应频域分解与增强编码协同可克服固定分解尺度局限及标准Transformer局部感知不足的问题。FFT基动态周期识别使分解完全由数据自身周期特性驱动,深度可分离卷积以低计算开销兼顾全局—局部协同建模。局限在于尚未融合新闻文本等非结构化信息致使方向准确率提升有限,模型决策过程透明度不足(频域操作使常规SHAP及注意力可视化难直接适用),外生因子边际贡献未单独量化,且未与TimesFM等时序基础模型对比。未来工作拟引入金融情感分析构建多模态输入、适配频域归因的SHAP、对齐注意力权重与金融事件可视化、量化各类外生因子贡献,并与时序基础模型系统比较。论文发表于《Mathematics》。
(全文严格依据原文浓缩,未添加推测性内容,专业术语已标注英文缩写及首次出现解释,引用标号与图号已去除,上标下标使用标记。)