图源:视觉中国
摘要:股票市场的准确预测对投资者和监管层而言都具有重要意义。在金融时间序列预测研究中分解-集成框架被广泛使用,然而以往研究中针对分解后的模态分量多数采用单一历史数据预测未来的思路,往往忽略了其他低频异质数据对分量的影响。本文融合了分解-集成与混频数据采样思想,提出EEMD-Mixed Frequency CNN-BiLSTM-Attention/LSTM-LSTM(EE-MFCBA/L-L)股指收益率预测模型,通过EEMD将股指收益率分解为若干不同频率特征的分量,采用模糊熵算法识别分量频率特征,进而结合不同频率倍差的低频数据,使用MFCBA/L模型实现对模态分量的预测,最后采用LSTM模型非线性集成各分量的预测结果。实证结果表明,所提出的模型可以更好地适应收益率变化特征,与传统模型相比,所提模型在预测非平稳和非线性收益率序列方面具有显著优势,具有最低预测误差和最高的方向性预测准确率。
关键词:股票指数;混频预测;集成学习;信号分解
一、研究背景与意义
随着经济全球化的发展,世界经济环境日趋复杂,联系愈加紧密,中国股票市场作为主要市场之一,在全球金融市场中占有举足轻重的地位。股票市场受政治、经济及政策等多因素影响,本质上是一个动态、非线性、非平稳、波动聚集的复杂系统。近年来,由于新冠疫情及中美关系不确定性等外部因素,使股票市场的非平稳、波动聚集性愈加突出,准确预测股票市场走势愈加困难。准确预测股票指数不仅受到投资者和众多学者的关注,也对政府监管部门意义重大。
二、主要结论与政策建议
本文提出了一种基于分解-集成框架,同时考虑混频数据的混合模型EEMD-Mixed Frequency CNN-BiLSTM-Attention/LSTM-LSTM预测股指收益率,根据模态的频率特征采用不同的预测方法,创造性地结合不同频率倍差的低频数据,基于混频数据对模态分量进行预测,最后将所有模态的预测值进行非线性加总得到最终的预测结果。以沪深300、中证500指数现货收益率作为预测对象的实证研究表明,所提出的模型在预测高度非平稳和非线性的收益率序列方面具有显著优势,可以更好地适应收益率变化特征,提高预测准确性。
根据实证分析结果可以得到以下结论:
(1) 所有分解集成模型的预测误差都小于单模型。分解-集成预测框架在股指收益率预测领域是有效的。此外,非线性集成方法可以提高分解-集成模型的预测性能,尤其是基于EEMD分解算法的模型,改进明显。
(2) EEMD算法在提高模型预测准确性方面具有显著优势,特别是在多步向前预测方面。EEMD-类模型预测误差明显小于基于EMD-类模型。在相同学习模型下,EEMD-类模型的整体预测精度明显优于EMD-类模型,该差异在多步向前预测方面尤其显著。该结论表明,EEMD分解算法能够更加有效的分解收益率序列,细化收益率序列的特征。
(3) 同时,考虑混频数据的MFCBA模型通常比仅考虑历史数据的LSTM模型更加准确,这在EEMD-类模型中更加明显。通过引入低频数据,根据各模态分量频率特征结合不同频率倍差的低频变量进行预测,其预测精度有显著改善。
准确预测股指收益率对于市场参与者(包括买卖双方)实现收益最大化非常重要。本文所提出的模型具有良好的预测准确性和鲁棒性,可以有效预测收益率变化趋势,为市场参与者提供有效的投资决策依据。同时,准确识别市场的异常波动对监管机构也具有重要参考意义。
三、边际贡献与未来拓展
虽然基于分解-集成框架的时间序列预测研究已经取得了较多进展,但这些研究对分解后得到的高频变量进行预测时仅考虑历史数据,忽略了外生因素对预测对象可能造成的影响,例如在股票市场上,周末或月末公布的经济指标可能会影响投资者的决策从而影响股指的变动。针对此问题,本文在预测部分引入混频数据采样思想[21],提出了Mixed Frequency CNN-BiLSTM-Attention神经网络,它可以结合不同频率差的低频变量实现对高频数据的预测,在输入端采用频率对齐方法将低频变量与高频模态分量对齐,先通过卷积神经网络进行输入变量的特征提取,再连接BiLSTM层实现历史信息的双向记忆,最后使用注意力机制对权值进行优化拟合。本文的主要贡献如下:
(1)不同于传统的分解-集成预测框架直接利用分解后各模态分量的历史数据进行拟合预测,本文采用模糊熵算法识别模态分量的频率特征,针对不同分量的频率特征,结合具有显著影响的低频因子形成混频数据,在分量上实现混频预测并集成,提高模态分量的预测精度,与未考虑混频因素的方法相比,预测精度大幅提升。
(2)本文提出的Mixed Frequency CNN-BLSTM-Attention网络可以将高频变量与低频变量相结合,有效拟合混频数据,实现异步时间序列数据的预测,本文将其应用在经EEMD分解后的高、中频模态分量的预测上,实证结果表明Mixed Frequency CNN-BiLSTM-Attention神经网络可以提升模态分量的预测精度。
(3)本文通过实证研究验证了所选取的公募基金仓位、货币供应量M2低频数据能够影响未来股指收益率,具有显著经济含义,并且这些低频数据可以提高所提模型对股指收益率的预测准确率。
本文摘编自《系统工程理论与实践》第42卷第11期论文《基于分解-集成和混频数据采样的中国股票市场预测研究》(点击题目链接全文);
作者:陈凯杰1, 博士研究生;唐振鹏2, 吴俊传3, 博士;杜晓旭1, 博士研究生;蔡毅1,硕士研究生
1. 福州大学 经济与管理学院, 福州 350108;
2. 福建农林大学 经济管理学院, 福州 350002;
3. 南昌大学 经济管理学院, 南昌 330031