基于多尺度1D-CNN和注意力机制的汇率多步预测研究

来源:《系统工程理论与实践》时间:2024-08-15


图源摄图网

摘要:深度学习在处理时间序列数据上具有优势, 在汇率时间序列的应用研究中, 目前深度学习主要关注于单步预测, 即利用以前时点的数据预测下一个时点的汇率数据. 然而, 在实际应用中, 这种单步预测方式往往无法为决策者提供足够的决策信息; 同时, 由于汇率时间序列呈现出非平稳、 复杂度高等特点, 直接利用传统深度学习方法进行预测无法充分挖掘汇率序列的特征及规律. 为此, 本研究提出一种基于多尺度一维卷积神经网络(1D-CNN)和注意力机制的汇率多步预测方法, 该方法在自适应的融合多尺度特征的同时, 差异化的融合汇率不同时刻的时间序列特征, 实现汇率的多步预测. 通过实验发现, 所提方法相较于基准方法, 如差分整合移动平均自回归模型、 支持向量回归、 随机游走、 极限梯度提升算法、 长短期记忆网络等具有更高的预测精度, 表明该方法能够为外汇市场投资者提供决策支持.
关键词:汇率多步预测;深度学习;多尺度1D-CNN;注意力机制

一、研究背景与意义

随着经济全球化的不断发展,汇率作为连接国家之间交易的纽带,影响着国家经济的稳定性。由于汇率的波动会对国际贸易和金融投资产生较大的影响,科学分析汇率变动、准确预测汇率值,具有重要的理论研究意义和实际应用价值。汇率预测一方面有助于私人投资者及时调整投资策略、分散风险,从而获得更多利润,另一方面也有助于跨国企业在国际交易中做出更好的风险管理决策,降低汇率波动带来的风险。然而,由于外汇市场是一个典型的复杂动态系统,汇率数据具有非线性、非平稳性、高波动性和不规则性等特征,使得准确预测汇率波动变得极为困难。因此,如何构建一种有效的汇率预测方法已成为金融业和学术界广泛关注的问题。

在早期的研究中,许多研究人员使用统计方法预测汇率,并开发了一些成熟的统计模型。但由于这类方法存在一定前提条件(如数据平稳性、线性等),在处理汇率这类非平稳数据时会呈现出较多不足。近年来,由于机器学习在很多领域都取得了巨大的成功,被逐渐引入汇率预测研究中以提高预测精度。目前典型的传统机器学习方法有LR、SVR和ANN等。然而,基于传统机器学习的时间序列预测方法也存在一定问题,如容易出现过拟合或局部最优解,预测时具有一定滞后性等,导致预测精度不够高。近年来,越来越多的学者开始关注深度学习方法,并将其应用于汇率预测领域。

然而,现有的大多数深度学习汇率预测方法都是用于单步预测任务,所获得的结果往往无法为决策者提供足够的决策信息。此外,由于汇率数据具有非平稳的特征,直接利用传统深度学习方法进行预测无法充分挖掘汇率序列的特征及规律。因此,本研究设计一种深度学习方法进行汇率多步预测,使用注意力机制等结构提高多步汇率预测的精度。

二、主要内容

针对现有研究存在的问题,本研究提出了基于多尺度1D-CNN网络和双重注意力机制的深度学习方法,实现对未来多个时间步汇率值的预测。首先,利用多尺度1D-CNN对时间序列进行不同精细度的特征提取以降低汇率数据非平稳特征带来的不利影响,并使用尺度注意力机制融合多尺度目标特征,通过对不同尺度特征的权重计算,以提高特征有效性;然后,利用时间注意力机制赋予不同时间步相应权重以更充分的挖掘汇率序列的特征及规律,进一步提高模型预测精度;最后,引入双向循环神经网络进一步挖掘时间序列过去和未来的动态特征,对汇率进行多步预测。

本研究在三对汇率对的真实数据集上进行实验,验证所提方法的性能。此外,为更好地说明所提方法的有效性,对三种汇率对的真实值和预测值拟合效果进行分析。实际结果与预测结果曲线非常相近,说明DAMS-1DCNN对于整体汇率变化趋势能产生较为准确的预测结果,进一步证实了本研究方法对于汇率多步预测的有效性。其次,为了验证各模块的效用及其对于预测性能的影响程度,本研究进行了消融实验研究,构建了4种变体模型与本研究模型进行对比。通过消融实验分析的结果,有助于可视化每个模块的效用及其对于预测性能的影响程度,从而为未来经济工作者选取或改进深度学习模型算法进行短期汇率预测提供决策支持。最后,本研究还进行了参数敏感性分析,选择不同尺度进行实验分析。实验结果表明适度的卷积核尺度数可以使模型学到更好的特征,从而提高模型的预测精度。

三、主要结论及政策建议

本研究选取了三对汇率对,分别为欧元兑美元、英镑兑美元和美元兑人民币2011年9月30日至2021年9月30日的每日收盘价进行实验分析。通过比较两种评价指标结果可以看出基于多尺度1D-CNN网络和双重注意力机制的深度学习方法的MAPE、RMSE值显著小于ARIMA、SVR、RW、XGBoost和LSTM等基准方法,说明所提方法是一种有效且稳健的汇率预测模型,与其他基准方法相比具有优越的性能。此外,通过消融实验分析,可以看出所提方法的每个模块都在一定程度上提升了多步汇率预测的精度。通过对不同尺度进行实验分析,可以看出适度的卷积核尺度数可以使模型学到更好的特征,从而提高模型的预测精度。

四、边际贡献与未来拓展

本研究的贡献主要有以下几点:第一,设计了一种新的汇率多步预测框架,该框架采用双重注意力机制结构,通过增加权重计算大大提升了汇率多步预测的精度;第二,提出了一种新的汇率多步预测模型DAMS-1DCNN。具体而言,采用多尺度1D-CNN进行特征提取,降低非平稳特征的不利影响,利用尺度注意力机制进一步提高特征的有效性,采用时间注意力机制充分挖掘时间序列的相关性;第三,在三个汇率数据集上验证了本研究所提模型DAMS-1DCNN的性能,实验结果表明本研究所提模型优于其他基准方法。

本研究下一步的研究方向将从以下几点展开:第一,本研究只预测了1天、3天和6天的短期汇率多步值,为了提供给汇率预测使用者更多决策支持,可以进一步拉长汇率预测的时间。第二,小时汇率、分钟汇率等高频汇率数据有利于提高汇率多步预测的精度,未来可以将本研究使用的日数据转化为更高频率的汇率数据。第三,本研究只使用了汇率的历史数据,属于单变量预测。然而,汇率波动受多种因素的影响,包括经济因素、政治因素和社会因素等,本研究在预测模型建模过程中,忽略了对这些因素的考虑,对于突发事件的解释能力不足。未来在预测模型建模过程中将考虑影响汇率变动的因素,如利率、通货膨胀、产出缺口等,并将新设计的方法与经济基本面模型进行比较。第四,本研究所提的深度学习模型相比于机器学习和传统经济模型在数据信息利用方面的优势呈现较为抽象,可解释性弱。未来将重点关注可解释的深度学习方法,以便更多经济工作者理解和使用。

 

本文摘编自《系统工程理论与实践》2024年,第44卷,第6期论文《基于多尺度1D-CNN和注意力机制的汇率多步预测研究》(点击题目链接全文)
作者:王刚1,2, 博士,教授,研究方向:信息管理与信息系统;陈红1, 硕士研究生,研究方向:商务智能;马敬玲1, 博士研究生,研究方向:智能风控与金融序列预测,;王珏3,博士,研究员,研究方向:智能计算和经济预测。
       1. 合肥工业大学 管理学院, 合肥 230009;
       2. 过程优化与智能决策教育部重点实验室, 合肥 230009;
       3. 中国科学院 数学与系统科学研究院, 北京 100190