基于多任务相关学习的投资组合优化

来源:《系统工程理论与实践》时间:2022-01-18

一、内容要点

对于金融组合投资而言,均值-方差投资组合优化问题是其中的关键问题之一,它试图在各种证券中寻求财富的最佳配置,以实现固定时间范围内的风险与预期投资回报之间的最佳权衡,也就是说,这是兼顾收益和风险的组合投资,以求达到一种平衡考量。

在包含不确定性的投资组合策略研究中,本文借鉴多任务相关学习的目标函数设置方法,对不同权重估计量进行加权能够对冲估计误差从而取得更好的样本外效果,但这类策略的加权权重往往取决于一定的分布假设,在复杂多变的真实金融市场中具有比较大的应用局限性。

本文是引入机器学习领域多任务相关学习的算法框架,以克服上述局限性的有益尝试。其办法是通过估计全局方差最小和均值-方差切点组合权重之间的相关性矩阵,对全局方差最小和均值-方差切点组合的权重进行了同步估计,从而实现了加权估计的类似效果。

在此基础上,作者还对于真实A股和美股数据集进行实证检验,其结果均表明基于本文策略的表现相对于多个基准策略具有显著提升。本文工作是金融实际问题与系统科学紧密联系的典型应用,将进一步丰富基于机器学习的投资组合优化研究的相关理论与方法。

因此,本文是借助于AI来评估金融组合投资有益尝试,值得这一领域人士关注。

二、研究背景与意义

自Markowitz(1952)的开创性工作以来,均值-方差投资组合问题已成为金融理论的关键问题之一。均值-方差优化模型同时考虑了收益和风险,构造了一条在给定收益下,包含所有最小方差组合的有效前沿,创新性地实现了对于金融资产的定价。尽管在投资者拥有二次效用函数或收益率服从联合正态分布的严格假设下,均值-方差策略能够取得最优的结果,但其在实际投资中的表现不佳。

由于总体均值和协方差的不可观测性,利用均值-方差策略进行投资时通常需要使用一些样本估计量,因此如何降低估计量的误差目前仍然是提高均值-方差相关策略实用性的关键问题之一。基于样本矩的均值-方差策略常被诟病的一大原因在于其不稳定的输出权重。在不施加非卖空约束的情况下,均值-方差策略经常会输出非常极端的权重,从而导致策略的表现不佳。为了解决这一问题,诸如收缩估计,稳健估计等方法被相继引入,并取得了不错的效果。

从估计量的角度来说,由于均值和协方差估计量均带有随机性,那么均值-方差策略的权重估计量也必然带有随机性,因此在均值-方差前沿上的不同组合,如全局方差最小组合、均值-方差切点组合等的权重估计量所包含的随机性是存在差异的,同时也有一定的相关性。在理解了这种不确定性的基础上,一系列将各种策略进行加权组合的策略被相继提出,主要可以分为三类。第一类策略直接使用全局方差最小组合以避免对收益率均值进行估计。Merton(1980),Best和Grauer(1991)等研究发现期望收益率的估计误差远大于协方差,且均值-方差权重对于前者误差的敏感性远高于后者。Michaud(1989)认为大量的估计误差会导致均值-方差最终变成误差放大器。Green和Hollifield(1992)发现直接使用全局方差最小能够有效避免均值估计量中误差的影响,有不少学者的结果也与这一结果一致。

第二类策略对权重估计量施加一定的范数约束。Jagannathan和Ma(2003)通过研究发现对全局方差最小施加非卖空约束等价于对协方差估计量进行收缩估计,即将一些极端的元素进行收缩,从而取得了与使用一些更复杂的估计量同样的样本外表现。Demiguel 等(2009)对这种施加范数约束的做法进行了统一。

第三类策略对权重估计量进行加权。Kan和Zhou(2007)从不确定性的角度重新解释了均值-方差权重估计量的误差问题,在收益率服从联合正态分布的假设下,提出可以利用不同均值-方差组合进行加权的方法对误差进行对冲。在此基础上,Tu和Zhou(2011)发现可以将均值-方差策略或Kan和Zhou(2007)加权策略的权重再进一步与等权重策略进行加权。Jiang 等(2019)进一步将全局方差最小与等权重结合,同样实现了更好的样本外表现。在中国市场方面,是否有必要进行加权取决于主动策略是否优于被动策略。黄琼等(2011)发现均值-方差策略在行业层面的表现优于等权重策略,而在个股层面的结果则正好相反,他们的结果与美股市场的结论存在较大的差异性。吴文生等(2018)则发现经过数据窥查调整后的均值-方差相关策略无法战胜等权重策略。因此,加权策略是否能够具有更优的表现将取决于是否选择了合理的加权方法。

上述方法通过一定的分布假设来确定加权权重,从而使新策略实现了更好的样本外表现。然而在实际投资过程中,各估计量的误差往往不服从于已知分布且具有高度的时变性,该问题引发作者研究如何依据数据的变化,在没有分布假设的前提下对不同组合权重进行合理加权,以相互抵消误差的不利影响。本文引入机器学习领域中的多任务相关学习算法框架,提出在没有分布假设的条件下对全局方差最小或均值-方差切点组合的权重进行估计的方法,从而进一步提升投资组合策略的表现,使其对于数据结构变化有更好的适应性。

三、策略的实证结果

多任务相关学习是在多任务学习的基础上由Zhang和Yeung(2014)提出的,通过将多个不同回归或分类任务的待估系数视为随机变量并引入这些系数之间的随机度量项,多任务相关学习可以同时实现对各任务系数的更优估计。

本文借鉴多任务相关学习的目标函数设置方法,将全局方差最小和均值-方差的优化问题看作不同的训练任务,在投资组合优化问题中引入包含权重估计量间协方差阵的惩罚项,构建了基于多任务相关学习的投资组合优化目标,从而可以同时估计全局方差最小和均值-方差切点组合的权重。这样做的原因是,考虑到全局方差最小或均值-方差切点组合相对于真实值的误差间必然存在相关性,而多任务相关学习中包含对于这种相关性的估计,可以利用这种相关性对两组合权重进行同时估计,不需要估计策略间加权的权重,并且从权重分配结果上来看同样实现了加权的效果。

之后,作者基于A股2000年至2019 年的全样本日数据,构建了基于市值因子和账面市值比因子排序的多个因子组合数据集以及从沪深300指数成分股中随机抽取的个股组合数据集,进行实证研究。作为对比,本文另外考虑了其他三种投资组合策略:等权重策略、TZ策略(Tu 和Zhou,2011)和BS策略(Jorion,1986)。等权重策略不需要很高的交易成本和调仓成本,是目前常见的比较对象。TZ策略将经过样本调整的切点组合与等权重策略进行加权,BS策略则利用了收益率均值和协方差的收缩估计量。TZ和BS策略都能在一定程度上平衡误差和偏差,因此很适合与同样考虑了误差相关性的本文方法进行对比。

从因子组合数据集的样本外结果来看,基于多任务相关学习的均值-方差切点组合策略(以下简称MTRL-MV)能够在夏普率,标准差和换手率上取得显著优于原均值-方差切点组合策略、等权重以及其他几种加权策略的表现。且从结果可以得知,MTRL-MV的表现提升是通过降低组合风险而非主动获取更多的超额收益所实现的,多任务相关学习的作用是将均值-方差的权重“拉向”全局方差最小权重,实现二者的加权,而加权权重则取决于两个策略在样本数据中的权重相关性。

图1以因子组合数据集BM20为例,展示了MTRL-MV、全局方差最小和均值-方差策略在各因子组合资产上的权重分配情况。可以看出,在所有三种策略均有较大权重分配的资产(1)上,MTRL-MV(深灰)的权重在多数情况下均介于均值-方差(浅灰)和全局方差最小(折线)之间,总体来看,MTRL-MV在某一资产上分配所有权重的极端情况有所减少,证明这是一种更加稳健的投资策略。



图1  BM20数据集下MTRL-MV、GMV和MV策略的权重分配情况

最后,本文使用A股的因子组合子样本、随机抽样的个股组合以及美股因子组合共3个数据集进行了稳健性检验,结果表明MTRL-MV相对于基准均值-方差策略具有比较显著的提升。

四、边际贡献与未来拓展

本文在不依赖于分布假设的前提下,引入多任务相关学习算法框架对两种经典投资组合策略:全局方差最小和均值-方差策略进行了同步估计,得到了两个新的权重估计量。本文继承了以往的一些关于估计量不确定性研究的假设,即将不同任务(策略)的系数(权重)视为随机变量,并引入这些权重之间的协方差矩阵来同时实现对权重的更优估计。从资产配置的结果上来看,虽然在估计阶段并未直接进行策略权重的加权,但本文方法在重要资产上的权重分配基本介于全局方差最小和均值-方差策略之间,因此同样实现了加权效果。实证结果表明本文策略能够在夏普率、标准差和换手率上取得优于多个基准策略的表现。

本文的研究工作有助于理解投资组合策略之间的相关关系,并为机器学习在投资组合中的进一步应用提供分析框架和方法参考。当然,本文工作基于多任务学习进行投资组合优化的工作仅仅只是开始,在下一步的研究工作中,作者将考虑尝试利用多任务学习对多个策略进行同时估计,以期实现更好的策略加权效果。

 

本文摘编自《系统工程理论与实践》第41卷第6期论文《基于多任务相关学习的投资组合优化》,点击链接下载全文:http://www.sysengi.com/CN/abstract/abstract112770.shtml

作者:倪宣明,北京大学 软件与微电子学院博士;沈鑫圆,北京大学 软件与微电子学院硕士研究生;邱语宁,北京大学 软件与微电子学院硕士研究生;赵慧敏,中山大学 管理学院博士。