传统|波动率预测:深度学习VS传统计量模型

量化投资与机器学习微信公众号 , 是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体 。 公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者 , 荣获2021年度AMMA优秀品牌力、优秀洞察力大奖 , 连续2年被腾讯云+社区评选为“年度最佳作者” 。
预测已实现的波动率对于交易信号和头寸管理至关重要 。 诸如GARCH和HAR等计量经济学模型 , 以相当直观和透明的方式 , 根据过去的收益预测未来的波动率 。 然而 , 递归神经网络已成为一个重要的竞争对手 。 神经网络是一种自适应机器学习方法 , 它使用相互连接的神经元层 。 一层中的激活决定了下一层中的激活 。 神经网络通过训练数据找到激活函数的权重和偏差来学习 。 递归神经网络是一类为数据序列(如时间序列)建模而设计的神经网络 , 特别是LSTM和GRU 。 神经网络的优势在于它可以灵活地包含复杂的交互特征、非线性效应和各种类型的非价格信息 。
对与传统计量模型(如GARCH)与深度学习模型(如LSTM) , 哪类模型预测的准确度更高 , 学术界一直没有停止过讨论 , 本文搜集了近几年关于LSTM用于波动预测的论文 。 为大家在波动预测模型建模提供参考 。
01
Volatility forecasting with machine learning and intraday commonality
“本文研究和分析了各种非参数机器学习模型 , 通过使用来自美国股市的高频数据来预测多资产的日内和每日波动 。 结果表明 , 利用日内波动的共性 , 可以显著提高模型的预测性能 。 即给定股票的已实现波动率相对于市场已实现波动率的线性回归中调整后的r平方值 。 尽管在日内实现波动率上的共性是强大和稳定的 , 在日度水平上的共性是随着时间的推移而动荡 。 一般来说 , 神经网络优于其他模型 , 因为相比传统计量模型 , 神经网络能够处理预测特征之间的非线性关系 , 而且高维的特性能够更好地逼近未知或可能存在的复杂的逻辑 。
此外 , 为了缓解过度拟合的担忧 , 我们进行了严格的样本外检验 , 利用已有的训练模型来预测训练样本中未包含的全新股票的波动率 。 我们的结果显示 , 神经网络仍然优于其他方法(包括为每只新股票训练的OLS模型) 。
02
Realized Volatility Forecasting with Neural Networks
本文研究了一个完全非参数模型是否能够在预测已实现波动率方面优于计量经济学方法 , 特别是比较分析时间序列模型的预测的准确性与多个神经网络架构 。 在这项研究中使用的数据集包括观察从1950年2月到2017年12月标准普尔(S&P)指数 , 其中波动率估计通过事后测量基于高频波动数据 , 即已实现的波动率 。
循环神经网络的表现优于所有传统的计量经济学方法 。 此外 , 通过LSTM捕获长期依赖似乎也可以提高在高度波动时期的预测精度 。
03
Deep Learning Stock Volatility with Google Domestic Trends
本文应用了一个LSTM神经网络来预测SP500指数的波动 , 将谷歌搜索指数作为公众情绪和宏观经济因素的指标 。 这项工作显示了深度学习金融时间序列在强噪声存在下的潜力 , 并通过深度学习和神经网络模型更好地预测股票行为 。 实验结果也表现 , LSTM模型的预测精度显著优于传统的计量模型 , 如GARCH模型 。
04
Machine learning for realised volatility forecasting
本文研究了机器学习模型预测2007年至2016年期间的23只纳斯达克股票波动率的优势和劣势 。 本文主要对比了HAR-family模型和LSTM模型预测波动率的表现 。 HAR-family模型在预测已实现波动率已经有了广泛的应用 。 LSTM模型主要使用了以下三种类型的数据:用于HAR-family模型的146个变量、订单流数据和新闻情绪数据 。
实验表现以LSTM为代表的机器学习模型比所有HAR-family模型有更强的预测能力 。
05
Can LSTM outperform volatility-econometric models?
由于噪声、市场微观结构、异方差、新闻外生和非对称效应以及不同时间尺度的存在等因素 , 波动率预测任务具有非常大的复杂性 。 本文研究了LSTM和GRU类型的方法实现波动率预测任务 , 并比较了神经网络与广泛应用的EWMA、HAR、GARCH家族模型的预测能力 。 LSTM优于该领域的知名模型 , 比如HAR-RV 。 样本外准确度测试表明 , LSTM在这两种类型的市场中都具有显著的优势 。
---
LSTM也有春天 , 虽然在收益预测上LSTM的表现并不如人意 。 但在呈现均值回归的波动率预测上 , LSTM已经吊打了大部分传统计量模型 。
所以很多还在怀疑深度学习到底能不能用在量化上的顾虑可以打消了 。
论文下载
【传统|波动率预测:深度学习VS传统计量模型】后台回复:LSTMYYDS

    推荐阅读