信达澳银量化多因子基金投资价值分析( 五 )

具体到股票的量化投资方面,其实量化投资最重要的任务就是预测股票收益,以多因子模型为例,本质上来说就是根据一些技术面或者基本面历史数据,预测股票未来的价格走势。给定一段较长时间内的历史价格数据,预测任务的目标是十分清晰且可以实现的,因此预测类的任务主要使用监督学习的算法。

多因子选股策略是一种应用广泛的选股策略,其基本构想就是找到某些和收益率最相关的指标,找出股票收益率与各种指标之间的“关系”,借此“关系”建立股票组合,并期望该组合可以跑赢指数。在以往的模型中,线性回归是多因子选股策略最常用的方法,它用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后把当下的因子数值代入回归方程得到未来股票的预期收益,最后以此为依据进行选股。在这种方法下,实际上默认股票收益率与各种指标之间的“关系”是线性的,而将机器学习最大的好处是可以突破线性的限制条件,运用机器学习算法,描述因子与股票收益的非线性关系,实现更精准的拟合,从而更好的预测股票未来表现。

从实践的角度来看,机器学习所做的工作是在现有因子的数据集上建立模型,对股票收益率进行拟合,然后对模型进行评估和优化。用机器学习做模型预测有一套基本流程:数据获取、数据预处理、模型训练、模型评估和模型预测。而采用不同机器学习模型对数据进行训练,模型拟合优度和预测效果也会有差别。

推荐阅读