多因子系列之六:寻找财务数据中的alpha信息( 八 )

多因子系列之六:寻找财务数据中的alpha信息

从上表中可以看到,在第一阶段排名前10%的因子,在后一阶段有46%的概率仍然排名前10%,有74%的概率仍然排名前30%。而在第一阶段排名后30%的因子,只有3%的3%的概率在下一阶段进入前10%。排名前10%的因子的概率转移矩阵呈非常明显的头部效应。即第一阶段表现好的因子下一阶段有很大概率表现较好。而第一阶段表现差的因子在第二阶段几乎不会进入头部。这进一步证明了我们的因子池中表现较好的那些因子确实具有持续性,是真正的alpha因子。而表现后70%的因子,我们发现其再次在后70%的概率较为平均,从第M(M>3)组变为第N(N>3)组的概率几乎都在10%左右,这也说明了后面这些因子几乎都是一些随机的噪声,并不产生显著的超额收益。

四、因子逻辑

尽管上述因子是在考虑了数据挖掘的影响之后,仍然显著的因子。数据和统计手段只能够告诉我们在当前样本下,只有极小的概率将一个假alpha因子判断为显著。但是小概率的事情也有可能发生,我们不能保证挑选出来的因子一定不是随机挖掘的结果。另一方面,即使在过去样本中显著有效的因子,在未来也有失效的可能性。这些问题不再是统计学能够解决的问题。我们需要去寻找因子背后的逻辑来解决这些问题。首先,逻辑能够“主观的”帮助我们再次降低犯第一类错误的概率。其次,在市场环境不发生很大变化的情况下,一个有效的经济学逻辑延续的概率较高,那么因子样本外仍然有效的概率也会较高。

推荐阅读