多因子系列之六:寻找财务数据中的alpha信息( 二 )

统计检验只能帮助我们降低犯第一类错误的概率,但是不能帮助我们确定因子影响股票收益的内在驱动因素。因子逻辑是因子表现持续性的保证,且能够帮助我们更好的理解因子表现。我们对筛选出的部分因子进行了分析,找出了逻辑较为清晰的几类因子例如应付员工薪酬增长、应交税费增长等等。

一、综述

常见的财务因子有例如ROE,净利润同比增长,ROE增长等等,通过对这些常见的财务因子进行归纳,我们发现这些因子的构造形式都较为简洁,有例如X/Y,X的同比增长,X/Y的同比增长,ΔX/Y等形式。我们通过遍历三张报表中的所有指标,就能构造出大量的财务因子,从而挑选出有用的alpha因子。

在上述方法中,经常被人质疑的一点是该方法有数据挖掘的嫌疑:由于测试的指标足够多,那么总可以找到一两个十分有效的因子,这些因子的表现可能仅仅只在样本内较好,而在样本外没有效果。这一质疑是非常合理的,就如同让1000个人抛20次硬币,其中有人能连续抛20次正面的概率很大,而这个人是依靠运气还是实力,我们不能确定。

事实上,数据挖掘(data mining/snooping)的问题在统计学中有很多的探讨。近年来,随着大量资产定价异象在学术期刊上出现,对于数据挖掘的质疑也出现在了实证资产定价领域。例如Harvey(2016)检验了过去已经发表的316个因子。为了考虑数据挖掘的影响,他使用三种不同的方法对传统的t统计量进行调整,发现很多发表的因子并不能通过显著性检验,同时指出,未来在寻找市场异象时,该异象的t统计量应该至少大于3才能通过检验。

推荐阅读