多因子系列之六:寻找财务数据中的alpha信息( 二 )
统计检验只能帮助我们降低犯第一类错误的概率,但是不能帮助我们确定因子影响股票收益的内在驱动因素。因子逻辑是因子表现持续性的保证,且能够帮助我们更好的理解因子表现。我们对筛选出的部分因子进行了分析,找出了逻辑较为清晰的几类因子例如应付员工薪酬增长、应交税费增长等等。
一、综述
常见的财务因子有例如ROE,净利润同比增长,ROE增长等等,通过对这些常见的财务因子进行归纳,我们发现这些因子的构造形式都较为简洁,有例如X/Y,X的同比增长,X/Y的同比增长,ΔX/Y等形式。我们通过遍历三张报表中的所有指标,就能构造出大量的财务因子,从而挑选出有用的alpha因子。
在上述方法中,经常被人质疑的一点是该方法有数据挖掘的嫌疑:由于测试的指标足够多,那么总可以找到一两个十分有效的因子,这些因子的表现可能仅仅只在样本内较好,而在样本外没有效果。这一质疑是非常合理的,就如同让1000个人抛20次硬币,其中有人能连续抛20次正面的概率很大,而这个人是依靠运气还是实力,我们不能确定。
事实上,数据挖掘(data mining/snooping)的问题在统计学中有很多的探讨。近年来,随着大量资产定价异象在学术期刊上出现,对于数据挖掘的质疑也出现在了实证资产定价领域。例如Harvey(2016)检验了过去已经发表的316个因子。为了考虑数据挖掘的影响,他使用三种不同的方法对传统的t统计量进行调整,发现很多发表的因子并不能通过显著性检验,同时指出,未来在寻找市场异象时,该异象的t统计量应该至少大于3才能通过检验。
推荐阅读
- |阴阳哲学探索系列之一百零八十四(以组织层级为例)
- 使命召唤手游|整个仙剑系列,修仙的角色一抓一大把,但真正成仙的又有哪些呢?
- 世界观|《真.女神转生V》系列回顾与测评:奇幻世界,现代视角,与魔为伴
- 皮卡丘|庆祝《宝可梦》系列25周年,官方推限量25尊「水晶皮卡丘」
- 大话西游2|大话西游2:这么全面的万金油神兽从鎏金宝鉴系列里可以说是”大哥“的存在了!
- |LOLM神龙和光明哨兵,哪个系列皮肤更受欢迎?玩家:主要看价格
- 开罗|《Let's Build a Zoo》No More Robots 系列新作,开罗向游戏上架steam
- |新作只排第四! 《银河战士》系列排名TOP10
- 炉石传说|炉石传说:迷你系列,1费新卡快攻德质变,胜率最高直逼最强卡组
- iqoo8|游戏表现“天花板”非它莫属!KPL选手同款的iQOO 8系列