其他数据源稳定,就某个数据源KS下降很大,那问题是不是大概率就是它了?
它都有问题了,你还拿原来的样本,在已用的数据源上,找新的三方数据去提升效果,你说是不是自嗨?
如果数据源效果波动跟最终模型效果波动趋势都一致,那是不是可能就是你们客群结构变动太大了?
客群都换了,还去优化原来的样本,前朝的剑还能斩本朝的官?
即使找原因你什么都没找出来,对小贷公司来说最重要的是什么?
用户啊,模型上线跑了大半年甚至一两年了,这些最新的用户你藏着不用?更别说这个「即使」本身就很小概率。
上面的问题想清楚了之后,你还会采用最开始的做法吗?
02市面上可能几乎所有的小贷公司,都是满脑子想着做模型的,没有别的原因,就是不专业。
我提供一个办法,一个策略思维的办法。
你肯定选好了几个数据源,一部分是行业用的多的,起始阶段就用了,一部分是你们听说不错后来测试有效果接入了的。
假设这些数据源提供的就是评分,以及这些评分效果都没有问题。
就基于这些数据源,用历史数据,不断迭代策略,也就是决策树,或者划格子算交叉效果。
当然,模型可以更好。但模型不是重点,迭代才是。
不管你们是什么方案,按我下面的策略来做风控ABtest,最起码能超过7成的对照组。
战胜70%对照组的策略思维:
- 在最新n个月的样本上,计算选用的每个数据源评分的效果;
- 挑选效果最好的,和第二好的评分做交叉(例如各分十档),得到一个新的决策结果;
- 再和第三好的做交叉,得到另一个结果,以此类推;
- 交叉效果会越来越弱,提升不明显就可以停了,一般来说4、5个就足够了。为什么我没有说所有的做交叉,还不是因为太多了,10^5太大了。但不用担心,按上面的贪心思想的做法足够接近最优;
- 每个月甚至每周每日,监控各个数据源评分的效果,和决策流的结果,每三个月甚至每个月,重复步骤1-4更新整个决策流。
说到这里,有些人可能笑话我满嘴跑火车了,我无法对我提的想法做任何回测,我也知道那毫无意义。
所以我解释了背后的逻辑,信则有不信则无,救生指南不是对每个人都有用的。
不要跟我说北美的玩法,也不要说国内银行的玩法,不要说那些常年不变的东西,你们小贷公司做这些是因为变化还是不变呢?
富贵险中求,不变的那些东西是你能挣的钱吗?
如果你们团队遇到了此类困境,但你没法去跟老板提,可以隐晦地让有决策权的老板看到我这篇文章。不敢说路子一定能走宽,但大概率能解决你们的很多烦恼。
03每家平台都说自己是数字科技,说自己可以精准地预测每个人的现金流,说发放的贷款不会有高坏账。马云也是这么说的。
这是狗屁资本主义的视角。事实是,鼓励超前消费、奢侈消费,是会系统性地降低未来收入的。
我们不要从资本的角度考虑问题,要看长远。
本来对于我们这些平民百姓而言,收入增长的速度就未必能赶得上经济增长的速度。
富人对利率精打细算,傻子才会去负担超过经济增速的利率。
哪家小贷公司不是针对穷人的贷款,不是在穷人身上刮油,有哪个小贷平台敢“明示年化利率”的。
当然了,它们现在必须明示。所以呢,我巴不得高利率的小贷公司批量倒下,消费信贷回归正统、回归朴素。
那我是在给小贷公司解决办法吗?是也不是,无论我说什么,小贷公司都不会听,我只是在和底层风控同学探讨交流。
推荐阅读
- 阿里巴巴|曾是阿里高管,遭马云“忽视”创办410亿公司,却进腾讯口袋
- 斐乐公司|网购平台销售数据可作为确定赔偿数额的依据
- 马化腾|刷屏!马化腾:腾讯只是一家普通公司,随时可以被替换
- 阿里|胡润公布全球公司排名,马云创始人头衔也被剥夺?
- 业务|哈啰出行新公司业务含小客车租赁
- 快递公司|网购退货的时,卖家为何总是要强调不要发顺丰?总算明白了
- 快递|快递客服外包公司怎样与甲方谈?
- 腾讯三家公司|腾讯三家公司起诉“腾讯分分彩”侵权获赔 100 万
- 起诉|腾讯三家公司起诉“腾讯分分彩”侵权获赔 100 万
- 快递公司|没人“送货上门”了,派费却涨了?快递员抱怨不赚钱,钱去哪了