如何将机器学习与灵敏性分析相结合来制定业务策略?( 十 )
-
在第一种最简单的方法中 , 训练是基于对丰富类(没有流失的客户)的随机抽样来进行的 , 以匹配稀有类(有流失的客户)的规模 。
-
在第二种方法中(如下图所示) , 我将训练基于模型的集合 , 其中每个模型使用9个丰富类的随机样本(不进行替换)和稀有类的一个完整样本 。 我之所以选择9倍 , 是因为类别的不平衡程度大约是1比9(如下图的直方图所示) 。 因此 , 1-9是使用丰富类中的全部或几乎所有数据所需的采样量 。 这种方法比较复杂 , 但是会使用所有可用信息 , 从而提高了通用性 。 我将在以下面章节中评估其有效性 。
对于这两种方法 , 在测试集上考虑实际情况而保持类的不平衡来评估模型性能 。
评估和完善ML模型的性能
在本节中 , 我测试了上一节中开发的不同模型的性能 。 然后 , 我确定了一种决策机制 , 该机制最大程度地降低了高估可能流失的客户数量的风险(称为误报率) 。
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?