如何将机器学习与灵敏性分析相结合来制定业务策略?(11)
在ML性能评估中经常使用所谓的接收算子特性(ROC)曲线来补充列联表 。 当更改概率阈值以推断正类别和负类别(在此项目中 , 分别为流失类和非流失类)时 , ROC曲线提供了准确性的不变度量 。 它涉及绘制所有准确的阳性预测(真阳性)与假阳性的图表 。 请参阅下表 。
默认情况下 , 将对不同ML模型预测的概率进行校准 , 以使p> 0.5的值对应一个类别 , 而p <0.5的值对应另一类别 。 此阈值是一个超参数 , 可以对其进行微调以最大程度地减少一类的错误分类 。 这是以增加另一种错误分类为代价的 , 这会影响不同性能指标的准确性和精确度 。 相比之下 , ROC曲线下的面积是性能的不变度量 , 在任何阈值下都保持不变 。
下表描述了使用稀有类9倍训练总体的不同ML模型的性能 。 您可以看到随机森林具有最佳性能 , 并且9倍总体的综合性更好 , ROC AUC得分为0.68 。 这个模型是表现最好的 。
下图描述了整体最佳模型的表现(9倍总体的随机森林模型)以及对精度和误差的优化 。 当使用概率阈值0.5时 , 最好的结果可以准确预测69%的流失客户 。
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?