Python数据分析入门教程(二):数据预处理(19)
1、异常值检测
要处理异常值首先要检测 , 也就是发现异常值 , 发现异常值的方式主要有以下三种 。
●根据业务经验划定不同指标的正常范围 , 超过该范围的值算作异常值 。
●通过绘制箱型图 , 把大于(小于)箱型图上边缘(下边缘)的点称为异常值
●如果数据服从正态分布 , 则可以利用3σ原则;如果一个数值与平均值之间的偏差超过三倍标准差 , 那么我们就认为这个值是异常值 。
箱型图如下图所示:
下图为正太分布图 , 我们把大于μ+3σ的值称为异常值 。
2、异常值处理
对于异常值一般有以下几种处理方式:
推荐阅读
- 季后赛|IG进季后赛概率仅1.83%!LPL数据分析:FPX比EDG更有机会拿第1
- RNG|五连胜:RNG又浪又稳赢下UP!双方对局战况及最新数据分析
- 盲盒|梦幻西游:数据分析老王无级别之夜2006件装备,破解出蓝字的几率
- 原神|原神:雷主技能和数据分析,隐忍了一年后终于从“最弱五星”摇身一变最强充能拐
- 原神|原神:甘雨12号上线,为什么说是必抽人权卡?最新实战演示数据分析
- 崩坏3吼姆天王|崩坏3吼姆天王数据分析
- Python|阿里达摩院13小时讲完的python!整整466集,拿走不谢
- 公主连结处女座工会战野性狮鹫|公主连结处女座工会战野性狮鹫数据分析
- 公主连结处女座工会战双足飞龙|公主连结处女座工会战双足飞龙数据分析
- 智慧公安可视化大数据分析平台开发情报研判平台开发