Python数据分析入门教程(二):数据预处理(20)

●最常用的处理方式就是删除 。

●把异常值当做缺失值处理 。

●把异常值当做特殊情况 , 研究异常值出现的原因 。

(1)Excel实现

在Excel中 , 删除异常值只要通过筛选把异常值对应的行找出来 , 然后单击鼠标右键选择删除即可 。

对异常值进行填充 , 其实就是对异常值进行替换 , 同样通过筛选功能把异常值先找出来 , 然后把这些异常值替换成要填充的值即可 。

(2)Python实现

在Python中 , 删除异常值用到的方法和Excel中的方法原理类似 , 在Python中是通过过滤的方法对异常值进行删除 。 比如df表中有年龄这个指标 , 要把年龄大于200的值删掉 , 你可以通过筛选把年龄不大于200的筛选出来 , 筛出来的部分就是删除大于200的值以后的新表 。

对异常值进行填充 , 就是对异常值进行替换 , 利用replace()方法可以对特定的值进行替换 。

推荐阅读