Python数据分析入门教程(二):数据预处理( 九 )

Python数据分析入门教程(二):数据预处理


从菜市场买来的菜总有一些不太好的 , 所以把菜买回来以后要先做一遍预处理 , 把那些不太好的部分扔掉 。 现实中大部分的数据都类似于菜市场的菜品 , 拿到以后都要先做一次预处理 。

常见的不规整的数据主要有缺失数据、重复数据、异常数据几种 , 在开始正式的数据分许之前 , 我们需要先把这些不太规整的数据处理掉 。

一、缺失值的处理

缺失值就是由某些原因导致部分数据为空 , 对于为空的这部分数据我们一般有两种处理方式 , 一种是删除 , 即把含有缺失值的数据删除;另一种是填充 , 即把缺失的那部分数据用某个值代替 。

1、缺失值查看

对缺失值进行处理 , 首先要把缺失值找出来 , 也就是查看哪列有缺失值 。

(1)Excel实现

推荐阅读