Python数据分析入门教程(二):数据预处理(13)

上表第二行中只有性别这个字段是空值 , 所以在利用dropna(how=“all”)的时候并没有删除第二行 , 只是把全为NaN值的第三行删除掉了 。

3、缺失值填充

上面 介绍了缺失值的删除 , 但是数据是宝贵的 , 一般情况下只要数据缺失比例不是过高(不大于30%) , 尽量别删除 , 而是选择填充 。

(1)Excel实现

在Excel中 , 缺失值的填充和缺失值的删除一样 , 利用的也是定位条件 , 先把缺失值找到 , 然后在第一个缺失值的单元格中输入要填充的值 , 最常用的就是用0填充 , 输入以后按Ctrl+Enter组合键就可以对所有的缺失值进行填充 。

缺失值填充前后的对比如下图所示:

推荐阅读