Python数据分析入门教程(二):数据预处理(14)

年龄用数字填充合适 , 但是性别用数字填充就不太合适 , 那么可不可以分开填充呢?答案是可以的 , 选中要填充的那一列 , 按照填充全部数据的方式进行填充即可 , 只不过要填充几列 , 需要执行几次操作 。

上图是填充前后的对比 , 年龄这一列我们用平均值进行填充 , 性别这一列我们用众数进行填充 。

除了用0填充、平均值填充、众数(大多数)填充 , 还有向前填充(即用缺失值的前一个非缺失值填充 , 比如上例中编号A3对应的缺失年龄的前一个非缺失值就是16)、向后填充(与向前填充对应)等方式 。

(2)Python实现

在Python中 , 我们利用的fillna()方法对数据表中的所有缺失值进行填充 , 在fillna后面的括号中输入要填充的值即可 。

推荐阅读