Python数据分析入门教程(二):数据预处理(18)
也可以利用多列去重 , 只需要把多个列名以列表的形式传给参数subset即可 。 比如按姓名和唯一识别码去重 。
还可以自定义删除重复项时保留哪个 , 默认保留第一个 , 也可以设置保留最后一个 , 或者全部不保留 。 通过传入参数keep进行设置 , 参数keep默认值是first , 即保留第一个值;也可以是last , 保留最后一个值;还可以是False , 即把重复值全部删除 。
三、异常值的检测与处理
异常值就是相比正常数据而言过高或者过低的数据 , 比如一个人的年龄是0岁或者300岁都算是一个异常值 , 因为这和实际情况差距过大 。
推荐阅读
- 季后赛|IG进季后赛概率仅1.83%!LPL数据分析:FPX比EDG更有机会拿第1
- RNG|五连胜:RNG又浪又稳赢下UP!双方对局战况及最新数据分析
- 盲盒|梦幻西游:数据分析老王无级别之夜2006件装备,破解出蓝字的几率
- 原神|原神:雷主技能和数据分析,隐忍了一年后终于从“最弱五星”摇身一变最强充能拐
- 原神|原神:甘雨12号上线,为什么说是必抽人权卡?最新实战演示数据分析
- 崩坏3吼姆天王|崩坏3吼姆天王数据分析
- Python|阿里达摩院13小时讲完的python!整整466集,拿走不谢
- 公主连结处女座工会战野性狮鹫|公主连结处女座工会战野性狮鹫数据分析
- 公主连结处女座工会战双足飞龙|公主连结处女座工会战双足飞龙数据分析
- 智慧公安可视化大数据分析平台开发情报研判平台开发