收藏 | 10个可以快速用Python进行数据分析的小技巧( 五 )
Pandas中df.describe和http://df.info函数可以实现EDA过程第一步 。 但是 , 它们只提供了对数据非常基本的概述 , 对于大型数据集没有太大帮助 。 而Pandas中的Profiling功能简单通过一行代码就能显示大量信息 , 且在交互式HTML报告中也是如此 。
对于给定的数据集 , Pandas中的profiling包计算了以下统计信息:
由Pandas Profiling包计算出的统计信息包括直方图、众数、相关系数、分位数、描述统计量、其他信息——类型、单一变量值、缺失值等 。
安装
用pip安装或者用conda安装
pipinstall pandas-profilingcondainstall -c anaconda pandas-profiling
用法
下面代码是用很久以前的泰坦尼克数据集来演示多功能Python分析器的结果 。
推荐阅读
- 布隆|云顶之奕S6:连续5个赛季,亚索刀都砍卷了,S6终于可以休息了
- edg战队|“EDG夺冠只拿48万”!同样是世界冠军,IG却可以拿到242万美金
- 手机游戏|梦幻西游:副本等人时可以刷的任务,随时随地领取,失败也没问题
- 交易|哪些游戏可以赚钱?每天200左右,整理5款,准备电脑开干!
- 吃鸡游戏|“吃鸡”高达天降模式的隐藏玩法!不仅可以打卡,而且还有物资!
- |原神梦里生花,可以改变稻妻的样子了,还有420钻,胡桃在等你哦
- 热血传奇|热血传奇:唐吉诃德的运6项链不是唯一,盘点收藏界的珍品项链
- 毒液|《毒液2》将无缘内地市场,但你或许可以看看这个游戏
- 国服|fgo国服:梵高和尼莫船长卡池要不要抽 不玩暴击队可以直接跳过
- edg战队|Bo还能继续打职业?外媒发出投票,74%网友希望Bo可以去他们赛区