数据分析师成长记(六):统计学5个基本概念,你怎能缺席?( 四 )

上图中 , 中间的直线表示数据的中位数 。 中位数用在平均值上 , 因为它对异常值更具有鲁棒性 。 第一个四分位数本质上是第二十五百分位数 , 即数据中的25%要低于该值 。 第三个四分位数是第七十五百分位数 , 即数据中的75%要低于该值 。 而最大值和最小值表示该数据范围的上下两端 。

箱形图很好地说明了基本统计特征的作用: