聚类分析:5步模拟数据进行K均值聚类!( 五 )

4、查看方差分析结果:

聚类分析得出的类别在三个变量上都呈现出了显著差异,可见三个变量在聚类分析中都起到了作用,当前聚类分析结果可以保留。

05 预设类别与聚类结果对比

先看看聚类得出的结果:

跟我们最初定义的用户特征对比(详见上面的表格),发现聚类分析对用户类别的还原度非常高!聚类得出的几个类别和最初定义的类别在三个变量的均值和类别样本数上差异都很小(注意类别的顺序不同)。

我们再用一个交叉表,看看样本的分布情况:

SPSS操作:分析-描述统计-交叉表,将原始数据定义的类别和K均值聚类得出的类别分别放在行和列变量中。勾选“显示复式条形图”。

横轴表示我们预设的类别,纵轴表示聚类分析得出的类别。

可以看出非常明显的对应关系,我们定义的第一类用户大部分被聚类为类别3,第二类用户大部分被聚类为类别1,第三类用户大部分被聚类为类别2——聚类分析定义出来的用户群体,不仅仅在属性上与预设的一致,连用户构成都很一致。

推荐阅读