聚类分析:5步模拟数据进行K均值聚类!( 四 )

第三类用户是“安稳型员工”,年龄大约在25-30岁,对使用A软件态度比较消极,觉得公司的管理是相对自由的。其样本共有600人。

接下来使用R来生成以上描述的三类用户的数据,代码如下(对代码没兴趣的同学可以直接跳过):

简而言之,三类用户的特征是这样的:

04 用SPSS做K均值聚类

接下来使用R生成的数据进行K均值聚类,看看分析得出的结果与我们预设的类别的关系。

1、先看看三个变量的相关性矩阵:

我们发现几个变量之间相关性都不高,因此可以全部作为聚类的变量进入后续分析过程。

2、接下来对三个变量进行标准化:

SPSS操作:分析-描述统计-描述-勾选“将标准化得分另存为变量”

3、K均值聚类:

SPSS操作:分析-分类-K均值聚类填写聚类数:3“保存”:勾选聚类成员、与聚类中心的距离“选项”:勾选ANOVA表

推荐阅读