聚类分析:5步模拟数据进行K均值聚类!( 三 )
系统聚类算法的好处是分析者可以对比不同聚类数量的结果,从中选择更感兴趣(更有解释力)的结果,这种对比可以通过生成的聚类树进行。
03 使用模拟数据进行K均值聚类
用R生成模拟数据为什么不使用现成的数据,而要用R来生成数据呢?
主要是因为在自己生成的数据中,我们可以预先定义存在哪些类型的用户群、每个用户群的属性是怎样的。
通过这种方式我们得以知道“客观现实”是怎样的,后面用SPSS做聚类分析时,可以将分析得出的结果与我们预设的“现实”做对比,看一下效果如何——聚类分析得出的类对我们预设的类的还原度有多高。
假设我们要做的是一款企业管理软件A的用户画像,所得数据中一共有1200个有效样本,其中存在三类用户:
第一类用户是“典型管理者”,年龄大约在30-40岁之间,对使用A软件态度相对较积极,认为公司的管理是很自由的。其样本共有200人。
第二类用户是“个性型员工”,年龄大约在20-25岁,对使用A软件态度波动较大,认为公司的管理很不自由。其样本共有400人。
推荐阅读
- 马里奥|AG迅速衰退原因分析!2个关键人物离队影响太大,月光驾驭不住了
- gta三部曲|梦幻西游:129级五开分析师,研究抓鬼任务最优化投入,不浪费一分钱
- ag战队|魔兽TBC:免费转服即将开放,四类服务器现状分析,玩家把握机会
- 端游|LOL双城之战彩蛋分析 范德尔最终变成了狼人 辛吉德也在剧中出现
- |魔兽TBC:T6副本小怪掉落,11件极品装备分析,P3阶段的第一桶金
- 孤岛惊魂6|英雄联盟世界赛参赛队分析!EDG战队!
- |魔兽TBC:法师1万金拿下盘蛇分解,职业饰品价值分析,千金也正常
- 李九|S组才是真正的宝藏!解说李九深度分析KPL秋季赛第三轮,爆发到了
- 卡牌|哈利波特:新增卡牌分析,罗恩有望超越卡姐,变形咒适合速转流
- |原神唯一火系盾辅,家政官托马机制分析,实用性到底如何?