什么是数据挖掘?( 四 )
作为一个独立的工具来获得数据分布的情况,作为其他算法(如:特征和分类)的预处理步骤。
聚类分析的基本思想是认为我们所研究的样本或指标(变量)之间存在着程度不同的相似性(亲疏关系)。于是根据一批样本的多个观测指标,具体找出一些彼此之间相似程度较大的样本(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样本(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样本(或指标)都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。最后把整个分类系统画成一张谱系图,用它把所有样本(或指标)间的亲疏关系表示出来。这种方法是最常用的、最基本的一种,称为系统聚类分析。
欢迎关注公众号,访问更多精彩:数据之魅。
推荐阅读
- 魔兽世界|魔兽TBC:为什么玩家期待跨区组队?降低组队难度,无需频繁换区
- 李儒|三国杀:为什么叫李儒时代的骄傲,他到底有什么好骄傲的?厉害吗
- edg战队|EDG决赛生死局圣枪哥直呼最后两局!Viper质问监督怕什么
- 池子|“为什么优菈总是在让人始料未及的版本到来?我还没准备好呀!”
- 原神|原神:阿贝多有什么用?兼顾副C与辅助,三大作用机制详解
- 游戏本|双11告一段落,游戏狂欢月还在继续!什么装备可坐等老头环?
- FMVP|Scout的FMVP争议过大,根本原因在于观众不理解什么是FMVP!
- fpx战队|为什么同样是S赛夺冠,FPX的热度,完全没法跟IG与EDG相比?
- 手机游戏|DNF关服了会有什么补偿?玩家讨论出四种可能,最后一条最靠谱
- 王者荣耀|王者荣耀为什么要出限定皮肤?看完你就明白了