聚类分析:无监督算法的理论与实现( 四 )
第2步:数据我在此演示中使用的数据是著名的虹膜数据集 。 我之所以选择此数据集 , 是因为可以在散点图中轻松/直观地分离聚类 。 在许多情况下 , 导入数据后 , 您可能需要进行一些处理 , 例如对分类变量进行编码等 。 还需要确保没有任何NaN值 。
第3步:准备模型输入选择数据集之后 , 下一步是预处理/格式化输入 , 使模型能够使用它 。 在这个阶段会发生两件事:对所选特征进行归一化和将数据帧转换为numpy数组 。
第4步:确定聚类数在K-means算法中 , 您需要定义所需的聚类数 。 所谓的“elbow method”可以通过最小化误差平方和来帮助确定 。
第5步:模型实现在上一步中确定了唯一必需的参数后 , 可以很好地拟合机器学习模型 , 可视化二维图中的聚类数 , 并进行进一步分析以回答您正在寻找的研究问题 。
最后
推荐阅读↓↓↓↓↓↓↓
推荐阅读
- edg战队|EDG决赛生死局圣枪哥直呼最后两局!Viper质问监督怕什么
- 马里奥|AG迅速衰退原因分析!2个关键人物离队影响太大,月光驾驭不住了
- gta三部曲|梦幻西游:129级五开分析师,研究抓鬼任务最优化投入,不浪费一分钱
- ag战队|魔兽TBC:免费转服即将开放,四类服务器现状分析,玩家把握机会
- 端游|LOL双城之战彩蛋分析 范德尔最终变成了狼人 辛吉德也在剧中出现
- |魔兽TBC:T6副本小怪掉落,11件极品装备分析,P3阶段的第一桶金
- 孤岛惊魂6|英雄联盟世界赛参赛队分析!EDG战队!
- |魔兽TBC:法师1万金拿下盘蛇分解,职业饰品价值分析,千金也正常
- 李九|S组才是真正的宝藏!解说李九深度分析KPL秋季赛第三轮,爆发到了
- 卡牌|哈利波特:新增卡牌分析,罗恩有望超越卡姐,变形咒适合速转流