整个过程就像一个人举着火把黑夜中点亮其他火种 , 够得着的点亮 , 然后握手合作成为同一族 , 够不着的就不属于同一族了 。
为了简化问题 , 假设所有的天体一共有13个 , 每个都可以表示为这样的两个特征 , 比如P1表示为(1 , 2)... ...
那么这13个点在二维空间的分布就表现为下图这样的簇 , 比如P3、P4、P13、P2、P1就更接近 , 并且与其他点有较大的距离从而表现为一簇:
BIT看出了大家的担心 , 随即向舰长申请了探测舰k09 , 前去探测路线的可行性 , 下图黄色路线就是避开众多蓝色引力沼泽之后的新路线 。
舰长稍作思考之后同意了 。
在大家注视下 , k09穿越了所有的星体 , 成功到达了“蜘蛛网”星体阵的另一侧 。
于是 , 大家不再有任何迟疑 , 整个舰队沿着这个路线开拔并有惊无险地安全通过了引力沼泽 。
02—掉书袋【1】 上述情节是对DBSCAN聚类算法的一个通俗演义 。
【2】 聚类是机器学习中的一类方法 , 通俗点讲就是近朱者赤近墨者黑的道理 , 只不过聚类中涉及到的数据往往不只是单一维度上的“接近” , 而是多个维度表示为数值之后的多维空间上的“接近”;区别于分类 , 聚类不需要监督数据 , 属于无监督算法 。
【3】 DBSCAN对于“足够接近”这个概念是通过两个参数来刻画的 , 一个是距离阈值a , 另一个是平均个数minpts(这是一个数) , 足够接近是距离<a的这个圈内 , 点的个数不低于minpts , 这样一来就刻画了这个区域的密度 。
【4】 聚类算法有很多 , 有的只能聚出规则形状的簇 , 比如圆或球状的簇 , 而DBSCAN擅长对无规则的簇进行聚类 , 上述情节中的情况恰是DBSCAN的用武之地 。
03—参考文献1. 关键字:《统计学习方法》、李航
2. 关键字:《机器学习》、西瓜书、周志华
【引力沼泽撕裂舰船】3. 关键字:coursera、DBSCAN
推荐阅读
- 史无前例!科学家发现恒星中大型有机分子,外星人体型也将巨大?
- 冷知识:眨眼让我们的大脑得到休息!关于眨眼的6个小知识
- 科学家发现神奇物种,能生蛋还能产仔,人类或正见证它的进化
- 难道“我们”才是外星人?美国科学家:人类可能来自其他星球
- 光速是宇宙中最快的速度吗?这三种速度从理论上来说已经超过光速
- NASA宇航员准备执行太空行走任务,危险重重,俄罗斯会配合吗?
- 危险的参宿四:比太阳大7亿倍,随时可能爆炸?科学家进行预测
- 天文学家在5亿光年外,发现超新星爆发
- 人类并不弱,在外星生命眼里,我们就是“超级文明”?