引力沼泽撕裂舰船( 三 )


整个过程就像一个人举着火把黑夜中点亮其他火种 , 够得着的点亮 , 然后握手合作成为同一族 , 够不着的就不属于同一族了 。
为了简化问题 , 假设所有的天体一共有13个 , 每个都可以表示为这样的两个特征 , 比如P1表示为(1 , 2)... ...

那么这13个点在二维空间的分布就表现为下图这样的簇 , 比如P3、P4、P13、P2、P1就更接近 , 并且与其他点有较大的距离从而表现为一簇:

BIT看出了大家的担心 , 随即向舰长申请了探测舰k09 , 前去探测路线的可行性 , 下图黄色路线就是避开众多蓝色引力沼泽之后的新路线 。

舰长稍作思考之后同意了 。
在大家注视下 , k09穿越了所有的星体 , 成功到达了“蜘蛛网”星体阵的另一侧 。
于是 , 大家不再有任何迟疑 , 整个舰队沿着这个路线开拔并有惊无险地安全通过了引力沼泽 。
02—掉书袋【1】 上述情节是对DBSCAN聚类算法的一个通俗演义 。
【2】 聚类是机器学习中的一类方法 , 通俗点讲就是近朱者赤近墨者黑的道理 , 只不过聚类中涉及到的数据往往不只是单一维度上的“接近” , 而是多个维度表示为数值之后的多维空间上的“接近”;区别于分类 , 聚类不需要监督数据 , 属于无监督算法 。
【3】 DBSCAN对于“足够接近”这个概念是通过两个参数来刻画的 , 一个是距离阈值a , 另一个是平均个数minpts(这是一个数) , 足够接近是距离<a的这个圈内 , 点的个数不低于minpts , 这样一来就刻画了这个区域的密度 。
【4】 聚类算法有很多 , 有的只能聚出规则形状的簇 , 比如圆或球状的簇 , 而DBSCAN擅长对无规则的簇进行聚类 , 上述情节中的情况恰是DBSCAN的用武之地 。
03—参考文献1. 关键字:《统计学习方法》、李航
2. 关键字:《机器学习》、西瓜书、周志华
【引力沼泽撕裂舰船】3. 关键字:coursera、DBSCAN

推荐阅读