python机器学习API介绍20: 密度聚类及其用法( 七 )

ax.set_ylabel(\"core_nums\")

plt.suptitle(\"DBSCAN\")

plt.show()

centers=[[11
[12
[22
[1020

x labels_true = create_data(centers 1000 0.5)

plot_DBSCAN_minSamples(x labels_true)

上述代码运行后结果为:

API of DBSCAN:0.32560316605377004

core sample num of DBSCAN: 985

DBSCAN中参数E和MinPts对API性能的影响

从运行结果可以看出 , 核心样本数量随着eps的增长而上升 , 这是因为随着E的增长 , 样本点的邻域在扩展 , 样本点邻域内的样本会更多 , 这就产生了更多满足条件的样本点 , 但是样本集中的样本有限 , 所以核心样本点增加到一定数目后会趋于稳定 。

推荐阅读