dbscan
K-Means算法主要针对那种类圆形区域数据的聚类。而密度聚类可以弥补这个缺点,可用于任何形状的聚类。这个算法需要我们调节两个参数,半径sigma,最小数目m,先介绍该算法的一些概念。
-
核心对象:对于一个对象它的sigma领域内至少有m个对象,那我们就称之为核心对象。
-
直接密度可达:如果一个对象处在一个核心对象的sigma领域内,那称这两个对象直接密度可达。
-
密度可达(相连):如果一个对象a和b直接密度可达,对象b和c也是直接密度可达,那么我们称a和c是密度可达的,也称这两个对象是密度相连的。
dbscan的算法就是我们先找到一个核心对象,从它出发,确定若干个直接密度可达的对象,再从这若干个对象出发,寻找它们直接密度可达的点,直至最后没有可添加的对象了,那么一个簇的更新就完成了。我们也可以说,簇其实就是所有密度可达的点的集合。
参考链接:
https://www.jianshu.com/p/e8dd62bec026
https://blog.csdn.net/itplus/article/details/10088625
文章最后发布于: 2018-11-20 11:38:27
相关阅读
DBSCAN,英文全写为Density-based spatial clustering of applications with noise ,是在 1996 年由Martin Ester, Hans-Peter Kri
DBSCAN DBSCAN是一种密度聚类算法,它基于一组参数(ϵ\epsilonϵ,MinPts)来刻画样本分布的紧密程度。1、算法原理 如上图所示,DBSCAN