DBSCAN

基于密度的聚类算法
DBSCAN是一种典型的基于密度的聚类方法。该方法由两个参数确定,∈表示半径,MinPts表示点的数目阈值,通常参数使用一个二元组(∈,MinPts)表示。[1]
DBSCAN方法和基于网格法十分相似。然而,和基于网格法不同的是,它使用数据点的密度特性来将数据点合并成簇。因此,DBSCAN方法在基于密度进行数据点分类后,需要将密集区域内的各个数据点作为基础模块。[2]DBSCAN方法能够发现任意形状的簇且不要求将簇的数目作为一个输入参数;基于网格法很容易受局部簇密度变化的影响。[3]

概念

DBSCAN中的几个定义:
Ε邻域:给定对象半径为Ε内的区域称为该对象的Ε邻域;