无监督学习

无监督学习
无监督学习(Unsupervised Learning),亦被称为无监督机器学习,它借助机器学习算法来对未标注的数据集进行分析,并实现聚类操作。这些算法无需借助人工的介入,就能自行发掘隐藏的模式或数据分组。该方法能够有效地洞察信息之间的相似性与差异性,因此成为探索性数据分析、交叉销售策略制定、客户细分以及图像识别等方面的理想解决方案[1]

常见的无监督学习算法

无监督学习算法可以分为三个主要种类:聚类、关联和降维

聚类

在聚类中,具有相似特征的样本会被归为同一簇,而不同簇之间的样本则具有较大差异。聚类的目的是发现数据中潜在的自然分组结构,帮助理解数据的分布和模式[2]聚类算法可以分为几种类型,具体为独占、重叠、分层和概率。