参考:https://github.com/apachecn/vt-cs4624-pyml-zh/blob/master/docs/18.md
聚类
介绍:使用无标注数据,将相似数据分组,同时隔离不相似数据。注意,与分类不同的是,聚类用于识别数据集中的潜在组,分类用于将输入与现有组匹配。简单的说,聚类前没有已知类别,分组前已知需要的类别。
如何理解潜在组:如用户群体聚类。用户特征很多,可以是xx岁的xx月薪的xx职业。事先不好提出一个可能的类别。因此用聚类,自动将相似用户特征聚集在一起,观察有颜