问:常用的聚类方法有哪几种??
- 答:1.k-mean聚类分析 适用于样本聚类;
2.分层聚类 适用于对变量聚类;
3.两步聚类 适用于分类变量和连续变量聚类;
4.基于密度的聚类算法;
5.基于网络的聚类;
6.机器学习中的聚类算法;
前3种,可用spss简单操作实现;
问:用于数据挖掘的聚类算法有哪些,各有何优势
- 答:K均值聚类:最适合处理大数据,适用于大样本的个案聚类,分类数明确,适用于连续性变量;
系统聚类:适用于个案或变量聚类,对分类数没有要求,连续性和分类型变量均适用;
两步聚类:1)分类变量和连续变量均可参与二阶聚类;2)可自动确定分类数;3)适用于大数据集;4)用户可自己定制用于运算的内存容量