大数据聚类方法综述论文

大数据聚类方法综述论文

问:常用的聚类方法有哪几种??
  1. 答:1.k-mean聚类分析 适用于样本聚类;
    2.分层聚类 适用于对变量聚类;
    3.两步聚类 适用于分类变量和连续变量聚类;
    4.基于密度的聚类算法;
    5.基于网络的聚类;
    6.机器学习中的聚类算法;
    前3种,可用spss简单操作实现;
问:用于数据挖掘的聚类算法有哪些,各有何优势
  1. 答:K均值聚类:最适合处理大数据,适用于大样本的个案聚类,分类数明确,适用于连续性变量;
    系统聚类:适用于个案或变量聚类,对分类数没有要求,连续性和分类型变量均适用;
    两步聚类:1)分类变量和连续变量均可参与二阶聚类;2)可自动确定分类数;3)适用于大数据集;4)用户可自己定制用于运算的内存容量
大数据聚类方法综述论文
下载Doc文档

猜你喜欢