【图文】数据挖掘中聚类算法的比较_第1页
【图文】数据挖掘中聚类算法的比较_第2页
【图文】数据挖掘中聚类算法的比较_第3页
【图文】数据挖掘中聚类算法的比较_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 K_pototypes算法 K-pototypes算法结合了K-means方法和根据K-means方法改 进的能够处理符号属性的K-modes方法。 CLARANS算法(随机搜索聚类算法 CLARANS算法是一种分割聚类方法.它首先随机选择一个点 作为当前点,然后随机检查它周围不超过参数Maxneighbor 个的一些邻接点,假如找到一个比它更好的邻接点,则把它 移入邻接点,否则把该点作为局部最小量.然后,再随机选择 一个点来寻找另一个局部最小量,直到所找到的局部最小量 数目达到用户要求为止. 该算法要求聚类的对象必须预先都调入内存,并且需扫描多 次数据库,这对大型数据库而言,无论从时间复杂

2、度还是空 间复杂度而言,都是不太适用的. 虽然该算法对脏数据和异 常数据不敏感,但对数据输顺序异常敏感,且只能处理凸形 或球形边界聚类. CLIQUE算法(自动子空间聚类算法 该算法利用自顶向上方法求出各个子空间的聚类单元。 CUQUE算法主要用于找出在高维数据空间中存在的低 维聚类。为了求出d维空间聚类,必须组合给出所有 d-1维子空间的聚类,导致其算法的空间和时间效率 都较低,而且要求用户输入两个参数:数据取值空间 等间隔距离和密度阔值。这2个参数与样木数据紧密 相关,用户一般难以确定。CLIQUE算法对数据输人顺 序不敏感 聚类算法的比较结果 算法 算法效率 适合的数据 发现的聚类 类型 类型 数值 数值 数值 凸形或球形 任意形状 任意形状 对脏数据或异 对数据输入 常数据的敏感 顺序的敏感 性 性 不敏感 敏感 不敏感 敏感 不太敏感 敏感 不太敏感 一般 BIRCH DBSCAN CURE K_pototypes 高 一般 较高 一般 数值和符号 凸形或球形 CLARANS CUQUE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论