基于划分聚类法的文献综述_第1页
基于划分聚类法的文献综述_第2页
基于划分聚类法的文献综述_第3页
基于划分聚类法的文献综述_第4页
基于划分聚类法的文献综述_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于划分聚类法的文献综述n引言n算法n应用n总结引言引言 聚类分析是一种重要的无监督学习方法,作为数据分析的工具,其重要性在各个领域都得到了广泛的认可。是寻找数据集中的“自然分组”,即所谓“簇”。 通俗地讲, 簇是指相似元素的集合,聚类分析就是一个在数据集中寻找相似元素集合的无监督学习过程。聚类分析的方法可分为基于层次的聚类方法、基于划分的聚类方法、基于模型的聚类方法、基于密度和网格的聚类方法等。本文将介绍基于划分的聚类方法。n本课题简单地阐述了经典 K-modes与快速全局K-means聚类算法的基本思想及算法流程。nk-modes算法采用差异度来代替k-means算法中的距离。k-mode

2、s算法中差异度越小,则表示距离越小。一个样本和一个聚类中心的差异度就是它们各个属性不相同的个数,不相同则记为一,最后计算一的总和。这个和就是某个样本到某个聚类中心的差异度。该样本属于差异度最小的聚类中心。算法算法算法k-means 算法的工作过程说明如下: 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。 缺点:k-means算法只能处理数值型数据,而不能处理分类

3、属性型数据。经典k-modes算法K中心聚类算法(KM)能被形式化描述如下:nStep 1.初始化 获得最小化 Set t=1.nStep 2.获得 最小化 .如果, 那么算法结束;否则,转到Step 3. nStep3.获得 最小化 ,如果 = 那么,算法结束;否则,设t=t+1且转到Step 2。 最小化目标函数F; W= 表示对象Xi与第l类的隶属关系;Z是类的中心,它由m个分量构成; d是用于度量对象和类中心之间的相异测度 应用应用n聚类分析在市场营销客户细分中的应用 市场营销业利用数据挖掘技术进行市场定位和消费分析,辅助制定营销方案。通过对客户数据库不同消费者消费同一类商品或服务的众多不同数据进行聚类分析,争取潜在的客户,制定有利于市场运行的策略。n聚类分析在金融领域中的应用n聚类分析在检验医学方面的应用n聚类分析在图像处理中的应用n这两类聚类算法在一定程度上还存在一定的缺陷,可以尝试把算法应用到具体的实际问题中,扩展应用领域,来检验算法的可行性。同时,意识到各个学科之间的联系及其重要性,每个学科都与生活存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论