kmeans算法(算法+数据+代码).ppt_第1页
kmeans算法(算法+数据+代码).ppt_第2页
kmeans算法(算法+数据+代码).ppt_第3页
kmeans算法(算法+数据+代码).ppt_第4页
kmeans算法(算法+数据+代码).ppt_第5页
免费预览已结束,剩余12页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、K-means聚类算法,聚类分析概念,1,K-means算法,2,K-means实验-国民健康,3,K-means实验-图像分割,4,K-means实验-商户评级,5,目 录,1.聚类分析概念,聚类与分类的不同在于: 分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。 聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。,2.K-means算法,Q1:K是什么?A1:k是聚类算法当中类的个

2、数。,Summary:Kmeans是用均值算法把数据分成K个类的算法!,Q2:means是什么?A2:means是均值算法。,2.K-means算法,距离的定义,欧式距离: N维空间点或向量的距离 曼哈顿距离: 城市街区距离 夹角余弦: 向量方向的差异 相关系数: 信息熵:,2.K-means算法,K-means算法详解,步骤一:取得k个初始中心点,从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类,2.K-means算法,K-means算法详解,Min of three due to the EuclidDistance,步骤二:把每个点划分进相应的簇,根据欧氏距离最小原则,把

3、每个点划分进相应的簇,2.K-means算法,K-means算法详解,Min of three due to the EuclidDistance,步骤三:重新计算中心点,根据均值等方法,重新计算每个类的中心点,2.K-means算法,K-means算法详解,步骤四:迭代计算中心点,重复第二步和第三步,2.K-means算法,K-means算法详解,步骤五:收敛,聚类中心不再发生移动,3.K-means实验-国民健康,数据示意图,X,textdata=xlsread(examp09_04.xls); row=any(isnan(X),2); X=X(row,:); countryname=textdata(3:end,1); countryname=countryname(row); X=zscore(X); startdata=X(8,27,42,:); idx=kmeans(X,3,Start,startdata); S,H=silhouette(X,idx);,代码,轮廓图,聚类结果,3.K-means实验-国民健康,4.K-means实验-图像分割,灰度图,代码,分割后二值图像,4.K-means实验-图像分割,真彩图,4.K-means

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论