下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、装订线 题目: K-Means聚类算法分析与实现 学 院 xxxxxxxxxxxxxxxxxxxx 专 业 xxxxxxxxxxxxxxxx 学 号 xxxxxxxxxxx 姓 名 xxxx 指导教师 xxxx 20xx年x月xx日K-Means聚类算法KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。K-Means聚类算法主要分为三个步骤:(1)第一步是为待聚类的点寻找聚类中心(2)第二步是计算每个点到聚类中心的距离,将每个点聚类到离该点最近的聚类中去(
2、3)第三步是计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心反复执行(2)、(3),直到聚类中心不再进行大范围移动或者聚类次数达到要求为止下图展示了对n个样本点进行K-means聚类的效果,这里k取2:(a)未聚类的初始点集(b)随机选取两个点作为聚类中心(c)计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去(d)计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心(e)重复(c),计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去(f)重复(d),计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心Matlab实现:%随机获取150个点X
3、 = randn(50,2)+ones(50,2);randn(50,2)-ones(50,2);randn(50,2)+ones(50,1),-ones(50,1);opts = statset(Display,final);%调用Kmeans函数%X N*P的数据矩阵%Idx N*1的向量,存储的是每个点的聚类标号%Ctrs K*P的矩阵,存储的是K个聚类质心位置%SumD 1*K的和向量,存储的是类间所有点与该类质心点距离之和%D N*K的矩阵,存储的是每个点与所有质心的距离;Idx,Ctrs,SumD,D = kmeans(X,3,Replicates,3,Options,opts);
4、%画出聚类为1的点。X(Idx=1,1),为第一类的样本的第一个坐标;X(Idx=1,2)为第二类的样本的第二个坐标plot(X(Idx=1,1),X(Idx=1,2),r.,MarkerSize,14)hold onplot(X(Idx=2,1),X(Idx=2,2),b.,MarkerSize,14)hold onplot(X(Idx=3,1),X(Idx=3,2),g.,MarkerSize,14)%绘出聚类中心点,kx表示是圆形plot(Ctrs(:,1),Ctrs(:,2),kx,MarkerSize,14,LineWidth,4)plot(Ctrs(:,1),Ctrs(:,2),k
5、x,MarkerSize,14,LineWidth,4)plot(Ctrs(:,1),Ctrs(:,2),kx,MarkerSize,14,LineWidth,4)legend(Cluster 1,Cluster 2,Cluster 3,Centroids,Location,NW)CtrsSumD执行结果: Kmeans6 iterations, total sum of distances = 204.82110 iterations, total sum of distances = 205.88616 iterations, total sum of distances = 204.82
6、19 iterations, total sum of distances = 205.886.9 iterations, total sum of distances = 205.8868 iterations, total sum of distances = 204.8218 iterations, total sum of distances = 204.82114 iterations, total sum of distances = 205.88614 iterations, total sum of distances = 205.8866 iterations, total sum of distances
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某汽车制造厂装配线管理规程
- 贝斯手考试试卷及答案
- 压力性损伤分期及标准化处理规范(2026临床版)
- ECMO及体外二氧化碳清除临床完整版
- 《2024 卵巢早衰循证指南》更新要点解读
- 扩散峰度成像的脑微观网络
- 江西省上饶市民校考试联盟2026年高三下学期5月联考化学试题含解析
- 帕金森病基因编辑治疗的伦理构建
- 超市采购合同
- 26年腭癌靶点检测用药避坑指南
- 资金确权协议书
- 2026届江苏省南京市高三二模英语试题(含答案和音频)
- 2026版公司安全生产管理制度及文件汇编
- 2026年中国铁路各局集团招聘试题及答案解析
- 湖北省2026届高三(4月)调研模拟考试 英语答案
- 《敏捷革命》读书笔记思维导图PPT模板下载
- 磁悬浮离心冷水机组、螺杆式水冷冷水机组、离心式水冷冷机组及多联机组方案比较
- GB/T 8306-2013茶总灰分测定
- FZ/T 60007-2019毛毯试验方法
- 高数下册试题及答案
- 中医诊所规章制度(完整版)
评论
0/150
提交评论