下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、装订线 题目: K-Means聚类算法分析与实现 学 院 xxxxxxxxxxxxxxxxxxxx 专 业 xxxxxxxxxxxxxxxx 学 号 xxxxxxxxxxx 姓 名 xxxx 指导教师 xxxx 20xx年x月xx日K-Means聚类算法KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。K-Means聚类算法主要分为三个步骤:(1)第一步是为待聚类的点寻找聚类中心(2)第二步是计算每个点到聚类中心的距离,将每个点聚类到离该点最近的聚类中去(
2、3)第三步是计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心反复执行(2)、(3),直到聚类中心不再进行大范围移动或者聚类次数达到要求为止下图展示了对n个样本点进行K-means聚类的效果,这里k取2:(a)未聚类的初始点集(b)随机选取两个点作为聚类中心(c)计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去(d)计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心(e)重复(c),计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去(f)重复(d),计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心Matlab实现:%随机获取150个点X
3、 = randn(50,2)+ones(50,2);randn(50,2)-ones(50,2);randn(50,2)+ones(50,1),-ones(50,1);opts = statset(Display,final);%调用Kmeans函数%X N*P的数据矩阵%Idx N*1的向量,存储的是每个点的聚类标号%Ctrs K*P的矩阵,存储的是K个聚类质心位置%SumD 1*K的和向量,存储的是类间所有点与该类质心点距离之和%D N*K的矩阵,存储的是每个点与所有质心的距离;Idx,Ctrs,SumD,D = kmeans(X,3,Replicates,3,Options,opts);
4、%画出聚类为1的点。X(Idx=1,1),为第一类的样本的第一个坐标;X(Idx=1,2)为第二类的样本的第二个坐标plot(X(Idx=1,1),X(Idx=1,2),r.,MarkerSize,14)hold onplot(X(Idx=2,1),X(Idx=2,2),b.,MarkerSize,14)hold onplot(X(Idx=3,1),X(Idx=3,2),g.,MarkerSize,14)%绘出聚类中心点,kx表示是圆形plot(Ctrs(:,1),Ctrs(:,2),kx,MarkerSize,14,LineWidth,4)plot(Ctrs(:,1),Ctrs(:,2),k
5、x,MarkerSize,14,LineWidth,4)plot(Ctrs(:,1),Ctrs(:,2),kx,MarkerSize,14,LineWidth,4)legend(Cluster 1,Cluster 2,Cluster 3,Centroids,Location,NW)CtrsSumD执行结果: Kmeans6 iterations, total sum of distances = 204.82110 iterations, total sum of distances = 205.88616 iterations, total sum of distances = 204.82
6、19 iterations, total sum of distances = 205.886.9 iterations, total sum of distances = 205.8868 iterations, total sum of distances = 204.8218 iterations, total sum of distances = 204.82114 iterations, total sum of distances = 205.88614 iterations, total sum of distances = 205.8866 iterations, total sum of distances
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目合作协议合同范本8篇
- 加油站施工作业安全管理规定与加油站日常维修管理制度
- 2024年福建省中考语文专题复习 考点6 仿写、对联 课件
- 企事业单位疫情应急响应流程图
- 棉花运输病虫害防治方案
- 病虫害防治宣传网络剧
- 果品网络苹果病虫害防治方案
- 社区卫生服务中心:传染病管理实践
- 2024年化妆品行业综合研究报告
- 水稻病虫害绿色防控技术进展
- 2.4《火山喷发的成因及作用》课件
- 户口薄改婚姻状况申请书
- 社保卡委托书
- 云计算白皮书(2023年)
- 规章制度销售管理销售管理制度销售管理制度
- “岁月如歌我的初中生活”主题历年中考语文综合性学习试题汇编
- 四年级劳动与技术我做家庭小主人课件
- 人教版池上公开课一等奖市优质课赛课获奖课件
- 小学二年级数学下册无纸化测试题
- 抗挫折主题班会公开课一等奖市赛课获奖课件
- 整形美容科品管圈PDCA汇报模板-通过综合性护理干预措施降低疤痕发生率
评论
0/150
提交评论