已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
K-均值聚类算法,由张明磊报道,1,2020/8/3,K-均值算法是一种典型的基于距离的聚类算法,它使用距离作为相似性的评价指标,即两个物体之间的距离越近,它们的相似性越大。该算法认为类是由距离较近的对象组成的,所以最终的目标是得到紧凑且独立的类。2,2020/8/3,假设数据集是(x1,x2,xn),并且每个xi是一个D维向量,K-means聚类的目的是给定k(kn)的值,将原始数据分成K个类:S=S1,S2,SK在数值模型上,也就是说,找到下面的表达式(2)根据最小距离原则将数据样本集中的样本分配到最近的聚类;(3)根据聚类结果,重新计算k个聚类的中心,并将其作为新的聚类中心;(4)重复步骤2.3,直到群集中心不变。4,2020/8/3,数学表达式:n:样本数。k:样本分为k类。Rnk:第n个采样点是否属于第k类,如果是,rnk=1,如果不是,rnk=0。kth中心点。5,2020/8/3,K-means要做的就是最小化这个函数。迭代方法:1 .修正k得到rnk。2.修正rnk并找到最优K,6,2020/8/3,求rnk并求K,7,2020/8/3,8,2020/8/3,k- means算法性能分析优势:1 .K-means算法框架清晰、简单、易懂。2.对于处理大型数据集,该算法相对可扩展且高效,计算复杂度为0(NKt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《新型肥料对蓝莓果实品质与土壤微生物代谢活性的关系研究》教学研究课题报告
- 2025年河南中医药大学马克思主义基本原理概论期末考试模拟试卷
- 2025年荆州理工职业学院马克思主义基本原理概论期末考试模拟试卷
- 2024年辽宁中医药大学杏林学院马克思主义基本原理概论期末考试真题汇编
- 第04讲 利用导数研究函数的零点(方程的根) 高频考点精练(原卷版)
- 2024年南京邮电大学通达学院马克思主义基本原理概论期末考试真题汇编
- 2024年重庆城市职业学院马克思主义基本原理概论期末考试笔试题库
- 2025年湖南城建职业技术学院马克思主义基本原理概论期末考试真题汇编
- 2024年中原科技学院马克思主义基本原理概论期末考试笔试题库
- 2025年河南轻工职业学院马克思主义基本原理概论期末考试笔试题库
- DB46-T 481-2019 海南省公共机构能耗定额标准
- 神经介入进修汇报课件
- 感染患者终末消毒操作规范
- 学生公寓物业管理服务服务方案投标文件(技术方案)
- 脑供血不足病人的护理查房-课件
- 文控文员工作总结
- 团体团建跳舞活动方案
- 食品加工企业主要管理人员及工程技术人员的配备计划
- 儿童语言发育迟缓课件
- 2025至2030年中国汽车用碳纤维行业竞争格局分析及市场需求前景报告
- 焊接作业指导书完整版
评论
0/150
提交评论