已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
K-均值聚类算法,由张明磊报道,1,2020/8/3,K-均值算法是一种典型的基于距离的聚类算法,它使用距离作为相似性的评价指标,即两个物体之间的距离越近,它们的相似性越大。该算法认为类是由距离较近的对象组成的,所以最终的目标是得到紧凑且独立的类。2,2020/8/3,假设数据集是(x1,x2,xn),并且每个xi是一个D维向量,K-means聚类的目的是给定k(kn)的值,将原始数据分成K个类:S=S1,S2,SK在数值模型上,也就是说,找到下面的表达式(2)根据最小距离原则将数据样本集中的样本分配到最近的聚类;(3)根据聚类结果,重新计算k个聚类的中心,并将其作为新的聚类中心;(4)重复步骤2.3,直到群集中心不变。4,2020/8/3,数学表达式:n:样本数。k:样本分为k类。Rnk:第n个采样点是否属于第k类,如果是,rnk=1,如果不是,rnk=0。kth中心点。5,2020/8/3,K-means要做的就是最小化这个函数。迭代方法:1 .修正k得到rnk。2.修正rnk并找到最优K,6,2020/8/3,求rnk并求K,7,2020/8/3,8,2020/8/3,k- means算法性能分析优势:1 .K-means算法框架清晰、简单、易懂。2.对于处理大型数据集,该算法相对可扩展且高效,计算复杂度为0(NKt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南省普洱市2026届高三历史上学期期末教学质量监测试题
- 2026 幼儿情绪管理明智情绪培养方法课件
- 2026 幼儿情绪管理宽容情绪培养方法课件
- 2026 三年级上册《We love animals 动物》课件
- 2026年幼儿园情绪安定愉快
- 2026三年级上《万以内的加法》易错题解析
- 2026年幼儿园天气的课件
- 2026年初一地理第二学期期末考试卷及答案(共十六套)
- 2026年护工病人护理知识培训方案
- 钢网架安装施工工艺流程
- 2026江西省铁路航空投资集团有限公司第一批社会招聘23人笔试备考题库及答案详解
- 期中基础模拟卷(1-4单元试卷)2025-2026学年五年级数学下册人教版(含答案)
- 兰州翡翠华庭地热项目环评报告表
- 兴业证券集团2027届暑期实习生招聘笔试参考试题及答案解析
- GB/T 44693.4-2026危险化学品企业工艺平稳性第4部分:开工过程管理规范
- 环卫专用车研发工程师考试试卷及答案
- 禁种铲毒课件
- 2024-2025学年宁夏银川市唐徕中学南校区九年级下学期期中考试历史试卷
- 人教版(2024)八年级上册英语Unit 4 Amazing Plants and Animals 教案
- (2025年标准)球阀技术协议书
- 绵阳市格英达环保科技有限公司水基钻井废弃物综合利用及油气田钻采废水环保处理项目环评报告
评论
0/150
提交评论