机器学习-聚类_第1页
机器学习-聚类_第2页
机器学习-聚类_第3页
机器学习-聚类_第4页
机器学习-聚类_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机器学习聚类汇报人:杨光1.聚类任务务有一天老老板给你你一堆数数据,然然后他说说,你给给我分类类(聚类类)出来来21.聚类任务务聚类算法法是一种种无监督督学习,我们区区分监督督学习和和无监督督学习的的方法是是看IN数据有无无标签(Label)。31.聚类任务务4在实际工工作中,我们需需要处理理很多数数据,标标签获取取需要极极大的人人工工作作量。1.聚类任务务引言聚类算法法会将数数据集中中的样本本划分成成为若干干个通常常不相交交的子集集,每一一个子集集我们称称之为“簇”。在聚类类过程自自动形成成簇结构构后,我我们会发发现每个个簇里会会存在一一些潜在在的概念念,比如如“黄种种人”、“白种种人”,“

2、女性性”、“男性”,这些些是我们们事先未未知的,这些概概念也是是由使用用者来把把握和命命名的。51.聚类任务务引言62.性能度量量引言目标:尽量使聚聚类结果果的“簇簇内相似似度高” 且“簇间相相似度低低”两类指标标:7外部指标标:与某某个“参参考模型型”比较较内部指标标:直接接考察聚聚类结果果(不利利用参考考模型)2.性能度量量引言外部指标标:82.性能度量量引言92.性能度量量引言10内部指标标:2.性能度量量引言113.距离计算算引言距离度量量dist(.,.)需要满足足一些性性质:12非负性:dist(xi,xj)0同一性:dist(xi,xj)=0当且仅当当xi=xj对称性:dist(

3、xi,xj)=dist(xj,xi)直递性:dist(xi,xj)dist(xi,xk)+dist( xk,xj)3.距离计算算引言闵可夫斯斯基距离离:当给定样样本我们最常常用的是是“闵可可夫斯基基距离”p1时,“闵闵可夫斯斯基距离离”公式式满足上上述4个性质。p=1时,“闵闵可夫斯斯基距离离”即“曼哈顿顿距离”。p=2时,“闵闵可夫斯斯基距离离”即“欧氏距距离”。133.距离计算算引言有序属性性:1,2,3闵可夫斯斯基距离离无序属性性:飞机,火火车,轮轮船VDM143.距离计算算引言153.距离计算算引言164.原型聚类类k-means引言174.原型聚类类k-means引言184.原型聚类类k-means引言194.原型聚类类k-means引言204.原型聚类类LVQ引言214.原型聚类类LVQ引言224.原型聚类类LVQ引言234.原型聚类类LVQ引言244.原型聚类类LVQ引言255.密度聚类类引言265.密度聚类类引言275.密度聚类类引言285.密度聚类类引言295.密度聚类类引言305.密度聚类类引言316.层次聚类类引言32给定聚类类簇Ci,Cj,可以通通过下面面的式子子来计算算距离:6.层次聚类类引言336.层次聚类类引言34以西瓜数数据集4.0为例,令令AGNES算法一直直执行到到所有样样本出现现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论