k-means聚类、EM聚类、模糊聚类比较.ppt_第1页
k-means聚类、EM聚类、模糊聚类比较.ppt_第2页
k-means聚类、EM聚类、模糊聚类比较.ppt_第3页
k-means聚类、EM聚类、模糊聚类比较.ppt_第4页
k-means聚类、EM聚类、模糊聚类比较.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

聚类,IRLAB,大纲,聚类分析简介 层次聚类 单连接和全连接聚类 组平均聚类 应用:改进语言模型 自顶向下聚类 非层次聚类 K-均值 EM算法,什么是聚类分析?,聚类: 数据对象的集合 在同一个类中,数据对象是相似的 不同类之间的对象是不相似的 聚类分析 一个数据集合分组成几个聚类 聚类是一种无监督分类:没有预定义的类 典型应用 作为一个独立的工具 透视数据分布 可以作为其他算法的预处理步骤,聚类算法类型,层次聚类与非层次聚类 自底向上与自上向下(凝聚与分裂) K-均值 软聚类与硬聚类 K-均值 模糊聚类(EM算法),层次聚类,自底向下的聚类 每一项自成一类 迭代,将最近的两类合为一类 自顶向下的聚类 将所有项看作一类 找出最不相似的项分裂出去成为两类,类的相似度度量,我们可以知道两个项之间的相似度,但是聚类要求知道类与类之间的相似度 三种方法: 单连接方法 全连接方法 组平均方法,非层次聚类,K-均值 硬聚类 计算每个类的中心 EM算法 考虑稀疏数据 公式 用EM算法计算P( ci|w1),K-均值,将n个向量分到k个类别中去 选择k个初始中心 计算两项距离 计算均值,K-均值算法,EM-算法,算法族 以前的一个例子:前向后项算法是EM算法的一个例子 可以用于任意的概率模型E(likelihood)及max likelihood estimite估计,模糊聚类,经典的k均值聚类算法的一部迭代中,每一个样本点都被认为是完全属于某一类别。 模糊聚类放松这一条件,假定每个样本是模糊隶属于某一类的。 每类是一个高斯分布 样本集合模拟成一个高斯混合分布,点集x1,xn K个类 Z为二维数组,zij为1表示xi在j类中,否则为0 每个j类定义为一个高斯分布,EM算法,用先前的概率累加 任意一项xi的概率,EM算法,参数 给定参数下x的值,EM算法,找到zij的期望值并用它计算最大似然估计,反复迭代,直到收敛。,EM算法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论