已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
聚类,IRLAB,大纲,聚类分析简介层次聚类单连接和全连接聚类组平均聚类应用:改进语言模型自顶向下聚类非层次聚类K-均值EM算法,什么是聚类分析?,聚类:数据对象的集合在同一个类中,数据对象是相似的不同类之间的对象是不相似的聚类分析一个数据集合分组成几个聚类聚类是一种无监督分类:没有预定义的类典型应用作为一个独立的工具透视数据分布可以作为其他算法的预处理步骤,聚类算法类型,层次聚类与非层次聚类自底向上与自上向下(凝聚与分裂)K-均值软聚类与硬聚类K-均值模糊聚类(EM算法),层次聚类,自底向下的聚类每一项自成一类迭代,将最近的两类合为一类自顶向下的聚类将所有项看作一类找出最不相似的项分裂出去成为两类,类的相似度度量,我们可以知道两个项之间的相似度,但是聚类要求知道类与类之间的相似度三种方法:单连接方法全连接方法组平均方法,非层次聚类,K-均值硬聚类计算每个类的中心EM算法考虑稀疏数据公式用EM算法计算P(ci|w1),K-均值,将n个向量分到k个类别中去选择k个初始中心计算两项距离计算均值,K-均值算法,EM-算法,算法族以前的一个例子:前向后项算法是EM算法的一个例子可以用于任意的概率模型E(likelihood)及maxlikelihoodestimite估计,模糊聚类,经典的k均值聚类算法的一部迭代中,每一个样本点都被认为是完全属于某一类别。模糊聚类放松这一条件,假定每个样本是模糊隶属于某一类的。每类是一个高斯分布样本集合模拟成一个高斯混合分布,点集x1,xnK个类Z为二维数组,zij为1表示xi在j类中,否则为0每个j类定义为一个高斯分布,EM算法,用先前的概率累加任意一项xi的概率,EM算法,参数给定参数下x的值,EM算法,找到zij的期望值并用它计算最大似然估计,反复迭代,直到收敛。,EM算法,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店销售部工作总结(资料13篇)
- UPVC管道施工方案
- 防疫专员招聘考试试题及答案
- 专升本民法真题及答案
- 中级经济师考试《保险专业》真题及答案解析
- 养老护理员四级考试卷含答案
- 2026年注册安全工程师《安全管理》培训试卷(附答案)
- 建筑工地施工物料提升机方案
- 制造业智能制造推进实施方案
- 2025年高血压健康管理试题及参考答案
- 药品生产管理规范实施指南(2025版)
- 地坪裂缝修补工程实施方案
- 2025年咸宁市中小学教师系列高、中级职称水平能力测试综合能力测试考前冲刺模拟题及答案(网页版)
- 泌尿系结石中西医结合治疗
- 2025年浙江高中信息技术学业水平考试卷试题(含答案详解)
- 员工雇佣合同管理规范
- 工业设备接口技术应用与维护
- 《土木工程智能施工》课件 第3章 土方作业辅助工程-土壁支护2
- 学堂在线 大数据机器学习 期末考试答案
- 《养老机构智慧运营与管理》智慧健康养老服务与管理专业全套教学课件
- 中国环境保护法讲解
评论
0/150
提交评论