




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
聚类的定义 假设样本集合为 X,可将 X划分为 m个子集 ,其中: 且同一类(或簇, cluster)中的样本较为相似, 不同类中的样本不相似。聚类属于无监督学习 。 一个简单例子 k-means clustering K平均( K-means)聚类方法 (见书本 6.6.3节 ) initialize N,m,c1,c2, ,cm do classify N samples according to nearest ci recompute ci , i=1, ,m until no change in ci Return c1,c2, cm 注意 ( 1)簇的数量 m需要预先指定。 ( 2) c1,c2, ,cm为各个簇内样本的均值,其初始 值通过随机抽取 m个样本产生。 基于准则函数的聚类算法 1、准则函数 通过准则函数可以对聚类结果的质量进行评估。 c为预先指定的簇的数量。 2、准则函数取值的变化 : 假设已给定一个划分, 考虑两个簇 Di、 Dj,假设 。当 由 Di移入 Dj 时, mj及 Jj分别变为: mi及 Ji分别变为: 因此, Je的变化量为: 3、聚类算法: Initialize N,c,m1, ,mc do randomly select a sample ( 获得 所属于的簇 i) if then compute if for all j then transfer to Dk until no change in Je in N attempts return m1,m2, ,mc 聚类结果的分析与验证 ( 1)采用某一算法对样本集进行聚类分析 。 ( 2)由专家对聚类结果进行分析与解释。 ( 3)采用不同算法或不同参数重复上述过 程,直至得到一个满意的结果。 1、知识表示 2、经典逻辑推理 3、不确定性推理 4、搜索原理及应用 5、模式识别的基本理论方法(或应用)综述。 6、模式识别系统的设计方法。 7、神经网络分类器的应用或算法分析或综述。 8、支持向量机的应用或算法分析或综述。 9、决策树分类器的应用或算法分析或综述。 10、聚类分析的应用或算法分析或综述。 11
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业无人机租赁平台在2025年农业技术推广中的运营模式研究报告
- 江苏省无锡市2025年化学中考真题试卷附真题答案
- 安全教育培训隐患课件
- 林草监管面试题库及答案
- 昆明文员面试题库及答案
- 2025年新能源行业运维技术革新与国际标准对比报告
- 零售行业会员积分体系优化与精准营销效果研究报告
- 2025年医疗行业信息化政策背景下的医疗信息化产业投资报告
- 电商绿色物流与城市配送协同发展报告
- 住院医师规范化培训协议
- ktv安全消防管理制度
- 《子宫颈癌筛查规范(2025年版)》解读
- 政府夜市活动方案
- 党校中青班入学考试试题及答案
- 肝硬化并腹水的护理查房
- 公司贷款流程
- 血透患者高血钾的护理
- 呼吸机与肺康复讲课件
- 2025至2030年中国二手车金融行业市场行情监测及发展前景研判报告
- 2025年浙江宁波市北仑区现代服务业发展集团下属全资国企招聘笔试参考题库含答案解析
- 香茅精油-大自然的驱蚊天使
评论
0/150
提交评论