



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚类分析聚类分析是将个对象按各自的特征将相似的对象归到同一个类或簇的一种方法,它的原则是同一个类中的对象有很大的相似性,而不同类间的对象有很大的相异性。特点:适用于没有先验知识情况下的分类。对于没有先前的经验或一些规则的对象进行分类,则显得很随意和主观,这时需要使用聚类分析法通过对象各自的特性来合理的分类;能处理多个维度或属性决定的分类。例如,对于某个地区的全部家庭的富裕程度而言,通过家庭的收入和支出差可以简单分类,容易知道。但是如果要求从家庭的收入、家庭的支出、家庭的固有资产、家庭所在地区的地段等多个变量来分析就比较复杂,然后解决这个问题可以使用聚类分析算法。聚类分析算法也是一种探索性分析方
2、法,能够挖掘对象的潜在规律和特性,并根据相似性原则对事物进行分类。几类距离公式:系统聚类法思想先将每一个样本作为一个单独的类,然后计算各个样本之间的距离,在将计算出来的距离定义为类之间的距离,以为标准的距离,进行合理合并,形成新的一个类,在重新对新类和其他剩余的类进行计算其距离,循环执行合并动作,直到全部的样本都属于一个大类为止。2 / 4步骤:若有n个样本点,计算出每两个样本点之间的距离,即矩阵;建立n个类,每个类中仅有一个样本点,且每个类的平台高度都为0;将距离最近的两个类合并为新类,选取聚类图的平台高度为这两类之间的距离值;求出新类和目前各类之间的距离,如果类的个数等于1,执行步骤,否则,返回执行步骤;画出聚类图;确定类的数目和类,例题:设有5个销售员,他们的销售业绩由二维变量描述,见表1。表1 销售员业绩表记销售员的销售业绩为。若使用绝对值距离来测量点与点之间的距离,使用最短距离法来测量类与类之间的距离,即 题中有5个样本点,计算出每两个样本点之间的距离,即矩阵为建立5个类。每个类的平台高度都为0;将合并为新类,选取新的平台高度为1,此时有;将合并为新类,选取新的平台高度为2,此时有;将合并为新类,选取新的平台高度为3,此时有;将合并为新类,选取新的平台高度为4,此时有;画出聚类图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 品牌核心价值的建立试题及答案
- 监狱法及试题答案
- 如何在纺织考试中进行高效记忆试题及答案
- 广告设计师商业价值评估试题及答案
- 知识点梳理纺织设计师试题及答案
- 公司应聘测试题及答案
- 助理广告师考试2024年潜力挖掘试题及答案
- 2024年中国纺织行业的生态转型试题及答案
- 2024年设计师考试作品创作流程概述试题及答案
- 2024年纺织品设计中的市场反馈考题及答案
- 2025年四川绵阳交通发展集团有限责任公司招聘笔试参考题库附带答案详解
- 成本控制在质量管理中的策略试题及答案
- 起重吊装作业安全管理培训
- 2025届河北省石家庄第一中学高三下学期二模地理试题及答案
- 2025年山东省应急管理普法知识竞赛参考试题库大全-下(多选、判断题)
- PSP问题解决流程分析
- 6.5 国家司法机关 课件-2024-2025学年统编版道德与法治八年级下册
- 语文-华大新高考联盟2025届高三3月教学质量测评试题+答案
- 低空经济行业分析报告
- 2025年安徽省C20教育联盟中考三模语文试题(含答案)
- 计算机毕设管理系统答辩
评论
0/150
提交评论