版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚 类 分 析,数据分析与处理方法(2),第五章 聚类分析方法及其程序实现,5.1 聚类分析思想,5.2 数据预处理,5.3 聚类方法的选择,5.4 系统聚类法,物以类聚,样本数据:,n个样本分类!,5.1 聚类分析思想,同类事物具有很强的相似性,因而可以用相似性统计量这个度量标准作为事物分类的依据。 聚类分析有对样本进行聚类(Q型聚类)的,也有对变量进行聚类(R型聚类)的。,5.2 数据预处理,5.2.1 标准化处理,式中,,(5.2),特点: 标准化后变量的平均值为0,标准离差为1。,5.2.2 正规化处理,5.3相似性统计量的确定,如何定量地表示样品间的相似程度?,样本之间相似性,相关系
2、数统计量,距离系数统计量,变量之间相关程度,距离系数统计量,欧氏(Euclid)距离,距离矩阵,(1)距离系数常用来表示两个样本之间的相似程度 (2) 越小表示第i个样本和第j个样本相似程度越高,越是应该聚为一类 (3)距离矩阵R对角线上元素为0 (4) = ,即R为对称阵,相关系数统计量,(1)相关系数常用来表示两个变量之间的相关关系 (2) 越大表示第t个变量和第s个变量相关程度越高 (3)相关矩阵R对角线上元素为1 (4) = ,即R为对称阵,相关矩阵,5.3 系统聚类法的一般步骤,1、数据预处理,2、对Q型聚类,计算其距离矩阵 对R型聚类,计算其关系矩阵,3、开始聚类 对Q型聚类,找小
3、的数;对R型聚类,找大的数,4、作谱系图,样本聚类谱系图,变量聚类谱系图,例5.1 在某地区有七个矽卡岩体,对七个岩体的三个元素Cu、W、Mo作分析得原始数据表(见表5.1)。现对这七个样品进行分类。,表5.1,(一)对数据预处理,表5.2,正规化,(二)计算距离系数阵用计算 得表5.3,表 5.3,聚类工作是根据距离矩阵出发,按下面三步反复进行: 1从表5.3中选出最小者,划为同一类,填入综合表5.14。 2将58、79号两岩体各元素含量合并(求平均值).则得到比原来表5.2少一个岩体的正规化数值,见表5.4。,表 5.4,(三)开始聚类,3根据表5.4重新计算各样品距离系数矩阵,得表5.5
4、。,表 5.5,注意这里只需计算合并后的58、79号与其他各岩体距离,其余岩体距离不变,照表5.3抄。 4重复第1步,由表5.5选出最小者d56,80=0.1558填入综合表5.14中。 5重复第2步将表5.4中56、80号两岩体的数据合并,得表5.6。 6重复第3步,计算距离函数得表5.7。 7重复第1步,从表5.7中选出最小者d98,102=0.2170填入综合表5.14中。,表 5.6,表 5.7,8重复第2步,将表5.6中98、102号两岩体数据合并得表5.8。 9重复第3步,计算距离函数得表5.9。 10重复第1步,从表5.9中挑出最小者 d55、80、83=0.2535填入综合表5.14中。 11重复第2步,将表5.8中56、80号和83号两列数据合并(加权平均)得表5.10。 12重复第3步,计算距离函数得表5.11。,表 5.8,表 5.9,表 5.10,表 5.11,13重复第1步,从表5.11中挑出最小者 d56、80、83、58、79=0.3993,填入综合表5.14中。 14重复第2步,将表5.10中56、80、83号和58、79号两列数据以加权合并得表5.12。 15重复第3步,计算距离函数得表5.13。 16将0.73
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026北京市东昌私募基金管理有限公司招聘3人笔试备考试题及答案解析
- 2026年河南科技职业大学单招综合素质笔试参考题库含详细答案解析
- 2026西藏日喀则吉隆县招聘大学生公益性岗位工作人员3人笔试备考试题及答案解析
- 2026广西南宁隆安县雁江镇卫生院医生招聘2人笔试备考题库及答案解析
- 2026年闽北职业技术学院高职单招职业适应性测试备考题库及答案详细解析
- 2026上海松江区中山街道大海公益服务中心招聘文员2人参考考试题库及答案解析
- 2026浙江温州市苍南县交通发展集团有限公司招聘9人笔试备考题库及答案解析
- 2026四川德阳市旌阳区城镇公益性岗位招聘27人笔试备考试题及答案解析
- 2026天津市红桥区卫生健康委所属事业单位招聘事业编制高层次人才笔试备考试题及答案解析
- 2026年青海农牧科技职业学院单招职业技能考试模拟试题含详细答案解析
- 智能网联汽车感知技术与应用 课件 项目1 智能网联汽车感知技术概述
- 低空经济在红河州乡村振兴中的实践与探索报告2025
- 港口复工复产安全培训课件
- 歌颂内蒙古的诗歌
- uom理论考试题库及答案2025
- 2025年文字排版与设计考试试题及答案
- 新能源充电桩施工方案
- 2015-2024年十年高考地理真题分类汇编专题03 地球上的大气(原卷版)
- DLT 572-2021 电力变压器运行规程
- 金相分析原理及技术
- 无责任人道主义赔偿协议书
评论
0/150
提交评论