版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
误差分析课件聚类分析之谱系聚类法第一页,共二十七页,2022年,8月28日类间距离及其递推公式谱系聚类法的应用分析谱系聚类法的步骤谱系聚类第二页,共二十七页,2022年,8月28日引言谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。谱系聚类第三页,共二十七页,2022年,8月28日利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近性大小聚结起来的谱系图,再进一步根据实际情况确定合适的分类个数。谱系聚类第四页,共二十七页,2022年,8月28日问题判断两个样品最相似的依据是什么?谱系聚类第五页,共二十七页,2022年,8月28日类间距离及其递推公式常用的类间距离有四种:
最短距离最长距离类平均距离重心距离类间距离谱系聚类第六页,共二十七页,2022年,8月28日以分别表示样品,以简记与的距离,设分别表示两个类,它们分别含有个样品.我们用来表示类与之间的距离.最短距离即用两类中样品之间距离最短者作为两类间的距离.谱系聚类第七页,共二十七页,2022年,8月28日最长距离
即用两类中样品之间距离最长者作为这两类间的距离.类平均距离
即用两类中所有两两样品之间的距离的平均作为两类之间的距离.或者
即用两类中所有两两样品之间的平方距离的平均作为两类间的平方距离.谱系聚类第八页,共二十七页,2022年,8月28日重心距离设类中的样品为,,…,,则其均值称为类的重心.其中,,分别是的重心,即用两类的重心之间的距离作为两类间的距离.谱系聚类第九页,共二十七页,2022年,8月28日按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类由类合并所得,则包含个样品.
为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,即计算类与其他类之间的距离.
类间距离的递推公式谱系聚类第十页,共二十七页,2022年,8月28日常用的四种类间距离的递推公式最短距离最长距离谱系聚类第十一页,共二十七页,2022年,8月28日类平均距离对于类平均距离的下列定义方式同理可得递推公式如下:谱系聚类第十二页,共二十七页,2022年,8月28日重心距离由的合并集的重心是而由,有谱系聚类第十三页,共二十七页,2022年,8月28日若采用欧氏距离的距离,以上介绍的4种类间距离的递推公式可统一表示为计算样品之间谱系聚类第十四页,共二十七页,2022年,8月28日各种类间距离的参数如下表所示谱系聚类第十五页,共二十七页,2022年,8月28日谱系聚类法的步骤(1)n个样品开始时作为n个类,计算两两之间的距离,构成一个对称距离矩阵此时,谱系聚类第十六页,共二十七页,2022年,8月28日
(2)选择中主对角线以下(或以上)的最小距离,设这个元素是,这时,首先将合并为一个新类.在中消去,所对应的行与列,并加入由新类与剩下的其他未聚合的类间的距离所组成的一行和一列,得到一个更新的距离矩阵,它是阶方阵.(3)从出发重复步骤(2)的做法得,再由出发重复上述步骤,直到个样品聚为一个大类为止.(4)在合并过程中要记下合并样品的编号及两类合并时的距离(称为距离水平),并绘制聚类谱系图.
谱系聚类第十七页,共二十七页,2022年,8月28日谱系聚类法的应用分析
核电企业对自身库存的优化管理仓库内存货位置摆放的合适与否会直接影响到总搬运费用、大修工作效率以及仓库人员的工作积极性。因此将备品备件正确地分类存放是非常重要的。应用谱系聚类法中的最短距离法对核电企业的备品备件进行分类,然后根据分类的结果对这些类之间的关系做总结归纳。谱系聚类第十八页,共二十七页,2022年,8月28日谱系聚类法的应用分析将备品备件大致分为以下几类:机械类:
紧固件、密封、轴承、过滤器、压缩机、管道、热交换器等;电气类:
熔断器、断路器、变压器、电气元件、电机、电缆等;仪表类:
电子元件、电路板、电源、工业计算机及备件、各种测量仪等;五金类:
金属材料等;其他类:
焊接材料、润滑油、安全防护、消防器材等。谱系聚类第十九页,共二十七页,2022年,8月28日谱系聚类法的应用分析为了便于说明,列举了部分变量指标,对这五类备品备件的各项变量打分如下表(满分10分):
谱系聚类第二十页,共二十七页,2022年,8月28日谱系聚类法的应用分析然后利用欧式距离公式,根据表内的打分计算各类之间的相互距离,得到矩阵如下:谱系聚类第二十一页,共二十七页,2022年,8月28日谱系聚类法的应用分析由上述矩阵知,G4与G5之间距离最短,所以组成一个新类G6。然后再用G6与其他类再次比较,即用G6里面的子类G4与G5分别与其他类的欧氏距离进行比较,选择其中距离小的为两类之间的距离。故得到新矩阵如下:谱系聚类第二十二页,共二十七页,2022年,8月28日谱系聚类法的应用分析此时,G3与G6之间的距离最短,所以G3、G4和G5共同组成一个新类G7,同上述步骤一样,得出新的矩阵如下:谱系聚类第二十三页,共二十七页,2022年,8月28日谱系聚类法的应用分析同理,G2与G7组成一个新类G8,G8与G1的欧氏距离为:
综上所述,我们在距离为11的水平上首先合并五金类和其他类,得到新类G6={G4,G5};
然后,更新距离矩阵后又在距离为12的水平上合并G3与G6得到新类G7={G3,G4,G5};
在距离为13的水平上合并G2与G7为新类G8;
最后在距离为41的水平上将G1与G8合并成一个大类。
谱系聚类第二十四页,共二十七页,2022年,8月28日谱系聚类法的应用分析将上述聚类过程连同合并时的水平用图表示出来,可以画出谱系图如下:谱系聚类第二十五页,共二十七页,2022年,8月28日谱系聚类法的应用分析由此可见,这五类归纳为两类比较合适,即电气类、仪表类、五金类和其他类为一类,机械类自成一类。
把聚类
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 22186-2026网络安全技术具有中央处理器的IC卡芯片安全规范
- 医学26年:卒中一级预防要点 查房课件
- 24公路收费及监控员考试题库
- 计划生育基础知识试题和答案
- 配电房设施设备清单
- 扶贫攻坚心得总结
- 2024年云南省玉溪市小升初语文试卷
- 人际协调的心理艺术与技巧
- 提高新入患者护理表格书写完整性品管圈汇报
- 金华市九峰水厂及配套输水管道工程-取水工程全过程造价控制招标文件
- 北京市2025文化和旅游部恭王府博物馆应届毕业生招聘笔试历年参考题库典型考点附带答案详解
- 重庆育才中学2026届高三适应性训练(二)生物+答案
- 2026年租赁烘干塔合同(1篇)
- 神经重症目标温度管理共识
- 2026年高校学报编辑部期刊出版岗应聘笔试指南及规范
- 2026年林业局森林资源管理岗面试题
- 2026年小升初数学考试知识点总结
- 肝素类药物临床监测专家共识解读2026
- 2025年湖北省工程专业中级职务水平能力测试(林业)综合试题及答案
- 东莞广告行业分析报告
- 内江市东兴区2025年网格职员考试题及答案
评论
0/150
提交评论