聚类分析论文统计学聚类分析论文_第1页
聚类分析论文统计学聚类分析论文_第2页
聚类分析论文统计学聚类分析论文_第3页
聚类分析论文统计学聚类分析论文_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

聚类分析论文统计学聚类分析论文 1. 聚类分析方法 聚类分析关注于根据一些不同种类的度量构造一些相似的对象组成的群体。 1 、基本:我们所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,这就是分类的基本思想.关键的思想去确定对分析目标有利的对象分类方法。这个思想已经用于许多领域,包括天文学、考古学、医药、化学、教育、心理学、语言学和社会学。在聚类分析前,首先把数据标准化为Z-分数,采用系统聚类(Hierachical Cluster)方法,用音差平方和法(Ward法)计算欧几里得(Eudlidean)距离。 聚类分析依据的基本原则是:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广,它的表达式如下: 其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。 当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,本节只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。分类结果可以画成一张直观的聚类谱系图。应用系统聚类法进行聚类分析的步骤如下: 确定待分类的样品的指标; 收集数据; 对数据进行变换处理(如标准化或规格化); 使各个样品自成一类,即n个样品一共有n类; 计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成 一类; 并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止; 最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。 例如,我们可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素情况,将网点分为几个等级,再比较各银行之间不同等级网点数量对比状况。 。 在聚类分析中,通常我们将根据分类对象的不同分为Q型聚类分析和R型聚类分析两大类。 R型聚类分析是对变量进行分类处理,Q型聚类分析是对样本进行分类处理。 R型聚类分析的主要作用是: 1、不但可以了解个别变量之间的关系的亲疏程度,而且可以了解各个变量组合之间的亲疏程度。 2、根据变量的分类结果以及它们之间的关系,可以选择主要变量进行回归分析或Q型聚类分析。 Q型聚类分析的优点是: 1、可以综合利用多个变量的对样本进行分类; 2、分类结果是直观的,聚类谱系图非常清楚地表现其数值分类结果; 3、聚类分析所得到的结果比分类更细致、全面、合理。 为了进行聚类分析,首先我们需要定义样品间的距离。 常见的距离有 : 绝对值距离 欧氏距离 明科夫斯基距离 切比雪夫距离 聚类的几种方法: (1)直接聚类法 先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。 (2)最短距离聚类法 是在原来的mm距离矩阵的非对角元素中找出 ,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式 计算原来各类与新类之间的距离,这样就得到一个新的(m1)阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论