SPSS分层聚类操作指南_第1页
SPSS分层聚类操作指南_第2页
SPSS分层聚类操作指南_第3页
SPSS分层聚类操作指南_第4页
SPSS分层聚类操作指南_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分层聚类,又称层次聚类,是指聚类过程是按照一定层次进行的。如果需要按变量(标题) 聚类,此时应该使用分层聚类,并且结合聚类树状图进行综合判定分析,得出科学分析结果。分成聚类的基本思想是: 在聚类分析的开始,每个样本(或变量)单独作为一组,然后按照某种方法度量所有样本(或 变量)之间的亲疏程度,把距离相近的先样本(或变量)先聚成类,距离相远的后聚成类, 如此反复,直到所有样本(或变量)聚成一类为止。分层聚类有几点需要特别注意:1:仅针对定量数据进行分层聚类;2:如果数据的单位有较大差别,可首先对于数据进行标准化处理后,针对标准化数据进行分层聚类;SPSSAU用户可点击数据处理-生成变量-选择标准

2、化(S),进行数据标准化处理。生成变星Q平均但 ,清带入娈量名称平均佶同口乘见中位数标准化(S)中化Cj 日盛点 平方(Sq板号(Sqr)兰湖故Ln)1。为底对数(L四1叫正向化(MMS) 谜向化(MMS) 三次方(uhe 忸裁(Reciprccalj3 :由于均为定量数据,因而从原理角度上,分层聚类时应该使用Pearson相关系数去度量 距离,相关系数值越大说明越紧密,则说明距离越近,相关系数值越小说明越疏远,说明距 离越远;SPSSAU默认使用Pearson相关系数表示距离大小;案例分析背景当前有8个裁判对300名选手打分,最低分为1分,最高分为10分;希望对8个裁判进 行聚类,以识别出裁

3、判的风格类型。总共8个裁判共有8列数据,并且共有300行。由于 打分全部均是从1到10分,8列数据的单位均一样,因此在分析之前不需要进行标准化数 据(当然进行标准化处理也没有问题)。2、操作步骤本案例中总共涉及8个标题,SPSSAU操作截图如下:SPSSAU会默认聚类为3类并且呈现表格结果,如果希望更多的类别个数,可自行进行设 置。w? 0钢裁判2哉判3藏裁邳毒判&裁判7哉判日勺iff】占TrvrJfluEaj3、SPSSAU输出结果SPSSAU会首先输出聚类项的基本描述情况,接着输出每项的聚类类别归属情况;并且输出树状图,如下所述: , *KP4xc甲M中g上表格展示总共8个分析项(即8个裁

4、判数据)的基本情况,包括均值,最大或者最小值, 中位数等,以便对于基础数据有个概括性了解。整体上看,8个裁判的打分基本平均在8分 以上。特别提示上表格中的值与聚类的原理基本没有关联性,请勿将上表格信息与聚类结果产生联系%分析建议会层聚耋弟寸定虽敖据进行研究,探索分析项的类别归后,言无可对分析以基本特征曲施述; 第一:描述会信聚美分析的基本情况,选择分析项进行聚奏的原因等:笫二:描述聚美项的基本特征情况,针对m均值或中位数进行描述等,V智能醐但用制M瘀窟撬判I稔织.SJ判裁判4哉荆5我判裁判T.耗判8总共8进行尝我.上球砂的拧风的耳本琮胃:总 职寸耳本胃况世要性闫i.哄照颤仙表总共聚类为3个类别

5、,以及具体分析项的对应关系情况。在上表格中展示出来,上表格可 以看出:裁判8单独作为一类;裁判5,3,7这三个聚为一类;以及裁判1,6,2,4作 为一类。聚类类别与分析项上的对应关系可以在上表格中得到同时也可以查看聚类树状图得出更多 信息。至于聚类类别分别应该叫做什么名字,这个需要结合对应有关系情况,自己单独进行 命名。聚美哽状图上图为聚类树状图的展示,聚类树状图是将聚类的具体过程用图示法手法进行展示;最上面 一行的数字仅仅是一个刻度单位,代表相对距离大小;一个结点表示一次聚焦过程。树状图的解读上,建议单独画一条垂直线,然后对应查看分成几个类别,以及每个类别与分 析项的对应关系。比如上图中,红

6、色垂直线最终会拆分成3个类别;第1个类别对应裁判8 ; 第2个类别对应裁判5,3,7;第3个类别对应裁判1,6,2,4。0.500.10Q.15 DJO D.25 Q.3Q_Il品珀理ml:a?!?SftHS?拓*4当然在分析时也可以考虑分成2个类别,此时只需要对应将垂直线移动即可,如下图:上图展示出仅分为2个类别时的情况;如果聚类成2个类别;此时裁判8单独作为一个类 别;裁判5,4,7,1,6,2,4会单独聚为一类。聚美伊状图 TOC o 1-5 h z 0昭00.100.150#200.250.30IlIIIiill裁刮81 倒5ik裁郎i盖叩T 1 惟知f卷刊日iM I414如果是聚为四

7、类;从上图可看出,明显的已经不再合适。原因在于垂直线不好区分成四类。也即说明有2个类别本应该在一起更合适(上图中的裁判1与6/2/4);但是如果分成4 类,此时裁判1会单独成一类。所以画垂直线无法区分出类别。因而综合分析来看,最终聚类为3个类别最为适合。%分析建议第一:椀状图是分层聚类的过程可视化描述;第二:椀状图的具体使用和分析过程,请阅读帮助手册;第二:建议结合具体情况识引.出最丰圭刖数晶以及类别和分析项对应关系; 第四:对会析进行总结.文字分析:本次研究共涉及8个裁判对于300个选手的打分数据,打分从1到10分;并 没有量纲问题,因而对平数据不需要进行标准化处理(如果有量纲单位问题,最好先进行标 准化处理)具体分层聚类时使用Pearson相关系数度量距离大小,同时使用组平均距离法 进行分析。结合聚类树状图进行分析,如果聚类为一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论