




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS聚类分析过程聚类的主要过程一般可分为如下四个步骤:1.数据预处理(标准化)2.构造关系矩阵(亲疏关系的描述)3.聚类(根据不同方法进行分类)4.确定最佳分类(类别数)SPSS软件聚类步骤1. 数据预处理(标准化)Analyze Classify Hierachical Cluster Analysis Method 然后从对话框中进行如下选择从Transform Values框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:标准化方法解释:None:不进行标准化,这是系统默认值;Z Scores:标准化变换;Range 1 to 1:极差标准化变换(作用:变换后的数据均
2、值为0,极差为1,且|xij*|<1,消去了量纲的影响;在以后的分析计算中可以减少误差的产生。);Range 0 to 1(极差正规化变换 / 规格化变换);2. 构造关系矩阵在SPSS中如何选择测度(相似性统计量):Analyze Classify Hierachical Cluster Analysis Method 然后从对话框中进行如下选择常用测度(选项说明):Euclidean distance:欧氏距离(二阶Minkowski距离),用途:聚类分析中用得最广泛的距离;Squared Eucidean distance:平方欧氏距离;Cosine:夹角余弦(相似性测度;Pear
3、son correlation:皮尔逊相关系数;3. 选择聚类方法SPSS中如何选择系统聚类法常用系统聚类方法a)Between-groups linkage 组间平均距离连接法方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。(项对的两成员分属不同类)特点:非最大距离,也非最小距离b)Within-groups linkage 组内平均连接法方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小C)Nearest neighbor 最近邻法(最短距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d)Furthest neighbor 最远邻法(
4、最长距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e)Centroid clustering 重心聚类法方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦。f)Median clustering 中位数法方法简述:两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者间的距离特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。g)Wards method 离差平方和法方法简述:基于方差分析思想,如果
5、分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。谱系分类的确定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:A. 任何类都必须在临近各类中是突出的,即各类重心间距离必须极大B. 确定的类中,各类所包含的元素都不要过分地多C. 分类的数目必须符合实用目的D. 若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类实例分析SPSS19.0分析软件聚类分析4.2聚类分析系统聚类法在数据编辑窗口的主菜
6、单中选择“分析(A)”“分类(F)”“系统聚类(H)”(如图-4所示),弹出“系统聚类分析”对话框,将“地区”变量选入“标注个案(C)”中,将其他变量选入“变量框”中,如图-5所示。在“分群”单选框中选中“个案”,表示进行的是Q型聚类。在“输出”复选框中选中“统计量”和“图”,表示要输出的结果包含以上两项。单击“统计量(S)”按钮,在“系统聚类分析:统计量”对话框中选择“合并进程表”、“相似性矩阵”,如图-6所示,表示输出结果将包括这两项内容。单击“绘制(T)”按钮,在“系统聚类分析:图”对话框中选择“树状图”、“冰柱”,如图-7所示,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)。
7、单击“方法(M)”按钮,弹出“系统聚类分析:方法”对话框,如下图-8所示。“聚类方法(M)”选项条中可选项包括如图-9所示的几种方法,本例中选择“组间联接”:“度量标准-区间(N)”选项条中可选项包括如图-10所示的几种度量方法,本例中选择“平方Euclidean距离”:“转换值-标准化(S)”选项条中可选项包括如图-11所示的几种将原始数据标准化的方法,本例中选择“全局从0到1”:冰柱图解释聚类分析冰柱图形状类似于屋檐上垂下的冰柱,因此而得名。横轴:案例(Case)表示被聚类的对象或变量;纵轴:群集数(Number of clusters)表示被聚成几类;观察冰柱图应从最后一行开始。举例如下:当聚成6类时X4和X8和X6聚成一类,其他个案自成一类,用白板将6类一下挡上可以看出如图;当聚成5类时X4和X8和X6和X2聚成一类,其他个案自成一类。冰柱图的优点是不仅可以显示出不同类数时个案所属的分类结果,还能表现出聚类的过程步骤,生动形象;缺点是不能表现出聚类过程中距离的大小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学五年级学生国旗下演讲稿《夏至的悄悄话》
- 学校学生会秘书部工作总结模版
- 学校读书活动总结模版
- 工行撤销委托协议
- 客服年终总结模版
- 学前儿童发展 课件 第2章 胎儿的发育与出生
- 反比例函数知识点总结模版
- 铜川市重点中学2025届八年级数学第二学期期末学业水平测试模拟试题含解析
- 勾股定理思维导图+题型总结模版
- 室性心律失常的临床护理
- 2025年安徽马鞍山博望港华燃气有限公司招聘笔试参考题库附带答案详解
- 浙江开放大学2025年《社区治理》形考任务1-3答案
- 广告项目方案投标文件(技术方案)
- 脑梗死三基试题及答案
- 王者荣耀考试题及答案
- 浙江省钱塘联盟2024-2025学年高二下学期期中联考试题 地理 含答案
- 07北工大高数工2期末考试A卷工答案1
- 安全教育零食大PK(课堂PPT)
- 译林版六下英语3-6四会词归类复习
- 协和医院老年综合评估表
- GB_T 15109-2021 白酒工业术语(高清-现行)
评论
0/150
提交评论