版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
新编21世纪心理学系列教材高级心理统计(第2版)刘红云
编著第六章聚类分析核心要点掌握聚类分析的基本概念,熟悉聚类分析的应用场景。了解层次聚类法和非层次聚类法的概念,并掌握它们的计算步骤。知道如何对聚类分析的结果进行解释。了解聚类分析与因素分析、回归分析的区别与联系。提纲1一般目的和描述2主要回答的问题3模型及原理4聚类分析的主要类型5值得注意的问题6应用案例及SPSS操作1.一般目的和描述聚类分析是将所观测的事物或观测事物的指标进行分类的一种统计分析方法,它的目的是辨认在某些特征上相似的事物,并将这些事物按照这些特征划分为几个类,使得同一类中的事物具有较高的同质性,不同类中的事物具有较大的异质性。聚类分析的对象有两个方面,一个方面是对样品也即个案或被试聚类(称Q型聚类),另一个方面是对指标也即变量进行聚类(称R型聚类)。2.主要回答的问题如何测量变之间的相似性或个体之间的距离如何将相似的事物或变量聚为一类如何描述和解释所聚成的各类3.模型及原理距离每个样品(案例)有p个指标(变量),故每个样品可以看成p维空间中的一个点,n个样品组成p维空间中的n个点,用距离来度量样品之间接近的程度。距离测度应满足下列四个条件:1)dij
0;2)dij=dji,即距离具有对称性;3)dijdik+dkj,即三角不等式,任意一边小于其他两边之和;4)如果dij0,则ij3.模型及原理距离3.模型及原理相似系数3.模型及原理相似系数选择原则要考虑所选择的距离/相似系数公式在实际应用中有明确的意义。要综合考虑对样本观测数据的预处理和将要采用聚类分析方法。要考虑研究对象的特点及计算量的大小。3.模型及原理变量的标准化中心化变换变量的标准化标准化变换中心化变换变量的标准化极差正规化变换中心化变换变量的标准化对数变换中心化变换4.聚类分析的主要类型根据聚类分析的对象划分样品聚类(称Q型聚类)指标聚类(称R型聚类)根据聚类分析的原理划分层次聚类法(HierarchicalCluster)非层次聚类法(NonhierarchicalCluster)或K平均数法(K—meansmethods)4.1层次聚类1、聚集法:首先把每个案例各自看成一类,先把距离最近的两类合并,然后重新计算类与类之间的距离,再把距离最近的两类合并,每一步减少一类,这个过程一直持续到所有案例归为一类为止。2、分解法:与聚集法相反,首先把所有的案例看成一类,然后把最不相似的案例分为两类,每一步增加一类,直到每个案例都成为一类为止。4.1层次聚类(1)最短距离法(SingleLinkage)类与类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者。(2)最长距离法(CompleteLinkage)与最短距离法相反,类与类之间的距离定义为两类中离得最远的两个案例之间的距离。4.1层次聚类(3)中间距离法4.1层次聚类(4)重心法4.1层次聚类(5)类平均法4.1层次聚类(6)可变类平均法4.1层次聚类(7)可变法4.1层次聚类(7)离差平方和法4.2非层次聚类K平均数法的计算步骤如下:(1)指定要形成的聚类个数,对样本点进行初始分类并计算每一个初始分类的重心;(2)调整分类,计算每个样本点到各类重心的距离,把每个样本点归到距离重心最近的那个类;(3)重新计算每个类的重心;(4)重复第(2)和第(3)步,直到没有样本点可以再调整为止5.值得注意的问题5.1分类数目的确定和结果解释类间差异与类内差异相比,类间差异显著大于类内差异所分出的各类有明确的含义;若选用不同的方法进行聚类,应该得到较多相同的类;确定的类中,每类所包含的元素的个数不应太多。5.值得注意的问题5.2聚类分析与其他多元分析方法的联系聚类分析与因素分析研究使用的目的不同,因素分析是从众多的测量指标中寻求潜在变量,即决定诸多指标之间存在相关的潜变量因素是什么,而聚类分析,只寻求指标是有哪些不同的类别。假设不同,不管哪种因素分析模型,都假设原有的观测指标可以用新的因素取代,而聚类只是寻求其中一个有代表性的指标代替原来的众多指标。计算方法不同,求解因素的方法与聚类的计算思路与方法有很大差异。5.值得注意的问题5.2聚类分析与其他多元分析方法的联系聚类分析与回归分析回归分析是从诸多自变量(因)中寻求与因变量(果)之间变量关系的统计分析的方法。联系,当回归分析中进入的自变量太多时,为了减少自变量的数目,简化回归计算,可以先用聚类分析,从各指标类别中选取有代表性的指标,用这些少数有代表性的指标进行回归分析,可大大减少自变量的数目,简化回归分析中的的计算,特别是当自变量很多的情况下,此种方法的优点就显现出来了。6.案例及SPSS操作一、应用案例及SPSS操作1.层次聚类
详见课本P128-1332.K-平均值聚类详见课本P133-136关键术语聚类分析层次聚类法非层次聚类法K平均数法内容小结聚类分析是将所观测的事物或观测事物的指标进行分类的一种统计分析方法,它的目的是辨认在某些特征上相似的事物,并将这些事物按照这些特征划分为几类,使得同一类中的事物具有较高的同质性,不同类中的事物具有较大的异质性。根据聚类分析的对象,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 土石方基底清理施工方案
- 企业工艺优化改进方案
- 建筑装饰木作施工方案
- 建筑幕墙BIM协同方案
- 建筑安防系统安装调试方案
- 公司结算阶段审核方案
- 钢结构防火检测验收方案
- 道路交通挡土墙施工方案
- 2026年高校知识产权案例
- 充电桩用户反馈及意见收集方案
- 2026年宁波余姚市泗门镇人民政府公开招聘编外工作人员7人笔试参考试题及答案解析
- (2026年)检验检测机构资质认定“一单一库”的学习与解读(2026年实施)课件
- 24J113-1 内隔墙-轻质条板(一)
- 2024低压电力线高速载波通信互联互通技术规范第 4-3 部分:应用层通信协议
- 2024年贵州省中考理科综合试卷(含答案解析)
- 唐诗宋词人文解读智慧树知到期末考试答案章节答案2024年上海交通大学
- 完美着装智慧树知到期末考试答案章节答案2024年武汉纺织大学
- MOOC 地学景观探秘·审美·文化-重庆大学 中国大学慕课答案
- 第4章-动车组列车餐饮服务操作技能《高速铁路列车餐饮服务》
- 关于领导干部报告个人有关事项的规定全文
- 新版FMEA(AIAG-VDA)完整版PPT可编辑FMEA课件
评论
0/150
提交评论