版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验五:聚类分析一.实验日的1.学会用spss进行聚类分析。2.了解层次聚类和K值聚类法的有缺点。二.实验要求利用2001年全国31个省市自治区各类小康和现代化指数的数据,对地区别作分层聚类和K-Means聚类分析。数据见:聚类分析数据(小康指数)。.实验内容方法一:层次聚类1.试验步骤:依次点击“分析”一一“分类”一一“系统聚类”如下图一所示,将“省市”放入标注个案中,将其余放入“变量”中。【图一】点击统计量,选中“合并进程表,相似性矩阵”如下图二所示:■析:统iw继续取消帮助W继续取消帮助Q相似性拒我)聚类成员 G无(10广单一解笞缶)TOC\o"1-5"\h\z聚类数窟: |—r解笞全距国)最小聚类数W): I最大聚类数co; |~【图二】点击“图”,设置相应操作,如下图三所示:【图三】点击“图”,设置相应操作,如下图三所示:【图三】选中“方法”,设置如下图四:
选中“方法”,设置如下图四:【图四】点击“确定”得到输出结果,如下表一:【表一】聚类案例处理汇总(a)案例有效缺失总计N百分比N百分比N百分比31100.00.031100.0aWard联结聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21262819.735001121244.62500173121381.11500642427117.710001051921160.355001861218206.332301371517284.397001381011368.2920015945452.2220021
102429545.8334012112630641.6451016122425764.93310020131215902.666672214691050.28600191510231202.14480261620261378.2270112317131574.21720291814191795.372052219672059.159140262022242336.9680122321482630.10590272212142961.9381318242320223467.6861620252412163980.051220282520314553.96423028266105196.11119152727467302.5312126292812209617.935242530291415114.2651727303011235858.78829280******HIERARCHICALCLUSTERANALYSIS******DendrogramusingWardMethodRescaledDistanceClusterCombineCASE 0510152025LabelNum+■ +- +-- +—— + +甘肃26也江西28,口贵州30,口青海20,口安徽24,口广西27,口河南29,。,,也云南25,口。宁夏22,口。西藏31,s。湖北12也。陕西13,口
口,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,也内蒙古18,口。◎山西15,口。◎重庆17,口。◎湖南19,口。◎四川21g,,,s◎河北14,口◎海南16,s◎北京1也◎上海2g,,,,,,,,,,g◎天津3,s 。◎浙江4也口,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,"广东5,。,,也 。福建8,s。 。黑龙江10也口,,,,,,,"吉林11,口。新疆23g,,,s江苏6,口山东9,口辽宁7,s试验结果分析:在聚类表中:第一列表示聚类分析的第几步,第二列第三列表示本步骤类中哪两个样本或小类聚成一类,第四列是个体距离或小类距离,第五列第六列表示本步骤类中参与聚类的是个体还是小类,0表示样本,非0表示由第几步骤生成的小类参与本布聚类,第七列表示本步骤类的结果将在以下第几步中用到。在第一步中,26号样品与28号样品聚成一小类,它们的个体距离是19.735,且它们都是样本,这个小类将在下面的第11步用到;在第11步中,30号样品与第一步聚成的小类(26和28)又聚成一个小类,它们的距离是641.645,形成的小类将在下面的第16步用到,群集1表示群集1是第一步类聚生成的小类。在树状图中可以看出,若想将其分为两类只需从10处向下划竖线,此时26、28、30、20、24、27、29、25、22、31、12、13、18、15、17、19、21、14、16是一类,1、2、3、4、5、8、10是一类,同理,若要化为3类只需从5出向下画竖线。
方法二:K值聚类法操作步骤:依次点击“分析”一一“分类”一一“K值聚类法”,“省市”加到“标注个案”中,其余加到“变量”中,将聚类数改为3,保存中全选中,如下图五所示:页IK均值橐美分析念崇例的类别耳国方法二:K值聚类法操作步骤:依次点击“分析”一一“分类”一一“K值聚类法”,“省市”加到“标注个案”中,其余加到“变量”中,将聚类数改为3,保存中全选中,如下图五所示:页IK均值橐美分析念崇例的类别耳国CL_
彩案例与其类别中心之变熨(V*令综合指数[xl]~-合社会结构[x2]寥经济与技术发展[& 「1去店「她1声注个案⑻: [反省市[明】S3礁定
粘贴(?)
重置四
取消
畚助聚类数QJ): 广专法瑚类中心. Ir读取初始值但)吏件叽」r写入最入值也g」 |少迭代与分类(T) 尸仅始类Q0迭代(!)...保存但农:选项⑴【图五】输出结果如下表二所示:【表二】快速聚类初始聚类中心1聚类23综合指数79.2092.3051.10社会结构90.4095.1061.90经济与技术发展86.9092.7031.50人口素质65.90112.0056.00生活质量86.5095.4041.00
|法制与治安 | 59.4057.5075.60|迭代历史记录(a)迭代聚类中心内的更改123124.3876.30723.5792.000.000.000a由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为.000。当前迭代为2。初始中心间的最小距离为49.349。最终聚类中心聚类123综合指数75.4991.1360.02社会结构82.8696.1766.86经济与技术发展72.4192.0344.03人口素质77.74106.1369.32生活质量75.8494.2751.81法制与治安67.1758.5776.15每个聚类中的案例数聚类17.00023.000321.000有效31.000缺失.000试验结果分析:“初始类中心点”展示了3个类的初始类中心点的情况,可见第二类是最优的,第一类次之,第三类最不理想。“迭代历史”中,展示了3个类中心点每次迭代的偏移情况,由表只,第一次迭代后,三个类的中心点分别偏移了24.387,6.307,23.579,第三类中心偏移最大,第二次迭代后,3个类的中心点的偏移均小于指定的判定标准(0.02)。“每个聚类中的案例数”表明,第一类有7个省市自治区,第二类有3个省市自治区,第三类有21个省市自治区。四、存在问题与解决情况聚类分析是研究“物以类聚”的一种科学有效的方法。做聚类分析时,出于不同的目的和要求,可以选择不同的统计量和聚类方法。系统聚类是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年期末幼儿园标题
- 2026年幼儿园橘子红了
- 监护仪日常维护与保养的质控标准
- 皮肤护理的发展趋势与预测
- 护理会诊的理论基础
- 云计算数据中心运维手册
- 艺术创作与表演管理手册
- 疼痛科常见并发症预防与护理
- 护理质量持续改进的PDCA循环实践探索
- 保险业务流程与服务规范手册
- 2026年网约车驾驶员从业资格试题及答案
- 国家义务教育质量监测四年级科学质量检测试题
- 湖南新高考教研联盟暨长郡二十校联盟2026届高三第二次联考英语试题+答案
- 物流运输风险识别与控制
- 关于杭州市“社交主题酒吧”运营模式与典型案例的调研分析
- 阿里巴巴集团内部审计制度
- 纺粘针刺非织造布制作工操作知识考核试卷含答案
- 2025年国防军事动员教育知识竞赛题库及答案(共50题)
- 泛光照明施工安全措施方案
- KPS评分表模板及使用指南
- 2025年专利代理师资格真题及答案解析
评论
0/150
提交评论