![聚类分析的案例分析_第1页](http://file1.renrendoc.com/fileroot_temp2/2020-8/7/0e8f90a2-bc40-4981-a1a3-e5d26515a7a5/0e8f90a2-bc40-4981-a1a3-e5d26515a7a51.gif)
![聚类分析的案例分析_第2页](http://file1.renrendoc.com/fileroot_temp2/2020-8/7/0e8f90a2-bc40-4981-a1a3-e5d26515a7a5/0e8f90a2-bc40-4981-a1a3-e5d26515a7a52.gif)
![聚类分析的案例分析_第3页](http://file1.renrendoc.com/fileroot_temp2/2020-8/7/0e8f90a2-bc40-4981-a1a3-e5d26515a7a5/0e8f90a2-bc40-4981-a1a3-e5d26515a7a53.gif)
![聚类分析的案例分析_第4页](http://file1.renrendoc.com/fileroot_temp2/2020-8/7/0e8f90a2-bc40-4981-a1a3-e5d26515a7a5/0e8f90a2-bc40-4981-a1a3-e5d26515a7a54.gif)
![聚类分析的案例分析_第5页](http://file1.renrendoc.com/fileroot_temp2/2020-8/7/0e8f90a2-bc40-4981-a1a3-e5d26515a7a5/0e8f90a2-bc40-4981-a1a3-e5d26515a7a55.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用多元统计分析报告班级: 学号: 姓名:指导教师:聚类分析的案例分析摘要 本文主要用SPSS软件对实验数据运用系统聚类法和K均值聚类法进行聚类分析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的气体浓度的情况,从而判断出这几个地区的污染程度。 经过聚类分析可以得到,样本6这一地区的气体浓度值最高,污染程度是最严重的,样本3和样本4气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。关键词:SPSS软件 聚类分析 学生成绩1、 数学模型 聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相似性。可以根据这些相似性把相似程度较高的归为一类,从而对其总
2、体进行分析和总结,判断其之间的差距。 系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。 K均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。 2、 数据来源 应用多元统计分析第一版164页第6题 我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的8个大气取样点,在固
3、定的时间点每日4次抽取6种大气样本,测定其中包含的8个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及大气污染气体进行分类。3、 建立数学模型1、 运行过程(一)系统聚类分析 在SPSS界面对上述数据进行系统聚类分析如图1和图2所示,进行最近距离分类。图1图2(二)K均值聚类分析 对数据进行K均值聚类分析,如下图所示:图3图4图52、 运行结果(1) 聚类树形图图6 由图可以看出,将数据进行聚类分析,根据设定的分为了二类到三类。若分为两类则样本6为一类,其他为一类;若分为三类则将样本四分离出来,其他分为一类。(2) 新变量图7 该图显示将分类结果的新变量,分别为CLU3_1和
4、CLU2_1。可以清楚的看到将数据聚为2类和3类的分类情况。(3) 新变量迭代过程中类中心的变化量迭代历史记录a迭代聚类中心内的更改12341.049.042.000.0742.000.000.000.000a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 .230。图8 从表中可以看出本次聚类过程共进行了两次迭代。由于我们在Iterate子对话框中设置最大迭代次数为10和收敛判据为0,所以在第二次迭代后,类中心的变化为0,从而迭代停止。(4) 各观测量所属类成员表聚类成员案例号聚类距离11.04921.07134
5、.07444.07452.04263.00072.04281.060图9(5) 最终类中心表最终聚类中心聚类1234X1.0580.0660.0640.0360X2.0753.0775.0720.1125X3.0527.0455.1000.0685X4.0660.2900.2100.1650X5.0397.0250.0280.1290X6.0168.03851.3800.0360图10 根据结果(五)和结果(六)可以看出,将8个样本聚为了4类。第一类包括样本1、样本2和样本8,根据图1中聚类1这一列可以看出,这一类为这四类中气体浓度值最低的一类,也就是说该类的环境污染不严重,属于优;第二类包括样本5和样本7,该类气体浓度也是比较低的一类,环境污染有些严重,属于良;第三类包括样本6,这一气体浓度最高,环境污染最严重,属于差;第四类包括样本3和样本4,环境污染较严重,属于中。(6) 新变量 如图所示,QCL_1为分类情况,而QCL_2为所属类中心距离。4、 结论 通过在SPSS软件中对聚类分析案例的运用将不同的样本聚为不同的类,并算出其间的距离更加清楚方便的将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学美术活动方案(34篇)
- Unit4 lesson 23 Shopping Online(教案)2023-2024学年英语四年级上册-冀教版(三起)
- GBT 19018-2017 质量管理 顾客满意企业消费者电子商务交易指南
- 数学高一第二学期教学计划(10篇)
- 唐山大地震观后感范文(9篇)
- 车间核算员工作总结
- 与球有关的切、接问题讲义-2025届高三数学一轮复习
- 电子产品租借合同
- 2024山东省德州市高三下学期三模历史试题及答案
- 2024浙江省县域教研联盟高三下学期模拟考语文试题及答案
- 数据库课程设计之SQLServer图书馆管理系统
- 2024劳动合同模板下载
- 2024年钢质防火门规范5篇
- 2023-2024学年北师大版数学八年级下册期末模拟试卷二
- H -G-T 6238-2023 硫酸镍钴锰 (正式版)
- 基于STM32的驾驶行为监测系统研究与设计
- 汽车智能座舱交互体验测试评价规程
- 项目亏损整治方案
- 新疆生产建设兵团地区部分学校2024年中考模拟考试数学模拟试卷(含答案)
- 奥鹏作业-中国医科大学2024年7月(附答案)《形势与政策》作业考核试题
- 糖尿病患者血脂管理中国专家共识(2024版)
评论
0/150
提交评论