下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用多元统计分析报告班级:学号:姓名:聚类分析的案例分析摘要本文主要用SPS欹件对实验数据运用系统聚类法和 K均值聚类法进行聚类分析,从而 实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的气体浓度的情况,从而判断出这几个地区的污染程度。经过聚类分析可以得到,样本6 这一地区的气体浓度值最高,污染程度是最严重的,样本 3 和样本 4 气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。关键词:SPSSB件聚类分析学生成绩一、数学模型聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相似性。 可以根据这些相似性把相似程度较高的归为一类, 从而对其总体进行分析
2、和总结,判断其之间的差距。系统聚类法的基本思想是在这几个样本之间定义其之间的距离, 在多个变量之间定义其相似系数, 距离或者相似系数代表着样本或者变量之间的相似程度。 根据相似程度的不同大小, 将样本进行归类, 将关系较为密切的归为一类, 关系较为疏远的后归为一类, 用不同的方法将所有的样本都聚到合适的类中, 这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。K 均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。二、数据来源应用多元统计分析第一版164 页第 6 题我国山区有一某大型化工厂, 在该厂区的邻近地区中挑选其中最具有代表性的8 个大气取样点
3、,在固定的时间点每日 4 次抽取 6 种大气样本,测定其中包含的8 个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及大气污染气体进行分类。三、建立数学模型一、 运行过程(一)系统聚类分析在SPS鼾面对上述数据进行系统聚类分析如图1和图2所示,进行最近距离分类。(二)K均值聚类分析对数据进行K均值聚类分析,如下图所示:图3图4图5二、运行结果(一)聚类树形图图6由图可以看出,将数据进行聚类分析,根据设定的分为了二类到三类。 若分为 两类则样本6为一类,其他为一类;若分为三类则将样本四分离出来, 其他分为 一类。(二)新变量图7该图显示将分类结果的新变量,分别为 CLU3侪口
4、CLU2_1可以清楚的看到将 数据聚为2类和3类的分类情况。(三)新变量迭代过程中类中心的变化量迭代历史记录a迭代聚类中心内的更改12341.049.042.000.0742.000.000.000.000a.由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为.000。当前迭代为2。初始中心间的最小距离为.230 。从表中可以看出本次聚类过程共进行了两次迭代。由于我们在Iterate 子对话框中设置最大迭代次数为10和收敛判据为0,所以在第二次迭代后,类中心的变化为0,从而迭代停止。(四)各观测量所属类成员表聚类成员案例号聚类距离11.04921.07134.07444.
5、07452.04263.00072.04281.060图9(五)最终类中心表最终聚类中心聚类1234X1.0580.0660.0640.0360X2.0753.0775.0720.1125X3.0527.0455.1000.0685X4.0660.2900.2100.1650X5.0397.0250.0280.1290X6.0168.0385.0360图10根据结果(五)和结果(六)可以看出,将8个样本聚为了 4类。第一类包括样 本1、样本2和样本8,根据图1中聚类1这一列可以看出,这一类为这四类中气体 浓度值最低的一类,也就是说该类的环境污染不严重,属于优;第二类包括样本 5和样本7,该类气体浓度也是比较低的一类,环境污染有些严重,属于良;第三 类包括样本6,这一气体浓度最高,环境污染最严重,属于差;第四类包括样本 3 和样本4,环境污染较严重,属于中。(六)新变量如图所示,QCL_1为分类情况,而QCL_2所属类中心距离。四、结论通过在SPS欹件中对聚类分析案例的运用将不同的样本聚为不同的类,并算 出其间的距离更加清楚方便的将多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年哈尔滨电力职业技术学院单招职业倾向性考试题库及参考答案详解一套
- 2026年四川希望汽车职业学院单招职业技能测试题库附答案详解(巩固)
- 2026年四川信息职业技术学院单招职业适应性测试题库含答案详解(考试直接用)
- 2026年四川托普信息技术职业学院单招综合素质考试题库附参考答案详解(满分必刷)
- 2026年唐山职业技术学院单招职业倾向性考试题库附答案详解(精练)
- 2026年四川工商职业技术学院单招职业技能测试题库附参考答案详解(夺分金卷)
- 2026年哈尔滨职业技术学院单招职业倾向性测试题库附答案详解(基础题)
- 2026年吉林职业技术学院单招职业倾向性测试题库带答案详解(研优卷)
- 2026年吉林水利电力职业学院单招职业适应性考试题库含答案详解(a卷)
- 高效能核保专员的工作方法与技巧
- 品质意识活动方案
- 广东高职单招测试题及答案
- 2025年《植物造景》课程标准(含课程思政元素)
- 四川通达化工有限责任公司峨边分公司地块土壤污染状况初步调查报告
- 暑假支教安全教育
- 数字化文化资源库的构建与管理-全面剖析
- 慢阻肺护理新进展
- 《数字化转型对某公司效绩的影响》开题报告(含提纲)3200字
- 2024-2025学年湖南省长沙市雅礼教育集团八年级(上)期末物理试卷含解析
- 护士培训便携式吸痰器操作流程
- 攻读博士学位期间材料科学研究计划参考范文
评论
0/150
提交评论