




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2012江苏省各地区环境卫生状况分析应数1101 王松 2007110122摘要本文主要研究的是2012年江苏省各地区的环境卫生问题,利用多元统计知识,分别对这13个地区进行了归类。首先,我们进行了聚类分析,画出了类平均法的谱系聚类图,得到了较为合适的分类,并通过计算各类的平均值发现:苏州和南京属于环境卫生高管理水平地区,无锡属于环境卫生中等管理水平地区,其余地区属于环境卫生低管理水平地区。然后,我们又进行了因子分析,得到了两个公共因子Factor1(生活垃圾处理效率因子)、Factor2(粪便处理效率因子),并计算出了它们的得分,然后根据这两个因子的得分构建得分函数Y=4.2032019*Factor1+2.3208286*Factor2进行了综合评价地区泰州盐城宿迁镇江连云港淮安扬州南通徐州常州无锡南京苏州得分-3.7719-3.4336-3.3816-3.0245-2.3966-2.3521-1.9879-1.5096-1.4708-0.42544.10699.424110.2228最后根据评价得分对其进行分类,得到:苏州和南京属于环境卫生高管理水平地区,无锡属于环境卫生中等管理水平地区,其余地区属于环境卫生低管理水平地区。这与聚类分析的结果一致。关键词:类平均法 聚类分析 因子分析 综合评价1、 问题描述 自改革开放以来,我国的经济发展越来越快,人民的生活管理水平也日益提高,但伴随而来的环境问题却愈加严重。所以环境卫生的管理变得尤为重要。下面请根据的数据,对江苏省各地区的管理水平进行估计。2、 分析方法2.1 聚类分析聚类分析又称群分析,它的功能是建立一种分类方法,将一批样品或变量按照它们在性质上的亲疏、相似程度进行分类。聚类分析的内容十分丰富,按其聚类的方法可分为:系统聚类法、调优法(动态聚类法)、最优分割法、模糊聚类法、图论聚类法、聚类预报法。本文主要运用的是系统聚类法,它的主要思想是:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度(本文采用的是类平均法)。这一过程一直继续直到所有对象都归为一类为止。下面我们利用SAS软件对的数据进行聚类分析,得到谱系聚类图:使用类平均法的谱系聚类图根据谱系聚类图,我们可以看出分为三类比较合适:=南京、苏州,=无锡,=徐州、扬州、常州、连云港、淮安、盐城、镇江、宿迁、泰州、南通。分别计算各类地区的环境卫生的平均值,我们得到:13个地区的分类及环境卫生状况平均值类别第一类第二类第三类该类所包含地区南京、苏州无锡徐州、扬州、常州、连云港、淮安、盐城、镇江、宿迁、泰州、南通平均清扫面积生活垃圾平均清运量粪便平均清运量无害化处理厂平均日处理量垃圾粪便平均年处理量环卫机械平均辆数公共厕所平均个数8028.5203.7257.5656550210.831622.5979.548351099.62875110.584016861710.335.7421.692148136.201221.7397.3由此可见,第一类属于环境卫生高管理水平,第二类属于环境卫生中等管理水平,第三类属于环境卫生低管理水平。2.2因子分析因子分析(Factor analysis)就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。 因子分析特点: (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。(2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 因子分析主要包括以下几个步骤:确定待分析的原有若干变量是否适合进行因子分析、因子提取、因子变量的命名解释、计算因子变量得分。下面我们利用SAS软件对的数据进行因子分析。 是否适合进行因子分析判断因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程。其潜在的要求:原有变量之间要具有比较强的相关性。因此,因子分析需要先进行相关分析,计算原始变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验时,大部分相关系数均小于0.3且未通过检验,则这些原始变量就不太适合进行因子分析。SAS运行结果:各变量的相关系数矩阵由变量间相关系数都超过0.3,所以本问题,即2012年江苏省各地区环境卫生情况适合因子分析。 提取公共因子对于公共因子的提取,我们采用的是主风量法。SAS运行结果:相关阵的特征值、累计贡献率及因子载荷矩阵由特征值的累计贡献率可知,前2个特征值的累计贡献率为0.93200.9,所以,最后选择了2个公共因子,包含2个公共因子的因子分析模型为:X1=0.98469Factor1-0.11313Factor2+X2=0.98385Factor1-0.01855Factor2+X3=0.70639Factor1+0.63654Factor2+X4=0.93375Factor1-0.32531Factor2+X5=0.98705Factor1-0.05521Factor2+X6=0.91352Factor1-0.32839Factor2+X7=0.75624Factor1+0.44716Factor2+由于X3(粪便清运量)和X7(公共厕所)在Factor2上的载荷比较大,所以可以将Factor2解释为粪便处理效率因子。但是对于Factor1,各变量的载荷都比较大,所以含义比较模糊,不好进行解释。所以下面需考虑进行因子旋转。 因子旋转和因子命名解释由于第1个公共因子含义不清,所以对因子载荷矩阵进行方差最大的正交旋转。方差最大正交旋转(varimax orthogonal rotation)的基本思想是:使公共因子的相对负荷的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。SAS运行结果:方差最大正交旋转矩阵及旋转后的因子载荷矩阵因子模型为:X1=0.88284Factor1+0.45056Factor2+X2=0.82981Factor1+0.52888Factor2+X3=0.23624Factor1+0.92106Factor2+X4=0.95774Factor1+0.24571Factor2+X5=0.85276Factor1+0.50012Factor2+X6=0.94265Factor1+0.23187Factor2+X7=0.38255Factor1+0.79088Factor2+ 从旋转后的因子载荷可以看出,X1(清扫面积),X2(生活垃圾清运量),X4(无害化处理厂日处理能力),X5(垃圾粪便年处理量),X6(环卫机械)五个变量在公共因子Factor1上的载荷比较大,所以Factor1可以解释为生活垃圾处理效率因子,X3(粪便清运量)和X5(公共厕所)在公因子Factor2上的载荷比较大,所以Factor2可以解释为粪便处理效率因子。 计算因子变量得分因子变量确定以后,对于每一个样本数据,我们希望得到它们在不同因子上的具体数据值,即因子得分。估计因子得分的方法主要有:回归法、Bartlette法等。计算因子得分应首先将因子变量表示为原始变量的线性组合。即:回归法,即Thomson法:得分是由贝叶斯Bayes思想导出的,得到的因子得分是有偏的,但计算结果误差较小。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。Bartlett法:Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。对于因子变量得分的计算,本文采用的的是回归法。SAS运行结果:标准化的因子得分系数因子得分函数:Factor1=0.21915*X1+0.15635*X2-0.31838*X3+0.35222*X4+0.18111*X5+0.35137*X6-0.18558*X7Factor2=-0.01711*X1+0.07718*X2+0.70377*X3-0.23365*X4+0.04091*X5-0.23880*X6+0.51967*X7标准因子得分 综合评价可以根据因子得分构建得分函数进行综合评价:Y=4.2032019*Factor1+2.3208286*Factor2因子前的权数选择每个因子所解释的方差。分别代入每个地区环境卫生的标准因子得分即可得到每个地区环境卫生的综合得分值。SAS运行结果:综合得分从上图可以看出,苏州和南京的综合得分较高,说明这两个地区的环境卫生状况非常好;无锡的综合得分为4.1069,说明该地区的环境卫生状况较好;其余地区得分较低,均为负值,说明这些地区的环境卫生状况较差。根据以上情况,我们可以将这13个地区大致分为三大类,第一类为环境卫生高管理水平地区(苏州和南京),第二类为环境卫生中等管理水平地区(无锡),第三类为环境卫生低管理水平地区(常州、徐州、南通、扬州、淮安、连云港、镇江、宿迁、盐城、泰州)。三、建议根据以上分析的结果,我们提出以下几点建议:1.常州、徐州、南通、扬州、淮安、连云港、镇江、宿迁、盐城、泰州这些地区应该加大管理力度,争取把环境卫生做到最好。2.无锡地区管理的力度还不够,应该继续加强。附录一:数据来源:江苏统计年鉴2012附录二:SAS程序:1、聚类分析goptions ftext=宋体;data a;input area $ x1-x7;cards;南京740922512.15800224.511261166无锡48351099.62875110.58401686徐州1609520.0220051.6372488常州2543580.6296058.7276796苏州86481833.07300197.12119793南通2647537.291055.8294197连云港 1795243.2140027.2254481淮安2142402.1110031.2207446盐城1450230.7122023.349225扬州1572430.0211047.5196474镇江1372260.9113026.5235313泰州915191.268020.6119263宿迁1058190.9110019.5215290;proc cluster data=a method=ave std pseudo rsq outtree=b;var x1-x7;id area;run;goptions lsize=4 hsize=8;/*控制输出聚类图的大小*/proc tree data=b horizontal graphics n=3 out=c;copy area x1-x7; title 使用类平均法的谱系聚类图;run; 2、 因子分析goptions ftext=宋体;data a;input area $ x1-x7;cards;南京740922512.15800224.511261166无锡48351099.62875110.58401686徐州1609520.0220051.6372488常州2543580.6296058.7276796苏州86481833.07300197.12119793南通2647537.291055.8294197连云港 1795243.2140027.2254481淮安2142402.1110031.2207446盐城1450230.7122023.349225扬州1572430.0211047.5196474镇江1372260.9113026.5235313泰州915191.268020.6119263宿迁1058190.9110019.5215290;proc factor data=a corr msa method=principal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纪委监委应急知识培训课件
- 去年江苏省中考数学试卷
- 约翰施特劳斯进行曲课件
- 2024年福建中烟真题试卷及答案
- 七十分数学试卷
- 宁波十五中三模数学试卷
- 乾县九年级期末数学试卷
- 红酒课件教学课件
- 宁河区学业测试数学试卷
- 湛江市徐闻县县直医疗卫生单位招聘考试真题2024
- 公务车驾驶员安全课件
- 医院护工礼仪培训
- 地铁安检培训课件
- 2025年豪华别墅室内外装饰设计及施工一体化服务合同
- 废铅酸蓄电池回收处置项目可行性研究报告
- 农村处理矛盾纠纷课件
- 2025年重庆对外建设有限公司招聘考试笔试试题
- 2025年阿克苏社区专职工作人员招聘真题
- 2025年生猪屠宰检疫竞赛题库
- 2025年汽车驾驶员(技师)考试试题附答案
- 矿山基金管理办法
评论
0/150
提交评论