SPSS的综合运用——以我国城市空气质量分析为例.doc_第1页
SPSS的综合运用——以我国城市空气质量分析为例.doc_第2页
SPSS的综合运用——以我国城市空气质量分析为例.doc_第3页
SPSS的综合运用——以我国城市空气质量分析为例.doc_第4页
SPSS的综合运用——以我国城市空气质量分析为例.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

。SPSS的综合运用以我国城市空气质量分析为例 年欢管理科学与工程 2013200644(一)实验目的 近年来随着现代化和工业化的进程,我国大气污染状况十分严重,主要呈现煤烟型污染特征,城市大气环境中总悬浮颗粒浓度普遍超标、二氧化硫污染保持在较高水平、机动车尾气污染物排放总量迅速增加、氮氧化物污染趋势加重、全国形成多个酸雨区等,危害生态环境、影响人民群众身体健康。从污染物构成来看,我国大气污染来源主要有三个方面:一是生活污染源,包括饮食或取暖时燃料向大气排放有害气体和烟雾;二是工业污染源,包括火力发电、钢铁和有色金属冶炼,各种化学工业给大气造成的污染;三是交通污染源,包括汽车、飞机、火车、船舶等交通工具的煤烟、尾气排放。本文通过聚类分析和主成分分析法,研究我国主要城市的空气质量,以及各参数对空气质量好坏的影响以及最主要的影响因素。并据此提出科学合理的对策建议。(二)问题描述 在2013年之前,大部分人对于雾霾天气的认知都会自然而然觉得是北京的事。然而,12月伊始,我国遭受了入冬以来最大范围雾霾天气,今年12月伊始,我国中东部地区迎来了严重雾霾事件,几乎涉及中东部所有地区。天津、河北、山东、江苏、安徽、河南、浙江、上海等多地空气质量指数达到六级严重污染级别,使得京津冀与长三角雾霾连成片。由于能见度过低,导致多处高速公路封道关闭,给车辆出行带来了不便,也严重影响了市民的正常工作与生活。 (三)数据来源 通过查询“中华人民共和国国家统计局官方网站”的“国家统计数据库”,中国统计年鉴获得。(四)案例中使用的SPSS方法1. 描述性分析2. 相关分析3. 聚类分析4. 主成分分析(五)实验内容与步骤1. 城市空气质量因素的描述性统计本实验对城市空气质量的可吸入颗粒物、二氧化硫、二氧化氮、空气质量达到及好于二级的天数、年平均气温和年平均相对湿度六项影响空气质量的因素做描述性统计分析,包括频数、极小值、极大值、均值和标准差五个项目,见表1.1。 表1.1 描述统计量描述统计量N极小值极大值均值标准差可吸入颗粒物31.040.138.09121.021762二氧化硫31.008.079.03902.015930二氧化氮31.016.068.04005.011855空气质量达到及好于二级的天数31244365326.8127.463年平均气温315.223.313.8774.9856年平均相对湿度31348163.3511.047有效的 N (列表状态)31 从表1.1可以看出,在影响空气质量的因素中,可吸入颗粒物的最小值为0.04毫克/立方米,最大值为0.138毫克/立方米,平均值为0.9121毫克/立方米,标准差为0.21762;二氧化硫的最小值为0.08毫克/立方米,最大值为0.079毫克/立方米,平均值为0.03902毫克/立方米,标准差为0.01593;二氧化氮的最小值为0.016毫克/立方米,最大值为0.068毫克/立方米,平均值为0.04005毫克/立方米,标准差为0.011855;空气质量达到及好于二级的天数最小值为244天,最大值为365天,平均值为326.81天,标准差为27.463;年平均气温的最小值为5.2摄氏度,最大值为23.3摄氏度,平均值为13.877摄氏度,标准差为4.9856;年平均相对湿度最小值为34%,最大值为81%,平均值为63.35%,标准差为11.047。2.相关分析(1) 按照顺序:分析相关双变量打开相关分析的对话框(2) 在简单相关分析的主对话框中将所有变量选入“变量”中。在“显著性检验”框中,有“双侧检验”和“单侧检验”。系统默认是双侧检验。(3) 点击“OK”,输出结果见表2.1。 表2.1 Pearson相关系数相关性可吸入颗粒物二氧化硫二氧化氮空气质量达到及好于二级的天数年平均气温年平均相对湿度可吸入颗粒物Pearson 相关性1.560*.460*-.901*-.412*-.132显著性(双侧).001.009.000.021.480N313131313131二氧化硫Pearson 相关性.560*1.311-.468*-.448*-.232显著性(双侧).001.089.008.011.210N313131313131二氧化氮Pearson 相关性.460*.3111-.359*-.040.073显著性(双侧).009.089.047.831.696N313131313131空气质量达到及好于二级的天数Pearson 相关性-.901*-.468*-.359*1.412*.241显著性(双侧).000.008.047.021.192N313131313131年平均气温Pearson 相关性-.412*-.448*-.040.412*1.617*显著性(双侧).021.011.831.021.000N313131313131年平均相对湿度Pearson 相关性-.132-.232.073.241.617*1显著性(双侧).480.210.696.192.000N313131313131*. 在 .01 水平(双侧)上显著相关。*. 在 0.05 水平(双侧)上显著相关。 表2.1给出了Pearson相关系数,以一个矩阵的形式表现出来。从中可以看出,可吸入颗粒物、二氧化硫、二氧化氮空气质量达到好于二级的天数、年平均温度和年平均相对湿度的相关系数分别为0.901、0.56、0.46、0.468、0.617和0.617,在这些数据的右边都有两个星号,表示在0.01的显著性水平下,是显著相关的,还有一些相关系数带有一个星号表示在0.05的显著性水平下,相关系数是显著的。故得出空气质量达到及好于二级的天数和可吸入颗粒物、二氧化硫和二氧化氮在0.01置信度条件下呈高负相关,其中空气质量达到及好于二级的天数和可吸入颗粒物的相关性大雨二氧化硫和二氧化氮与空气质量达到及好于二级的天数的相关性;空气质量达到及好于二级的天数和年平均温度、年平均相对湿度在0.01置信度条件下呈高度正相关,其中年平均温度与空气质量达到及好于二级的天数相关性等于平均相对湿度与空气质量达到及好于二级的天数的相关性。3. 聚类分析 3.1.衡量指标 衡量指标的选取对于聚类分析来说至关重要,具有决定性的意义,影响空气质量好坏的因素有很多,有,温度,湿度等等,为此本文选取了四个指标,分别是可吸入颗粒物,二氧化硫,二氧化氮,空气质量达到及好于二级的天数。用以衡量我国主要的31个城市的空气质量,数据来源于中国统计年鉴2011年:3.2操作步骤(1) 选择分析分类系统聚类 打开系统聚类分析对话框。(2) 在主对话框中将用于聚类的所有变量选入“变量”,把区分样本的标签变量选入“标注个案”。(3) 单击“方法”按钮,展开分层聚类分析的方法选择对话框。(4) 点击“统计量”选中“合并进程表”。选择“方案范围”分别输入“2”和“4”,点击“继续”回到主对话框,此时分析结果中就包含了凝聚状态表。点击“绘制”选中“树状图”,点击“继续”回到主对话框,此时分析结果中就包括了冰柱图。(5) 点击“保存”,然后再弹出的对话框中点击“继续”,最后回到主对话框中点击“OK”。完成上述步骤后,会得到凝聚状态表(表3.1)和树状图(图3.2)。 表3.1 分成24类时各地区所属的类别群集成员群集成员案例4 群集3 群集2 群集案例4 群集3 群集2 群集1: 北 京 1118: 哈 尔滨 1112: 天 津 1119: 上 海 1113: 石 家 庄 11110: 南 京 1114: 太 原 11111: 杭 州 1115: 呼和浩特 11112: 合 肥 1116: 沈 阳 11113: 福 州 1117: 长 春 11114: 南 昌 11115: 济 南 11124: 贵 阳 11116: 郑 州 11125: 昆 明 11117: 武 汉 11126: 拉 萨 22118: 长 沙 11127: 西 安 11119: 广 州 11128: 兰 州 33220: 南 宁 11129: 西 宁 11121: 海 口 22130: 银 川 11122: 重 庆 11131: 乌鲁木齐 43223: 成 都 111H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 南 京 10 -+ 成 都 23 -+-+ 武 汉 17 -+ +-+ 杭 州 11 -+ +-+ 北 京 1 -+ | 呼和浩特 5 -+ | 南 昌 14 -+-+ | 贵 阳 24 -+ +-+ | 沈 阳 6 -+ | +-+ 重 庆 22 -+ +-+ | | 银 川 30 -+-+ | | | | 西 宁 29 -+ | | | | | 哈 尔 滨 8 -+ +-+ | | | 郑 州 16 -+-+ | +-+ | 石 家 庄 3 -+ | | | +-+ 济 南 15 -+ +-+ | | | 天 津 2 -+ | | | | 西 安 27 -+ | | | 太 原 4 -+ | | 福 州 13 -+-+ | | 南 宁 20 -+ +-+ +-+ 广 州 19 -+-+ | | | 昆 明 25 -+ +-+ | | 上 海 9 -+-+ | +-+ 长 沙 18 -+ | | | | 长 春 7 -+ | | | 合 肥 12 -+ | | 海 口 21 -+-+ | 拉 萨 26 -+ | 兰 州 28 -+-+ 乌鲁木齐 31 -+ 图3.2 树状图 从图3.2可以直观地观测整个聚类过程和结果。图中的第一行给出的是聚类方法“系统聚类分析”;第2行给出的是计算类间距离的方法是“Ward method”;第3行是类别合并的相对距离,它是把类别间的最大距离作为相对距离25,其余的距离都换算成与之相比的相对距离大小。 图3.2中左边一列是参加聚类的对象;第2列是地区的编号;图3.2中线的长短表示类别之间的相对距离远近。该图提供了131个类别的所有分类结果,想要分成几类可根据实际情况而定。本例分成四类比较合适,每一类别中包括的地区如表3.3所示。 表3.3 31个地区分成四类时的系统聚类结果 类别 地区 地区个数第一类南京,成都,武汉,杭州,北京 5第二类呼和浩特,南昌,贵阳,沈阳,重庆,银川,西宁,哈尔滨,郑州,石家庄,济南,天津,西安,太原 14第三类福州,南宁,广州,昆明,上海,长沙,长春,合肥 8第四类海口,拉萨,兰州,乌鲁木齐 4 从聚类分析谱系图可以看出,在不同的聚类标准下,聚类的结果不同:当距离为0时,每个样本为单独的一类,即31个城市各自为一类;当距离为25时,31个城市被归为一类;在这里我们将城市分成四类:第一类:南京,成都,武汉,杭州,北京;第二类:呼和浩特,南昌,贵阳,沈阳,重庆,银川,西宁,哈尔滨,郑州,石家庄,济南,天津,西安,太原;第三类:福州,南宁,广州,昆明,上海,长沙,长春,合肥;第四类:海口,拉萨,兰州,乌鲁木齐 4. 主成分分析4.1实验步骤(1) 按照顺序:分析降维因子分析 进入因子分析主对话框中,将左侧所有变量都选入“变量”中。(2) 单击“抽取”按钮,弹出“因子分析:抽取”对话框,选中“Scree plot”以显示碎石图。点击“Continue”按钮,返回到主对话框。此对话框中的默认选项表明此次主要成分分析是觊觎相关系数矩阵进行的,是按照特征根大于1的原则提取成分。(3) 点击“Scores”按钮,弹出对话框“因子得分”,选中“因子得分系数矩阵”点击“Continue”按钮,返回主对话框。(4) 点击主对话框中的“OK”,可以得出输出结果,见表4.14.5和图4.6。 表4.1Communalities(变量共同度)公因子方差初始提取可吸入颗粒物1.000.878二氧化硫1.000.721二氧化氮1.000.742空气质量达到及好于二级的天数1.000.782年平均气温1.000.799年平均相对湿度1.000.781提取方法:主成份分析。 表4.2Total Variance Explained(方差贡献表)解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 % 12.97449.57049.5702.97449.57049.5702.55642.60442.604 21.40723.44573.0151.40723.44573.0151.82530.41173.015 3.63910.65383.668 4.5739.55393.221 5.3305.49798.718 6.0771.282100.000提取方法:主成份分析。 表4.3 Component Matrix(因子载荷矩阵)成份12可吸入颗粒物.888.300二氧化硫.739.022二氧化氮.478.604空气质量达到及好于二级的天数-.864-.189年平均气温-.683.577年平均相对湿度-.447.763提取方法 :主成分分析法。a. 已提取了 2 个成份。 表4.4 Component Score Coefficient Matrix(主成分得分系数矩阵)旋转成份矩阵a成份12可吸入颗粒物.915-.201二氧化硫.644-.363二氧化氮.721.271空气质量达到及好于二级的天数-.838.284年平均气温-.286.847年平均相对湿度.011.884提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 3 次迭代后收敛。 表4.5 Component Score Covariance Matrix(主成分得分系数矩阵)成份转换矩阵 成份12 1.856-.516 2.516.856提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 图4.6 碎石图 表4.7成分矩阵成份影响因素12可吸入颗粒物.888.300二氧化硫.739.022二氧化氮.478.604空气质量达到及好于二级的天数-.864-.189年平均气温-.683.577年平均相对湿度-.447.763提取方法 :主成分分析法。a. 已提取了 2 个成份。4.2结果分析(1) 表2.1中的相关系数表明六个变量之间存在显著相关性,可以进行主成分分析。(2) 表4.1为变量共同度,表中最后一列的数据都大于0.720,表明提取的主成分对每个变量的解释程度都较高。(3) 表4.2为方差贡献率,“合计”是特征根,“方差的%”是每个特征根对应的方差贡献,“累计%”是累计方差贡献;“初始特征值”列出了所有的主成分,并按照特征根的大小排列,而“提取平方和载入”对应的是提取主要成分后的各项指标。可以看出两个主成分,因为有两个特征根大于1.由表4.2可以看出,第一主成分的特征根为2.974,方差贡献率为49.570%,第二个主成分的特征根为1.407%,方差贡献率为23.445%,两个主成分的累计方差贡献率达到73.015%,即两个主成分共解释了总变异的73.015%,进一步说明提取两个主成分是比较合适。(4) 图4.6为碎石图,实际上是按特征根大小排列的主成分折线图。横坐标表示第几主成分,纵坐标表示特征根的值,本例在第三个特征根处变得比较平缓,表明可以提取两个主成分。(5) 表4.4为主成分得分系数矩阵,根据该矩阵,可以写出以标准化的原始变量表示的主成分的表达式。若记标准化的原始变量为zx1、zx2、zx3、zx4,两主成分记为f1、f2,则表达式为: f1=0.915zx

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论