数理统计判别分析作业.doc_第1页
数理统计判别分析作业.doc_第2页
数理统计判别分析作业.doc_第3页
数理统计判别分析作业.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

判别分析大气环境质量评价是环境质量评价的一项重要内容。对空气环境质量的充分认识对我国社会的可持续发展具有现实的指导意义。在多元统计分析中,常常使用聚类分析和判别分析来解决样本的分类问题。在事先不知道应将样品或指标分为几类、怎么分类的情况下,可以使用聚类分析根据样本或指标的相似程度,将样本或指标归组分类。聚类分析的基本思想是:在样品之间定义距离,在变量之间定义相似系数,距离或相似系数代表样品或者变量之间的相似程度。按相似程度的大小,将样品逐一归类,关系密切的类聚集到一个小的分类单位,然后逐步扩大,使得关系疏远的聚合到一个大的分类单位,直到所有的样品都聚集完毕,形成一个表示亲疏关系的谱系图,依次按照某些要求对样品进行分类。一般地,根据分类对象的不同,聚类分析可以分为Q型和R型两大类。Q型聚类分析是对样本进行分类处理,R型聚类分析是对变量进行分类处理。判别分析也是一种数据的分析方法。在事先已经建立了样品分类,需要将新样本归入到已知分类的样本组中时,就可以使用判别分析。本文以4种空气质量指标为变量,采用系统聚类分析Ward方法(离差平方和法),对我国31个主要城市的空气质量类型进行了聚类。并在此基础上,对这些城市的空气质量归属进行了回报判别。从结果来看,比较圆满地完成了预定目标。 本文选取了全国31个城市的2007年的四项空气质量指标作为对空气质量类型划分的依据,具体见表1。表1主要城市空气质量指标(2007年)城市可吸入颗粒物(毫克/立方米)二氧化硫(毫克/立方米)二氧化氮(毫克/立方米)空气质量达到二级以上的天数(天)北京0.1480.0470.066246天津0.0940.0620.043320石家庄0.1280.0430.035289太原0.1240.0760.027269呼和浩特0.0840.0660.048331沈阳0.1190.0540.036323长春0.0990.0300.038340哈尔滨0.1020.0480.060308上海0.0880.0550.054328南京0.1070.0580.051312杭州0.1070.0600.057308合肥0.1160.0230.026300福州0.0650.0270.055361南昌0.0830.0540.034348济南0.1180.0560.023311郑州0.1050.0690.045313武汉0.1230.0610.055276长沙0.1040.0650.041302广州0.0770.0510.065333南宁0.0640.0590.048352海口0.0430.0090.012365重庆0.1080.0650.044289成都0.1110.0620.049319贵阳0.0850.0550.023346昆明0.0750.0680.042365拉萨0.0570.0070.025358西安0.1350.0530.043294兰州0.1290.0600.042271西宁0.1150.0280.035296银川0.0920.0490.025317乌鲁木齐0.1360.0880.067252通过SPSS使用离差平和方法(Ward方法),计算样本的欧氏距离,样本变量按照Z得分进行标准化处理。聚类结果将31个城市分成四种空气质量类型。聚类分析得到的聚类分析图谱如图1所示。图 1聚类分析结果树状图Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 南京 10 -+ 成都 23 -+ 杭州 11 -+-+ 哈尔滨 8 -+ +-+ 长沙 18 -+ | | 重庆 22 -+-+ | 天津 2 -+ | 郑州 16 -+ +-+ 西安 27 -+ | | 兰州 28 -+ | | 石家庄 3 -+-+ | | 武汉 17 -+ +-+ +-+ 沈阳 6 -+-+ | | 济南 15 -+ | | | 太原 4 -+ | | 北京 1 -+-+ | 乌鲁木齐 31 -+ | 海口 21 -+-+ | 拉萨 26 -+ | | 南宁 20 -+-+ | | 昆明 25 -+ | +-+ 呼和浩特 5 -+ | | 上海 9 -+-+-+ | 广州 19 -+ | | | 福州 13 -+ +-+ 南昌 14 -+ | 贵阳 24 -+-+ | 银川 30 -+ +-+ 合肥 12 -+ | 西宁 29 -+-+ 长春 7 -+表 2类型城市第一类北京、天津、石家庄、太原、沈阳、哈尔滨、南京、杭州、济南、郑州、武汉、长沙、重庆、成都、西安、兰州、乌鲁木齐第二类呼和浩特、上海、福州、广州、南宁、昆明第三类长春、合肥、南昌、贵阳、西宁、银川第四类海口、拉萨 按照表2聚类分析的分类结果,可以将我国31个城市的空气质量类型分为四类:优、良、污染和轻微污染。第二类型的城市属于轻微污染型,这些城市的工业类型多以轻工业为主,对大气环境的污染较轻。第三类型的城市空气质量良好。第四类型的城市空气质量优,尤其是拉萨,作为我国独具特色的一个旅游城市,在发展经济的同时,特别需要将环境保护的重要性提上日程,不可再走先污染后治理的道路。总的来说,结合这些城市的工业等的发展状况,该聚类结果还是比较符合实际的。下面对这些城市的空气质量归属进行了回报判别,判别分析采用逐步选择判别分析Fisher判别法。本文采用WilkLambda(每步选择Wilk的统计量值最小的变量进行判别函数)方法进行样品分析及分类。表3表示对判别函数的显著行检验,其中Wilk的值很小,显著概率Sig=0.000,从而认为判别函数有效。表 3显著性检验表函数检验Wilks 的 Lambda卡方dfSig.1 到 3.07967.2999.0002 到 3.45221.0464.0003.996.1031.748表4是逐步判别后给出的判别函数系数表,最后进入的自变量是可吸入颗粒物、二氧化硫和二氧化氮的含量,分别设这三个变量为x1、x2、x3,其判别函数如下:F1=687.606x1+573.39x2+325.217x365.827F2=433.725x1+488.629x2+422.513x342.275F3=573.032x1+400.508x2+189.123x340.646F4=274.6x1+119.857x2+118.602x311.182表 4分类函数系数Ward Method1234687.606433.725573.032274.600573.390488.629400.508119.857325.217422.513189.123118.602-65.827-42.275-40.646-11.182Fisher 的线性判别式函数表5为回报判别的结果。可以看到所有的回报率均为1,所以采用的判别分析方法是适用的。表 5分类结果a预测组成员合计12341700017060060060600022100.0.0.0.0100.0.0100.0.0.0100.0.0.0100.0.0100.0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论