PM2.5的主成分分析.doc_第1页
PM2.5的主成分分析.doc_第2页
PM2.5的主成分分析.doc_第3页
PM2.5的主成分分析.doc_第4页
PM2.5的主成分分析.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息与计算科学专业学年论文论文题目PM2.5的相关因素分析姓名黄坤兰学号3111342127指导教师谢海中文摘要 为了研究PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物(PM10)等5项分指标及其对应污染物(含量)之间的相关性及其关系。对武汉市2013年1月-8月份的PM2.5质量浓度、影响因素数据资料进行整理统计,运用典型相关分析及其MATLAB分析PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物之间的相关性及其关系,结果显示:PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的相关系数为0.8336,可见相关系数比较接近于1,说明PM2.5和二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的复相关性很强,这五项分指标对PM2.5的质量浓度影响还是很大的;而对于这五项污染物指标进行了主成分分析,并运用spss软件进行了详细的相关性分析,得出贡献率,并算出每个变量的累计贡献率,然后根据累计贡献率所占的百分比,分出第一主成分和第二主成分;然后用spss计算出第一主成分的值、第二主成分的值和综合主成分的值,进而得出各个变量的排名情况,从而知道二氧化硫对PM2.5的影响比较大,从而可以推测出PM2.5形成的机理与这几个变量的紧密相关程度。桂林理工大学理学院信息与计算科学专业学年论文(2011级)PM2.5的相关因素分析学生姓名:黄坤兰 学号:3111342127 指导教师:谢海摘 要:为了研究PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物(PM10)等5项分指标及其对应污染物(含量)之间的相关性及其关系。对武汉市2013年1月-8月份的PM2.5质量浓度、影响因素数据资料进行整理统计,运用典型相关分析及其MATLAB分析PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物之间的相关性及其关系,结果显示:PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的相关系数为0.8336 ,可见相关系数比较接近于1,说明PM2.5和二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的复相关性很强,这五项分指标对PM2.5的质量浓度影响还是很大的;而对于这五项污染物指标进行了主成分分析,并运用spss软件进行了详细的相关性分析,得出贡献率,并算出每个变量的累计贡献率,然后根据累计贡献率所占的百分比,分出第一主成分和第二主成分;然后用spss计算出第一主成分的值、第二主成分的值和综合主成分的值,进而得出各个变量的排名情况,从而知道二氧化硫对PM2.5的影响比较大,从而可以推测出PM2.5形成的机理与这几个变量的紧密相关程度。关键词:PM2.5;相关性;相关系数;主成分分析1前言由于工业的发展越来越迅猛,进而产生了一系列环境问题,尤其是近年来空气质量越来越严重,所以有部分专家专注研究这方面,找出这些问题的产生的因素。发现细颗粒物影响空气质量也占了很大一部分。细颗粒物是指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物,也称PM2.5、可吸入肺颗粒物。它能较长时间悬浮于空气中,其在空气中含量(浓度)越高,就代表空气污染越严重。虽然PM2.5只是地球大气成分中含量很少的组成,但它对空气重量和能见度等有重要的影响。与较粗的大气颗粒物相比,PM2.5粒径小,表面积大,活性强,易附带有毒、有害物质,且在大气中的停留时间长,输送距离远,因而对人体健康和大气环境的影响更大。而可吸入颗粒物也叫PM10,是指空气动力学直径小于10微米的细颗粒。戴海夏等的研究表明城区中大气PM2.5日平均浓度与居民日死亡数之间存在明显关联,浓度上升总死亡数上升。最近这几年,城市PM2.5的研究日益引起公众的广泛关注。已有研究表明,我国大陆城市大气中PM2.5约占PM10的50%70%,已成为影响环境空气质量的主要污染物之一。有研究表明,AQI监测指标中的二氧化硫,二氧化氮,一氧化碳是在一定环境条件下形成PM2.5前的主要气态物体。所以为了了解PM2.5(含量)与其它5项分指标及其对应污染物(含量)之间的相关性及其关系进行分析。对武汉2013年1月-8月份的二氧化硫、一氧化碳、二氧化氮、臭氧、PM2.5、可吸入颗粒物这六个变量的质量浓度进行分析。而我们根据贡献率的大小,然后分析各个变量的影响大小。对于贡献率的概念,即贡献率是分析经济效益的一个指标。它是指有效或有用成果数量与资源消耗及占用量之比,即产出量与投入量之比,或所得量与所费量之比。计算公式:贡献率(%)=贡献量(产出量,所得量)/投入量(消耗量,占用量)100%贡献率也用于分析经济增长中各因素作用大小的程度。2 典型相关分析分析PM2.5与这五项分指标关系2.1典型相关分析思想在相关分析中,当考察的一组变量仅有两个时,可用简单相关系数去衡量;当考察的一组变量有多个,研究一个随机变量之间的线性相关关系,可用复相关系数去衡量,然后,在样本数量庞大所面临的复杂研究中,多数都是想要找出一个以上的反应变量与一组解释变量的关系。这种用于探讨一组解释变量与一组反应变量间的关系的分析方法既是典型相关分析法,典型相关分析可以说是复相关分析的延伸。这个模型的基本思想就是运用典型相关分析,分别在两组变量中选取若干个有代表性的综合变量,每一综合变量都是这组变量的一个线性组合,而且综合变量之间是互相关的,称这种综合变量为典型相关变量。然后,通过这一组典型相关变量的相关关系研究。在实际上,只须着重研究相关关系较大的那几对典型相关变量。2.2典型相关分析的数学模型设随机向量为与另一组变量,而我所要研究的是当时,维随机向量,设 ,则称为与的全(复)相关系数,全相关系数用于度量一个随机变量与另一组随机变量的相关关系。复相关系数的求法:假设,其中,。将和分别剖分为, ,变量与向量变量之间的复相关系数是基于简单相关系数来定义的。构造向量变量的线性组合,其中,。变量与变量之间的简单相关系数为,变量与向量变量之间的复相关系数被定义为在时,变量与变量之间的简单相关系数的最大值,考虑到这个最大值一定是非负(至少是0)的,所以,根据关于二次型极值的性质,有,并且在的时候取得最大值。所以变量与向量变量之间的复相关系数被定义被定义为,其中,。显然。越大,意味着变量与向量变量之间的复相关性越强。2.3 MATLAB编码符号说明2.3.1 通用符号、 PM2.5 二氧化硫 一氧化碳 二氧化氮 臭氧 可吸入颗粒物 进行线性组合,构造向量变量 连接和这两个矩阵 计算的协方差 取矩阵中第1-5行和第1-5列的元素构成的矩阵 取矩阵中第1-5行和第6列的元素构成的矩阵 取矩阵中第6行和第1-5列的元素构成的矩阵 取矩阵中第6行和第6列的元素构成的矩阵 计算变量与向量变量之间的复相关系数2.3.2 常用函数符号 将矩阵进行标准化 求矩阵的协方差函数 求矩阵逆的函数2.4 结果与分析 表1 协方差矩阵PM2.5二氧化硫一氧化碳二氧化氮臭氧可吸入颗粒物PM2.51.0000 0.7241 0.8216 0.7324 0.3549 0.7787 二氧化硫0.7241 1.0000 0.6570 0.8051 -0.1815 0.6779 一氧化碳0.8216 0.6570 1.0000 0.6245 0.3830 0.5860 二氧化氮0.7324 0.8051 0.6245 0.0000 0.0646 0.7275 臭氧0.3549 -0.1815 -0.3830 -0.0646 1.0000 -0.0685 可吸入颗粒物0.7787 0.6779 0.5860 0.7275 -0.0685 1.0000 运用MATLAB编辑软件进行编码得到了协方差矩阵和最终的结果复相关系数为0.8336,结果比较接近于1,说明了PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的复相关性很强,也就意味着PM2.5的浓度的增大或者变化,很大一部分是由这五个变量影响的。3 主成分分析五项分指标的关系3.1主成分分析的基本原理主成分分析法是一种降维的统计方法,它借助于一个正交互换,将其分量相关的原随机向量转化成其分量不相关的新的随机向量,这在代数上表现将原随机向量的协方差阵变换成对角形矩阵,在几何上表现为将原坐标变换成新的正交坐标系,使之指向样本点散布最开的个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。3.2 数学模型原始指标数据的标准化采集维随机向量,个样品,构造样本阵,对样本阵元进行如下标准化变换:,其中, ,得到标准化变换阵。对标准化阵求相关系数矩阵。,其中,。解样本相关矩阵的特征方程,得个特征根,确定主成分,按,确定值,使信息的利用率达85%以上,对每个 ,解方程组 的单位特征向量 。将标准化后的指标变量转化为主成分。,称为第一主成分,称为第二主成分,.,称为第主成分。对个主成分进行综合评价。 对个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。3.3 在spss环境下进行操作,以下是主成分分析所得的结果分析表2 相关系数矩阵二氧化硫二氧化氮可吸入颗粒物一氧化碳臭氧二氧化硫1.0000 0.8050 0.6780 0.6570 -0.1820 二氧化氮0.80501.0000 0.72700.6250 -0.0650 可吸入颗粒物0.6780 0.7270 1.0000 0.5860 -0.0690 一氧化碳0.6570 0.6250 0.5860 1.0000 -0.3830 臭氧-0.1820 0.0650 -0.0690 -0.3830 1.0000由表2我们可以看得出来,二氧化硫与二氧化氮的相关系数最大,为0.805,其次为可吸入颗粒物与二氧化氮的相关系数0.727、可吸入颗粒物与二氧化硫的相关系数为0.678、一氧化碳与二氧化硫的相关系数为0.657、一氧化碳与二氧化氮的相关系数为0.625、可吸入颗粒物与一氧化碳的相关系数为0.586,而臭氧与其他的变量的相关系数很小。如果直接用于分析,可能带来严重的共线性问题,因此有必要对变量进行主成分分析,表中相关系数为1的为自身相关系数。表3 初始因子载荷矩阵12二氧化硫0.901-0.88二氧化氮0.8940.238可吸入颗粒物0.8430.232一氧化碳0.835-0.265臭氧-0.2850.993从表3中可知二氧化硫与二氧化氮、可吸入颗粒物、一氧化碳这几个指标存在着极其显著地关系,可见许多变量之间直接的相关性比较强,证明它们存在信息上的重叠,所以有必要进行主成分分析。图1 特征根数值衰减折线图(碎石图)图1为碎石图,实际上是按特征根大小排列的主成分散点图,如图所示,第一主成分的特征值大部分都大于1,因为变量3、4叠加信息量也比较大,所以也属于第一主成分的。第二个主成分特征根就比较低,特征根小于1,所以可以认为第一主成分能概括绝大部分信息。表4 相关矩阵的特征值及其累计贡献率特征值相邻特征值之差贡献率(%)累计贡献率(%)1.000 3.100 2.042 62.002 62.002 2.000 1.058 0.726 21.162 83.164 3.000 0.332 0.004 6.644 89.808 4.000 0.328 0.146 6.558 96.367 5.000 0.182 3.633 100.000 表4给出了各样本相关系数矩阵的特征值,相邻两个特征值之间的差,每个特征值所解释的方差比率和积累方差比率。这里第一、第二主成分累计比率为96.367%、3.633%。可见,在这些变量中,只要选择第一、第二主成分就可以了。如果是按照特征值大于1的标准来考虑的话,那么只要选择第一主成分就可以了第二主成分特征值为0.182,小于1,而且所占的比例很小。与此同时,从这个表我们也看得到,各个变量的贡献率情况。二氧化硫的贡献率占了超过了一半,也就是说当它变化的时候,对PM2.5质量浓度的影响比较大;而其他几个变量的贡献率相对比较小一些,特别是臭氧的贡献率仅占3.633%,对PM2.5质量浓度影响很小。表5 综合主成分值变量第一主成分(F1)排名第一主成分(F2)排名综合主成分(F)排名二氧化硫0.512 10.856 20.599 1二氧化氮0.508 20.231 30.437 2可吸入颗粒物0.478 30.226 40.414 3一氧化碳0.474 4-0.258 50.288 4臭氧-0.162 50.907 10.110 5通过了综合评价分析,表5得出第一主成分、第二主成分、综合主成分的各个变量的值和排名情况,表中显示二氧化硫的在各个主成分的排名情况都是相当地好的,在综合排名中为第一位,说明二氧化硫对PM2.5的影响在这几个变量中是最大,并且是最明显的,而二氧化氮、可吸入颗粒物、一氧化碳、臭氧对PM2.5的影响力相对次之。4 结论通过典型相关分析与主成分分析PM2.5、一氧化碳、二氧化硫、二氧化氮、臭氧、可吸入颗粒物这几个变量的相关性,发现一氧化碳、二氧化硫、二氧化氮、臭氧、可吸入颗粒物对PM2.5的影响还是比较显著的,所以有些研究说,一氧化碳、二氧化硫、二氧化氮、臭氧是在一定环境条件下形成PM2.5前的主要气态物体,也不是没道理的。其中主成分分析五项分指标的相关性及其关系,结果显示二氧化硫的贡献率达到了62.002%,还得到了各个变量的在各个主成分、综合主成分的值和排名情况。所以我们得出了二氧化硫对PM2.5变化量的影响比较大,而其他的变量次之,所占比率较小,但也不能说明这些变量不会影响PM2.5的形成和质量浓度变化,还是有一定的影响的。总的来说,PM2.5的形成机理以其质量浓度的变化与一氧化碳、二氧化硫、二氧化氮、臭氧、可吸入颗粒物这些变量存在着密切相关的联系。所以在空气质量上,应该控制一氧化碳、二氧化硫、二氧化氮、臭氧等污染气体的排放,特别是经济发展发达的地区,工厂设施也一定很多,在排放的时候一定要处理好,符合国家的排放标准。致谢:感谢指导老师谢海提供的资料、数据和指导,以及王玉婷同学的指点!参考文献1 梅长林,范金成,数据分析方法M.北京:高等教育出版社,2006.2 周开利,邓春晖,MATLAB基础及其应用教程M.北京:北京大学出版社,2007.3 郝香芝,李少颖,我国科技投入与经济增长关系的典型相关分析J.商场现代化,2007,522:178-179.4 朱倩茹,刘永红,广州PM2.5污染特征及影响因素分析J.中国环境监测,2013,2:15-21.5 中国环境科学研究院,中国环境监测总站.GB3095-2012环境空气质量标准s.北京,中国标准出版社,2016.6 何平,杨兴堂,上海宝山地区大气PM2.5污染特征分析J.环境与职业医学,2010,12(27):724-726.Analysis of the relevant factors PM2.5Student : Huang Kunlan ID: 3111342127 Teacher: Xie HaiAbstract : In order to study PM2.5 and sulfur dioxide, carbon monoxide, nitrogen dioxide , ozone, particulate matter (PM10) and other five component indicators and their corresponding correlation and its relationship pollutants ( content ) between . Wuhan PM2.5 mass concentrations in January-February 2013 , influencing factors collate statistical data , using canonical correlation analysis and MATLAB analysis PM2.5 and sulfur dioxide, carbon monoxide, nitrogen dioxide , ozone, particulate matter correlation between their relationship , the results show : PM2.5 and sulfur dioxide, carbon monoxide, nitrogen dioxide , ozone , respirable particulate matter correlation coefficient was 0.8336 , showing a correlation coefficient closer to 1 , indicating that PM2.5 and sulfur dioxide , carbon monoxide, nitrogen dioxide , ozone, particulate matter is a strong correlation between the complex impact of these five sub-indicators of PM2.5 mass concentration is still very large ; while for these five indicators of pollutants principal component analysis , spss software and use a detailed correlation analysis, the contribution rate and calculate the cumulative contribution of each variable , and then based on the percentage share of the cumulative contribution rate , the separation of the first principal component and the second component ; then spss calculated values with the first principal component , the value of the value of the main components and integrated second main component , and then come rankings for each variable , and thus know the impact of sulfur dioxide on PM2.5 is relatively large , which can be inferred PM2.5 to this mechanism is formed is closely related to the extent of several variables .Key words : PM2.5; relevance ; correlation coefficient ; principal component analysis 附录:1、程序代码如下:load PM25; %读取数据X=A; % PM2.5B ; % 二氧化硫C ; % 一氧化碳D ; % 二氧化氮E ; % 臭氧F ; % 可吸入颗粒物Y=B C D E F; %构造向量变量Y的线性组合ALL=zscore(X) zscore(Y); % 连接两个矩阵DXY=cov(ALL) % 计算协方差ALLV11=DXY(1:5,1:5)V12=DXY(1:5,6)V21=DXY(6,1:5)V22=DXY(6,6)R=sqrt(V21*inv(V11)*V12)/V22) %变量X与向量变量Y之间的复相关系数运行结果如下:DXY = 1.0000 0.7241 0.8216 0.7324 -0.3549 0.7787 0.7241 1.0000 0.6570 0.8051 -0.1815 0.6779 0.8216 0.6570 1.0000 0.6245 -0.3830 0.5860 0.7324 0.8051 0.6245 1.0000 -0.0646 0.7275 -0.3549 -0.1815 -0.3830 -0.0646 1.0000 -0.0685 0.7787 0.6779 0.5860 0.7275 -0.0685 1.0000V11 = 1.0000 0.7241 0.8216 0.7324 -0.3549 0.7241 1.0000 0.6570 0.8051 -0.1815 0.8216 0.6570 1.0000 0.6245 -0.3830 0.7324 0.8051 0.6245 1.0000 -0.0646 -0.3549 -0.1815 -0.3830 -0.0646 1.0000V12 = 0.7787 0.6779 0.5860 0.7275 -0.0685V21 = 0.7787 0.6779 0.5860 0.7275 -0.0685V22 = 1.0000R =0.83362、原始数据:二氧化硫二氧化氮可吸入颗粒物一氧化碳臭氧PM2.553 89 76 19 30 90 47 83 88 29 8 143 57 80 51 31 13 58 61 92 81 28 8 142 55 104 96 34 8 175 56 97 99 30 10 215 51 97 121 31 28 250 58 123 157 54 9 309 64 111 127 47 8 273 61 111 159 51 24 329 74 115 145 65 4 299 62 109 143 59 27 299 59 111 131 45 38 246 50 110 136 44 27 261 54 112 124 44 9 260 63 109 159 60 5 295 57 89 145 61 15 282 56 95 137 48 36 262 54 94 111 39 26 204 55 87 91 41 12 179 54 82 82 53 11 227 72 92 116 75 8 277 57 97 119 66 24 242 58 99 112 50 32 226 53 101 106 32 43 173 85 120 156 52 19 266 72 121 236 73 18 426 63 110 149 57 30 307 47 102 120 40 62 230 44 85 96 40 23 201 12 58 80 54 4 186 35 83 66 86 8 143 52 73 101 101 4 235 30 59 79 67 9 173 28 39 41 52 3 79 11 32 26 33 10 53 24 39 66 31 9 124 32 35 48 43 20 84 22 29 42 17 26 69 30 40 61 19 35 109 71 67 132 30 29 240 21 40 81 25 28 183 24 47 87 30 43 201 44 64 82 31 23 183 36 64 78 32 8 182 35 69 93 34 38 211 43 49 62 26 39 117 36 64 64 32 7 120 13 38 58 27 23 117 12 45 27 16 29 42 25 63 55 19 19 84 16 73 66 22 8 114 29 80 84 29 32 155 52 99 94 36 47 175 52 83 85 28 17 159 45 87 111 35 10 224 11 60 125 44 12 327 26 69 145 55 3 285 46 74 88 45 8 145 20 43 75 22 17 67 28 50 60 15 27 52 32 74 73 17 40 80 37 102 105 25 39 94 55 103 126 30 56 103 58 102 111 27 70 108 29 82 114 17 44 83 40 107 128 28 80 128 43 106 130 34 52 144 16 37 282 15 27 65 43 63 75 19 18 64 41 69 89 27 6 138 23 52 92 24 17 180 49 69 74 22 41 103 52 79 81 20 51 89 27 80 74 28 13 103 7 57 45 24 18 88 24 72 74 24 39 102 42 79 83 35 24 110 28 65 98 28 23 180 51 74 82 30 31 119 43 72 100 34 46 166 18 62 90 32 6 203 21 58 86 28 23 183 37 53 78 23 43 117 12 49 59 16 31 105 21 72 76 20 47 115 51 80 95 30 46 137 41 88 132 37 70 237 49 74 99 30 46 173 42 83 101 32 40 173 50 93 114 31 62 188 36 67 97 25 89 143 57 90 99 29 63 122 49 65 86 31 45 124 11 35 67 23 36 132 13 49 81 16 69 84 36 68 73 18 86 78 44 70 86 17 73 83 22 48 98 13 42 67 37 90 88 20 48 73 40 97 98 22 58 89 26 98 94 17 66 82 30 68 85 15 86 82 29 67 86 18 74 93 27 95 88 19 80 89 34 87 92 20 47 93 41 73 109 30 60 152 22 50 84 26 36 127 15 47 63 17 37 67 5 34 42 14 41 73 31 54 63 20 36 99 20 68 52 25 15 75 10 60 48 24 26 69 28 92 84 33 48 124 32 110 121 42 77 160 32 101 115 34 101 155 44 79 93 27 85 99 37 65 81 27 47 92 9 43 35 14 77 40 35 85 74 24 126 80 52 77 82 23 134 93 33 103 94 22 108 119 49 95 101 28 114 135 52 63 87 25 92 117 29 62 65 24 29 95 27 57 53 23 15 69 10 45 34 22 31 40 8 50 53 26 47 70 17 75 61 18 21 67 18 68 62 14 79 62 23 85 76 20 105 78 37 82 88 23 114 94 44 74 95 26 110 100 10 49 58 21 46 85 8 34 38 14 45 45 10 50 49 17 49 53 7 47 48 18 50 65 15 58 78 21 92 119 21 82 87 23 87 129 21 88 103 27 118 139 41 95 110 33 127 139 32 101 118 32 147 144 32 104 140 37 130 183 17 69 106 30 36 162 5 32 18 18 29 28 12 42 51 21 90 58 20 63 71 25 120 80 10 35 54 15 42 67 9 60 57 19 20 78 12 60 66 15 63 92 9 69 59 17 29 75 10 65 65 18 110 89 20 64 81 25 146 113 30 57 76 27 104 97 27 55 75 26 103 90 19 59 64 25 18 83 6 33 25 11 42 28 12 42 38 14 64 35 6 35 65 18 26 99 7 40 39 16 72 43 20 75 76 23 134 94 40 63 64 20 109 7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论