已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
臭氧与气象监测数据分析模型摘要臭氧(O3)是大气中的微量元素,是一种有微腥臭味,浅蓝色的气体,主要密集在离地面20-25公里的平流层内,科学家称之为臭氧层。臭氧层好比是地球的 保护伞。阻挡了太阳99%的紫外线辐射,保护地球上的生灵万物。本文从两个角度出发分别建立了两个关于预测大气中臭氧浓度的数学模型,并通过建立数学模型建立起大气中臭氧浓度与气象数据中的联系。首先,通过数据库技术对给定的大量数据(臭氧浓度和气象数据)进行统计分类,筛选出能便于我们分析的数据,并进行画图分析,得出浓度分布图,通过观察,我们近似的认为浓度变化具有马尔可夫性,从这个角度出发我们建立模型1(马氏链模型),首先把臭氧浓度的变化范围化分为若干个状态,并通过统计得出臭氧浓度从一个状态转移到下一个状态的转移概率,并通过转移概率建立转移概率矩阵,从而能对臭氧的浓度变化情况进行简单的预测。 由于在马氏链模型中,我们把臭氧浓度变化范围划分为若干区间,因此预测出的数据会因为区间的划分有限而在精确度上有一定的局限性。因此我们在模型1的基础上通过两种适当假设(1.地区发生变化,时间不发生变化,2.时间发生变化,地区不发生变化)分别求出两种假设情况下的函数表达式,并通过MATLAB拟合成一个与时间t,以及地点坐标lon,lat,相联系的函数。对于问题2,由于提供的气象数据中描述气象状态的指标存在着多个,一般认为各个指标之间存在复杂的关系,之间可能互相加强也可能互相制约,若直接与臭氧的浓度进行联系分析,自变量之间可能会涉及到较多的重共线性问题,因此我们采用基于主成份分析的多元统计分析方法来建立模型,利用描述气象数据的众多指标重新生成少数几个重要的指标,减少了数据矩阵的维数,从而提高了多元统计分析的准确度,通过模型的建立与求解,我们得出气象数据与臭氧浓度之间的联系,为气象的分析或臭氧浓度的预测提供了一种有效的途径。 本文通过SQL SERVER 2000有效地从庞大的数据中筛选出了有利于我们统计分析的数据,并利用数学软件MATLAB很好的实现了数据的拟合以及主元分析,多元分析,得出数学模型。 一问题的提出与分析 臭氧(O3)是大气中的微量元素,是一种有微腥臭味,浅蓝色的气体,主要密集在离地面20-25公里的平流层内,科学家称之为臭氧层。臭氧层好比是地球的 保护伞。阻挡了太阳99%的紫外线辐射,保护地球上的生灵万物。臭氧层浓度每减少1%,太阳紫外线辐射增加2%,皮肤癌就会增加7%,白内障增加 0.6%,现在全世界每年死于皮肤癌的有十几万人,患白内障的更多。紫外线辐射还能破坏植物光合作用和受风粉能力,最终降低农业产量。剧实验,如臭氧减少 25%,大豆将减产20-25%。紫外线辐射还会杀死水中雨卵和单细胞藻类,同时还会引起塑料制品老化、发黄、开裂。氟利昂的排放增多导致臭氧层破坏。对温室效应有重要作用的气体还有甲烷、臭氧、氯氟烃以及水气等。还随着人口的急剧增加,工业的迅速发展,排入 大气的二氧化碳也相应增多。又由于森林被大量砍伐,大气中应被吸收的二氧化碳没有被吸收,由于二氧化碳逐渐增加,温室效应也不断增强。据分析,在过去二百年中,二氧化碳浓度增加25%,地球平均气温上升0.5摄氏度。估计到这个世纪中叶,地球表面温度将上升1.5-4.5摄氏度,而在中高纬度地区温度上升更多。我们要研究的问题是:(1)根据附表数据,能够有效地在时间和空间2个方面预测未来时间的情况。(2)根据数据的分析和处理,建立臭氧和气象数据之间关系的数学模型,并进行一定的分析,得出一定的结论。(3)在所建立的数学模型分析的基础上,向有关部门提出具体的建议。 二模型的假设和符号声明2.1 对模型的基本假设。 1假设对臭氧层中臭氧含量的描述以浓度为标准。 2假设对臭氧层的变化起决定作用的是其中臭氧的含量,而与其它的因素无关。 3假设臭氧的含量在不同的地区降低相同的浓度所引起的影响是一样的,并且在一定时间内是稳定的。 4假设臭氧的浓度为一个状态E,根据数据中的臭氧浓度波动的幅度,把臭氧的浓度分为6个状态E1,E2,E3,E4,E5,E6. 2.2 符号说明。 E 臭氧的浓度 E1E6 臭氧浓度E分别满足:E10.065,0.07;E20.06,0.065; E30.055,0.06;E40.05,0.055;E50.045,0.05;E60.04,0.045;P(i,j) 臭氧浓度由Ei转移到Ej的转移概率P(ij)=P(EiEj)。 P 转移概率矩阵。 k步转移概率。问题一模型的建立与求解1模型1(马氏链模型)的建立与求解我们以附件1的数据作为分析来源,对其按月求平均值。它的波动带有一定的随机性,个别点的波动比较大,大部分情况臭氧的浓度变化比较平缓,因而我们假设臭氧的浓度变化具有马尔可夫性。如图1所示为全部地区年5月9月的臭氧浓度的分布情况。 依据附件给出的资料,进行方差计算,其数据的观察精度一般在 23,因而在状态的划分上根据臭氧浓度的变化范围可分为6个状态:E1,E2,E3,E4,E5,E6,则每个状态都有6个转移方向:EiE1,EiE2,EiE3,EiE4,EiE5,EiE6(i=1,2,3,4,5,6),E1,E2,E3,E4,E5,E6的具体划分如符号声明所述。将这种转移的可能性用概率描述,就是状态转移概率。由于当样本容量足够大时,可用样本分布近似地描述状态的理论分布,因而可以用频率近似地代替相应状态间的转移概率。将状态的转移概率P(i,j)=PEiEj依次排列,得到一个6*6阶的矩阵: P= 其中Pij=0,1,(i=1,2,3,4,5,6),加入目前预测对象处于状态Ei,Pij(i,j=1,2,3,4,5,6)恰好描述了目前的状态向各个状态转移的可能性,可能最大者就是结果,即可预测对象进一步转移最大可能到达的状态。设为k步转移概率矩阵, 则=设方阵A,如存在正整数m,使得=(),使得0,且=1,则A为标准概率矩阵.若一步转移概率矩阵为标准概率矩阵,择其必有稳定状态。设为预测对象在t=k时刻的状态向量,则处于稳定状态时 (1)令=(X1,X2,Xn)=X 且由(1)式得, 得 (2) 其中,X,P分别为X,P的转置矩阵.联立(1),(2)式可解出,即为稳定状态时的概率.现在假设状态Ei出现的次数为Mi,由状态Ei转移到状态Ej的个数为Mij,则,进一步可以解得转移矩阵P,即可根据当前的臭氧浓度所在的状态预测它下一个时间段会出现的浓度值。以A地区(lon=-84.721,lat=39.836)为例进行分析(其它地区分析方法类似)。我们先以A地区(lon=-84.721,lat=39.836)19972003年5月9月的臭氧月平均浓度为数据来源进行分析。其浓度分布图如图2所示,得出它的转移矩阵 P= 图2因此,我们由现有的数据我可以预测一下2004年A地区5月份的臭氧浓度,由于2003年9月份该地区的臭氧浓度为:0.46267,在E5状态下,根据转移矩阵中,PE5E3=1,我们就可以认为2004年5月份该地区的臭氧浓度为:0.0550.060之间。通过计算K步转移矩阵概率可以计算得以后几个月的臭氧浓度状态。取k=4,P4=,可以看到PE3E3=0.4831,即几个月之内,A地区的臭氧浓度将保持在一个状态下。 现假设,解即由MATLAB解得=0.0171 0.2231 0.3483 0.0892 0.3153 0.0060 由于=0.3483(i=1,2,4,5,6)所以这个地区的臭氧含量的平均值可能稳定在状态E3中,也就是说这一区域的臭氧的平均值在短期内应该不会有太大的波动。 2模型2的建立与求解 由于模型1中浓度的划分不够细,因此预测出来的臭氧浓度的精确度有限,为了提高预测的精确度,我们在臭氧浓度的变化范围之间取24等分点,构成23个浓度区间,并对1300个样本观察值进行浓度区间匹配,统计出样本观察值落在某个浓度区间的个数除以样本观察值的个数,由于观察值的个数大概有1300,所以可以用频率近似代替概率.下面是对1320个样本观察值进行浓度区间筛选得出概率分布的数据:(注:浓度区间如0.04000,表示(0.04000,0.041364,以此类推)浓度区间0.040000.0413640.0427270.0440910.0454550.0468180.048182概率0.00833330.0371210.0143940.0212120.0303030.0416670.033333浓度区间0.0495450.0509090.0522730.0536360.0550000.0563640.057727概率0.0287880.0363640.0386360.0507580.0439390.0750.059091浓度样本0.0590910.0604550.0618180.0631820.0645450.0659090.067273浓度均值0.0757580.0666670.0643940.0545450.0424240.0393940.000758浓度区间0.0686360.07000概率0.0272730依据上面的概率分布,我们画出其概率分布图象。现假设概率分布是连续的,根据概率分布图中的趋近曲线,假设浓度均值分布服从正态分布,均值为0.058035272,方差为0.0000674753360034再假设:1地区不发生变化,时间发生变化,其浓度均值分布服从正态分布.2时间不发生变化,地区发生变化,其浓度均值分布服从正态分布.对第一种假设分析: 假设地区不变,数据中地区均值是lon=-82.76244,lat=40.44755,下面是数据给出的地区分布图: 从图上可以看出在地区均值的点比较少,所以不能用地区均值的地区来代表总地区去分析地区不变的假设,所以要对数据进行整理,按year,month对数据进行分组,求出按月份的均值数据来完成第一种假设的分析,下面是地区不变时间变化,在给定时间点上臭氧浓度均值在浓度区间的概率分布分析:从图上可以看出,在地区不变时间变化的情况中,浓度均值的概率分布还是以总体的概率分布比较相像的,基于对总体浓度均值概率分布的分析,我们同样假设在第一种假设的条件下,浓度均值分布服从正态分布,均值为0.058028, 方差为0.0000479200982029 .由于臭氧层会因为环境的污染而变得虚薄,总量会有所减少,假设总量减少是线性的,而且总量减少的速度很慢,在一个月内臭氧的总量基本不变,所以在对臭氧总量线性减少的分析中,以年为单位分析.下面是一年为单位,浓度均值的数据:yearAVGYEAR8HRAVGYEAR1HRAVGYEAR19970.0511820.0575870.05438419980.0586540.0661410.06239819990.0573750.0642830.06082920000.050960.0575680.05426420010.0541120.0609910.05755220020.0588750.0659950.06243520030.0510230.0576060.054314 根据数据作出图图表中的虚线是均值的趋势曲线,在Matlab中用polfit进行y=a+bx回归,得出 polyfit(x,y,1) % x表示时间向量,对应YEAR列% y表示均值向量,对应AVGYEAR列ans = -0.0001 0.3018解得: (t)=-0.00012188*t+0.30178根据上面对臭氧总量减少的线性回归分析, 则在第一种假设的条件下,浓度均值分布服从正态分布,均值为 (t)= -0.00012188*t+0.30178,方差0.0000479200982029.根据正态分布函数,代入(t),得出:(0.04x0.07)对第二种假设(时间不发生变化,地区发生变化)分析: 与第一种假设时一样,先分析在时间不变,地区变化时,分析其概率的分布,下面是通过上面筛选的方法筛选出来的数据画的在给定的地区时浓度均值概率分布图:由于选取的概率区间(23)的有限性,也可以把上面的概率分布是连续变化的,其样本观察值服从正态分布,其均值为0.05804717,方差为0.0000100330113383 从臭氧数据中,可以知道,lon值或lat值都可以唯一标识一个地区,下面分别以lon变化和lat变化分析均值的变化的图表说明:从线性的角度观察,以lon变化和以lat变化来说明浓度均值的变化,都呈现了微小的线性递减,所以单独取lon或lat变化来分析,应该从lon和lat共同的变化来分析浓度均值的变化,下面是均值随地区变化的图表:根据按lon和lat分组求浓度均值进行二元四阶线性回归,得出地区变化时,均值变化的线性函数: 根据正态分布函数,代入 (lon,lat),0.0000479200982029得出: (0.04x0.07)经过对我们所作的两种假设的分析,又因为总体的浓度均值概率分布,地区不变时间变化的浓度均值概率分布和时间不变地区变化的浓度均值概率分布都是服从正态分布,所以总体的浓度均值概率分布函数如:(0.04x0.07)根据正态分布的性质:有限各相互独立的正态随机变量的线性组合仍然服从正态分布,所以有存在着这样的性质: 求得0.6263 0.3737所以总体的浓度均值随时间,地区的变化函数为 计算得出的预测数据:Lon-84.115,lat=40.085,t=2000,预测得出的浓度均值为0.0592Lon81.249,lat41.515,t2010,预测得出浓度均值为0.0576将上面的数据代入总体浓度均值的概率分布函数: (0.04x0.07)总体浓度均值预测数据:Lon-84.115,lat=40.085,t=2000, 浓度预测为0.0592,可得=0.1Lon81.249,lat41.515,t2010,浓度预测为0.0576, 可得=0.1即其浓度均值在区间(0.057727,0.059091)时可达到显著水平m+1次观察数据,利用最小二乘法建立因变量Z与自变量X间的线性回归方程。 设有n组相互独立的检测数据:我们通过上述的n*(m+1)维数据矩阵,推求出拟合方程: 其中称为回归系数 3.模型的求解我们在气象数据中选取最能全面描述气象特征的10个指标,并假设这10个指标用X1X10代替,其对应关系如下所示:我们随机选取KAOH地区1998年2003年五月到九月的臭氧浓度为分析数据来源对模型进行求解(同理可用同样的方法对其它地区进行分析)。调用MATLAB统计工具箱princomp函数,格式为:【pc, score,latent,tsquare 】=princomp(ingredients)其中ingredients指标准样化后的样本指标矩阵,PC是指各主成分关于指标的线性方程组的系数矩阵,score是各主成分得分,latent是方差矩阵的特征值, tsquare为HotellingT统计量。统计结果如下:特征值贡献率积累贡献率第一主成份0.38957.74%57.74%第二主成份0.19729.24%86.98%第三主成分3.9165.80%92.78% 由表可以看出,前三个主成份的积累贡献率已经达到92.78%,因此我们可以取这三个主成分来对气象进行分析。 根据R的特征值的相应的正则化单位特征向量,前三个主成份关于指标的线性组合为Y1=0.256*X1+0.246*X2+0.281*X3-0.397*X4-0.401*X5-0.4*X6-0.248*X7-0.304*X8-0.224*X9-0.334*X10Y2=0.426*X1+0.435*X2+0.381*X3-0.009*X4-0.039*X5-0.044*X6+0.402*X7+0.31*X8+0.419*X9+0.217*X10Y3=-0.033*X1+0.021*X2-0.07*X3-0.216*X4-0.205*X5-0.142*X6-0.367*X7+0.532*X8-0.317*X9+0.605*X10 通过结果我们对各主成分的实际意义做如下解释:主成份Y1与X1,X2,X3正相关,即与大气中的温度关系比较密切。主成份Y2与X1,X2,X3,X7,X8,X9,X10正相关,即与大气中的温度,风速以及风向关系比较密切。主成份Y3与X1,X2,X8,X10正相关,即与大气中的温度和风速相关密切。根据上面的关系式,我们可以算出该地区各个月份的主成分的值,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理伦理视角下护理诊断PES的实践思考
- 2026年医院与供应商合作协议
- 益阳市重点中学2026届高一生物第一学期期末达标测试试题含解析
- 上海市静安区2025年化学高一第一学期期中学业质量监测试题含解析
- 1+3护理学教学:理论与实践融合探索
- Unit 2 Home,Sweet Home人与社会:家庭及家庭生活-人教版八年级英语上册话题阅读专练
- 2026中考英语语法复习分类训练:一般将来时100题(中考试题+中考模拟)原卷版
- 2026年中考物理一轮基础复习:第一章 机械运动(专项练习)
- 医学生基础医学 冻伤护理基础护理课件
- 2026浙江春季高考物理考试总复习:静电场(知识梳理+考点)原卷版
- JG/T 535-2017建筑用柔性薄膜光伏组件
- 火灾风险评估相关试题及答案
- 广州水务笔试题目及答案
- 2025南宁市武鸣区辅警考试试卷真题
- GB 14930.2-2025食品安全国家标准消毒剂
- 【李宁公司财务管理问题及建议分析9700字(论文)】
- 2024年吉林省高职高专单招考试英语卷试题真题(含答案)
- 2025年入团考试练习试题(100题)附答案
- 2025北京外国语大学辅导员考试题库
- 物业商铺装修管理协议合同书
- 湖北省技能高考(护理)专业知识考试题(附答案)
评论
0/150
提交评论