基于ARIMA模型的地表PM2.5浓度预测_第1页
基于ARIMA模型的地表PM2.5浓度预测_第2页
基于ARIMA模型的地表PM2.5浓度预测_第3页
基于ARIMA模型的地表PM2.5浓度预测_第4页
基于ARIMA模型的地表PM2.5浓度预测_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于ARIMA模型的地表PM2.5浓度预测摘要:在中国许多大中型城市中,颗粒物引起的空气雾霾已成为人们关注的主要健康问题,空气中拥有细颗粒物PM2.5是雾霾的主要成分。本研究用MATLAB软件建立了预测地表大气中细小颗粒物PM2.5的时间序列分析自回归移动平均模型ARIMA,能够预测到地表空气PM2.5浓度变化的趋势。浓度预测能为公民健康出行,避免因空气污染而引起人群健康效应,从而实现早期预警的目标。收集盐城市地表空气PM2.5监测数据构建ARIMA预测模型,本研究以2016年7月1日至2017年6月30日的PM2.5小时浓度构造训练集,训练集用于建立ARIMA模型,并对建立的ARIMA模型进行数据的检验、参数的估计、模型的诊断,并且选择最优预测模型。以2017年7月1日至2017年12月31日的PM2.5小时浓度构造测试集,测试集用于检验最终选择最优的ARIMA模型的性能,利用构建的最佳ARIMA模型对盐城市未来一小时地表大气PM2.5浓度进行预测,并对预测效果进行评价。随着我们经济的发展,PM2.5污染导致健康生活问题被广泛关注,世界卫生组织已经证实了PM2.5为-类致癌物。目前国内外学者研究表明,空气中PM2.5浓度水平与人群的呼吸系统、心血管系统存在密切联系。目前我国环境质量状况总体平稳,但形势依然非常严峻,多数城市PM2.5超标。因此,我们有必要重视PM2.5浓度水平,实现地表大气PM2.5浓度水平变化趋势的预测,为制定有效的空气污染防治措施提供了科学依据,改善大气质量。关键词:PM2.5、ARIMA模型、时间序列、预测SurfacePM2.5concentrationpredictionbasedonARIMAmodelAbstract:PM2.5,Inmanylargeandmedium-sizedcitiesinChina,airhazecausedbyparticulatematterhasbecomeamajorhealthconcernforpeople.PM2.5,thefineparticulatematterintheair,isthemaincomponentofhaze.Inthisstudy,MATLABsoftwarewasusedtoestablishatimeseriesanalysisARIMAmodelofautoregressivemovingaverageforthepredictionofPM2.5fineparticulatematterinthesurfaceatmosphere,whichcanpredictthetrendofPM2.5concentrationchangeinthesurfaceair.Concentrationpredictioncanhelpcitizenstravelinahealthywayandavoidthehealtheffectscausedbyairpollution,soastoachievethegoalofearlywarning.ARIMApredictionmodelwasconstructedbycollectingPM2.5monitoringdataofsurfaceairinyanchengcity.Inthisstudy,atrainingsetwasconstructedbasedonthehourlyconcentrationofPM2.5onJuly1,2016(solstice,June30,2017).Thetrainingsetwasusedtobuildthemodel,testthedata,estimatetheparameters,diagnosethemodel,andselecttheoptimalpredictionmodel.BasedonthehourlyconcentrationofPM2.5onJuly1,2017(solstice,December31,2017),atestsetwasconstructed,whichwasusedtotesttheperformanceoftheultimatelyselectedoptimalmodel.TheoptimalmodelwasusedtopredictthePM2.5concentrationinthesurfaceatmosphereofyanchengcityinthenexthour,andthepredictioneffectwasevaluated.Withthedevelopmentofoureconomy,thehealthylivingcausedbyPM2.5pollutionhasbeenwidelyconcerned.In2013,theworldhealthorganizationhasconfirmedthatPM2.5isaclassIcarcinogen.Atpresent,domesticandforeignscholarshaveshownthatPM2.5concentrationintheairiscloselyrelatedtotherespiratorysystemandcardiovascularsystemofthepopulation.Atpresent,China'senvironmentalqualityisgenerallystable,butthesituationisstillveryserious.MostcitieshaveexcessivePM2.5.Therefore,itisnecessaryforustopayattentiontothePM2.5concentrationlevel,soastorealizethepredictionofthechangetrendofPM2.5concentrationlevelinthesurfaceatmosphere,soastoprovidescientificbasisforformulatingeffectiveairpollutionpreventionandcontrolmeasuresandimproveairquality.Keywords:PM2.5,ARIMAmodel,timeseries,forec目录302201概述 2245581.1课题研究的背景及意义 2128721.1.1PM2.5的来源和研究现状 342041.2本文主要研究内容和成果 399462ARIMA模型 3326862.1ARIMA模型定义 3217102.2ARIMA模型建立 4232432.2.1时间序列的获取 431122.2.2时间序列的预处理 4296332.2.3模型识别 4145542.2.4模型定阶 5269012.2.5参数估计 6164462.2.6模型的验证 640653.ARIMA模型实证分析 6152473.1数据的预处理 6232833.2平稳性检验。 7324993.2.1绘制序列时序图 741243.3模型识别 766793.4估计模型参数 798404.模型有效性检验与预测 798585.PM2.5变化影响因素分析 862865.1风速因素 8276045.2降雨量因素 8136225.3气温因素 843855.结论 94123参考文献 错误!未定义书签。27181致谢 错误!未定义书签。1概述1.1课题研究的背景及意义PM2.5是指大气中的细小颗粒物通过吸收太阳光,反射或散射降低大气的能见度,使得太阳辐射强度降低,同时PM2.5是雾霾制造者之一。建立有效的PM2.5浓度预测模型具有重要的现实意义,这种细颗粒被吸入肺部后,对我们的身体健康有很大的危害。实现PM2.5的准确预测有利于为制定有效的空气污染防治措施提供了科学依据,还有利于为我们的出行提供必要的科学指导。目前许多专家对PM2.5浓度水平进行了相关性研究,并且为我们提出了目前存在的相关问题以及一些改进方法。比如我们已有学者采用神经网络的方法对大气中PM2.5浓度水平进行了模拟和预测。由于神经网络模型的网络结构确定难度很大,过拟合等因素会影响模型的泛化能力,当利用ARIMA模型和神经网络模型分别对PM2.5进行预测,通过对比发现前者短期预测效果比后者好。ARIMA模型考虑序列的依存性和随机波动的干扰性,数据的类型不受限制,实用性非常强,短期预测效果很好。本研究收集盐城市地表大气PM2.5监测数据,以2016年7月1日至2017年6月30日的PM2.5小时浓度构造训练集,训练集用于建立ARIMA模型,并对建立的ARIMA模型进行数据的检验、参数的估计、模型的诊断,并且选择最优预测模型。以2017年7月1日至2017年12月31日的PM2.5小时浓度构造测试集,测试集用于检验最终选择最优的AIMA模型的性能,对未来一小时浓度进行预测,为人们出行提供科学依据。目前本研究发现我国大气污染水平逐年的好转,这是由于政府针对大气污染采取了一系列宏观的政策,例如政府加强了生态文明建设、加强了环境监督执法的力度等密不可分,使环境空气质量渐渐的有所好转。由于近年来国内学者们利用ARIMA模型在大气污染物水平预测中成功运用了。因此,本研究也基于ARIMA模型对地表大气PM2.5浓度变化趋势进行预测并评价模型效果,运用MATLAB软件对地表PM2.5浓度序列进行处理和建模,并且得出最优模型。应用该模型可以有效针对空气污染治理,并能提前得知未来一小时PM2.5污染状况,以便对提前对公众做出预警,使得他们能够合理安排出行计划。预测模型就是利用已经拥有的资料对未来数据进行预测,预测结果为其估值,也是理论值。本研究基于ARIMA模型对地表大气PM2.5进行预测也不例外。实际上PM2.5浓度水平会受到多种因素的综合影响,例如天气状况、其他污染物等。因此ARIMA模型只能进行短期的浓度预测,长期预测效果会很差,所以我们得出的ARIMA预测模型不能作为长期永久的预测工具。因此,我们应不断更新PM2.5浓度水平数据对ARIMA模型进行重新构建,才能为居民合理安排出行提供合理的科学依据,减少PM2.5对人群健康的影响。本研究参考了其他学者利用ARIMA模型预测效果,对未来的一小时PM2.5浓度水平进行预测,相信预测效果会较好。1.1.1PM2.5的来源和研究现状PM2.5的出处比较繁杂,既有天然出处亦有人为出处,此中人工排放为重要出处。天然污染源涵盖海盐、风扬尘土、植被花粉、真菌袍子等以及大自然内的各种灾患风波,像火山爆发形成的火山灰,森林大火,尘暴风波等往大气层排出的大批颗粒物。人类污染源主要出自煤炭、油等化石燃料的燃烧、汽车尾气的燃烧、粉尘及烟尘的排出、家用炉灶的燃烧、废弃物的燃烧、生物质(像桔梗、树叶、杂草等)的燃烧及道路扬尘和建筑物扬尘。除此以外,人类工作排出的空气内二氧化硫、氮氧化物、氨等气态污染物及挥发性有机物,亦可穿过化学反应或者物化流程产生粒径比较微小的二次粒子,涵盖硫酸盐、硝酸盐、铵盐及光化学烟雾。2011年12月21日,第七届全国环境保护大会于北京市举行。会中公布了PM2.5的监测时间表。2012年,北京市、天津、河北、长三角、珠三角等我国关键地带、直辖市及省会城市实施PM2.5监测。2013年,又在113个环境保护重点城市及环境保护榜样城市开展PM2.5监测。2015年,于全部地级之上城市实施PM2.5监测。2016年,全新规范于举国执行。全国各处依照标准条件对空气质量情况开展监测及评价,并且往社会发布监测结果。环境空气质量标准(GB3095-2012)已于2012年度2月29日公布,并且已在2016年度1月1日全面实施。本研究数据就是严格按照该标准。1.2本文主要研究内容和成果基于ARIAM模型的PM2.5地表浓度预测模型的整体思想是:先收集整理数据集PM2.5浓度水平,然后数据预处理,接着建立ARIMA模型,然后通过调整参数,得到最优组合,不断优化模型。本研究内容如下:第一部分探讨了用ARIAM模型实现PM2.5浓度预测研究的背景以及意义,分别阐述了ARIAM模型和PM2.5浓度的研究现状以及发展趋势。第二部分研究了ARIAM模型的建模理论。第三部分实证分析建立ARIAM模型,在给定盐城市市监测站空气质量数据的基础上利用MATLAB软件建立预测模型。先用训练集构建模型,再用测试集检验构建模型的精度,评价并分析构建的ARIMA模型。最后发现ARIAM模型的短期预测效果非常好,因为在本研究预测未来一小时的PM2.5浓度中,绝对平均离差小于十。长期预测因多种因素的综合影响效果极差。总之,ARIMA模型只适合预测短期。第四部分分析了为什么PM2.5在天冷时浓度高,在天热时浓度低。2ARIMA模型2.1ARIMA模型定义ARIMA模型分为3个部分,它们分别是AR、I、MA。AR的英文意思是auto

regression,中文意思是自回归模型;I的英文意思是integration,中文意思是单整阶数,MA的英文意思是movingaverage,中文意思是移动平均模型。计量模型的建立必须是平稳性的时间序列模型,因为ARIMA模型是时间序列模型,同理必须对时间序列模型即ARIMA模型做单位根检验,如果该时间序列是非平稳时间序列,消去局部水平或者趋势之后,该时间序列显示出一定的同质性,也就是说,此时时间序列的某些部分与其它部分非常相似。非平稳时间序列经过差分处理后可以转换为平稳时间序列,经过几次差分转化变为平稳序列,就称为几阶单整。如果是平稳序列,ARIMA模型的阶数I=0,此时ARIMA模型就相当于ARMA模型。所以说,ARIMA模型实际上就是AR模型和MA模型的组合。公式(2-1)其中,L表示滞后算子;Δd=(1-L)d,d为差分阶数;εt是方差σ2的白噪声过程。2.2ARIMA模型建立2.2.1时间序列的获取实验分析可以获取时间序列,相关部门的统计数据也可以获得,本研究的数据来源于盐城市市监测站,首先检查数据是否突兀,是否有缺失数据,弄明白数据突兀和缺失的原因。准确的数据是建立合理模型的第一步,也是正确分析的前提。2.2.2时间序列的预处理预处理时间序列涵盖两个方面:白噪声的检验和平稳性检验。平稳非白噪声序列是ARMA模型做时间序列预测的必要条件。所以我们必须对时间序列做平稳性检验。时段序列的平稳性一般而言采用时间序列图及有关图来检测。时序图形的特征为直观简易但误差较大,自相关函数图和偏自相关函数图繁杂但结局越加精确。本研究采用时序图形开展直观的断定又应用相关图形开展进一步的检测。对非平稳时间序列中若有提高或者降低趋向,规范要求开展差分处置之后开展平稳性检测直到稳定截止。此中,差分运用的次数为ARIMA(p,d,q)的阶数。原理中,差分次数愈多,时间序列讯息的非平稳确定性信息提取便愈充裕。但是进行一次差分操作全可以导致讯息遗失,应当防止过大的差分。2.2.3模型识别由我们知道的模型中选取一个和提交的时间序列流程相符合的模型就是模型识别的意思。基本原则如下表2-1。ACFPACF选择模型拖尾p阶截尾AR(p)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)表2-1基本原则2.2.4模型定阶本应该截尾的ACF或PACF依旧会呈现出小值震荡的状况,是因为范例具有随机性,范例的相关系数绝不会呈现出原理截至的精美状况。我们确立完模型的类别后,必须还要知晓模型的阶数,所以说模型的定阶存在艰难的情况。又因为平稳时间序列平常全拥有短期相关性,随之延误阶数k趋向无限,ACF和PACF全可以衰减至零值周边作小值浮动。模型定阶的经验方法:如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然[11]。这时,我们通常视为(偏)自相关系数截尾。截尾的阶数为d。95%的置信区间:公式(2-2)公式(2-3)样本自相关系数:公式(2-4)样本偏自相关系数:公式(2-5)2.2.5参数估计对模型的参数进行估计的方法通常有相关矩估计法、最小二乘估计以及极大似然估计等。本研究采用的是极大似然估计法。极大似然估计法的原则是在极大似然准则下,认为样本来自使该样本出现概率最大的总体。因此未知参数的极大似然估计就是使得似然函数(即联合密度函数)达到最大的参数值:公式(2-6)似然方程:公式(2-7)似然方程组实际上是由p+q+1个超越方程构成,通常需要经过复杂的迭代算法才能求出未知参数的极大似然估计值。极大似然估计法优点是极大似然估计充分应用了每一个观察值所提供的信息,因而它的估计精度高。同时还具有估计的一致性、渐近正态性和渐近有效性等许多优良的统计性质。缺点是需要假定总体分布。2.2.6模型的验证模型的验证主要是验证模型的拟合效果,如果模型完全或者基本解释了系统数掘的相关性,那么模型的噪声序列为白噪声序列,那么模型的验证也就是噪声序列的独立性检验。贝体的检验方法可利用Barlett定理构造检验统计量Q。如果求得的模型通不过经验,那么应该重新拟合模型,直至模型能通过自噪声检验。3.ARIMA模型实证分析以2016年7月1日至2017年6月30日的PM2.5小时浓度构造训练集,以2017年7月1日至2017年12月31日的PM2.5小时浓度构造测试集。以2016年7月1日至2017年6月30日中春季和冬季的PM2.5小时浓度构造一个ARIMA,并对测试集中的数据进行预测,然后与模型预测精度进行比较;以2016年7月1日至2017年6月30日中夏季和秋季的PM2.5小时浓度构造另一个ARIMA,并对测试集中的夏季和秋季的数据进行预测,然后与模型预测精度进行比较。3.1数据的预处理根据模型建立的过程,在建模之前首先我们先对异常数据进行预处理。异常数据包括缺失数据以及数据异常大异常小。这些都影响了预测模型精度。数据缺失是因为在监测浓度的过程中,由于监测设备损坏等导致,形成数据断档,其主要破坏了数据的连续性。数据异常大异常小表现为根时间前后监测到的数据异常不符有明显差异。解决的方法有估计、推测、线性插值等进行数据的处理。3.2平稳性检验。3.2.1绘制序列时序图根据空气质量数据绘制时序图如下图3-1所示:首先选取2016年7月1日至2017年6月30日PM2.5的日均浓度时间序列当作研究数据,我们用EXCLE软件画出这一年日均PM2.5浓度的时序图。通过图形大致分析出日均浓度序列为非平稳序列。并在MATLAB编程中加入单位根检验更加精确的检验平稳性。接着我们我们对PM2.5的日均浓度进行一阶差分处理观察其平稳性。一阶差分后序列是平稳的。一阶差分更加平稳,我们称之为弱平稳。3.3模型识别首先一阶差分后的数据利用MATLAB软件画出其自相关图和偏自相关图,其中滯后阶数选择√/365≈19,得到相关图结果,然后根据Box

-

Jenkins模型,并观察图3-2和图3-3的相关性质进行模型识别和定阶。由图3-4知,经过差分后序列的相关图具有很明显的拖尾性,所以将差分后的序列设定为AR-MA过程.首先,通过偏自相关图可以发现,1~2阶的相关系数均较显著,从第一阶开始自相关系数均在置信区域范围(95%的点都符合该规律)内波动,即一阶后截尾因此可以设定q=1。然后,由偏自相关图可以预估p=1,p=2综上,该文可对一阶差分后PM2.5浓度数据初步建立ARIMA(1,1,1)模型或者ARIMA(2,1,1)。3.4估计模型参数根据模型的初步建立,利用MATLAB软件进行的相应的参数估计,首先对(1,1,1)进行估计结果见图3-4。运用相同的方法对ARIMA(2,1,1)模型进行参数估计,如下图3-5所示。我们通过对比发现ARIMA(2,1,1)模型和ARIAM(1,1,1)模型的统计量和p值都非常小,都是非白噪声序列。我们通过程序运行结果绝对平均离差值发现ARIMA(1,1,1)模型的值更小,结果图也更加贴合。模型有效性检验与预测用训练集建立ARIMA(1,1,1)模型预测未来一小时,预测测试集得到的绝对平均离差值为9.2582,结果图很贴合,效果明显。预测集训练结果图如下图4-1所示。PM2.5变化影响因素分析ARIMA结果显示,在过去的两年中,PM2.5浓度经历了季节性波动,在寒冷时期较高,而在相应的温暖时期较低,本研究认为导致这种现象的原因主要是因为风速、气温、降雨量这些因素造成的。5.1风速因素风速为危害PM2.5浓度之一个主要要素,风速比较强有益于PM2.5的蔓延,故而可以减低PM2.5浓度,寒冷时即春冬季节的风速比较低会促进PM2.5微粒的聚集,故而PM2.5浓度可以偏高;温暖时即夏秋季节因为风速加速,PM2.5蔓延速率比较迅速,不易导致空气污染。5.2降雨量因素降雨有益于减低PM2.5浓度。水汽凝结,产生云雾及降雨,可以减弱部分太阳辐射及阻拦地板辐射。夏秋时令之中强降雨量给空气内PM2.5存在显著的去污功效,归因于中强降雨量可以冲刷大气内的细微颗粒物,故而清洁大气,恰恰相反春冬季节降雨量比较微小,甚至可以增加大气的湿度,PM2.5等细微颗粒可以和水汽组合,致使流通性减低,比较困难受到蔓延。5.3气温因素近地面气温较高时,大气

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论