时间序列ARIMA期末论文_第1页
时间序列ARIMA期末论文_第2页
时间序列ARIMA期末论文_第3页
时间序列ARIMA期末论文_第4页
时间序列ARIMA期末论文_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-.z.ARIMA模型在总人口预测中的应用【摘要】人口开展与社会经济的开展是密不可分的,研究我国总人口的开展,对我国人口数进展分析和预测,有利于及时控制人口的增长调节人口平衡,利于政府及时了解开展趋势并做出反响对策使我国人口开展步入安康的轨道。本文利用时间序列建模原理和思路,并结合软件对1962年——2014年我国年底总人口数据做分析和预测。找到对原始数据有着较好的拟合度和较高的预测精度的模型。利用此模型可对我国年底总人口进展合理的预测。【关键词】ARIMA建模总人口人口预测目录TOC\o"1-3"\u一、引言3TOC\o"1-3"\u1.1研究背景31.2研究现状4二、模型建立5TOC\o"1-3"\u2.1模型识别52.2模型的参数估计82.3模型的诊断102.模型的预测12模型的优缺点及推广133.1模型的优缺点133.2模型的推广13完毕语.............................................................14【参考文献】........................................................15附录...............................................................16引言1.1研究背景我国是世界上人口最多的国家,自1980年开场,年末中国大陆总人口就已经超过了10亿,并一直保持约占世界总人口的五分之一,亚洲人口的三分之一。中国人口的开展同中国社会的开展一样经过了漫长而曲折的道路。在世纪的进程中,目前我国进入了一个全新的时代,要想在21世纪——这个充满竞争与挑战的时代中变的富强、屹立于世界民族之林,实现我们的中国梦,这全取决于人。能否顺利解决人口现状等问题,是我国乃自世界共同面临的问题,由于地球的资源是有限的,它不可能无限制的容纳人口,当人口过多,会由于经济跟不上,工作岗位欠缺,医疗等水平缺乏,从而导致整个社会处于一种动乱之中;然而如果人口过少,又会由于人员缺乏,导致各方面人力资源缺乏,无法正常完成各项必须社会活动,这也会极大地限制一个国家的开展,因此,对人口的研究是具有相当的意义的。我国由于幅员广阔,民族众多,各民族开展水平不一,同时作为世界第一人口大国,我国的耕地面积却相对缺乏,因此我国每年都需要从国外大量进口粮食,由于过分依赖于进口这对我国的开展影响巨大,为此甚至有国外反华势力叫嚣只要断绝给中国供粮,三五年之内中国必定大乱。当然那只是敌对势力的一厢情愿与恶意诋毁,但我们自己却必须认识到在由于人口的问题而导致的一系列问题,关于人口问题我国必须重视,并根据其趋势做出反响对策。因此,认真分析我国当前人口现状,从中发现其变化的趋势,并对未来总人口进展短期预测,及时采取必要的政治及经济措施来解决人口开展问题,对树立未来的开展目标很有必要。总之,人口是构成社会的主体,在我国社会主义现代化建立中,人口问题始终是极为重要的问题,而人口问题的本质是开展问题。人口开展与社会经济的开展也是密不可分的。基于此,我们利用时间序列中的ARMA模型对我国人口进展预测,对人口的控制起到指导作用,有利于政府采取必要的政治及经济措施来进展调控。所以,对其进展分析和测试是非常有意义的工作。1.2研究现状在对人口问题的研究上,国内外学者做了相当多的工作。在国内程等利用自限模型对我国的人口增长进展了预测,认为中国在2010年-2019年人口数依次会缓慢增加,2016年突破14亿大关,且未来15年人口净增加量不会超过1亿;蒋慧基于多元统计模型对**人口增长进展了分析,得出了人口增长的综合因子,并提出了稳定人口增长的建议;丁明等运用相空间重构神经网络模型对我国人口增长进展预测,很好的解决了非线性的问题,为我国人口增长预测提供了一种新的方法;王保等,利用Logistic模型进展人口预测,并检验了2005年—2007年的数据误差,取得了理想的效果。在国外,Rosen利用Malthusian模型对人口进展研究,也取得了不错的成绩。本文基于时间序列在研究时间相关问题上的优势,以1949年-2014年的年末总人口数据,利用时间序列知识建模,找到适合人口增长的过程的时间序列模型〔模型识别〕,然后利用参数估计估计出模型的参数〔参数估计〕,再对模型进展诊断,判断模型的好坏〔模型诊断〕,最后利用已经建立的模型对未来的给定的时间进展预测〔预测〕。C:\Users\Administrator\Desktop\研一时间序列期末论文\javascript:__doLinkPostBack('','ss~~AR模型建立2.1模型识别首先需要对数据进展预先的处理,观察其时间序列图是否为平稳序列,可以用R软件完成〔具体程序见于附录1〕,可得到时间序列图为:C:\Users\Administrator\Desktop\研一时间序列期末论文\javascript:__doLinkPostBack('','ss~~AR图1:人口时间序列图由图一可以看出,年底总人口数随着时间增加的同时也在逐年上涨,有着明显的上升趋势。因此可得出这列数据是不平稳的、方差也是不平稳的结论。并且数据大致是呈线性变化的,因此可以考虑做差分变换。先对数据做一阶差分变换后再观察序列是否平稳,可运用R软件编程得其变换后的序列及变换后序列的自相关图和偏自相关图(具体程序见附录2):图二:一阶差分序列图及其ACF、PACF图由图二可知,对原始数据在进展一阶差分之后的时间序列图显示并不算平稳,并且一阶差分后的ACF图仍呈现出近似直线下降趋势,因此可以考虑再做一次差分运算。通过编程可以得到〔具体程序见附录3〕:图三:对数二阶差分序列图及其ACF、PACF图再观察其二阶差分后的时间序列图,根本上趋于平稳,而其自相关图(ACF)和偏自相关图〔PACF〕呈现出明显的拖尾形式,且PACF图在滞后6阶比拟显著,ACF在滞后1,3,6阶相对较显著,由此可以认为原序列根本上可以用ARIMA(1,2,1),ARIMA(1,2,2),ARIMA(1,2,3),进展拟合。对ARIMA(1,2,1)模型序列满足:QUOTE=1\*GB3①由=1\*GB3①式可以得到:QUOTE=2\*GB3②同理可以得到ARIMA(1,2,2)模型:QUOTE=3\*GB3③ARIMA(1,2,3)的模型为:QUOTE=4\*GB3④2.2模型的参数估计根据2.1节,已经找到几个可能用于拟合的模型,分别为ARIMA(1,2,1),ARIMA(1,2,2),ARIMA(1,2,3),则接下来就应该对其进展参数估计,在对模型进展参数估计时有多种方法可以选择,这里选择用最小二乘估计,通过R编程序可以得到如下结果〔具体程序见于附录4〕:Call:arima(*=*,order=c(1,2,1),method="CSS")Coefficients:ar1ma1-0.47940.5150s.e.0.10330.1901sigma^2estimatedas21752:partloglikelihood=-327.05Call:arima(*=*,order=c(1,2,2),method="CSS")Coefficients:ar1ma1ma2-0.52160.8442-0.3147s.e.0.00090.09120.1014sigma^2estimatedas16939:partloglikelihood=-320.67Call:arima(*=*,order=c(1,2,3),method="CSS")Coefficients:ar1ma1ma2ma3-0.52030.7646-0.11110.3405s.e.0.00080.13270.14350.1278sigma^2estimatedas15191:partloglikelihood=-317.89由上面的输出可以确定在=2\*GB3②式中的系数,并且由估计值的误差项判断该系数是否显著〔通过判定在0是否在区间QUOTE内,假设在则系数不显著,如不在则显著〕。从而代入=2\*GB3②可以确定ARIMA(1,2,1)模型为:QUOTE=5\*GB3⑤类似代入=3\*GB3③式得ARIMA(1,2,2)表达式为:QUOTE=6\*GB3⑥代入=4\*GB3④式得ARIMA(1,2,3)模型的表达式:QUOTE=7\*GB3⑦2.3模型的诊断在对模型完成了识别和参数估计之后,需要对模型进展诊断,诊断模型是否具有对原时间序列数据的很好的拟合效果。主要进展拟合模型的残差分析和分析过度参数化;对模型进展过度参数分析主要看在进展差分时是否出现过度差分的状况,而对残差进展分析主要需要做以下几个方面的工作:=1\*GB2⑴,检验残差是否是随机的,一个模型如果能很好的拟合,则拟合后的残差根本上是随机的,残差是应该围绕在*条平行于*=0这一条直线上下波动的,并且波动的幅度不会很大,这可以用做残差序列图观察得到;=2\*GB2⑵,检验残差是否呈正态性,一个模型如果能很好的拟合,则其残差应该是呈正态性的,这里用残差QQ图和S-W正态性检验〔原假设为:QUOTE〕进展;=3\*GB2⑶,判断残差之间是否是相互独立的,一个模型如果能很好的拟合,则其残差之间相对是比拟独立的,这里主要用残差的自相关序列图和L-B检验〔原假设为:QUOTE〕进展。诊断ARIMA(1,2,1)模型,用R软件编程序〔具体程序见于附录5〕输出为:图4:ARIMA(1,2,1)模型残差的序列图、ACF图和QQ图Shapiro-WilknormalitytestW=0.93417,p-value=0.00592Bo*-Ljungtest*-squared=23.846,df=23,p-value=0.4124由图4中的残差序列图可以看出残差根本根本上是围绕*=0这条直线上下波动的,因此可以认为ARIMA(1,2,1)模型拟合满足残差是随机的条件;又由图4中的QQ可以看出残差根本上是集中在一条直线上的,由S-W检验的的p=0.00592<0.05,检验也可以认为残差是非正态的;又在残差的自相关图中,只有滞后二阶是是显著的,因此可以认为残差之间根本上也是不相关的,特别由B-L检验的p=0.4121>0.05,因此没有充分的理由拒绝原假设,应该认为残差是相互独立的。到此就已经对模型行进展了诊断,由于残差正态性缺乏,说明用ARIMA(1,2,1)模型拟合原数据不是十分适宜。同理可对ARIMA(1,2,2)和ARIMA(1,2,3),进展诊断,这里图形和数据检验就不再一一呈现在论文中。在诊断中发现模型ARIMA(1,2,2)用于拟合是满足条件的,而ARIMA(1,2,3)模型也由于残差正态性缺乏而不适合用于拟合合。因此在对人口模型进展预测时采用ARIMA(1,2,1)模型。并且在进展参数冗余分析时发现,对于该时间序列用ARIMA(1,2,2)模型拟合后,对ARIMA(p,d,q)中p,d,q任意一个变小都不能再满足条件,因此用ARIMA(1,2,2)模型是适合且简化的,因此后文选用ARIMA(1,2,2)模型进展预测。2.4模型预测由2.1,2.2,2.3三节已经完成了对模型的识别、参数估计和模型诊断,现在就需要运用该模型对原时间序列趋势进展预测。在实际情况中,过去的状态已经是即成的事实,我们关心的更多的是未来是什么状态,从而就可以判断在目前的情况未来的情况,进而可以进展相应的措施予以应对。这里假设对未来5年进展预测,编QUOTE得到〔具体程序见附录6〕:TimeSeries:Start=2015End=2019Frequency=1[1]137487.2138208.4138936.0139666.2140397.4TimeSeries:Start=2015End=2019Frequency=1[1]162.5725305.4282518.2338796.22561129.1609由上输出,可知由模型ARIMA(3,2,6)预测的2015年-2019年年末总人口数分别为:137487.2,138208.4,138936.0,139666.2,140397.4〔单位:万人〕。并且还可以对人口数进展区间估计,在此就不列出。模型优缺点及推广3.1模型优缺点优点:ARIMA模型在对许多时间序列都适用,并且在建模过程中有多种方法可以选择,并且在模型的诊断中能过对模型的好坏进展评价,对预测起到很好的作用。缺点:ARIMA模型对数据进展预测时,对短期预测效果还是比拟好的,但随着时间的延长,其预测误差就比拟大了。3.2模型的推广ARIMA模型对大多以时间为变量的趋势都有比拟好的拟合效果,可广泛运用于气温、股票、降水量、商品价格等的研究之中。完毕语人口问题是人类社会伴随始终的问题,在新中国成立之初,由于对人口问题的认识缺乏,导致我国大量的人员过剩,从而影响到后面几十年的开展,给教育、医疗社会带来了巨大的压力,即便后来在意识到问题的严重性后,在方案生育政策下,人口得到了有效的控制,然而由于人口基数过大,人们传统观念的根深蒂固,我国人口还是处于不断增长的时期,最近几年又由于伴随着人口老龄化情况加剧,社会经济压力又有了很大的压力,这对我国的经济在一定程度上有着不良影响,慢慢政府在对方案生育问题上又有了一定放松,在一定条件下允许第二胎。这一系列的重大举措反响了当代人对人口问题的重视。本文对未来几年利用模型进展了预测,对政策是一定的补充说明。论文完毕之际,在此向各位教师表示感谢,对在相关领域做出奉献的学者表示感谢。参考文献:[1]程华,高孝成,幺焕民"我国人口增长预测问题的自限模型",[J],**师*大学自然科学学报,2009年,第25卷第3期:34-36[2]蒋慧萍,"基于多元统计模型的**人口增长分析",[J],企业科技与开展,2010年,第10期:190-192[3]丁明磊,杨晓娜,曹连海"相位空间重构神经网络模型在我国人口增长预测中的应用",[J],华北水利水电学院学报,2008年6月,第29卷第3期:95-98[4]王保学,蔡果兰,"Logistic模型的参数估计及人口预测"[J],工商大学学报〔自然科学版〕,2009年11月,第27卷第6期:75-79[5]RosenF,"Theprincipleofpopulationaspoliticaltheory:Godwin'sOfpopulationandtheMalthusiancontroversy",[J],JournalOfTheHistoryOfIdeas[JHistIdeas]1970Jan-Mar;Vol.31(1),pp.33-48.[6]潘红宇等译,"时间序列分析及应用"[M],机械工业,2011年1月[7]薛毅,陈丽萍,"统计建模与R软件〔下册〕"[M],清华大学附录1、做时间序列的序列图plot(*)2、做序列的一阶差分时间按序列图及处理后的ACF图,PACF图程序:mydata<-read.table("C:/Users/Administrator/Desktop/shuju.t*t",header=T)*<-ts(mydata,frequency=1,start=1962)par(mfrow=c(3,1))plot(*)plot(diff(*,difference=1))#做差分后的时间序列图acf(diff(*,difference=1),ci.type='ma')#做差分后的自相关图pacf(diff(*,difference=1))#做差分后的偏自相关图3、做序列的二阶差分时间按序列图及处理后的ACF图,PACF图程序:mydata<-read.table("C:/Users/Administrator/Desktop/shuju.t*t",header=T)*<-ts(mydata,frequency=1,start=1962)par(mfrow=c(3,1))plot(diff(*,difference=2))#做差分后的时间序列图acf(diff(*,difference=2),ci.type='ma')#做差分后的自相关图pacf(diff(*,difference=2))#做差分后的偏自相关图4、估计模型中的参数程序:mydata<-read.table("C:/Users/Administrator/Desktop/shuju.t*t",header=T)*<-ts(mydata,frequency=1,start=1962)arima(*,order=c(1,2,1),method="CSS")#CSS代表条件最小二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论