ARIMA模型预测_第1页
ARIMA模型预测_第2页
ARIMA模型预测_第3页
ARIMA模型预测_第4页
ARIMA模型预测_第5页
已阅读5页,还剩13页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ARIMA模型预测一、模型选择预测是重要的统计技术,对于领导层进行科学决策具有不可替代的支撑作用。常用的预测方法包括定性预测法、 传统时间序列预测(如移动平均预测、指 数平滑预测)、现代时间序列预测(如 ARIMA模型)、灰色预测(GM)、线性回 归预测、非线性曲线预测、马尔可夫预测等方法。综合考量方法简捷性、科学性原则,我选择 ARIMA模型预测、GM(1,1)模型 预测两种方法进行预测,并将结果相互比对,权衡取舍,从而选择最佳的预测结 果。二ARIMA模型预测(一)预测软件选择-R软件ARIMA模型预测,可实现的软件较多,如 SPSS SAS Eviews R等。使用R 软件建模预测的优点

2、是:第一,R是世最强大、最有前景的软件,已经成为美国 的主流。第二,R是免费软件。而SPSS SAS Eviews正版软件极为昂贵,盗版 存在侵权问题,可以引起法律纠纷。第三、R软件可以将程序保存为一个程序文件,略加修改便可用于其它数据的建模预测,便于方法的推广。(二)指标和数据指标是销售量(x),样本区间是1964-2013年,保存文本文件data.txt中。(三)预测的具体步骤1、准备工作(1)下载安装R软件目前最新版本是R3.1.2,发布日期是2014-10-31,下载地址是 /。我使用的是 R3.1.1。(2)把数据文件data.txt文件

3、复制 “我的文档”。(3) 把data.txt文件读入R软件,并起个名字。具体操作是:打开R软件, 输入(输入每一行后,回车):data=read.table("data.txt",header=T)我的文档是默认的工作目录,也可以修改自定义工作目录。data #查看数据回车表示执行。完成上面操作后,R窗口会显示:> T己七 table i r,:1比七比 tMt11 r h已a.dez=T)二X.11时66593219518010319662 5 60屮1甘斫5783351驻£74107二44214=笳纹(4)把销售额(x)转化为时间序列格式x=ts(x,

4、start=1964)结果:Tune Series:Start 1964End = 2013Frequency = 11】665&3leoio6256D57S337-5107442170044672577S3523666275650572731337092936B39565559062233225576235510106235"US)503352S0703935635550052知$35。790331BS67【37】51052111192956710356720951沪1S470359567748S&3367 562225严-494405534242、对x进行平稳性检

5、验ARMA模型的一个前提条件是,要求数列是平稳时间序列。所以,要先对数 列x进行平稳性检验。先做时间序列图:#后的提示语句是给自己看的,并不影响R运行0197019801990Time2000 2010nrrnranMH0X002从时间序列图可以看出,销售量x不具有上升的趋势,也不具有起降的趋势, 初步判断,销售量x是平稳时间序列。但观察时间序列图是不精确的,更严格的 办法是进行单位根检验。单位根检验是通行的检验数列平稳性的工具,常用的有ADF单位根检验、PP单位根检验和KPSS单位根检验三种方法。单位根检验的准备工作是,安装tseries程序包。安装方法:在联网状态下, 点菜单“ Packa

6、geIn stall packages,在弹出的对话框中,选择一个镜像,如 China(Beijing1,确定。然后弹出附加包列表,选择tseries,确定即可。安装完附加包后,执行下面操作:library(tseries)#加载 tseries 包adf.test(x)#ADF 检验pp.test(x) #PP 检验 kpss.test(x) #KPSS检验结果:Dickey-Full er Teaudat-a:xseDickey-Fuller 2-D4S3, Laa order 2, p-value 0*99alte工亡aLive hvcocheszs! srfitionaryPhilli

7、ps-Perron Unit Root Test口0 匸JE DiclceyFuller Z (elpha) = 43.575, Truncsticu 1己q pezameter = 3, p-value - 0.01alcernacive Jh#p匸电ezl白已 sraricnaTyKPSS Test for Level Stationaritytiara:xKPSS Level = 0.2026, T二二nc且t丄du lag parainet-er = lr p-value = 0.1上面分别给出了 ADF检验、PP检验和KPSS佥验的结果。其中,ADF检验显 示x是不平稳的(P值=0.

8、99>0.05),而PP检验和KPSS佥验则表明x是平稳时 间序列。再结合时间序列图的判断,我们认为 x是平稳时间序列,因而符合建立 ARMA模型的前提条件。3、选择模型做x的自相关图(左图)和偏自相关图(右图):acf(x) #做自相关图pacf(x) #做偏自相关图无论是自相关系数图(左),还是偏自相关系数图(右),都显著第4阶的系 数突破了虚线,表明相关性显著。因此,我们建立4阶AR模型,写作AR(4)。4、估计模型参数fit=arima(xse,order=c(4,0,0) #把估计结果取名为 fitfit #查看 fit PP检验的原假设是不平稳,P值=0.01,小于0.05,

9、拒绝原假设,表明序列是平稳的。 KPSS检验与PP检验和ADF检验不同,它的原假设是平稳的。P值=0.1,大于0.05,接受原假设,表明序列是平稳序列。Coefficient:arlarZar3iri 匸 ercep 匸0.0344 -0.0174 -0.2002 Q.45604079.31s.e Q.12390.117701303 0125100-01上面给出了 AR模型的回归系数的估计值,其中,截距为44079.31, 1到4阶自回归系数分别是 0.0344,-0.0174,-0.2002和0.4560。5、模型效果的检验模型效果的检验非常重要,因为只有通过检验,才证明是可靠、有效的模型,

10、 才能进行后续的预测分析。主要的检验工具有两个,一是对回归系数的显著性检验。四个自回归系数中, 第4个回归系数的T统计值=0.4560/0.1241=3.67,大于2,因此,通过了显著性 检验,表明确实存在四阶自相关。这与前面看自相关图和偏自相关系数图的结论 相吻合。第二个检验是残差的白噪声检验(Ljung-Box检验),这个最主要、最关键。 一般来说,只要通过了残差的白噪声检验,则表明模型是有效的。残差白噪声检验的R代码:tsdiag(fit)结果:ACF of Residualsp values for Ljung Box上边是残差的自相关图,图形显示,除了 0阶以外,各阶自相关系数都很小

11、,基本在0左右。表明残差中已经没有多少有用的信息, 残差是纯随机序列,即白 噪声。换个角度说,时间序列的有价值信息绝大部分都已经被模型提取了, 建模 获得了成功。下边是更为精确的Lju ng-Box检验结果,所有小圈都在虚线之上(虚线值为 0.05),表明在0.05的显著性水平上,各阶自相关系数和零的差别不显著,残差 为白噪声序列,模型效果优良。这与上面的残差的自相关图相吻合。6 ARIMA模型预测R软件代码:predict(fit,n.ahead=3)#预测下三年(2014-2016)的数值若想预测后五年,就把3改成5,依此类推。结果:SpredTime Series: 201End =Fr

12、equency - 11 il7£S402S3 45464.37pred即predict(预测)的前四个字母,下面是时间2014-2016,表明要预测2014-2016年三年的。结果在最后一行,2014年销售额预测值为61768.02, 2015 年为 36563.83,2016 年为 45464.87。(四)模型的再检验一用AIC准则寻找更优上面建模预测,通过的显著性检验和残差的白噪声检验,证明模型优良,可以进行预测。一般的预测报告就到此结束了。但考虑到预测对于企业家的决策重要,而决策的失误将会产生很大的不良后 果。因此,更严谨起见,我们建立了 24个可能的ARMA模型,一个一个比

13、较, 想看一看还有没有比前面我们建立的模型拟合效果更好的。挑选标准是国际通行的AIC准则。AIC是日本统计学家Akaike于1973年提出的。其基本思想是,变量越多, 一般来说模型的拟合优度会越高。但是我们又不能单纯地以拟合的准确度的衡量 模型的好坏,因为自变量的增多会导致未知参数的增多,而参数越多,参数估计的难度就越大,估计的精度也越差。因此,应该寻求在拟合优度和参数个数之间 的一个平衡,AIC达到最小时的模型被认为是最优的模型。这就是说,我们所建立的预测模型,经过Lju ng-Box检验,表明是优良的模型。但是,如果有好多模型通过检验,证明优良呢?这时,就可以比较AIC的大小,达到优中选优

14、的目的。统计界的经验表明,ARMA模型最常见的4阶之内。这样会产生24个ARMA 模型。分别是 AR(1)、AR(2)、AR(3)、AR(4)、MA(1)、MA(2)、MA(3) 、MA(4)、ARMA(1,1) 、 ARMA(2,1) 、ARMA3,1) 、ARMA(4,1) 、ARMA(1,2) 、ARMA(2,2) 、ARMA(3,2) 、 ARMA(4,2) 、ARMA(1,3) 、ARMA(2,3) 、ARMA(3,3) 、ARMA(4,3) 、ARMA(1,4) 、ARMA(2,4) 、ARMA(3,4) 、ARMA(4,4)。R 代码:fit=arima(x,c(1,0,0);f

15、it#ar(1)fit=arima(x,c(2,0,0);fit #ar(2)fit=arima(x,c(3,0,0);fit #ar(3)fit=arima(x,c(4,0,0);fit #ar(4)fit=arima(x,c(0,0,1);fit#ma(1)fit=arima(x,c(0,0,2);fit#ma(2)fit=arima(x,c(0,0,3);fit#ma(3)fit=arima(x,c(0,0,4);fit#ma(4)fit=arima(x,c(1,0,1);fit#arma(1,1)fit=arima(x,c(2,0,1);fit#arma(2,1)fit=arima(x

16、,c(3,0,1);fit#arma(3,1)fit=arima(x,c(4,0,1);fit#arma(4,1)fit=arima(x,c(1,0,2);fit#arma(1,2)fit=arima(x,c(2,0,2);fit#arma(2,2)fit=arima(x,c(3,0,2);fit#arma(3,2)fit=arima(x,c(4,0,2);fit#arma(4,2)fit=arima(x,c(1,0,3);fit#arma(1,3)fit=arima(x,c(2,0,3);fit#arma(2,3)fit=arima(x,c(3,0,3);fit#arma(3,3)fit=a

17、rima(x,c(4,0,3);fit#arma(4,3)fit=arima(x,c(1,0,4);fit #arma(1,4)fit=arima(x,c(2,0,4);fit #arma(2,4)fit=arima(x,c(3,0,4);fit #arma(3,4)fit=arima(x,c(4,0,4);fit #arma(4,4)结果计算出每个模型的AIC值,如下:AR(4):aic = 1151.31AR(1): aic = 1159.14AR(2): aic = 1161.08AR(3): aic = 1160.73MA(1): aic = 1159.13MA(2): aic = 1

18、161.05MA(3): aic =1160.06MA(4): aic =1151.49ARMA(1,1):aic =1155.99ARMA(2,1):aic = 1157.59ARMA(3,1):aic = 1154.97ARMA(4,1):aic = 1152.97ARMA(1,2):aic = 1156.66ARMA(2,2):aic = 1156.67ARMA(3,2):aic = 1155.4ARMA(4,2):aic = 1154.38ARMA(1,3):aic = 1155.68ARMA(2,3):aic = 1157.67ARMA(3,3):aic = 1156.19ARMA(

19、4,3):aic = 1153.55ARMA(1,4):aic = 1153.09ARMA(2,4):aic = 1155.29ARMA(3,4):aic = 1152.25ARMA(4,4):aic = 1153.63第一行是我们前面建立的四阶自回归模型 AR(4的AIC值,为1151.31。经一 一对比可以发现,所有其它模型的 AIC值都大于115.31。就是说,我们前面建立 的模型是所有可能模型中的最优模型。三、GM(1,1)预测(一) 方法简介灰色系统理论是由华中理工大学邓聚龙教授于 1982 年提出并加以发展的。 二十几年来,引起了不少国内外学者的关注,得到了长足的发展。目前,在我国

20、 已经成为社会、 经济、科学技术在等诸多领域进行预测、 决策、评估、规划控制、 系统分析与建模的重要方法之一。 而其精华在于GM(1,1)模型,GM(1,1)被广泛应 用于预测,并且预测效果很好,其使用限制条件是:原始数据单调,预测背景呈 现稳定发展趋势;其优势是:适用于观测数据较少的预测问题,算法简单易行, 预测精度相对较高。鉴于GM(1,1)预测适合于数据较少情况,我们选择2008-2013年的近期数据, 进行预测尝试。(二) R软件操作1、把脚本文件GM11.R和data2.txt复制到“我的文档”;2、R窗口输入命令:source("GM11.R")data2=re

21、ad.table("data2.txt",header=T)x=data2$xxGM11(x,length(x)+1) #预测后 1 期值预测结果:2014年销售量分别为28385.3。在R显示结果中,是x(0)的模拟 值的最后 1 个数。(三) 模型检验利用R软件进行操作处理结果显示如下:平均相对误差=22.11903%相对精度=77.88097%可见,GM(1,1)模型预测的误差较大,相对精度不高。 再进行后验差比值检验。2原始序列的方差:S1 =5970035633残差序列e的方差:s2 =192438750后验差比值为:C 值=S2/S1=0.7108341按照灰色

22、预测理论,C值大于0.65,表明GM(1,1)预测精度等级为:不合格 (标准见下表)。说明该模型的预测结果不太可靠。预测精度等汲杆>0®和合格屮esp徹强合格-<0. 65+j不合格门won孑山6丹小误差概率检验:R软件给出了小误差概率值,p= 4 / 6 = 0.6666667。属于(0.7,0.8, GM(1,1)模型预测精度等级为:勉强合格(标准见上表)。综合来看,对于我公司的数据,GM(1,1)模型效果并不理想。四简要结论前面用ARIMA模型和GM(1,1)模型,对我公司的销售量进行了预测。 检验表 明,GM(1,1)模型的精度较低,而 ARIMA模型则通过Lju

23、ng-Box检验,表明模型 优良。而且,我们进行了全方位的 24个模型的一一比对,发现我们建立的模型 在所有可能模型中最优。因而,建立重点参照 ARIMA模型的预测结果。作为统计人员,基于对统计工作的经验认识,明白任何预测,都是根据过往 的历史信息进行的。如果历史条件不变,预测结果可靠。一旦历史条件改变,则 预测结果不一定准确。而且,只要是预测,无论方法多么科学,分析多么严谨,都没有百分百的准 确,都会有预测误差。五进一步建议单变量时间预测,是依据单一变量一销售量的历史信息进行预测,并没有考 虑其它因素。结果仅具有参考意义。建议领导层根据自己的经验、销售部门根据其经验,尤其是对未来经济形势 的

24、变化特点,修正前面的预测结果,使预测结果更加完善。附录:GM( 1,1 )基本理论G表示Grey(灰),M表示Model (模型),前一个“ 1 ”表示一阶,后一个"1”表示一个 变量,GM(1, 1)则是一阶,一个变量的微分方程模型。给定等时间间隔的数据列,且设数据列单调:k,x(k)(1,xJ , (2,X2)(n,xjk表示时刻,将数据列记成:x(k) Xk表示t = k时刻某量的观测值,不妨设XkXk 1 ,k 1,2, ,n 1 ,(0) 0 0 0 0xX1 ,X2,X3Xnx(0)表示原始数据序列。比如:X(0)2.874, 3.278, 3.337, 3.390, 3

25、.697。对原始数据作一次累加生成:即令k(1)Xki 1(0)|Xik1,2, ,n得一次累加生成数序列为:(1)(1) (1)(1)XX1 ,X2 ,Xn在此,xk1)=2.874, 6.152, 9.489, 12.879, 16.558给定的原始数据序列 xk0)已经是单增序列,经一次累加后生成的累加数序列具有更强烈的单调性。我们知道指数序列是单调的,但是,单调序列却不一定是指数型的,不过强烈的单调序列可近似看做是指数的,即可用指数型曲线进行弥合。如果用指数曲线来弥合一次累加生成序列,那么,这条指数曲线一定是某个一阶线性常系数微分方程的满足某个初始条件的一条积分曲线 (1)dx(1)axudtX(1)XUat ueaa即(1)(0)uatuXXeaadx(7)其中a, u是待确定的未知参数,该微分方程中的导数可用差商近似表示。dt16dxx(1) k t x(1) klimdtt ott为时间间隔,将时间间隔t看做是单位时间间隔,并且认为时间被充分细化毫秒。微秒事实上只要单位时间内函数的增量相对很小,这个单位时间间隔也可以是日,月,年等。)此时有dxdt注意到一次累加生成数 x(t)在时刻t = k +1与t = k时的差为:x k 1 x(1) k x(0) k 1而()是在k, k+ 1上某一点取值,既然是近似,索性将dtdxdt的值取在点k+1,即dx(1)x(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论