时间序列ARIMA模型在R中的实现.docx

上传人：n*** IP属地：河南上传时间：2020-01-28 格式：DOCX 页数：12 大小：111.62KB 积分：20 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

J I A N G S U U N I V E R S I T Y江苏省餐饮业零售总额分析预测学校：江苏大学学院：财经学院班级：统计1201 组员：韩亚琼3120812015 马海燕3120812022 顾君颖3120812020 王培培3120812009 陆金龙3120812029 白卓3120812028完成时间：2014年12月13日星期六一、摘要二、引言三、数据分析原始数据的获取：本文所有的样本数据均来自江苏统计年鉴2014（/2014nj/nj14.htm）得到的样本数据参见表1：表1 按行业分社会消费品零售总额年份社会消费品零售总额批发和零售业餐饮业其他行业197884.797197999.1691.613.903.651980122.56114.354.723.491981134.7961982150.01138.875.495.651983169.12156.286.146.701984205.05188.807.618.641985262.57240.6910.4511.431986304.58279.2512.5312.801987360.74329.3115.8415.591988471.83432.0620.3319.441989509.56467.1122.4719.981990515.43472.7224.1718.541991578.12529.9427.8620.321992704.52644.6133.6426.271993967.77888.2444.7434.7919941359.611238.3071.4449.8719951741.921573.0195.2173.7019962080.441901.47135.6443.3319972300.612082.71167.9249.9919982453.842208.24192.5253.0819992649.562367.59227.5854.3920002908.462583.19269.5955.6920013233.352845.89326.7160.7620023656.573179.23410.8366.5220034194.503613.67510.9469.8820044892.184333.18496.1021.2220055735.505051.70583.0950.9120066706.195898.79678.8360.8920077985.907023.48810.5669.3820089905.108890.30826.1088.90200911484.1010312.81957.23106.40201013606.8012207.181147.99124.50201115988.3814320.871359.27146.30201218331.3016448.831588.08115.97201320796.5018694.851788.44139.98这里我们仅用到第三列数据，为了方便分析，我们将餐饮业零售总额序列命名为caterts。第一步序列的平稳性检验为判断一个序列是否平稳，我们主要通过时序图以及自相关图进行检验。对caterts做时序图，有图形发现有明显的指数趋势，序列非平稳，也可以初步发现江苏省的餐饮业零售总额逐年递增，尤其是在新世纪以后，人们的生活水平逐年提高，对餐饮业的贡献也增大：图1 caterts序列时序图因为原序列有明显的指数趋势，故先对数列进行对数变换得到新的数列 logcatets，序列图如下，具有明显的非线性增长趋势：图2 对数化后的时序图对具有明显线性趋势的数列常用的平稳化措施是差分，我们对logcaterts序列进行一阶差分得到新的数列difflogcaterts，时序图如下：图3 对数化和一阶差分后的时序图通过对时序图分析发现数列具有平稳性，为了方便分析，我们对difflogcaterts序列进行中心化处理，得到新的数列x。对x进行ADF检验（单位根检验）。R语言中有专门的fUnitRoots包，里面有urdftest功能，是专门进行序列的ADF单位根检验，通过R软件得到如下结果：Title:Augmented Dickey-Fuller Unit Root TestTest Results:Test regression none Call:lm(formula = z.diff z.lag.1 - 1 + z.diff.lag)Residuals: Min 1Q Median 3Q Max -0.224894 -0.051073 0.006261 0.043257 0.242110 Coefficients: Estimate Std. Error t value Pr(|t|) z.lag.1 -0.59259 0.19455 -3.046 0.0047 * z.diff.lag 0.02909 0.18067 0.161 0.8731 - Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 0.08821 on 31 degrees of freedom Multiple R-squared: 0.2853, Adjusted R-squared: 0.2392 F-statistic: 6.188 on 2 and 31 DF, p-value: 0.005481 Value of test-statistic is: -3.046 Critical values for test statistics: 1pct 5pct 10pct tau1 -2.62 -1.95 -1.61从结果可以看出ADF统计量为-3.046，在1%，5%，10%的置信水平下均拒绝原假设，认为序列x平稳。第二步模型的识别与定阶模型的识别与定阶主要是通过对序列的自相关和偏自相关观察得到的。通过R软件的到序列x的自相关和偏自相关图：图4 序列x的自相关图图5 序列x的偏自相关图通过自相关图和偏自相关图，可以发现序列x自相关明显拖尾，偏自相关有结尾的性质，在第十阶的时候，PACF超出了两倍的标准差，这可能是由于偶然因素引起的，可以考虑使用AR（1）和AR（11）模型，但是为了数据的完整性，尽量避免滞后期，可以考虑AR（1）模型。在R语言中有专门的forecast包，包里的auto.arima函数可以对序列模型进行智能识别建模。通过R语言的智能识别功能得到如下结果：Series: x ARIMA(1,0,0) with zero mean Coefficients: ar1 0.4126 s.e. 0.1512 sigma2 estimated as 0.006901: log likelihood=37.33 AIC=-70.65 AICc=-70.28 BIC=-67.54通过如剑的输出结果我们发现结果与我们预测的一样，均是AR（1）模型。得到的模型方程为：Xt=0.1426Xt-1+at第三步模型的适应性检验模型的适应性检验实质上就是检验残差序列at是否为白噪声序列。其中最主要的是at序列的独立性检验。通过R软件得到模型的残差序列的时序图（偏）自相关图：图6 残差序列的时序、自相关和偏自相关图通过对图形的观察，初步判断残差序列at为白噪声。R语言中的Box.test函数也可对残差序列进行白噪声检验。且得到的结果如下：LAG LB p1, 1 0.02128392 0.88400812, 2 0.08484764 0.95846353, 3 0.43750962 0.93238944, 4 0.69614605 0.95180335, 5 2.02913305 0.84509946, 6 2.03204959 0.91672757, 7 2.24882031 0.94479578, 8 2.45473056 0.96380859, 9 8.50017079 0.484629310, 10 10.92550151 0.363351511, 11 10.93987632 0.448313912, 12 13.84447905 0.3107497可以发现无论滞后几期，P值均大于0.05，所以接受原假设，认为残差序列通过纯随机性检验。故模型最终为ARIMA(1,0,0),即为AR（1）第四步模型参数的估计模型参数的估计主要有矩估计，最小二乘估计（ML估计），极大似然估，这里我们主要用的是最小二乘估计，估计的结果在第二步模型的识别中R语言智能建模中给出了，这里不做重复论述。模型的估计方程如下：Xt=0.1426Xt-1+at第五步模型的预测将模型的拟合值与模型的真实值进行画图对比，得到如下图：图7 拟合值真实值发现拟合值与真实值之间有一定差别，这是由于残差序列的存在，将拟合值与残差序列相加得到的结果与X序列作图，结果如下：图8 加上残差的拟合值真实值观察图8，可以发现拟合的特别好，所有的点都落在了真实值上。我们用拟合的有效模型进行短期预测，比如我们预测2014年、2015年、2016、2017年和2018年的餐饮业零售总额。先预测2014年、2015年、2016年、2017年和2018年的x，再预测餐饮业零售总额。在R语言中可以使用predict函数对序列进行预测，这里我们进行向前5步预测，得到点预测，区间预测。结果如下：$predTime Series:Start = 2014 End = 2018 Frequency = 1 1 -0.0254059516 -0.0104836538 -0.0043260335 -0.0017851186 -0.0007366213$seTime Series:Start = 2014 End = 2018 Frequency = 1 1 0.08307163 0.08986632 0.09097274 0.09115980 0.09119162利用公式XtZ2S.E.可以得到预测值的区间估计，点估计和区间估计具体结果如下：序列X20142015201620172018点预测值-0.0254060-0.0104837-0.004326-0.0017851-0.0007366下界值（L）-0.1882263-0.1866216-0.1826326-0.1804583-0.1794722上界值（U）0.13741440.16565430.17398050.17688810.1779990通过还原零均值、差分和对数变换，就可以得到江苏省餐饮业零售总额（caterts）2014到2015年的预测值：利用公式：logcaterts2014=X2014+logcaterts2013+mean（difflogcaterts）caterts2014=exp(logcaterts2014)得到江苏省2014年餐饮业的零售手总额预测值，以此类推，分别得到2015,2016,2017,2018年餐饮业零售总额的预测值。值得一体的是时间序列预测效果越好，则向前预测的阶数就越少。所以在该模型中预测最好的是2014年。caterts20142015201620172018点预测值2088.2452474.9672951.4233528.5564222.97值得一体的是时间序列预测效果越好，则向前预测的阶数就越少。所以在该模型中预测最好的是2014年。四、参考文献1 王振龙.应用时间序列分析M.北京：中国统计出版社，20102 Paul Teetor .R语言经典实例M. 北京：机械工业出版社，20133 Robert I.Kabacoff.R语言实战M.北京：人民邮电出版社，2013五、附录R语言代码：rcatering - read.table(E:catering.txt,header=F)caterts - ts(catering,start=1978,frequency=1) #数据时间序列化plot.ts(caterts,main=(CATERING),ylab=CATERING) #序列图logcaterts - log(caterts)difflogcaterts - diff(log(caterts) #对数差分plot(difflogcaterts, main=logged and diffed)x - scale(difflogcaterts,T,F) #零均值化acf(x,10) #自相关pacf(x,10) #偏自相关corr - acf(x,10)cov - acf(x,10,type = covariance) library(fUnitRoots) #ADF单位根检验urdfTest(x)library(forecast) #建模fit - auto.arima(x)fitresid - fit$residual #生成残差序列residplotForecastErrors(fit$residuals)# 白噪声检验Result=0LAG=0LB=0p=0 for(i in 1:12) Btest=Box.test(resid,type=Ljung-Box,lag=i) LAGi=i LBi=Btest$statistic pi=Btest$p.value Result=cbind(LAG,LB,p) Result #接受原假设，认为resid序列为白噪声#预测pre=predict(fit,n.ahead=5)preU=pre$pred + 1.96*pre$seL=pre$pred - 1.96*pre$sets.plot(x,pre$pred,col=1:2)lines(U,col=blue,lty=dashed)lines(L,col=blue,lty=dashed)plot(x,type=o)lines(fitted(fit),col=2,pch=7)points(fitted(fit),col=2,pch=7)plot(x,type=o)points(fitted(fit)+resid,col=blue,pch=20)# 预测20142015年x2014 - -0.0254059516+logcaterts36+mean(difflogcaterts)x2015 - -0.0104836538+x2014+mean(difflogcaterts)x2016 - -0.0043260335+x2015+mean(difflogcaterts)x2017 - -0.0017851186+x2016+mean(difflogcaterts)x20

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

时间序列ARIMA模型在R中的实现.docx

文档简介

温馨提示

最新文档

评论

时间序列ARIMA模型在R中的实现.docx

文档简介

温馨提示

最新文档

评论

相关文档