应用时间序列分析论文应用统计_第1页
应用时间序列分析论文应用统计_第2页
应用时间序列分析论文应用统计_第3页
应用时间序列分析论文应用统计_第4页
应用时间序列分析论文应用统计_第5页
已阅读5页,还剩9页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用时间序列分析大作业姓 名: 陈叮学 号: 5061214012专业班级: 应用统计 18院 系: 信息工程学院数学系时 间: 2017/5/22题目:对苏格兰异性结婚数据的时序分析摘要:本文以苏格兰 1855年至 2015年异性结婚数据为研究对象,首先运用 R软件对 1855-2010年的结婚数据绘制时序图、自相关图和做差分进行相关分析,得出一阶差分后的数据是趋于平稳的,然后根据主观确定拟合模型为 ,)2(MA并运用 R软件里面的 函数进行模型的自动选择,得出().arimuto模型即 模型最优,故我们所选择的拟合模型 是最优)2,10(AIM2A )(的,最后运用 模型预测并进行预测残差检验,得出了苏格兰 2011-2015(年异性结婚数据的预测值(29200.45,28905.94,28905.94,28905.94,28905.94)与实际值(29135,30534,27547,28702,28020)相比,相差不大,这说明模型拟合较好,能反映数据的真实水平,而且残差检验也表明预测残差是平均值为 0且方差为常数的正态分布(服从零均值、方差不变的正态分布),这进一步说明 模型是可以)2(MA提供非常合适预测的模型。关键词:苏格兰; 函数; 函数;R 软件;预测()arimauto.()rim第 1 页 共 14 页二、数据来源本文的数据是 1855-2015年苏格兰的结婚数据(Marriages, Scotland, 1855 to 2015 ),数据可以从网上 (.uk/statistics-and-data/statistics/statistics-by-theme/vital-events/marriages-and-civil-partnerships/marriages-time-series-data)下载,数据见附件一。3、模型的定阶与确定3.1模型的定阶3.1.1序列预处理1首先,我们对苏格兰 1855年至 2010年的时间序列进行时序图和自相关分析,分析结果如图 和图 所示,程序见附录一。1855-2010一一一一一一一一一一一一一一一一一一1850 1900 1950 2000200003500050000图 苏格兰 1855年至 2010年异性结婚数据的时序图0 5 10 15 20-1.0LagACFSeries dataseries图 苏格兰 1855年至 2010年异性结婚数据的自相关图图 显示苏格兰的结婚数值的均值和方差变动很大,随着时间的增第 2 页 共 14 页加,具有明显的上升趋势,是典型的非平稳序列。图 显示该序列的自相关系数都超出了两倍标准误差,所以进一步证明了该序列是非平稳的。综上所述,该序列是非平稳序列。对于该非平稳时间序列,首先我们对数据进行 1阶差分处理,以便消除其具有的强烈的趋势性,来观察数据是否大致趋于平稳。因此得到的 1阶差分时间序列图如下:1855-2010一一一一一一一一一一一一一一一一一一一一一一一一1850 1900 1950 2000-1000005000图 苏格兰 1855年至 2010年异性结婚数据 1阶差分后的时序图从图 中我们可以看出,经过 1阶差分后,该序列的平均值和方差是大致平稳的,所以我们使用 ARMIA(p,1,d)模型是很合适的。通过一阶差分,我们去除了结婚数据的趋势部分,剩下了不规则部分。接下来我们可以检验不规则部分中邻项数数值是否具有相关性;如果有的话,可以帮助我们建立一个预测模型来预测苏格兰异性结婚数据的数值趋势。3.1.2平稳性检验由图 可以认为该序列一阶差分后,序列基本平稳,为了进一步判断其平稳性,考察差分序列的自相关图和偏自相关图,如图五和图六所示。图 自相关图显示延迟 2阶、3 阶、4 阶和 5阶时的自相关值超出了2倍标准差范围,但是其他在延迟 1-25阶的自相关系数都落入 2倍标准差范围以内,从而判断该序列有很强的短期相关性,是 2阶截尾,所以可以初步认为1阶差分后序列平稳。图 偏自相关图显示,在延迟 2阶和 4阶时的偏自相关系数超出了 2第 3 页 共 14 页倍标准差范围,从 lag4之后缩小至 0,是 4阶截尾,该序列趋于平稳。综上所述,我们可以认为该序列的一阶差分序列自相关图 2阶截尾和偏自相关图 4阶截尾。0 5 10 15 20 25-1.0LagACFSeries dataseriesdiff1图 该序列一阶差分后的自相关图5 10 15 20 25-0.3-0.10.1LagPartial ACFSeries dataseriesdiff1图 该序列一阶差分后的偏自相关图3.1.3纯随机性检验为了判断序列是否有分析价值,必须对序列进行纯随机性检验,即白噪声检验。如表 所示,P 值远远小于 0.05的临界值,因此, 拒绝原假设,即可以认定 1 阶差分后的序列是平稳非白噪声序列,需要建立模型来拟合该序列的变化趋势。表 纯随机性检验代码 Box.test(dataseriesdiff1,type=“Ljung-Box“,lag=30);Box-Ljung test第 4 页 共 14 页Data: Dataseriesdiff1X-squared=83.411 Df=30 P-value=6.313e-073.2模型确定3.2.1根据阶数确定模型由该序列一阶差分的自相关图和偏自相关图,知道自相关值在滞后 2阶之后为 0,且偏自相关值在滞后 4阶之后缩小至 0,那么意味着接下来的 ARIMA模型对于一阶时间序列有如下性质:1、 模型:即偏自相关值在滞后 4阶之后缩小至 0且自相关值缩(4,0)ARM小至 0,则是一个阶层 p=4自回归模型。2、 模型:即自相关图在滞后 2阶之后为 0且偏自相关图缩小至(,2)0,则是一个阶数 q=2的移动平均模型。3、 模型:即自相关图和偏自相关都缩小至 0,则是一个具有 p(p,)ARMq和 q大于 0的混合模型。接下来我们利用简单的原则来确定哪个模型是最好的:即我们认为具有最少参数的模型是最好的。 有 4个参数, 有 2个参数,而(,0)A(0,)ARM至少有两个变量。因此, 模型被认为是最好的模型。(,)ARMpq(,2)模型是二阶的移动平均模型,或者称作 。这个模型可以写作:02, ()(3.2.1)t12tttX移动平均模型通常用于建模一个时间序列,此序列具有邻项观测值之间短期的相关特征。直观地,可以很好理解 MA模型可以用来描述苏格兰异性结婚数据中的不规则部分。3.2.2运用 函数2自动选择模型().arimuto表 函数运行的结果().arimuto第 5 页 共 14 页代码 auto.arima(dataseries);Series: dataseries最优模型 (0,12)ARIMCoefficients:Ma1 Ma20.1022 -0.4311s.e 0.0763 0.0800sigma2 estimated as 4121992: log likelihood=-1399.62AIC=2805.24 AICc=2805.4 BIC=2814.37从表 中可以得出 模型最适合该序列,这与我们前面(0,12)ARIM通过主观确定的模型一样,这说明 非常适合拟合该序列。,3.3模型的参数检验对于 模型的参数估计问题,我们运用 函数来估计,估(0,12)ARIM()arim计结果如下:表 3.3.1 模型的参数检验(0,12)ARIM代码dataseriesarima=arima(dataseries,order=c(0,1,2);dataseriesarimaCall:arima(x = dataseries, order = c(0, 1, 2)Coefficients:Ma1 Ma2第 6 页 共 14 页续表:0.1022 -0.4311s.e. 0.0763 0.0800sigma2 estimated as 4068802: log likelihood = -1399.62, aic = 2805.24表 3.3.1显示, , 是比较显著地参数,所以模型的102.431.方程式确定为:3.3.1t 12.0.tt tX3.4模型预测以及预测误差的检验3.4.1 模型的预测预测就是要利用已观测到的样本值对序列在未来某个时刻的取值进行估计。为了对随机序列未来发展进行预测,我们对原序列进行短期(h=5)预测,并与实际值进行对比,观测预测效果,预测结果如下表 所示。表 运用 模型预测 2010-2015年的结婚数(0,12)ARIM据year Point Forecast 实际观测 值 Lo 80 Hi 80 Lo 95 Hi 952011 29200.45 29135 26615.40 31785.50 25246.95 33153.952012 28905.94 30534 25058.73 32753.16 23022.14 34789.752013 28905.94 27547 24685.64 33126.25 22451.54 35360.352014 28905.94 28702 24342.95 33468.94 21927.44 35884.442015 28905.94 28020 24024.26 33787.63 21440.05 36371.84表 显示预测值与实际值十分接近,这说明 模型的拟(012)ARIM, ,合效果非常好,很适合该时间序列的拟合。接下来,我们通过绘制预测图,直第 7 页 共 14 页观的看预测效果,预测图表明预测效果很好。Forecasts from ARIMA(0,1,2)1850 1900 1950 2000200003500050000图 预测图(,2)ARIM3.4.2预测误差的检验在指数平滑模型下,观测 ARIMA模型的预测误差是否是平均值为 0且方差为常数的正态分布(服从零均值、方差不变的正态分布)是个好主意,同时也要观测连续预测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论