




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、标准文档文案大全姓名:陈叮学号: 5061214012专业班级:应用统计18院系:信息工程学院数学系时间: 2017/5/22应用时间序列分析大作业标准文档文案大全题目:对苏格兰异性结婚数据的时序分析摘要:本文以苏格兰1855年至2015年异性结婚数据为研究对象, 首先运用R软件 对1855-2010年的结婚数据绘制时序图、自相关图和做差分进行相关分析,得出 一阶差分后的数据是趋丁平稳的, 然后根据主观确定拟合模型为MA(2),并运用R软件里面的auto.arima ()函数进行模型的自动选择,得出ARIMA (0,1,2)模型即MA(2)模型最优,故我们所选择的拟合模型MA(2)是最优的,最
2、后运用MA(2)模 型预测并进行预测残差检验,得出了苏格兰2011-2015年异性结婚数据的预测值(29200.45 , 28905.94 , 28905.94 , 28905.94 , 28905.94)与实际值(29135,30534, 27547, 28702, 28020)相比,相差不大,这说明模型拟合较好,能反映 数据的真实水平而且残差检验也表明预测残差是平均值为 0且方差为常数的正态分布(服从零均值、方差不变的正态分布 ),这进一步说明MA(2)模型是可以提供E常合适预测的模型。关键词:苏格兰;arima()函数;auto.arima ()函数;R软件;预测标准文档文案大全二、数据
3、来源本文的数据是1855-2015年苏格兰的结婚数据(Marriages, Scotland, 1855 to 2015 ),数据可以从网上(.uk/statistics-and-data/statistics/statistics-by-theme/vital-events/marriages-and-civil-partnerships/marriages-time-series-data)下载,数据见附件一。三、模型的定阶与确定3.1模型的定阶3.1.1序列预处理1首先,我们对苏格兰1855年至2010年的时间序列进行时序图和自相关分析,
4、 分析结果如图和图所示,程序见附录一。1855-2010年苏格兰结婚数据的时序图图 苏格兰 1855年至 2010 年异性结婚数据的时序图185019001950时间2000标准文档文案大全Lag图 苏格兰 1855 年至 2010年异性结婚数据的自相关图图显示苏格兰的结婚数值的均值和方差变动很大,随着时间的增 加,具有明显的上升趋势,是典型的非平稳序列。图显示该序列的自相关系数都超出了两倍标准误差,所以进一步证明了该序歹0是非平稳的。综上所述,该序列是非平稳序列。对丁该非平稳时间序列,首先我们对数据进行1
5、阶差分处理,以便消除其具标准文档文案大全有的强烈的趋势性,来观察数据是否大致趋丁平稳。因此得到的1阶差分时间序 列图如下:从图中我们可以看出,经过1阶差分后,该序列的平均值和方差是 大致平稳的,所以我们使用ARMIA(p,1,d)模型是很合适的。通过一阶差分,我 们去除了结婚数据的趋势部分,剩下了不规则部分。接下来我们可以检验不规则 部分中邻项数数值是否具有相关性;如果有的话,可以帮助我们建立一个预测模 型来预测苏格兰异性结婚数据的数值趋势。3.1.2平稳性检验由图可以认为该序歹0一阶差分后,序歹0基本平稳,为了进一步判断 其平稳性,考察差分序歹0的自相关图和偏自相
6、关图,如图五和图六所小。图自相关图显示延迟2阶、3阶、4阶和5阶时的自相关值超出了2倍标准差范围,但是其他在延迟1-25阶的自相关系数都落入2倍标准差范围 以内,从而判断该序列有很强的短期相关性,是2阶截尾,所以可以初步认为1阶差分后序歹0平稳。图偏自相关图显示,在延迟2阶和4阶时的偏自相关系数超出了2倍标准差范围,从lag4之后缩小至0,是4阶截尾,该序歹0趋丁平稳。综上所述,我们可以认为该序列的一阶差分序列自相关图2阶截尾和偏自相关图4阶截尾。该序列一阶差分后的自相关图1855-2010年苏格兰一阶差分结婚数据的时序图图 苏格兰 1855年至 2
7、010年异性结婚数据 1阶差分后的时序图Oflu5Oflu5 O O 0081-0081-据数分差阶一Series dataseriesdiff1Lag图 标准文档文案大全为了判断序歹0是否有分析价值,必须对序歹0进行纯随机性检验,即白噪声检 验。如表所示,P值远远小丁0.05的临界值,因此,拒绝原假设,即 可以认定1阶差分后的序列是平稳非白噪声序列,需要建立模型来拟合该序列的 变化趋势。表纯随机性检验代码Box.test(dataseriesdiff1,type=Ljung-Box”,lag=30);Box-Ljung testData:Datase
8、riesdiff1X-squared=83.41P-value=6.313e-1=073.2模型确定3.2.1根据阶数确定模型由该序列一阶差分的自相关图和偏自相关图, 知道自相关值在滞后2阶之后 为0,且偏自相关值在滞后4阶之后缩小至0,那么意味着接下来的ARIMA莫型对 丁一阶时间序列有如下性质:1、ARMA(4,0)模型:即偏自相关值在滞后4阶之后缩小至0且自相关值缩 小至0,则是一个阶层p=4自回归模型。2、ARMA(0,2)模型:即自相关图在滞后2阶之后为0且偏自相关图缩小至0,则是一个阶数q=2的移动平均模型。3、ARMA(p, q)模型:即自相关图和偏自相关都缩小至0,则是一个具有
9、p和q大丁0的混合模型。接下来我们利用简单的原则来确定哪个模型是最好的:即我们认为具有最少参数的模型是最好的。ARMA(4,0)有4个参数,ARMA(0,2)有2个参数,而ARMA(p,q)至少有两个变量。因此,ARMA(0,2)模型被认为是最好的模型。ARMA(0,2)模型3.1.3图 纯随机性检验该序列一阶差分后的偏自相关图Series dataseriesdiffl10Lagi01030标准文档文案大全是二阶的移动平均模型,或者称作MA(2)。这个模型可以写作:Xt = !- 口1 E - -2 ;t N(3.2.1)移动平均模型通常用丁建模一个时间序列,此序列具有邻项观测
10、值之间短期的相 关特征。直观地,可以很好理解MA模型可以用来描述苏格兰异性结婚数据中的 不规则部分。3.2.2运用auto.arima()函数2自动选择模型表auto.arima()函数运行的结果代码auto.arima(dataseries);Series:dataseries最优模型ARIMA (0,1,2)Coefficients:Ma1Ma20.1022-0.4311s.e0.07630.0800sigmaA2 estimated as 4121992: log likelihood=-1399.62AIC=2805.24AICc=2805.4BIC=2814.37从表3
11、.2.1.1中可以得出ARIMA(0,1,2)模型最适合该序列,这与我们前面通过主观确定的模型一样,这说明ARIMA(0,1,2)非常适合拟合该序列。3.3模型的参数检验对丁ARIMA(0,1,2)模型的参数估计问题,我们运用arima()函数来估计,估计结果如下:表3.3.1ARIMA (0,1,2)模型的参数检验代dataseriesarima=arima(dataseries,order=c(0,1,2);dataseriesarima码Call:arima(x = dataseries, order = c(0, 1,2)Coefficients:Ma1Ma2续表:0.1022-0.4
12、311标准文档文案大全s.e.0.07630.0800sigmaA2 estimated as 4068802: log likelihood = -1399.62, aic = 2805.24表3.3.1显示, = 0.1022 , =-0.4311是比较显著地参数,所以模型的方 程式确定为:Xt= ;t-0.1022代-0.4311七模型预测以及预测误差的检验3.4.1模型的预测预测就是要利用已观测到的样本值对序列在未来某个时刻的取值进行估计。为了对随机序列未来发展进行预测,我们对原序列进行短期(h=5)预测,并与实际值进行对比,观测预测效果,预测结果如下表所
13、示。表运用ARIMA(0,1,2)模型预测2010-2015年的结婚数据yearPointForecast值Lo 80Hi 80Lo 95Hi 95201129200.452913526615.4031785.5025246.9533153.95201228905.943053425058.7332753.1623022.1434789.75201328905.942754724685.6433126.2522451.5435360.35201428905.942870224342.9533468.9421927.4435884.44201528905.942802024024.
14、2633787.6321440.0536371.84表显示预测值与实际值十分接近,这说明ARIMA (0,1,2)模型的拟合效果非常好,很适合该时间序列的拟合。接下来,我们通过绘制预测图,直观的 看预测效果,预测图表明预测效果很好。Forecasts from ARIMA(0,1,2)图ARIMA(0,1,2)预测图标准文档文案大全3.4.2预测误差的检验在指数平滑模型下,观测ARIMA莫型的预测误差是否是平均值为0且方差为 常数的正态分布(服从零均值、方差不变的正态分布)是个好主意,同时也要观测 连续预测误差是否自相关。表预测误差的纯随机性检验Box
15、.test(dataforecast$residuals,type=Ljung-Box,la g=30);Box-Ljung testdataforecast$residuals图预测误差的白相关图相关图显示出在滞后1-20阶中样本自相关值都没有超出显著边界,而且Ljung-Box检验的p值为0.7107,所以我们推断在滞后1-20阶中没有明显证据 说明预测误差是非零自相关的。为了调查预测误差是否是平均值为0且方差为常数的正态分布(服从零均值、方差不变的正态分布),我们可以做预测误差的时间曲线图和直方图:因此,把预测误差看作平均值为。方差为常数正态分布是合理。既然依次连续的预测误
16、差看起来不是相关, 而且看起来是平均值为0方差为 常数的正态分布,那么对丁苏格兰异性结婚数据,ARIMA(0,1,2)模型看起来是可 以提供非常合适预测的模型。代码Data:X-squared=42.036Df=30P-value=0.07107Series dataforecast$residuals10Lag602020Histogram of forecasterrors标准文档文案大全图预测误差的分布图Time图预测误差的时序图四、总结时间序列是指同一种现象在不同时间上的相继连续的观察值排列而成的一 组数字序列,时间序列分析相当重要,应用也相当广泛。本文的研
17、究对象是苏格兰异性之间的结婚数据, 经过建立模型,对模型预测, 选取最优模型。利用时间序列方法预测结婚数的未来变化做出改变。 本文就是通 过ARMIA莫型对苏格兰异性之间的结婚数据作了时间序列分析的, 并对其进行了 预测。从而能客观的看出苏格兰异性之间的结婚数据,有利丁政府做出决策。五、参考文献1 王燕.应用时间序列分析(第四版) M.北京:中国人民大学出版社,2005: 65-102.2 吴喜之,刘苗.时间序列分析 R软件陪同M.北京:机械工业出版社,2016: 66-67.六、附录时间序列分析的R程序data=read.csv(w.csv);datax=c(data$x);dataseri
18、es=ts(datax,freq=1,start=c(1855);plot(dataseries,xlab=时 间,ylab=结 婚 数 据,type=o,col=red,main=1855-2010年苏格兰结婚数据的时序图);acf(dataseries,lag.max=20,plot=TRUE);dataseriesdiff1=diff(dataseries);oflbloflbl O O1010I I 9 9. .0 0B-B- 5 58 8didi标准文档文案大全plot(dataseriesdiff1,xlab=时间,ylab=一阶差分数据,type=o,col=red,main=1855-2010年苏格兰一阶差分结婚数据的时序图);acf(dataseriesdiff1,lag.max=25,plot=TRUE);pacf(dataseriesdiff1,lag.max=25,plot=TRUE);Box.test(dataseriesdiff1,type=Ljung-Box,lag=30);auto.arima(dataseries);dataser
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黑龙江省哈尔滨市实验学校2025年八年级数学第二学期期末复习检测模拟试题含解析
- 信息处理技术员考试小技巧与试题及答案
- 软件设计师考试趋势分析与试题及答案
- 2025届北京市延庆区数学七下期末质量跟踪监视试题含解析
- 软件测试策略与方法总结试题及答案
- 移动应用用户体验设计考题试题及答案
- 机械设备行业保安工作计划
- 算法与数据结构2025年考试试题及答案
- 如何开展财务审计工作计划
- 信息科技行业安全防护总结计划
- 2025年财务会计师入职考试试题及答案
- 安徽省1号卷A10联盟2025届高三5月最后一卷地理试题及答案
- 仓库定置目视化管理
- 2025年5月12日陕西省公务员面试真题及答案解析
- 2025-2030中国海上风电行业市场深度调研及投资策略与投资前景研究报告
- 工程经济课件
- 变电站值班员-中级工考试模拟题及参考答案解析
- 2024年西双版纳州景洪市事业单位选调工作人员笔试真题
- 2025-2030中国活塞杆行业市场发展趋势与前景展望战略研究报告
- 浙江省绍兴市柯桥区2025年5月统考英语试题试卷含解析
- 健康理疗室管理制度
评论
0/150
提交评论