时间序列分析学年论文.doc_第1页
时间序列分析学年论文.doc_第2页
时间序列分析学年论文.doc_第3页
时间序列分析学年论文.doc_第4页
时间序列分析学年论文.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

20112012学年09级统计学专业学年论文 题目 运用SAS对中国历年运动员获世界冠军数进行建模并作预报. 学生姓名 学 号 成绩 评语:指导教师日期运用SAS对历年中国运动员获世界冠军数进行建模并作预测摘要:本文通过选取1978年-2009年中国历年运动员获得金牌数,运用SAS统计软件进行处理分析,选取显著的系数,建立模型,对年我国2010以后运动员金牌数做出预测。关键字 SAS AR模型 参数估计 平稳时间序列1、引言 在自然现象和经济现象中,人们为了对某些事物或系统的运行规律探索其究竟,需要观测所要研究的某种现象,从而得到一定顺序的数据资料。通过分析这些数据资料,对事物或系统的未来发展进行预测或控制方法,称为时间系列分析。从统计学的内容来看,研究数据的统计方法就是时间序列分析。就此足以看到时间序列分析的重要性及其应用的广泛性。时间序列的统计解释是某项统计指标按时间顺序记录的指标值数列时间序列的统计意义是某一系统程序运行过程中的不用时间点的响应,是系统行为量化数据的有序 客观记录,反映了系统的结构特征和运行规律。随机时间序列分析就是利用数学的方法描述时间序列的构成因素,具体地说就是对影响时间序列的长期趋势、季节变动、循环波动进行预订和估计;进一步的,将它们从时间序列中分离后,对剩余的一项时间序列的随机波动进行分析和建模;从而实现对时间序列变化规律的认识,预测或控制未来行为。2、 SAS介绍 Statisticsl Analysisi System简称SAS,可以用来分析数据和编写报告。它是美国SAS研究所的产品,在国际上被誉为标准通用软件,在我国深受医学、农林、财经、社会科学、行政管理等众多领域的专业工作者的好评。 SAS采用积木式模型结构,其中的SAS/STAT模块是目前功能最强的多元统计分析程序集,可以作回归分析、聚类分析、判别分析、主成分分析、因子分析、典型相关分析、各种实验设计的方差分析、协方差分析以及时间序列分析。3、 平稳时间序列的基本概念 时间序列的统计特征函数,时间序列Xt,tZ是按时间次序排列的随机变量序列。对时间序列的研究通常情况下是通过统计特征函数进行的。 1) 均值函数 如果对任意tZ,EXt存在,则称函数 Mx(t)=EXt, tZ为时间序列Xt,tZ的均值。 如果对任意tZ,EXt存在,则称Xt,tZ为二阶矩时间序列有: 2) 自协方差函数 Cx(s,t)=E(Xs-Mx(s))(Xt-Mx(t), s,tZ. 3) 方差函数 Dx(t)=EXt-Mx(t)2,tZ. 4) 自相关函数 Rx(s,t)=E(XsXt), s,tZ. 二阶矩时间序列的协方差和相关函数一定存在,且有下列关系: Cx(s,t)=Rx(s,t)-Mx(s)Mx(t) , 特别的,当Xt的均值函数值 Mx(t)=0时,Cx(s,t)=Rx(s,t) . 均值函数 Mx(t)是时间序列Xt,tZ在时刻t的平均值,称为集平均。发差函数Dx(t)是时间序列在t时刻均值函数 Mx(t)的偏离程度。自协方差函数Cx(s,t)和自相关函数Rx(s,t)则反映时间序列在时刻s和t的线性相关程度。 下面介绍时间序列分析的重点对象平稳时间序列的概念。 平稳时间序列 如果一个时间序列Xt,tZ具有如下特征则称其为平稳时间序列:1) 在任意时刻tZ,Xt存在有限的方差,即Xt是一个二阶矩形时间序列; 2)在任意时刻tZ,Xt的均值函数Mx(t)=为与t无关的常数; 3)在任意时刻s,tZ,Xt的自协方差函数Cx(s,t)=t-s是时间差t-s的函数,及对任意s,tZ和kZ,Cx(s,t)=Cx(s+k,t+k)=t-s 。 很明显,平稳时间序列的统计特征主要是由其协方差函数刻画的,时间序列分析理论的一个重要特点就是利用自协方差函数研究平稳时间序列的统计性质。 4、 平稳性检验 平稳时间序列因为有很好的统计特征,所以便于研究。我们先检验所观测的样本是否具有平稳性,然后根据其平稳性来建立相适应的模型。平稳性检验中的以下二种方法 1)数据检验法 数据图检验是在t-Xt平面直角坐标系中将研究的试驾序列绘成连线图,观察其是否具有趋势性或周期性,若无明显的趋势性或周期性,其波动幅度也不大,就认为序列是平稳的。 2)自相关函数检验法 一个零均值平稳序列的自相关函数要么是结尾的,要么是拖尾的。因此,如果一个时间序列零均值化以后的自相关函数出现了缓慢衰减或周期性的衰减的情况,则说明序列可能存在某种趋势或周期性。5、 白噪声序列 如果序列彼此之间没有任何相依性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列,也称为白噪声序列。白噪声序列需要满足如下性质: 任取tt,有EXt=; 任取t,sT ,有 。表一 历年中国运动员获金牌数年份19781979198019811982198319841985金牌数41232513393746年份19861987198819891990199119921993金牌数26695482549389103年份19941995199619971998199920002001金牌数791027592839211090年份20022003200420052006200720082009金牌数110841011061411231201426. SAS分析及模型建立根据上表,运用如下SAS程序得到时序图。输入: data example2;input x ; t=intnx(year,01jan1978d,_n_-1);format t year4.; cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.312381 0.36407 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc gplot; plot x*t; symbol i=jion v=dot; run; 图一从上图可以看出存在奇异点。再输入程序: data example2;input x ;t=intnx(year,01jan1980d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.312381 0.36407 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc gplot; plot x*t; symbol i=jion v=dot; proc means; var x; run;得到 N 均值 标准差 最小值 最大值 - 30 0.1633056 0.0744381 0.0624960 0.3640700 - 因为均值为0.1633056, 标准差为0.0744381.根据置信区间公式(均值2*标准差,均值+2*标准差)得到置信区间 (0.014429, 0.312182)。显然,0.312381,0.36407 (0.014429, 0.312182),所以,0.312381,0.36407为奇异值。将其修正2*0.2360720.1633056=0.3088384.将修正后的数据再进行时序分析。由SAS输入:data example2;input x ;t=intnx(year,01jan1978d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc arima;identify var=x nlag=12 minic p=(0:5) q=(0:5);run;得到图2图2 AutocorrelationsLag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error0 0.0046802 1.00000 | |*| 01 0.0028140 0.60127 | . |* | 0.1825742 0.00070800 0.15128 | . |* . | 0.2396563 -0.0001373 -.02933 | . *| . | 0.2428184 -0.0010769 -.23011 | . *| . | 0.2429365 -0.0015647 -.33432 | . *| . | 0.2500966 -0.0012545 -.26804 | . *| . | 0.2645737 -0.0006004 -.12828 | . *| . | 0.2734758 -0.0000138 -.00295 | . | . | 0.2754749 0.00007075 0.01512 | . | . | 0.27547510 -0.0001650 -.03526 | . *| . | 0.27550311 -0.0005373 -.11480 | . *| . | 0.27565312 -0.0006276 -.13409 | . *| . | 0.277242 . marks two standard errors Partial AutocorrelationsLag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 1 0.60127 | . |* | 2 -0.32929 | *| . | 3 0.08389 | . |* . | 4 -0.34735 | *| . | 5 -0.00058 | . | . | 6 -0.08261 | . *| . | 7 0.06692 | . |* . | 8 -0.02765 | . *| . | 9 -0.11784 | . *| . | 10 -0.10132 | . *| . |11 -0.16195 | . *| . | 12 0.02434 | . | . | 修正后的自相关函数和偏自相关函数对数据进行平稳性检验由SAS输入:data example2;input x ;t=intnx(year,01jan1978d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc gplot;symbol i=joint v=none;plot x*t;run;得到图3图3由以上图形可以看出金牌数修正后的数据是平稳的。根据图4可以考虑建立AR(5)模型。 图4 Minimum Information CriterionLags MA 0 MA 1 MA 2 MA 3 MA 4 MA 5AR 0 -5.63808 -6.33592 -6.22679 -6.19669 -6.38506 -7.12205AR 1 -6.27622 -6.33676 -6.43043 -6.41702 -6.68033 -7.24621AR 2 -6.49859 -6.38843 -6.38887 -6.38811 -6.58229 -7.24494AR 3 -6.42686 -6.32627 -6.46201 -6.3864 -6.55773 -7.29697AR 4 -7.31525 -7.22557 -7.14565 -7.21716 -7.58271 -7.50121AR 5 -7.23622 -7.12611 -7.03709 -7.14579 -7.5927 -7.76424 Error series model: AR(9) Minimum Table Value: BIC(5,5) = -7.76424由SAS输入:data example2;input x ;t=intnx(year,01jan1978d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc arima;identify var=x nlag=12 minic p=(0:5) q=(0:5);estimate p=5;run;运行后得到图5图5 Conditional Least Squares Estimation Standard Approx Parameter Estimate Error t Value Pr |t| Lag MU 0.15311 0.01673 9.15 .0001 0 AR1,1 1.01641 0.21597 4.71 .0001 1 AR1,2 -0.81721 0.29979 -2.73 0.0118 2 AR1,3 0.71011 0.32900 2.16 0.0411 3 AR1,4 -0.57931 0.31352 -1.85 0.0770 4 AR1,5 0.11099 0.22942 0.48 0.6329 5 参数估计及检验由上图,我们可以看到-0.817210.05 , -0.5792131 |t| LagMU 0.16058 0.01204 13.34 Lag Square DF ChiSq -Autocorrelations-6 10.23 3 0.0167 0.470 -0.049 0.016 0.037 -0.156 -0.21512 13.57 9 0.1384 -0.116 -0.011 -0.029 -0.127 -0.168 -0.10118 15.91 15 0.3879 -0.098 -0.128 -0.015 0.013 -0.097 -0.03524 20.86 21 0.4678 0.159 0.097 -0.035 0.069 0.080 -0.040 AP(5)模型的残差白噪声检验 图7表明AR(5)模型拟合得非常好,我们利用此模型做预报。接着输入:data example2;input x ;t=intnx(year,01jan1980d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc arima;identify var=x nlag=12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论