时间序列分析方法及应用7.doc_第1页
时间序列分析方法及应用7.doc_第2页
时间序列分析方法及应用7.doc_第3页
时间序列分析方法及应用7.doc_第4页
时间序列分析方法及应用7.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

青海民族大学毕业论文论文题目:时间序列分析方法及应用以青海省GDP增长为例研究学生姓名: 学号: 指导教师: 职称: 院 系: 数学与统计学院 专业班级: 统计学 二 一五 年 月 日26时间序列分析方法及应用 以青海省GDP增长为例研究摘要:人们的一切活动,其根本目的无不在于认识和改造世界,让自己的生活过得更理想。时间序列是指同一空间、不同时间点上某一现象的相同统计指标的不同数值,按时间先后顺序形成的一组动态序列。时间序列分析则是指通过时间序列的历史数据,揭示现象随时间变化的规律,并基于这种规律,对未来此现象做较为有效的延伸及预测。时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界的目的。而且运用时间序列模型还可以预测和控制现象的未来行为,由于时间序列数据之间的相关关系(即历史数据对未来的发展有一定的影响),修正或重新设计系统以达到利用和改造客观的目的。从统计学的内容来看,统计所研究和处理的是一批有“实际背景”的数据,尽管数据的背景和类型各不相同,但从数据的形成来看,无非是横截面数据和纵截面数据两类。本论文主要研究纵截面数据,它反映的是现象以及现象之间的关系发展变化规律性。在取得一组观测数据之后,首先要判断它的平稳性,通过平稳性检验,可以把时间序列分为平稳序列和非平稳序列两大类。主要采用的统计方法是时间序列分析,主要运用的数学软件为Eviews软件。大学四年在青海省上学,基于此,对青海省的GDP十分关注。本论文关于对1978年到2014年以来的中国的青海省GDP(总共37个数据)进行时间序列分析,并且对未来的三年中国的青海省GDP进行较为有效的预测。希望对青海省的发展有所贡献。关键词: 青海省GDP 时间序列 白噪声 预测Abstract: All activities of people,its fundamental purposeistounderstand and transform the world,let yourlife moreideal.The timesequenceisthe samein differentnumerical statistical indicatorsrefer to the samespace,different time points ofa certain phenomenon,according toa set of dynamictime seriessequenceformation.Time series analysisisthrough the time series of historical data,to reveal the rulesof change over time,and based on thisrule,extensionand forecastfor the futureof this phenomenonis moreeffective.Development and changes oftime seriesanalysis can not onlyreveal aphenomenonfrom the quantityordescribe theintrinsic relationshipbetweenaregularphenomenon andother phenomenafrom the dynamic point of view,to achievethe purpose ofunderstandingthe objective world.Andthe application of time seriesmodel canpredict and controlthe future behavior ofthe phenomenon,the relationship betweenthe time seriesdata(historicaldata have a certain impact on thefuture development),modified or redesign of the systemto achieve theobjectivetouse and transformation.From a statisticalpoint of view,the statisticalresearch andtreatmentis a group ofbackgrounddata,although the background and thedata typeof each are not identical,but from thedata to form the point of view,it isthe cross section data andcross sectiondataof two.This paper mainlystudy on thelongitudinal section data,which reflects theregularity of development and changes inthe relationship betweenphenomenon andthe.After obtaininga set of observed data,we must first determine thestabilityof it,through the stationary test,thetime series intostationary andnon-stationary seriestwo categories.The main statistical methods is the time series analysis,mathematical softwareis mainly usedfor Eviews software.The University for four yearsin Qinghai province schoolin Qinghai Province,based on this,theGDPis very concerned about the.This thesisaboutsince 2014in Chinas Qinghai Provinceon1978GDP(a total of37 data)for time seriesanalysisandpredictionis moreeffectivein the future three years ofQinghai province of ChinaGDP.I hope it can be helpful tothe development of Qinghai province.Keywords: Qinghai province GDP, Time series analysis, White nose, Forecast目录一 时间序列模型的建立.41.1 含义.41.2 主要分类.51.3 分析工具.51.4时间序列的基本样式 .51.5模型简介.61.6格林函数.71.7非平稳时间序列平稳化处理.8二 时间序列模型的识别.10三 时间序列的试题应用.12四 时间序列的特性分析.13五 模型识别与建立.16六 模型的参数估计.16七 模型检验.17八 模型预测.17九 建议与对策.18参考文献.18背景: 在经济学中,常用GDP和GNI(国民生产总值,gross national income)共同来衡量该国或地区的经济发展综合水平通用的指标。这也是目前各个国家和地区常采用的衡量手段。GDP是宏观经济中最受关注的经济统计数字。GDP反映的是国民经济各部门的增加值的总额。它是指一个国家或地区所有常住单位在一定时期内 生产活动的最终成果。这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中,为评价和衡量国家经济状况、经济增长趋势及社会财富的经济变现提供了一个最为综合的尺度,可以说,它是影响经济生活乃至社会生活的最重要的经济指标之一。80年代以来,中国经济的迅速发展引起了全世界的震惊与关注,青海省也得以发展,本论文基于此,利用时间序列对青海省以往的GDP数据进行分析并预测未来三年中国的青海省的GDP的值。正文:一 时间序列模型的建立 1.1含义 从统计意义上讲,时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。 从数学意义上讲,对某一过程中的某一变量或一组变量Xt进行观测测量,在一系列时刻t1,t2,tN,(t为自变量,且t1 t2 tN)得到的离散有序数集合X1,X2,Xi,XN称为离散数字时间序列,、即随机过程的一次样本实现,也就是一个时间序列。 从系统意义上讲,不仅指出时间序列是按一定顺序排列而成的,这里的“一定顺序”既可以指时间序列,也可以是具有各种不同意义的物理量。1.2主要分类 按所研究的对象的多少分,有一元时间序列和多元时间序列。 按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。 按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。 按序列的分布规律来分,有高斯型时间序列和非高斯型时间序列。1.3分析工具 常用的时间序列分析软件有SAS、S-plus、R软件、Eviews、Gauss、SPSS、Matlab、SCA、马克威和其他几种国外常用软件。在实例分析中使用的是Eviews软件。Eviews是当今世界上最流行的计量经济学软件之一,是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。 Eviews能够处理以时间序列为主的多种类型的数据,进行包括描述统计、回归统计、传统时间序列分析等基本的数据分析以及建立条件异方差、向量自回归模型等复杂的计量经济模型。Eviews不仅能处理经济领域的时间序列数据,还能处理相当大型的非时间序列(截面数据),广泛应用于自然科学、社会科学、人文科学等领域的定量分析。1.4时间序列的基本样式时间序列的数据有各种样式,根据数据的特征,可将其分为两大类:一类是平稳时间序列,基本样式是白噪声时间序列:另一类为非平稳时间序列,根据其具体的数据特征,其基本样式包括趋势性时间序列、季节性、条件异方差和异常观测值等。平稳时间序列是通过对各时刻观测值之间的依存关系进行定量描述,通过对序列本身变化规律的研究预测未来的变化。当一个时间序列满足两个条件时 ,我们称该序列是平稳的 E()=,t=1,2.,T E()()= t=1,2,.T且k=-2,-1,0,1,2,其中,0为常数。白噪声是典型的平稳时间序列,如果时刻t以前的信息不能对时刻t的值Xt提供任何信息,并且如果对Xn+h的最好预测值或期望值都等于0,那么这样的时间序列就是白噪声时间序列。 时间序列模型大致可以分为自回归模型和移动平均模型两大类。自回归模型以其滞后变量为依据,推算其未来值;移动平均模型是以过去的误差项为依据,推算其未来值。有时,需要这两类模型结合起来,于是,产生了自回归移动平均模型。1.5模型简介 自回归模型(AR模型) Xt1Xt2Xt-2nXt-n =at 当n=1时,上述模型为一阶自回归模型,AR(1)模型的特例是游动随机模型 AR(n)模型假设: at 是白噪声,且正态 (atN(0,) Xt与Xt-j(j=n+1,n+2,)互不相关 AR(n)系统的响应Xt具有n阶动态性,AR(n)模型通过把Xt 中的依赖于Xt-1,Xt-2,Xt-n,的部分消除掉之后,使得具有n阶动态性的序列Xt转化为独立的序列at。因此,拟合AR(n)模型的过程也就是使相关序列独立化的过程。 移动平均模型(MA模型) Xt =at-1at-1-2at-2-mat-m当n=1时,上述模型为一阶移动平均模型 MA(m)模型假设: Xt仅与at-1, at-2,at-m有关,与at-j(j=m+1,m+2,)无关 at是白噪声Xt由m+1个部分组成:第一部分是依赖于at-1的部分,用-1at-1表示;第二部分是依赖于at-2的部分,用-2at-2表示,第m部分依赖于at-m的部分,用-mat-m表示,第m+1部分则是独立于前m部分的at。自回归移动平均模型(ARMA模型) 一个系统,如果它在时刻t的响应Xt,不仅与其以前时刻的自身值有关,而且还与其以前时刻进入系统的扰动存在一定的依存关系,那么这个系统就是自回归移动平均系统,相应的模型记作ARMA。ARMA(2,1)模型从模型中看出,ARMA(2,1)模型把Xt分解成了独立的四个部分,所以,其结构概括地讲,是由一个AR(2)和一个MA(1)两部分构成的。1.6格林函数格林函数就是描述系统记忆扰动程度的函数,用表示,且所有的序列都可表示为:。格林函数的意义 (1)是前个时间单位以前进入系统的扰动对系统现在行为(响应)影响的权数。 (2)客观地刻画了系统动态响应衰减的快慢程度。 (3)是系统动态的真实描述。系统的动态性就是蕴含在时间序列中的数据依存关系。具体地讲,对于一个平稳系统来说,就是系统在某一时刻,由于受到进入系统的扰动的作用,离开其平衡位置(即平均数零),描述系统回到平衡位置的速度。 (4)格林函数所描述的动态性完全取决于系统参数。1.7非平稳时间序列平稳化处理差分是通过通过逐项相减消除前后期数据相关性的方法,可剔除序列中的趋势性,是非平稳序列的均值平稳化的预处理。差分运算可用后移算子B或者差分算子以及相应的阶数d,即其中,差分算子表示后项减前项,数学表达式为;;后移算子B表示时间点的后移,数学表达式式为。二者的关系为。一般而言,若某序列具有线性的趋势,则可以通过进行一次差分而将线性趋势剔除掉,然后对差分后的序列进行拟合ARMA模型进行分析与预测,最后再通过差分的返运算得到Xt的有关结果。可得因而=+ 这是Xt对作一次差分为一阶差分,如果对一阶差分结果再进行差分,则成为高阶差分,d阶差分为,一般而言,如序列具有二次趋势,则两次差分可变为平稳序列,若序列Xt具有d次多项式的趋势,通过d阶差分可变为平稳序列,表达式:。当差分阶数为d时,最后的数据就会损失d个。当d=2时,有 = 因而 一般有 =1+因而 其中 季节差分:反应经济现象的序列,不少都具有周期性,设Xt为一含有周期S的周期性波动序列,则为各相应周期点的数值,他们表现出非常相近或呈现某一趋势的特性,如果把每一个观察同下一个周期相应时刻的观察值相减,叫季节差分。它可以消除周期的影响,季节差分常用表示,其中S为周期。 对数变换与差分运算的结合运用;如果序列Xt含有指数趋势,则可以通过取对数将指数趋势转化为线性趋势,然后再进行以消除线性趋势。不具有平稳性的过程就是非平稳性的过程。当环境及条件随时间变化时就可以认为是非平稳的。自相关就是指时间序列观察资料相互之间的依存关系。用一个回归模型表示,这个回归模型把现在观测的值分为独立的两部分;一部分依赖于以前的观测值,一部分是独立的序列。二 时间序列模型的识别对一个平稳时间序列,建立其适合模型的第一步就是模型识别,即判断该序列所适合的模型类型。模型识别的方法很多,这里只介绍Box-Jenkins的模型识别方法。由上述可知,三类平稳时间序列的自相关函数和偏自相关函数具有不同的统计特性。如果一个时间序列是由某一类模型所生成,理论上他就应该具有相应的自相关特征,因而我们可以计算出平稳时间序列的样本自相关函数和样本偏自相关函数,将其特性与不同类型序列的理论自相关函数和偏自相关函数的特性进行比较,进而初步判断序列所适合的模型类型。这种方法可以对模型和模型以及低阶模型进行初步识别。该方法简单易懂,但精度不够,尤其是当样本序列未达到足够长度时,其精度更不理想。前面已经讨论了平稳时间序列的自相关和偏自相关函数的形式及其统计特性。现将三类平稳时间序列的自相关函数和偏自相关函数的统计特性归纳如下: 模型(序列) 自相关函数 拖尾 截尾 拖尾 偏自相关函数 截尾 拖尾 拖尾掌握了平稳时间序列自相关和偏自相关函数的这些统计特性,就可依据这些性质来初步确定时间序列模型的类型。(1)若时间序列的自相关函数在步截尾(即时,)并且偏自相关函数被负指数函数控制收敛到零,则可判断时间序列为序列。实际计算的样本自相关函数不会在步后全为零,而是在零的上下波动。可以证明,当时,渐近与正态分布: 因此 可由此检验是否显著地为零。对于每个,分别考察,(通常取,或)中满足 , 的比例是否达到,若都未达到,而达到了,我们就说在步截尾。同理也可以利用式进行判断。(2)若时间序列的偏自相关函数在步截尾,并且序列被负指数函数控制收敛到零,则可判断时间序列为序列。可以证明,当时,的分布渐近与,于是有,对于,分别考察,中满足 的个数所占的百分比是否超过,或者满足的个数所占的百分比是否超,若时都超过了,而时没有超过,则可以认为在步截尾。(3)若序列与序列皆不截尾,但都被负指数函数控制收敛到零,则时间序列很有可能是序列。 若序列与序列无以上特征,而是出现了缓慢衰减或周期性衰减等情况,则说明序列不平稳。三 时间序列的试题应用年份GDP(百万元)19781554197915191980177919811749198219951983224519842642198533011986384419874338198854961989603719906994199175101992875219931096819941384019951678019961841719972027919982209219992393820002636820013001320023406520033902020044661020055433220066485020077973520081018622009108127201013504320111670442012188454201321010520142301001978-2014年青海省GDP 来自:中华人民共和国国家统计局2014年数据资料 四 时间序列的特性分析 图1上图为原始数据中心化后的时间序列折线图,由图可知此时时间序列的各个观测值并非围绕其均值上下波动,且有一定的趋势,则该均值与时间有关,振幅变化剧烈,说明上图是一个非平稳时间序列的折线图;同理,下表为原始数据中心化后的时间序列的自相关和偏自相关数值及分析图。Date: 03/25/15 Time: 23:20Sample: 1978 2014Included observations: 37AutocorrelationPartial CorrelationACPACQ-StatProb. |*|. |*|10.8620.86229.7980.000. |* |.*| . |20.726-0.06951.5080.000. |* |. | . |30.595-0.05666.5300.000. |* |. | . |40.471-0.05676.2210.000. |* |. | . |50.3710.01382.4330.000. |* |. | . |60.2930.01286.4370.000. |*. |.*| . |70.212-0.07788.5910.000. |*. |. | . |80.1490.00989.6990.000. |*. |. | . |90.099-0.00690.2040.000. | . |. | . |100.056-0.01390.3750.000表1 由上表可知序列的自相关系数不是很快地(滞后阶数大于或时)趋于,即不是很快地落入随机区间,则说明时序是非平稳的;由于本文的数据时年度数据,由上表看出序列不存在季节性。 图2 上图为原始数据中心化后再经过一阶差分后的时间序列折线图,由图可知此时时间序列的各个观测值并非围绕其均值上下波动,且有一定的趋势,则该均值与时间有关,振幅变化剧烈,说明上图是一个非平稳时间序列的折线图;同理,下表为原始数据中心化后的时间序列的自相关和偏自相关数值及分析图。Date: 03/25/15 Time: 23:26Sample: 1978 2014Included observations: 36AutocorrelationPartial CorrelationACPACQ-StatProb. |*|. |*|10.7890.78924.3390.000. |* |. |*. |20.6990.20143.9750.000. |* |. |*. |30.6710.19962.6530.000. |* |*| . |40.493-0.32573.0520.000. |* |.*| . |50.345-0.19878.3160.000. |* |. |*. |60.3140.13182.8080.000. |*. |. | . |70.199-0.01684.6800.000. |*. |. | . |80.1100.01385.2670.000. | . |.*| . |90.055-0.14085.4230.000表2 由上表可知序列的自相关系数不是很快地(滞后阶数大于或时)趋于,即不是很快地落入随机区间,则说明时序是非平稳的。 上图为原始数据中心化后再经过二阶差分后的时间序列折线图,由图可知此时时间序列的各个观测值围绕其均值上下波动,该均值与时间无关,振幅变化不剧烈,说明上图是一个平稳时间序列的折线图;同理,下表为原始数据中心化后再经过二阶差分后的时间序列的自相关和偏自相关数值及分析图。Date: 03/25/15 Time: 23:34Sample: 1978 2014Included observations: 35AutocorrelationPartial CorrelationACPACQ-StatProb*| . |*| . |1-0.398-0.3986.02490.014.*| . |*| . |2-0.202-0.4287.62840.022. |* |. | . |30.272-0.01910.6260.014. | . |. | . |4-0.0320.04210.6690.031. | . |. |*. |5-0.0410.10710.7400.057. | . |. | . |6-0.0050.01110.7410.097. | . |. | . |70.0220.00310.7640.149. | . |.*| . |8-0.050-0.08910.8810.209. | . |.*| . |90.005-0.06610.8820.284表3 由上表可知序列的自相关系数很快地(滞后阶数大于或时)趋于,即很快地落入随机区间,则说明此时时序是平稳的。 五 模型识别与建立由表3的自相关分析图可见,当处自相关系数显著不为,当以后,序列的样本自相关系数很快落入随机区域,则此时取;而偏自相关系数后很快趋于,所以;综上所述,原始数据中心化后再经过一阶差分后的时间序列可以建立模型。 六 模型的参数估计Dependent Variable: EMethod: Least SquaresDate: 03/25/15 Time: 23:38Sample (adjusted): 1982 2014Included observations: 33 after adjustmentsConvergence achieved after 13 iterationsMA Backcast: 1981VariableCoefficientStd. Errort-StatisticProb.AR(1)-0.6124480.454904-1.3463240.1883AR(2)-0.4193390.223360-1.8774160.0702MA(1)0.1017110.5096020.1995900.8431R-squared0.262752Mean dependent var606.8182Adjusted R-squared0.213602S.D. dependent var5305.864S.E. of regression4705.191Akaike info criterion19.83723Sum squared resid6.64E+08Schwarz criterion19.97327Log likelihood-324.3143Hannan-Quinn criter.19.88300Durbin-Watson stat1.946754Inverted AR Roots-.31-.57i-.31+.57iInverted MA Roots-.10表4 上表为模型参数估计与检验结果,从表中可知模型的滞后多项式倒数根都落入单位圆中,满足过程平稳的基本需求。 根据上表,可以写出平稳序列的模型方程为= +七 模型检验Date: 03/25/15 Time: 23:43Sample: 1982 2014Included observations: 33Q-statistic probabilities adjusted for 3 ARMA term(s)AutocorrelationPartial CorrelationACPACQ-StatProb. *| . |. *| . |1-0.077-0.0770.2166. | . |. | . |2-0.042-0.04

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论