第05章时间序列模型84595.ppt_第1页
第05章时间序列模型84595.ppt_第2页
第05章时间序列模型84595.ppt_第3页
第05章时间序列模型84595.ppt_第4页
第05章时间序列模型84595.ppt_第5页
已阅读5页,还剩178页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第五章 时间序列模型,关于标准回归技术及其预测和检验我们已经在前面的章节讨论过了,本章着重于时间序列模型的估计和定义,这些分析均是基于单方程回归方法,第9章我们还会讨论时间序列的向量自回归模型。 这一部分属于动态计量经济学的范畴。通常是运用时间序列的过去值、当期值及滞后扰动项的加权和建立模型,来“解释”时间序列的变化规律。,2,5.1 序列相关理论,第3章在对扰动项ut的一系列假设下,讨论了古典线性回归模型的估计、检验及预测问题。如果线性回归方程的扰动项ut 满足古典回归假设,使用OLS所得到的估计量是线性无偏最优的。 但是如果扰动项ut不满足古典回归假设,回归方程的估计结果会发生怎样的变化呢?理论与实践均证明,扰动项ut关于任何一条古典回归假设的违背,都将导致回归方程的估计结果不再具有上述的良好性质。因此,必须建立相关的理论,解决扰动项不满足古典回归假设所带来的模型估计问题。,3,5.1.1 序列相关及其产生的后果,对于线性回归模型 (5.1.1) 随机误差项之间不相关,即无序列相关的基本假设为 (5.1.2) 如果扰动项序列ut表现为: (5.1.3),4,即对于不同的样本点,随机扰动项之间不再是完全相互独立的,而是存在某种相关性,则认为出现了序列相关性(serial correlation)。由于通常假设随机扰动项都服从均值为0,同方差的正态分布,则序列相关性也可以表示为: (5.1.4) 特别的,如果仅存在 (5.1.5) 称为一阶序列相关,这是一种最为常见的序列相关问题。,5,如果回归方程的扰动项存在序列相关,那么应用最小二乘法得到的参数估计量的方差将被高估或者低估。因此,检验参数显著性水平的t统计量将不再可信。可以将序列相关可能引起的后果归纳为:, 使用OLS公式计算出的标准差不正确,相应的显著性水平的检验不再可信 ;, 如果在方程右边有滞后因变量,OLS估计是有偏的且不一致。, 在线性估计中OLS估计量不再是有效的;,6,EViews提供了检测序列相关和估计方法的工具。但首先必须排除虚假序列相关。虚假序列相关是指模型的序列相关是由于省略了显著的解释变量而引起的。例如,在生产函数模型中,如果省略了资本这个重要的解释变量,资本对产出的影响就被归入随机误差项。由于资本在时间上的连续性,以及对产出影响的连续性,必然导致随机误差项的序列相关。所以在这种情况下,要把显著的变量引入到解释变量中。,5.1.2 序列相关的检验方法,7,EViews提供了以下几种检测序列相关的方法。 1D.W.统计量检验 Durbin-Watson 统计量(简称D.W.统计量)用于检验一阶序列相关,还可估算回归模型邻近残差的线性联系。对于扰动项ut建立一阶自回归方程: (5.1.6) D.W.统计量检验的原假设: = 0,备选假设是 0。,8,如果序列不相关,D.W.值在2附近。 如果存在正序列相关,D.W.值将小于2。 如果存在负序列相关,D.W.值将在24之间。 正序列相关最为普遍,根据经验,对于有大于50个观测值和较少解释变量的方程,D.W.值小于1.5的情况,说明残差序列存在强的正一阶序列相关。,9,Dubin-Waston统计量检验序列相关有三个主要不足: 1D-W统计量的扰动项在原假设下依赖于数据矩阵X。 2回归方程右边如果存在滞后因变量,D-W检验不再有效。 3仅仅检验是否存在一阶序列相关。 其他两种检验序列相关方法:Q-统计量和Breush-Godfrey LM检验克服了上述不足,应用于大多数场合。,10,2 . 相关图和Q -统计量,我们还可以应用所估计回归方程残差序列的自相关和偏自相关系数(在本章5.2.4节给出相应的公式),以及Ljung-Box Q - 统计量来检验序列相关。Q - 统计量的表达式为:,其中:rj是残差序列的 j 阶自相关系数,T是观测值的个数,p是设定的滞后阶数 。,(5.1.7),11,p阶滞后的Q - 统计量的原假设是:序列不存在p阶自相关;备选假设为:序列存在p阶自相关。 如果Q - 统计量在某一滞后阶数显著不为零,则说明序列存在某种程度上的序列相关。在实际的检验中,通常会计算出不同滞后阶数的Q - 统计量、自相关系数和偏自相关系数。如果,各阶Q - 统计量都没有超过由设定的显著性水平决定的临界值,则接受原假设,即不存在序列相关,并且此时,各阶的自相关和偏自相关系数都接近于0。,12,反之,如果,在某一滞后阶数p,Q - 统计量超过设定的显著性水平的临界值,则拒绝原假设,说明残差序列存在p阶自相关。由于Q-统计量的P值要根据自由度p来估算,因此,一个较大的样本容量是保证Q- 统计量有效的重要因素。,在EViews软件中的操作方法: 在方程工具栏选择View/Residual Tests/correlogram-Q-statistics 。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-Box Q统计量。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。,13,例5.1:利用相关图检验残差序列的相关性,下面是这些检验程序应用的例子,考虑用普通最小二乘估计的简单消费函数的结果:,14,浏览这些结果:系数在统计上是很显著的,并且拟合得很好。但是,如果误差项是序列相关的,那么估计OLS标准误差将是无效的,并且估计系数由于在方程右端有滞后因变量会发生偏倚和不一致。在这种情况下D-W统计量作为序列相关的检验是不合适的,因为在方程右端存在着一个滞后因变量。选择View/Residual test/Correlogram-Q-statistice会产生如下情况:,15,16,虚线之间的区域是自相关中正负两倍于估计标准差所夹成的。如果自相关值在这个区域内,则在显著水平为5%的情形下与零没有显著区别。 本例13阶的自相关系数都超出了虚线,说明存在3阶序列相关。各阶滞后的Q-统计量的P值都小于5%,说明在5%的显著性水平下,拒绝原假设,残差序列存在序列相关。,17,3 . 序列相关LM检验,与D.W.统计量仅检验扰动项是否存在一阶自相关不同,Breush-Godfrey LM检验(Lagrange multiplier,即拉格朗日乘数检验)也可应用于检验回归方程的残差序列是否存在高阶自相关,而且在方程中存在滞后因变量的情况下,LM检验仍然有效。 LM检验原假设为:直到p阶滞后不存在序列相关,p为预先定义好的整数;备选假设是:存在p阶自相关。检验统计量由如下辅助回归计算。,18,1)估计回归方程,并求出残差et (5.1.8) 2) 检验统计量可以基于如下回归得到 (5.1.9) 这是对原始回归因子Xt 和直到p阶的滞后残差的回归。LM检验通常给出两个统计量:F统计量和TR2统计量。F统计量是对式(5.1.9)所有滞后残差联合显著性的一种检验。TR2统计量是LM检验统计量,是观测值个数T乘以回归方程(5.1.9)的R2。一般情况下,TR2统计量服从渐进的 分布。,19,在给定的显著性水平下,如果这两个统计量小于设定显著性水平下的临界值,说明序列在设定的显著性水平下不存在序列相关;反之,如果这两个统计量大于设定显著性水平下的临界值,则说明序列存在序列相关性。,在软件中的操作方法: 选择View/Residual Tests/Serial correlation LM Test,一般地对高阶的,含有ARMA误差项的情况执行Breush-Godfrey LM。在滞后定义对话框,输入要检验序列的最高阶数。,20,上一例子中相关图在滞后值3时出现峰值。Q统计量在各阶滞后值中都具有显著性,它显示的是残差中的显著序列相关。 进行序列相关的LM检验,选择View/Residual Tests/Serial Correlation LM Test,输入p =2产生如下结果:,例5.2: 关于残差序列相关的LM检验(1),21,此检验拒绝直至2阶的无序列相关的假设。Q-统计和LM检验都表明:残差是序列相关的,因此方程在被用于假设检验和预测之前应该重新定义。,22,例5.3: 关于残差序列相关的LM检验(2),考虑美国的一个投资方程。美国的GNP和国内私人总投资INV是单位为10亿美元的名义值,价格指数P为GNP的平减指数(1972=100),利息率R为半年期商业票据利息。回归方程所采用的变量都是实际GNP和实际投资;它们是通过将名义变量除以价格指数得到的,分别用小写字母gnp,inv表示。实际利息率的近似值r则是通过贴现率R减去价格指数变化率p得到的。样本区间:1963年1984年,应用最小二乘法得到的估计方程如下:,23,t =(-1.32) (154.25) R2=0.80 D.W.=0.94 从D.W.值来看,这个模型存在正的序列相关,但是,看起来还不是强的正序列相关。,24,图5.1 回归方程残差图,图5.1 回归方程残差图,图5.1 回归方程残差图 从残差图5.1可以看到残差序列的变化有相似的波动。所以,再采取上面介绍的其他检验序列相关的方法检验残差序列的自相关性。,25,下面采用 LM 统计量进行检验(p=2),得到结果如下: LM统计量显示,在5%的显著性水平拒绝原假设,回归方程的残差序列存在序列相关性。因此,回归方程的估计结果不再有效,必须采取相应的方式修正残差的自相关性。当然,对于这个例子,我们也可以用Q-统计量进行检验,而且效果更为直观,更有利于实际建模,但是这涉及到序列自相关和偏自相关系数的理论。,26,5.1.3 扰动项存在序列相关的 线性回归方程的估计与修正,线性回归模型扰动项序列相关的存在,会导致模型估计结果的失真。因此,必须对扰动项序列的结构给予正确的描述,以期消除序列相关对模型估计结果带来的不利影响。 通常可以用AR(p) 模型来描述一个平稳序列的自相关的结构,定义如下: (5.1.10) (5.1.11),27,其中:ut 是无条件误差项,它是回归方程(5.1.10)的误差项,参数0,1, 2 , , k是回归模型的系数。式(5.1.11)是误差项ut的 p阶自回归模型,参数 1, 2 , , p是p阶自回归模型的系数, t是相应的扰动项,并且是均值为0,方差为常数的白噪声序列,它是因变量真实值和以解释变量及以前预测误差为基础的预测值之差。 下面将讨论如何利用AR(p) 模型修正扰动项的序列相关,以及用什么方法来估计消除扰动项后方程的未知参数。,28,1修正一阶序列相关 最简单且最常用的序列相关模型是一阶自回归AR(1)模型。为了便于理解,先讨论一元线性回归模型,并且具有一阶序列相关的情形,即p = 1的情形: (5.1.12) (5.1.13),把式(5.1.13)带入式(5.1.12)中得到 (5.1.14),29,然而,由式(5.1.12)可得 (5.1.15) 再把式(5.1.15)代入式(5.1.14)中,并整理 (5.1.16) 令 ,代入式(5.1.16)中有 (5.1.17) 如果已知 的具体值,可以直接使用OLS方法进行估计。如果 的值未知,通常可以采用GaussNewton迭代法求解,同时得到 , 0, 1的估计量。,30,2修正高阶序列相关 通常如果残差序列存在p阶序列相关,误差形式可以由AR(p)过程给出。对于高阶自回归过程,可以采取与一阶序列相关类似的方法,把滞后误差逐项代入,最终得到一个扰动项为白噪声序列,参数为非线性的回归方程,并且采用Gauss-Newton迭代法求得非线性回归方程的参数。 例如:仍讨论一元线性回归模型,并且残差序列具有3阶序列相关的情形,即p = 3的情形:,31,按照上面处理AR(1) 的方法,把扰动项的滞后项代入原方程中去,得到如下表达式:,(5.1.20),通过一系列的化简后,仍然可以得到参数为非线性,扰动项 t为白噪声序列的回归方程。运用非线性最小二乘法,可以估计出回归方程的未知参数 0 , 1 , 1 , 2 , 3。,32,我们可以将上述讨论引申到更一般的情形:对于非线性形式为f (xt , ) 的非线性模型, , , 若残差序列存在p阶序列相关, (5.1.21) (5.1.22) 也可用类似方法转换成误差项 t为白噪声序列的非线性回归方程,以p = 1为例, (5.1.23) 使用Gauss-Newton算法来估计参数。,33,3. 在Eviews中的操作过程: 选择Quick/Estimate Equation或Object / New Object/Equation打开一个方程,输入方程变量,最后输入ar(1) ar(2) ar(3)。针对例5.1定义方程为:,34,需要注意的是,输入的ar(1) ar(2) ar(3) 分别代表3个滞后项的系数,因此,如果我们认为残差仅仅在滞后2阶和滞后4阶存在自相关,其他滞后项不存在自相关,即 则估计时应输入:cs c gdp cs(-1) ar(2) ar(4) EViews在消除序列相关时给予很大灵活性,可以输入模型中想包括的各个自回归项。例如,如果有季度数据而且想用一个单项来消除季节自回归,可以输入:cs c gdp cs(-1) ar(4)。,35,ARMA估计选择,如前所述,带有AR或MA的模型用非线性最小二乘法估计。非线性估计方法对所有系数估计都要求初值。 有时当迭代次数最大值达到时,方程终止迭代,尽管还未达到收敛。从前一步初值重新开始方程,使方程从中止处开始而不是从开始处开始。也可以试试不同的初值来保证估计是全部而不是局部平方误差最小,可以通过提供初值加速估计过程。,36,为控制ARMA估计初值,在方程定义对话框单击options。在EViews提供的选项中,有几项设置初值的选择。 EViews缺省方法是OLS/TSLS,这种方法先进行没有ARMA项的预备估计,再从这些值开始非线性估计。另一选择是使用OLS或TSLS系数的一部分作为初值。可以选择0.3,0.5,0.8或者可以将所有初值设为零。 用户确定初值选项是User Supplied。在这个选项下,EViews使用C系数向量中的值。为设置初值,双击图标,为C系数向量开一窗口,进行编辑。,37,为适当地设置初值,需对EViews如何为ARMA设置系数多些了解。EViews使用C系数向量。它按下列规则为变量安排系数: 1. 变量系数,以输入为序。 2. 定义的AR项,以输入为序。 3SAR,MA,SMA系数(按阶数由高到底),38,例如:下面两种定义将有同样规格的系数 Y c X ma(2) ma(1) sma(4) ar(1) Y sma(4 ) c ar(1) ma(2) X ma(1) 也可使用程序指令安排C向量值 param c(1) 50 c(2 ) 0.8 c(3) 0.2 c(4) 0.6 c(5) 0.1 c(6) 0.5 初值:常数是50, X系数的初值是0.8, ar(1)、ma(2)、ma(1)、sma(4) 系数的初值分别是0.2 , 0.6,0.1,0.5。 估计后,可在方程表达式Representation选项见到系数安排。也可以从估计方程中填写C向量,选择pros/update/ coefs from equations。,39,例5.4: 用AR(p)模型修正回归方程残差序列的自相关,例5.1中检验到带有滞后因变量的回归方程的残差序列存在明显的序列自相关。而且从相关图看到,可以采用AR(3) 模型来修正回归方程的残差序列的自相关性。,回归估计的结果如下:,40,再对新的残差序列 进行LM检验,最终得到的检验结果如下:,41,含有AR项模型的估计输出,当估计某个含有AR项的模型时,在解释结果时一定要小心。在用通常的方法解释估计系数、系数标准误差和t-统计量时,涉及残差的结果会不同于OLS的估计结果。 要理解这些差别,记住一个含有AR项的模型有两种残差: 第一种是无条件残差,通过原始变量以及估计参数 算出。在用同期信息对y t值进行预测时,这些残差是可以观测出的误差,但要忽略滞后残差中包含的信息。,42,第二种残差是估计的一期向前预测误差 。如名所示,这种残差代表预测误差。 对于含有AR项的模型,基于残差的回归统计量,如R2 (回归标准误差)和D-W值都是以一期向前预测误差为基础的。含有AR项的模型独有的统计量是估计的AR系数 。,43,对于简单AR(1)模型, 是无条件残差的序列相关系数。对于平稳AR(1)模型, 在-1(极端负序列相关)和+1(极端正序列相关)之间。一般AR(p)平稳条件是:滞后算子多项式的根的倒数在单位圆内。 EViews在回归输出的底部给出这些根:Inverted AR Roots。如果存在虚根,根的模应该小于1。,44,另外:EViews可以估计带有AR误差项的非线性回归模型。例如:将例5.4中的模型变为如下的非线性模型,估计如下带有附加修正项AR(3)的非线性方程,单击Quick/Estimate Equation,打开一个方程,用公式法输入 cs=c(1)+gdpc(2)+c(3)*cs(-1)+ar(1)=c(4),ar(2)=c(5), ar(3)=c(6),45,输出结果显示为:,46, 5.2 平稳时间序列建模,本节将不再仅仅以一个回归方程的残差序列为研究对象,而是直接讨论一个平稳时间序列的建模问题。在现实中很多问题,如利率波动、收益率变化及汇率变化等通常是一个平稳序列,或者通过差分等变换可以化成一个平稳序列。 本节中介绍的ARMA模型(autoregressive moving average models)可以用来研究这些经济变量的变化规律,这样的一种建模方式属于时间序列分析的研究范畴。,47,如果随机过程 的均值和方差、自协方差都不取决于 t,则称 u t 是协方差平稳的或弱平稳的:,注意,如果一个随机过程是弱平稳的,则u t与u t- s之间的协方差仅取决于s ,即仅与观测值之间的间隔长度s有关,而与时期t 无关。一般所说的“平稳性”含义就是上述的弱平稳定义。, 5.2.1 平稳时间序列的概念,48, 5.2.2 ARMA模型,1. 自回归模型AR(p) p阶自回归模型记作AR(p),满足下面的方程: (5.2.4) 其中:参数c 为常数;1 , 2 , p 是自回归模型系数;p为自回归模型阶数; t是均值为0,方差为 2的白噪声序列。,49,2. 移动平均模型MA(q) q阶移动平均模型记作MA(q) ,满足下面的方程: (5.2.5) 其中:参数 为常数;参数1 , 2 , q是q阶移动平均模型的系数; t是均值为0,方差为 2的白噪声序列。,50,3. ARMA(p,q)模型 (5.2.6) 显然此模型是模型(5.2.4)与(5.2.5)的组合形式,称为混合模型,常记作ARMA(p,q)。当p = 0时,ARMA(0, q) = MA(q);当q = 0时,ARMA(p, 0) = AR(p)。,51, 5.2.3 ARMA模型的平稳性,1. AR(p)模型的平稳性条件 为了理解AR(p)、MA(q)和ARMA(p,q)模型的理论结构,简单的算子理论是必不可少的。对于AR(p)模型 (5.2.7) 设L为滞后算子,则有 ,特别地, 。则式(5.2.7)可以改写为:,(5.2.8),52,若设 ,令 (5.2.9) 则 (z) 是一个关于z的p次多项式,AR(p) 模型平稳的充要条件是(z) 的根全部落在单位圆之外。式(5.2.7)可以改写为滞后算子多项式的形式 可以证明如果AR(p)模型满足平稳性条件,则式(5.2.10)可以表示为如下MA()的形式,(5.2.10),53,(5.2.11),其中 且 。假定平稳性条件满足,将式(5.2.7)两端取期望可以求得均值 或,(5.2.13),(5.2.12),(5.2.14),54,式(5.2.11)表示ut可以由一个白噪声序列的线性组合表示出来。现在可以看到,任何一个AR(p)模型均可以表示为白噪声序列的线性组合。事实上,式(5.2.11)是沃尔德分解定理(Wold定理)的特例。 沃尔德分解定理(Wold定理) 任何零均值协方差平稳过程ut可表示成如下形式 其中: 。 t是白噪声序列,对于任意的j,t的值与 t-j无关。t称为ut的确定性分量,而 称为线性非确定性分量。,(5.2.15),55,2MA(q) 模型的可逆性 考察MA(q) 模型 若 的根全部落在单位圆之外,则式(5.2.16)的MA算子称为可逆的。,(5.2.16),56,(5.2.17),比较式(5.2.16)和式(5.2.17),可知,(5.2.18),运用MA算子的逆运算,式(5.2.16)可写成AR()的形式,尽管不可逆时也可以表征任何给定的数据,但是一些参数估计和预测算法只有模型可逆时才有效。,57,3ARMA(p,q) 模型的平稳性条件 ARMA(p,q) 模型包括了一个自回归模型AR(p)和一个移动平均模型MA(q) 或者以滞后算子多项式的形式表示,(5.2.19),(5.2.20),58,若令 则ARMA(p,q)模型(5.2.19)平稳的充要条件是(z) 的根全部落在单位圆之外。在式(5.2.20)的两边除以 ,可以得到 其中,(5.2.21),(5.2.22),(5.2.23),59,ARMA模型构造了一种更为复杂的白噪声序列的线性组合,近似逼近一个平稳序列。可以看出ARMA模型的平稳性完全取决于自回归模型的参数,而与移动平均模型参数无关。,60,在Eviews中确定ARMA形式,1、ARMA项,模型中AR和MA部分应使用关键词ar和ma定义。在上面AR定义中,我们已见过这种方法的例子。这对MA也同样适用。,例如,估计一个2阶自回归和1阶动平均过程ARMA(2,1),应将AR(1), MA(1), AR(2)和其它解释变量一起包含在回归因子列表中: y c gov ar(1) ar(2) ma(1),61,如果采用公式法输入方程,则要将AR和MA项系数明确列出,形式为: LS = c(1)+ar(1)=c(2),ar(2)=c(3),ma(1)=c(4)。 下面说明EViews是如何估计一个ARMA(p,q)模型的。 单击Quick/Estimate Equation打开一个方程,输入 LS c ar(1) ma(1) 即可。,62,2. 季节ARMA项,对于带有季节因素的季度数据,Box and Jenkins(1976) 建议使用季节自回归SAR和季节动平均SMA。SAR(p)定义为带有p阶滞后的季节自回归项。估计中使用的滞后多项式是AR项和SAR项定义的结合。 与此类似,SMA(q)定义为带有q阶滞后的季节动平均。估计中使用的滞后多项式是MA项和SMA项定义的结合。存在SAR项则允许建立一个滞后多项式。 例如:没有季节项的2阶AR过程,63,例如:没有季节项的2阶AR过程,用滞后算子 ,则上式可表示为:,可以通过回归自变量的ar(1),ar(2)项来估计这个过程。,对于季度数据,可以加入sar(4)来表示季节因素,定义方程: y c x ar(1) ar(2) sar(4) 估计误差结构为:,64,等价于,参数 和季节因素相联系。注意:这是对系数有非线性约束的AR(6)模型。 在另一个例子中,无季节性的二阶MA过程如下,可以通过包含ma(1)和ma(2)来估计二阶MA过程。,65,对季度数据,可以添加sma(4)考虑季节性。例如定义方程: y c x ma(1 ) ma(2) sma(4) 估计模型为:,等价于:,参数 和季节因素相联系。这是对系数有非线性约束的MA(6)模型。还可以在方程说明中同时包括SAR,SMA项。,66,例5.5: 利用 AR(1) 模型描述上证指数的变化规律,本例取我国上证收盘指数(时间期间:1991年1月2003年3月)的月度时间序列S作为研究对象,用AR(1)模型描述其变化规律。首先对其做变化率,srt = 100(St-St-1)/S t-1(t = 1, 2, , T),这样便得到了变化率序列。一般来讲,股价指数序列并不是一个平稳的序列,而通过变换后的变化率数据,是一个平稳序列,可以作为我们研究、建模的对象。记上证股价指数变化率序列为sr,建立如下模型:,67,回归结果为:,68,图5.2 实线是上证股价指数变化率序列sr,虚线是AR(1)模型的拟合值,从图5.2可以看出我国上证股价指数变化率序列在1991年1994年之间变化很大,而后逐渐变小,基本在3%上下波动。近年来波动平缓,并且大多在3%下面波动。拟合曲线基本代表了这一时期的均值。,69, 5.2.4 ARMA模型的识别,在实际研究中,所能获得的只是经济指标的时间序列数据,根据经济指标的样本特征,来推断其总体(真实)特征。这一节将引入自相关系数 (autocorrelations,简称AC) 和偏自相关系数 (partial autocorrelations,简称PAC) 这两个统计量去识别ARMA(p,q) 模型。 1. 自相关系数 时间序列ut滞后k阶的自相关系数由下式估计,(5.2.26),70,其中 是序列的样本均值,这是相距k期值的相关系数,称rk为时间序列ut的自相关系数。 自相关系数可以部分的刻画一个随机过程的性质。它告诉我们在序列ut的邻近数据之间存在多大程度的相关性。通常的,AR(p) 模型的自相关系数是随着k的增加而呈现指数衰减或者震荡式的衰减,具体的衰减形式取决于AR(p) 模型滞后项的系数。,71,2偏自相关系数 偏自相关系数是指在给定ut-1,ut-2,ut-k的条件下,ut与ut-k之间的条件相关性。其相关程度用偏自相关系数 k , k度量。在p阶滞后下估计偏相关系数的计算公式如下,(5.2.27),72,其中:rk 是在k阶滞后时的自相关系数估计值。 这是偏相关系数的一致估计。要得到 k , k的更确切的估计,需要进行回归,(5.2.28),(5.2.29),因此,滞后k阶的偏相关系数是当ut 对ut-1,ut-k 作回归时ut-k的系数。称之为偏相关是因为它度量了k期间距的相关而不考虑k -1期的相关。,73,如果这种自相关的形式可由滞后小于k阶的自相关表示,那么偏相关在k期滞后下的值趋于零。一个纯的p 阶自回归过程AR(p) 的偏相关系数在p阶截尾,而纯的动平均函数的偏相关过程渐进趋于零。因此,如果我们能求出关于 k , k的估计值,用以检验其显著性水平,就能够确定时间序列ut的自相关的阶数。,3. MA模型的识别 MA(q)模型,(5.2.30),74,其中:t是均值为0,方差为 2的白噪声序列,而自协方差 k,计算可得,75,进而得到,(5.2.33),上式表明对MA(q)模型,当k q时,rk = 0。ut与ut+k 不相关,这种性质通常称为截尾。即MA(q) 模型的自相关函数在q步以后是截尾的。,76,MA(q) 的偏自相关系数的具体形式随着q的增加变得越来越复杂,很难给出一个关于q的一般表达式,但是,一个MA(q) 模型对应于一个AR() 模型。因此,MA(q) 模型的偏自相关系数一定呈现出某种衰减的形式是拖尾的。故可以通过识别一个序列的偏自相关系数的拖尾形式,大致确定它应该服从一个MA(q) 过程。,77,4. AR模型的识别 可以不加证明的给出AR(p)过程的自相关系数,(5.2.34),其中1 , 2 , , p 是AR(p) 模型的特征多项式,(5.2.35),的p个特征根,g1 , g2 , , gp为任意给定的p个常数。,78,由此可知,AR(p) 模型的自相关系数会由于g1 , g2 , , gp及k取值的不同,呈现出不同的衰减形式,可能是指数式的衰减,也可能是符号交替的震荡式的衰减。例如,对于AR(1) 模型,其自相关系数为,当r1 0时,rk呈指数式的衰减;当r1 0时,rk呈震荡式的衰减。 因此,可以通过自相关系数来获得一些有关AR(p) 模型的信息,如低阶AR(p) 模型系数符号的信息。但是,对于自回归过程AR(p),自相关系数并不能帮助我们确定AR(p) 模型的阶数p。所以,可以考虑使用偏自相关系数 k , k, 以便更加全面的描述自相关过程AR(p)的统计特征。,79,这里我们通过简单的证明给出AR(p)模型的偏自相关系数。对于一个AR(p)模型,,(5.2.36),将式(5.2.36)两边同时乘以ut-k ( k = 1, 2 , , p) ,再对方程两边取期望值并除以序列ut的方差得到如下关于系数1 , 2 , , p的线性方程组:,(5.2.37),80,其中:r1 , r2 , , rp分别为序列ut 的1 , 2 , , p阶自相关系数。然后求解方程组(5.2.37),计算出一组解1 , 2 , , p,就可得到的偏自相关系数为:k,k= k (k =1,2,p)。且对于一个AR(p) 模型, k,k的最高阶数为p,也即AR(p) 模型的偏自相关系数是p阶截尾的。因此,可以通过识别AR(p) 模型的偏自相关系数的个数,来确定AR(p) 模型的阶数p,进而设定正确的模型形式,并通过具体的估计方法估计出AR(p) 模型的参数。,81,例5.6 利用自相关和偏自相关系数 识别ARMA模型并检验序列相关性,例5.1考察了美国1947年第1季度1995年第1季度的消费和GDP之间的关系,发现残差存在序列相关,并且例5.4用AR(3) 模型修正了残差的序列相关性。但是,我们并没有说明是通过怎样的方法来判断残差服从一个AR(3) 模型。这个例子将借助Q-统计量、自相关系数和偏自相关系数图,说明如何判断模型的阶数。回归方程:,82,83,图5.3 原方程的残差图,从残差图5.3可以观察到,残差序列基本是平稳的,这一点还可以用5.3.2节介绍的单位根检验来验证。下面计算残差序列的自相关系数和偏自相关系数。,84,图5.4 原方程的残差序列的相关图,85,自相关系数呈震荡式递减,偏自相关系数除了1、2和3阶显著不为0以外,其他各项均接近于0,因此,我们可以猜测残差序列的自相关结构可以用AR(3) 模型来纠正,模型建立如下:,86,图5.5 修正序列相关后的回归方程的相关图,87,5. 模型的识别与建立 我们引入了自相关系数和偏自相关系数这两个统计量来识别ARMA(p,q) 模型的系数特点和模型的阶数。但是,在实际操作中,自相关系数和偏自相关系数是通过要识别序列的样本数据估计出来的,并且随着抽样的不同而不同,其估计值只能同理论上的大致趋势保持一致,并不能精确的相同。因此,在实际的模型识别中,自相关系数和偏自相关系数只能作为模型识别过程中的一个参考,并不能通过它们准确的识别模型的具体形式。,88,例5.7 利用消费价格指数研究模型识别和建模,本例将用ARMA模型模拟1990年1月2004年12月的居民消费价格指数CPI(上年同月=100)的变化规律。实际上用后面学到的单位根检验可知CPI序列是一个非平稳的序列,但是它的一阶差分序列CPI是平稳的。首先观察CPI序列的自相关系数和偏自相关系数的图形,89,图5.6 CPI序列的相关图,90,从图5.6可以看出CPI序列的自相关系数是拖尾的,偏自相关系数在1阶结尾。由前面的知识可以判断 CPI序列基本满足AR(1)过程。建模得到,91,图5.7 左边是CPI序列的实际值和拟合值,右边是残差序列,由图5.7可以观察到AR(1) 模型比较好的拟合了CPI序列,回归方程的残差序列基本上也是一个零均值的平稳序列。,92,图5.8 CPI序列方程残差序列的相关图,从图5.8的回归方程的残差序列的自相关系数和偏自相关系数可以看到不存在序列相关。因此,在实际建模中,可以借助ARMA(p,q)模型去拟和一些具有平稳性的经济变量的变化规律。,93,前述的AR(p)、MA(q) 和ARMA(p,q) 三个模型只适用于刻画一个平稳序列的自相关性。一个平稳序列的数字特征,如均值、方差和协方差等是不随时间的变化而变化的,时间序列在各个时间点上的随机性服从一定的概率分布。 然而,对于一个非平稳时间序列而言,时间序列的数字特征是随着时间的变化而变化的。, 5. 3 非平稳时间序列建模,94,也就是说,对于一个平稳的时间序列可以通过过去时间点上的信息,建立模型拟合过去信息,进而预测未来的信息。 而非平稳时间序列在各个时间点上的随机规律是不同的,难以通过序列已知的信息去掌握时间序列整体上的随机性。因此,对于一个非平稳序列去建模,预测是困难的。但在实践中遇到的经济和金融数据大多是非平稳的时间序列。,95,图5.9 中国1978年2002年的GDP序列,96,1. 确定性时间趋势和单位根过程 描述类似图5.9形式的非平稳经济时间序列有两种方法,一种方法是包含一个确定性时间趋势 (5.3.1) 其中ut是平稳序列;a + t 是线性趋势函数。这种过程也称为趋势平稳的,因为如果从式(5.3.1)中减去a + t,结果是一个平稳过程。注意到像图5.9一类的经济时间序列常呈指数趋势增长,但是指数趋势取对数就可以转换为线性趋势。, 5. 3.1 非平稳序列和单整,97,另一种方法是设定为单位根过程,非平稳序列中有一类序列可以通过差分运算,得到具有平稳性的序列,考虑下式 (5.3.2) 也可写成 (5.3.3),98,其中a是常数,ut是平稳序列,若ut i.i.d. N (0, 2) ,且ut 是一个白噪声序列,则该过程称为含位移a的随机游走。若令a = 0, y0 = 0,则由式(6.2)生成的序列yt,有var(yt) = t 2(t = 1, 2, , T),显然违背了时间序列平稳性的假设。而其差分序列 yt是平稳序列。,99,实际上,在5.1节中讨论的回归方程的序列自相关问题是暗含着残差序列是一个平稳序列。这是因为,如果残差序列是一个非平稳序列,则说明因变量除了能被解释变量解释的部分以外,其余的部分变化仍然不规则,随着时间的变化有越来越大的偏离因变量均值的趋势,这样的模型是不能够用来预测未来信息的。,100,残差序列是一个非平稳序列的回归被称为伪回归,这样的一种回归有可能拟合优度、显著性水平等指标都很好,但是由于残差序列是一个非平稳序列,说明了这种回归关系不能够真实的反映因变量和解释变量之间存在的均衡关系,而仅仅是一种数字上的巧合而已。伪回归的出现说明模型的设定出现了问题,有可能需要增加解释变量或者减少解释变量,抑或是把原方程进行差分,以使残差序列达到平稳。 一个可行的办法是先把一个非平稳时间序列通过某种变换化成一个平稳序列,根据5.2节中的方法建模,并利用变量之间的相关信息,描述经济时间序列的变化规律。,101,2. 单整 像前述yt这种非平稳序列,可以通过差分运算,得到平稳性的序列称为单整(integration)序列。定义如下: 定义 如果序列yt ,通过 d 次差分成为一个平稳序列,而这个序列差分d1次时却不平稳,那么称序列yt为d阶单整序列,记为 yt I(d)。特别地,如果序列yt本身是平稳的,则为零阶单整序列,记为 yt I(0)。,102,单整阶数是使序列平稳而差分的阶数。对于上面的随机游走过程,有一个单位根,所以是I(1),同样,平稳序列是I(0)。一般而言,表示存量的数据,如以不变价格资产总值、储蓄余额等存量数据经常表现为2阶单整;以不变价格表示的消费额、收入等流量数据经常表现为1阶单整;而像利率、收益率等变化率的数据则经常表现为0阶单整。,103,如果两个序列分别为d阶单整和e阶单整,即 xt I(d), yt I(e),e d 则二序列的线性组合是e 阶单整序列,即 zt =a xt +b yt I(max(d,e),104, 5. 3.2 非平稳序列的单位根检验 检查序列平稳性的标准方法是单位根检验。本节将介绍5种单位根检验方法: DF检验、ADF检验、PP检验、KPSS 检验和ERS检验。 前三种方法出现的比较早,在实际应用中较为常见,但是,由于这3种方法均需要对被检验序列作可能包含常数项和趋势变量项的假设,因此,应用起来带有一定的不便;后3种方法克服了前3种方法带来的不便,在剔除原序列趋势的基础上,构造统计量检验序列是否存在单位根,应用起来较为方便。,105,其中a是常数, t 是线性趋势函数,ut i.i.d. N (0, 2) 。,1. DF检验 为说明DF检验的使用,先考虑3种形式的回归模型,106,1) 如果 -1 1,则yt平稳(或趋势平稳)。 2) 如果 =1, yt 序列是非平稳序列。(5.3.4)式可写成: 显然yt 的差分序列是平稳的。 3) 如果 的绝对值大于1,序列发散,且其差分序列是非平稳的。,107,因此,判断一个序列是否平稳,可以通过检验 是否严格小于1来实现。也就是说: 原假设H0: =1,备选假设H1: 1,从方程两边同时减去yt-1得,,108,其中: = -1,所以原假设和备选假设可以改写为 可以通过最小二乘法得到 的估计值,并对其进行显著性检验的方法,构造检验显著性水平的t统计量。,109,但是,Dickey-Fuller研究了这个t 统计量在原假设下已经不再服从 t 分布,它依赖于回归的形式(是否引进了常数项和趋势项) 和样本长度T 。 Mackinnon进行了大规模的模拟,给出了不同回归模型、不同样本数以及不同显著性水平下的临界值。这样,就可以根据需要,选择适当的显著性水平,通过 t 统计量来决定是否接受或拒绝原假设。这一检验被称为Dickey-Fuller检验(DF检验)。,110,上面描述的单位根检验只有当序列为AR(1) 时才有效。如果序列存在高阶滞后相关,这就违背了扰动项是独立同分布的假设。在这种情况下,可以使用增广的DF检验方法(augmented Dickey-Fuller test )来检验含有高阶序列相关的序列的单位根。,111,2. ADF检验 ADF检验方法通过在回归方程右边加入因变量yt 的滞后差分项来控制高阶序列相关,112,扩展定义将检验 (5.3.14) 也就是说原假设为:原假设至少存在一个单位根;备选假设为:序列不存在单位根。序列yt可能还包含常数项和时间趋势项。判断 的估计值是接受原假设或者接受备选假设,进而判断一个高阶自相关序列AR(p) 过程是否存在单位根。,113,类似于DF检验,Mackinnon通过模拟也得出在不同回归模型及不同样本容量下检验 不同显著性水平的 t 统计量的临界值。这使我们能够很方便的在设定的显著性水平下判断高阶自相关序列是否存在单位根。,114,但是,在进行ADF检验时,必须注意以下两个实际问题: (1)必须为回归定义合理的滞后阶数。通常采用AIC准则来确定给定时间序列模型的滞后阶数。在实际应用中,还需要兼顾其他的因素,如系统的稳定性、模型的拟合优度等。,115,(2) 可以选择常数和线性时间趋势,选择哪种形式很重要,因为检验显著性水平的t统计量在原假设下的渐进分布依赖于关于这些项的定义。, 如果在检验回归中含有常数,意味着所检验的序列的均值不为0,一个简单易行的办法是画出检验序列的曲线图,通过图形观察原序列是否在一个偏离 0 的位置随机变动,进而决定是否在检验时添加常数项;,116, 如果在检验回归中含线性趋势项,意味着原序列具有时间趋势。同样,决定是否在检验中添加时间趋势项,也可以通过画出原序列的曲线图来观察。如果图形中大致显示了被检验序列的波动趋势随时间变化而变化,那么便可以添加时间趋势项。,117,EViews软件中的操作说明: 双击序列名,打开序列窗口,选择View/unit Root Test,得到下图:,单位根检验窗口,118,进行单位根检验必须定义4项: 1选择检验类型 在Test type的下拉列表中,选择检验方法。EViews5提供了6种单位根检验的方法: Augmented Dickey-Fuller(ADF) Test Phillips-Perron(PP) Test Dickey-Fuller GLS Test Kwiatkowski , Phillips , Schmidt and Shin (KPSS) Test Elliot , Rothenberg , and Stock Point Optimal (ERS) Test Ng and Perron (NP) Test,119,2选择被检验序列的形式 在Test for unit root in中确定序列在水平值、一阶差分、二阶差分下进行单位根检验。可以使用这个选项决定序列中单位根的个数。如果检验水平值未拒绝,而在一阶差分拒绝原假设,序列中含有一个单位根,是一阶单整I(1);如果一阶差分后的序列仍然拒绝了原假设,则需要选择2阶差分。一般而言,一个序列经过两次差分以后都可以变为一个平稳序列,也就是二阶单整I(2)。,120,3定义检验方程中需要包含的选项 在Include in test equation中定义在检验回归中是否含有常数项、常数和趋势项、或二者都不包含。这一选择很重要,因为检验统计量在原假设下的分布随这3种情况不同而变化。在什么情况下包含常数项或者趋势项,刚才已经作了介绍。,121,4定义序列相关阶数 在Lag lenth这个选项中可以选择一些确定消除序列相关所需的滞后阶数的准则。一般而言,EViews默认Akaike info准则和Scharz准则。 定义上述选项后,单击OK进行检验。EViews显示检验统计量和估计检验回归。 单位根检验后,应检查EViews显示的估计检验回归,尤其是如果对滞后算子结构或序列自相关阶数不确定,可以选择不同的右边变量或滞后阶数来重新检验。,122,5关于核函数形式的选择 如果选择KPSS法、ERS法和NP法进行单位根检验,还需要选择适当的核函数。如下图所示,在Spectral estimation method 中选择具体的核函数形式。,123,例5.8 检验居民消费价格指数序列的平稳性,例5.7用AR(1) 模型模拟1990

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论