第五章 自相关.ppt_第1页
第五章 自相关.ppt_第2页
第五章 自相关.ppt_第3页
第五章 自相关.ppt_第4页
第五章 自相关.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第五章,自相关,2,第一节自相关定义及D-W检验,一,自相关的定义 当误差项不再是相互独立的,即 cov(ij) 0,就产生了自相关(Auto-correlation),也叫序列相关(serial correlation)。 即t、t-1 t-2是相关的。 t 、t-k被称为k阶自相关 t 、 t-1被称为1阶自相关 t 、t-2被称2为阶自相关 以此类推。,3,二自相关的检验:DurbinWatson Test(DW检验) 关于自相关的检验就是检验t和t-1之间的相关性,需要计算它们的相关系数。由于是总体的,无法得到,因此通过回归初始模型,利用计算出的 的估计值代替 来进行检验,t和t1

2、 cov(t,t1) hat=_ var(t) var(t1),4,计算DurbinWatson 统计量,用d来表示: ( t - t1)2 d=_ t2 t 2 2 (t t1) + t-1 2 =_ t2,5,对于大样本来说, t是可以得到的,且t2 与t-1 2相差很小,可以认为它们是近似相等的,因此上式可以化简成 d 2-2 hat 因为 1 1,所以0d4 1时,d=4, 完全负相关 = 1时, d=0 完全正相关 = 0时, d=2 完全不相关 所以,经验地看,d值在2左右时是不相关的,向0或4靠近则存在正相关或负相关。,6,根据计算结果,建立DW检验的决策规则如下: 0ddL,存

3、在一阶正相关 4dLd4,存在一阶负相关 dud4-du,不存在自相关 dL d du, 4-du d 4-dL,无法下结论 Durbin Watson根据d的显著水平规定了上限du和下限dL(查表可以得到)。 d统计量有一个假设前提: t= t-1 + t 即误差项服从一阶自相关,7,DW检验的局限性,只能检验一阶自相关; 当d值落再dL d du, 4-du d 4-dL,无法下结论; 无法检验含有滞后因变量的模型,例如: yt= +1 yt-1 +2xt+t,8,例题,logy= -3.938 +1.451log L+0.384logK (0.237) (0.083) (0.048) R

4、2=0.9946 DW=0.88 hat=0.559 已知 k=2, n=40, =0.05, 查表 dL=1.39, 0.881.39 所以存在正的自相关。 查表时注意说明,有的表中k包括了常数项,有的附表没有包括,,9,修正的d检验,当d值落在无法决定的区域时,无法下结论。可以使用修正的d检验程序,给定显著水平 1, H0: =0, H1: 0 如果估计的ddu,则在水平 上拒绝H0 ;即存在统计上显著的正相关。 2,H0: =0, H1: 0 如果估计的4-ddu,则在水平 上拒绝H0 ;即存在统计上显著的负相关。 3,H0: =0, H1: 0 如果估计的ddu或4-ddu,则在水平2

5、 上拒绝H0 ;即存在统计上显著的自相关。,10,例题, 已知n=50, k=4(没有包括常数项),d1.43,查表 5 dL=1.38 , du=1.72, 1.43落在1.38和1.72之间,无法下结论,但是根据修订的d检验,1.431.72,所以基本可以拒绝没有一阶自相关的假设,即存在一阶自相关。,11,此外,计算机程序SHAZAM会自动计算出一种精确d检验(exact d test),它能算出d值的准确概率。,12,第二节自相关的结果,自相关存在的前提下,使用最小二乘法,估计量是否依旧是最佳线性无偏估计呢? 我们来推导一下,看发生何种变化。 假设模型yt=xt +t, t= t-1 +

6、t, 根据最小二乘法, hat= xtyt/ xt2 = xt ( xt+ t)/ xt2 = ( xt2+ xtt )/ xt2 = + xtt/ xt2 E(hat)=E( + xtt/ xt2 )= , 无偏得证,13,先来求E(tt-S ),t= t-1 +t,已知误差项满足古典回归的假设 E(tt-1 )=E( t-1 +t) t-1 = E(t-1 )2 +E(t t-1 ) 2 E(tt-2 )=E( t-1 +t) t-2 = E(t-1 t-2 ) +E(t t-2) 2 2 2 以此类推, E(tt-s )=E( t-1 +t) t-s = E(t-1 t-s) +E(t

7、t-s) s 2,14,Var(hat)=E(xtt/ xt2 )2 =1/( xt2 ) 2(xt2 ) E(t2) +2E(tt-1 ) xt xt-1 + 2E(tt-2 ) xt xt-2 + 2E(tt-3 ) xt xt-3 + = 2/( xt2 ) 2(xt2 ) +2 xt xt-1 + 2 2 xt xt-2 + 2 3 xt xt-3 + ,15,= 2/xt2 1 +2 xt xt-1 / xt2 + 2 2 xt xt-2 / xt2 + 2 3 xt xt-3 / xt2 + 如果干扰项之间不相关, 0 估计值的方差和前面的估计是相同的。 现在假设xt=rxt-1+

8、vt 对照前面的推导,可知 xt xt-1 / xt2 r, xt xt-2 / xt2 r2, .,16,= 2/xt2 1 +2 r +2 2 r2 + 2 3 r3+ = 2/xt2 (1 + r )/ (1 - r ) 如果不考虑自相关,估计值的方差为 Var(hatLs) = 2/xt2 =Var(hat) = 2/xt2 (1 + r )/ (1 - r ) = Var(hatLs) (1 + r )/ (1 - r ) Var(hatLs)= Var(hat) (1 - r )/ (1 + r ),17,如果和 r 是同号,因为它们都在1和1之间,所以, (1 - r )/ (1

9、 + r )就会小于1,也就是说直接使用最小二乘估计的方差小于真实的方差,即方差被低估,这样会导致t检验显著,误导人们接受估计模型。 如果和 r 是符号相反,则(1 - r )/ (1 + r )大于1,估计的方差会大于真实的方差,使检验无法通过。,18,第三节自相关的处理方法,一,相关系数已知的情况 yt= +xt +t,(1) t= t-1 +t, t满足古典回归的假设前提。 上述模型可以写成: yt-1= +xt-1 +t-1,(2) 两边同乘以,变成: yt-1= + xt-1 + t-1,(3),19,(1)(3) yt yt-1 =(1 ) +(xt xt-1 ) +t t-1 ,

10、(4) 因为t t-1 t,所以新模型中的误差项是不相关的,满足古典回归的假设。对其进行回归即可以得到最佳无偏估计量。 这种方法被称为广义最小二乘法(GLS, General Least Squares),20,方程(4)被称为广义的差分模型或者叫准差分模型。 特别地,当1时,上述模型变成: yt yt-1 =(xt xt-1 ) +t t-1 , 就称为标准的一阶差分模型。 GLS方法损失了第一组观测值,建议 使用下列方法定义第一组观测值: x1*= x1 1- 2 y1*=y1 1- 2,21,我们把初始模型称做水平方程,经过处理的模型称为一阶差分方程( 1) 差分方程和水平方程的R2不能

11、直接进行比较,因为,一阶差分方程的解释变量和被解释变量均发生了改变。 为了能够将水平方程的R2和一阶差分方程的R2进行比较,需要对水平方程的R2进行调整。,22,调整的方法如下:,1对水平方程做回归,计算得到RSS,记做RSSlevel,自由度为n-k-1, 2对一阶差分方程回归,计算得到RSS,记做RSS1,自由度为n-k(因为没有常数项) 将经过调整的水平方程的R2记做RD2 , RD2 =1-(1- R12 )* (RSSlevel /RSS1)* (n-k-1/n-k)*dlevel,23,例题,logyt= -3.938 +1.451log L+0.384logK (0.237) (

12、0.083) (0.048) R2=0.9946 DW=0.858 RSS=0.0434 logyt= 0.984 logL +0.502logk R12=0.8405 DW=1.177 RSS=0.0278 RDlevel2=1-(1-0.8405)(0.0434/0.0278)(36/37)0.858 =0.7921 RDlevel2 R12,24,此外,哈韦(Harvey)给出下面的定义: RDlevel2 1RSS0/RSS1(1- R12) 不考虑自由度和方差的调整。 同样是上面的例题 RDlevel2 1-0.0434/0.0278(1-0.8405) =0.7510,25,二,

13、未知时的处理方法。 首先要寻找并确定。有两类方法 第一,循环查找法 1,科克伦欧卡特方法(Cochran-Orucutt Procedure) 第一步,估计模型 yt= +xt +t, 得到t和RSS,定义RSSRSS旧,26,计算 (t t1) hat =_ t2 第二步,估计模型 yt yt-1 =(1 ) +(xt xt-1 ) +t t-1 ,,27,得到和的估计值,利用新得到的和的估计值,代入步骤(1)中,即初始模型,计算RSS,将其记做RSS新 第三步,判断|(RSS新-RSS旧)/RSS旧|0.05, hat就是所估计的值。 否则:将RSS新等同于RSS旧,利用第二步得到的和的估

14、计值计算t,在计算出 hat,重复步骤2以下程序,直到两个残差平方和满足步骤3中的条件,小于0.05为止。一般迭代三到四步就可以满足条件。 此时 */(1 hat), hat= hat* *、hat*是差分方程中的参数估计值。,28,2,Durbin 方法 第一步,估计模型: yt= (1- )+ yt-1 + xt- x t-1 + vt= 计算得到RSS,记做RSS旧, yt-1前面的估计值就是hat。 第二步,已知了 hat,估计下列模型 yt hat yt-1 =(1 hat ) +(xt hat xt-1 ) + vt ,得到和的估计值,利用得到的和的估计值,代入步骤(1)中,计算R

15、SS,将其记做RSS新 第三步,如果|(RSS新-RSS旧)/RSS|0.05, hat就是所估计的值。,29,此时 */(1 hat), hat= hat* *、hat*是差分方程中的参数估计值。 否则将步骤2中的和的估计值代入步骤1的模型估计出RSS,重复2、3步骤,直到满足条件为止。 由于Durbin的方法中包含了滞后变量yt-1所以该方法并不常用。,30,第二,灰色查找法具体步骤如下: 1, 在1 1范围内,每间隔0.1选一个 ; 如-1, -0.9 0.8, 0.7, 0.9, 1 2,每取一个 值,都做如下回归: yt yt-1 =(1 ) +(xt xt-1 ) + vt , 计

16、算出所有的RSS; 3,选择使RSS最小的作为估计值。,31,如果出现两个 值计算的RSS相同,并 且都是最小的,例如0.8和 0.7, 这时就把这个区间再按0.01的间隔划 分,例如令 0.71,0.72 重复 步骤2,直到找到使RSS最小的 。,32,Cochrane-Orcutt 方法举例,根据日本19701994年间,工薪家庭的实际消费支出Y和实际可支配收入X的变化数据为: 年份 Y X 年份 Y X 1970 239 300 1978 285 370 1971 248 311 1979 293 378 1972 258 329 1980 291 374 1973 272 351 19

17、81 294 371 1974 268 354 1982 302 381 1975 280 364 1983 304 384 1976 279 360 1984 308 392 1977 282 366 1985 310 400,33,年份 Y X 1986 312 403 1987 314 411 1988 324 428 1989 326 434 1990 332 441 1991 334 449 1992 336 451 1993 334 449 1994 330 449,34,Xt=9700 Yt=7455 XtYt=2921268 Xt2=3808668 Yt2=2241861 估计

18、的结果如下: Yt=50.875+0.63744Xt t (6.136) (30.008) R2=0.9751 t2=467.717,35,列表计算DW值 年份 t t- t-1 t2 (t- t-1)2 1970 -3.1056 - 9.6445 - 1971 -1.1174 1.9882 1.2485 3.9529 1972 -2.5912 -1.4739 6.7145 2.1723 1973 -2.6148 -0.0236 6.8374 0.0006 1974 -8.5272 -5.9123 72.7123 34.9554 1975 -2.9015 5.6256 8.4188 31.64

19、77 1976 -1.3518 1.5497 1.8273 2.4017 1977 -2.1764 -0.8246 4.7367 0.06800 1978 -1.7261 0.4503 2.9796 0.2027,36,年份 t t- t-1 t2 (t- t-1)2 1979 1.1744 2.9005 1.3791 8.4129 1980 1.7241 0.5497 2.9726 0.3022 1981 6.6364 4.9123 44.0421 24.1308 1982 8.2621 1.6256 68.2616 2.6427 1983 8.3497 0.0877 69.7183 0.0

20、077 1984 7.2503 -1.0995 52.5662 1.2089 1985 4.1508 -3.0995 17.2288 9.6069 1986 4.2384 0.0877 17.9644 0.0077 1987 1.1390 -3.0995 1.2972 9.6069,37,年份 t t- t-1 t2 (t- t-1)2 1988 0.3025 -0.8364 0.0915 0.6996 1989 -1.5221 -1.8246 2.3168 3.3292 1990 0.0159 1.5379 0.0003 2.3653 1991 -3.0836 -3.0995 9.5089

21、9.6069 1992 -2.3585 0.7251 5.5626 0.5258 1993 -3.0836 -0.7251 9.5089 0.5258 1994 -7.0836 -4.0000 50.1780 16.0000 合计 467.717 164.93,38,根据上面的结果就可以计算DW值 ( t - t1)2 d= =164.993/467.717 t2 =0.3528,39,已知n=25, k=1, 0.3581.29(dL),所以拒绝不相关的假设,即存在一阶正相关。 下面介绍使用科克伦欧卡特方法估计模型。 根据估计模型计算 t t 1 hat=_=355.3091/417.538

22、7 t-12 =0.850961,40,将相关系数的估计值代入计算: Yt*=Yt - 0.850961 Y t-1 Xt*=Xt - 0.850961 X t-1 得到一组新的数据,,41,就Yt*对Xt*回归得到: Yt*=13.973 +0.53513Xt* t (2.918) (7.155) R2=0.6994 DW=2.378,42,DW有所改善,误差项已经不存在自相关。利用差分方程可以求出初始模型的参数估计值了。 =13.973/(1 - 0.850961)=93.756 hat=0.53513 Yt=93.756 +0.53513Xt,43,代入最初的模型,求新的残差和残差平方和

23、 新的残差=Yt -93.756 -0.535125Xt 因为|(RSS新-RSS旧)/RSS旧|0.05的条件不能满足,还要继续迭代下去。 利用新的残差可以计算出一个新的相关系数=980.1575/1176.8310=0.832879,44,将相关系数的估计值代入计算: Yt*=Yt - 0.832879 Y t-1 Xt*=Xt - 0.832879 X t-1 又得到一组新的数据 Yt*对Xt*回归,得到 Yt*=15.387 +0.53830 Xt* 计算出和的新的估计值为92.073和0.53830 代入最初模型计算残差平方和(新),与旧的残差平方和比较满足条件,新的相关系数即为所求

24、,上述的参数即是最后的估计结果。模型最终为: Yt= 92.073 +0.53830 Xt R2=0.9906 DW=2.330,45,其他估计的方法,有时人们根据德宾-沃森d统计量来估计, d2(1- hat) hat 1-d/2 上述公式在大样本的情形下,具有很好 的结果。例如在上面的例题中可以计算 hat 1-d/2=1-0.3528/2=0.8236 与我们最终迭代的结果0.832879相差不是很大。,46,对于小样本的情况下,泰尔和纳加(Theil-Nagar) n2(1-d/2)+k2 hat= n2-k2 其中,n=样本容量, d为德宾-沃森d值,k为解释变量的个数加上常数项。当

25、样本容量非常大时,上式可以化为简单的公式(1-d/2),47,在实际中有几种估计hat的方法,问题是到底选择那一个?在大样本的前提下,上述方法会给出近似的结果,因此使用哪种方法区别不大。但是在小样本的情况下,会有区别。估计出的hat有时相差很大。哪种方法更为可取并没有最后的定论。实际上经常用的是科克伦-欧卡特方法。,48,几种方法估计hat的例子,根据美国零工招聘指数(HWI)和失业率(U)的数据(1962年第一季度到1967年第四季度)估计的模型为: lnHWIt=7.3084-1.5375lnUt, R2=0.9550 (0.1110)(0.0711) d=0.9108 查表可知,0.91

26、081.27( dL), n=24,49,所用方法 德宾-沃森d 0.5446(1-d/2,d=0.9108) 泰尔-纳加d 0.5554 (n2(1-d/2)+k2/n2-k2) C0法第一步 0.54571 第二步 0.57223 第三步 0.57836 第四步 0.57999 第五步 0.58040 德宾方法 0.79517,50,第四节对含有滞后因变量的序列相关模型的检验,典型的含有滞后变量的模型: yt= yt-1 +xt+t t= t-1 +t, 包含了滞后因变量的模型与模型yt= +xt +t不同的是存在双重自相关,即t是相关的, yt和yt-1也是相关的。因此出现多处违反古典回

27、归假设的情况,估计参数是有偏的。因此DW检验无效。,51,为此,Durbin于1970年提出h检验来解决这一问题。h检验假设H0: =0,步骤如下: 1,直接回归yt= yt-1 +xt+t ,得到和hat, 计算h= hat n/(1-nvar()N(0,1)。 置信度 ( 0.05,N=1.96) 当hN时,拒绝H0,即存在自相关 hN时,接受待检假设,不存在自相关。,52,logqt=Const.-0.31logpt+0.45logyt+0.65logq t-1, (0.05) (0.20) (0.14) R2=0.90 DW=1.8 其中qt为人均食物消费 pt为食物价格 yt人均可支

28、配收入,53,已知0.65,var()=(0.14)2=0.0196 hat=0.1, n=50 h=0.1 50/(1-50*0.0196) =51.96(或2.576),所以,拒绝不存在自相关的假设,存在自相关。,54,第五节自相关产生的原因,1,惯性。大多数经济时间序列都有一个明显的特点,就是所谓的惯性或粘滞性。这样,相继的观测值很可能是相依赖的,由此产生自相关。 2,设定偏误(漏掉变量或不正确的函数形式)也会导致自相关 3,蛛网现象。例如许多农产品的供给反映一种所谓的蛛网现象,即供给对价格的反映要滞后一个时期,因为供给需要经过一定时间才能实现,这样也会产生自相关。,55,滞后效应。例如人们发现当前的消费除了依赖于其他的变量以外,还严重依赖于上一期的消费,因此消费函数模型就可能不仅仅是当前消费对当前收入的回归,而是当前消费对当前收入以及上一期消费的回归。但是如果我们忽视滞后项,也会导致误差项的自相关。 数据本身的原因。有时模型中使用的数据是原始数据计算后得来的,并因此导致自相关。,56,高阶自相关的检验方法,布劳殊-戈弗雷(Breusch-Godfrey, BG)检验 假设t是 p 阶自相关 t = 1 t-1 + 2 t-2 + p t-p + t H0: 1 = 2 = = p =0 具体的检验步骤如下: 1,估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论