第讲异方差与自相关_第1页
第讲异方差与自相关_第2页
第讲异方差与自相关_第3页
第讲异方差与自相关_第4页
第讲异方差与自相关_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4讲 异方差(fn ch)与自相关共四十九页主要(zhyo)内容1-异方差检验(jinyn)与处理2-自相关和可行广义最小二乘法共四十九页第1节:异方差(fn ch)检验与处理一、基本原理 要解决模型中存在的异方差问题,分为(fn wi)两个步骤:第一,要准确的检测出异方差的存在;第二,解决异方差带来的副作用,使模型估计量具有很好的性质。下面将会详细介绍异方差检验和处理的原理。共四十九页(一)异方差检验(jinyn)的方法(1)残差图观察法。由于异方差就是模型扰动项的方差是变化的,根据这个原理就可以观察模型残差拟合值的图形,根据图形的形状变化判断异方差是否(sh fu)存在。但是这种方法的严

2、谨性稍差,并不是主流的检验方法。共四十九页(2)怀特检验方法。由于模型扰动项的稳健标准差在同方差的情况下还原为普通标准差,所以怀特检验的原理简单来说就是看扰动项的稳健标准差与普通标准差的差距大小。White在1980年基于这一思想(sxing)提出了怀特检验。共四十九页(二) 异方差的处理(chl)方法(1)稳健标准差加OLS法只要样本容量足够大,在模型出现异方差的情况下,使用稳健标准差时参数估计、假设检验等均可正常进行,即可以(ky)很大程度上消除异方差带来的副作用。共四十九页(2)广义(gungy)最小二乘法共四十九页(3)加权最小二乘法(WLS)(4)可行广义最小二乘法该方法是先用样本数

3、据一致的估计(gj)出V(X),然后使用GLS法对模型进行估计。(此方法克服了GLS和WLS要求扰动项协方差已知的缺点)共四十九页二、实验内容和数据来源数据来自Nerlove 1963年的一篇文章,数据内容是美国1955年145家电力企业的横截面数据,变量主要有TC(企业总成本)、Q(产量)、PL(工资率)、PF(燃料价格)及PK(资本租赁价格)。完整的数据在本书附带光盘里的data文件夹的“nerlove.dta”工作文件夹中。根据cobb-douglas生产函数:,在企业追求成本最小化的的合理假设下,可证明其成本函数也为cobb-douglas函数,可显示如下:本实验中,运用(ynyng)

4、nerlove数据分析各个解释变量对总成本TC的影响,并运用多种方法检验是否存在异方差,如果存在异方差则对模型进行合理的修正,最终得到一个效果较好的模型。共四十九页三、实验操作指导这就是实验模型。显然模型将一个非线性模型转化成了线性模型,在运用计量经济学进行模型研究时,将非线性模型化为线性模型来简化分析(fnx)一直是计量经济学的指导准则。2.打开文件,进行回归(1)打开文件命令 use c:datanerlove,clear 或者直接从菜单栏中“file”选择“open”找到需要打开的数据文件nerlove共四十九页(2)对回归方程进行估计在stata命令窗口中输入如下命令:根据实验结果图回

5、归方程具体化为:lntc=-3.57+0.72lnq+0.46lnpl-0.22lnpk + 0.43lnpf;根据结果图中给出的p值看出,在10%和5%的置信度下模型都只有lnq和lnpf的系数(xsh)和常数项通过了t检验。共四十九页3.异方差检验对模型进行回归并不是本章的知识(zh shi),然而回归是一个基础,即做异方差检验之前必须做回归,下面将会详细介绍异方差检验的基本方法。(1)残差图观察法做完模型的基本回归后,运用Stata绘制残差图来观察异方差是否存在。在命令窗口中输入如下两个命令中的任意一个即可rvfplot (residual-versus-fitted plot)rvpp

6、lot varname (residual-versus-predictor plot)第一个命令语句的作用是绘制默认形式的残差图,第二个命令语句的作用是绘制残差与某个解释变量的散点图,varname可以换做认为合理的解释变量。 共四十九页在前面的章节中,已经介绍过作残差图的各种命令,所作出的各种图形虽然有些差异,但是所展示的信息是基本一致的。图8.2中显示残差的方差是变化的,从一开始时分散程度很大(方差大),然后逐渐变得紧凑(方差变小),这样一来很显然的否定了球形扰动项的假设。即通过残差图观察法,得出的结论是此模型存在异方差问题。在stata中分别输入:rvpplot lnq rvpplot

7、 lnpf rvpplot lnpl rvpplot lnpk 通过rvpplot varname命令的残差预测图知道异方差存在主要的决定变量是lnq,因为它与残差形成的散点图与被解释变量的拟合值形成的残差图形状(xngzhun)最相似,但是其他变量也或多或少的影响了异方差的形成。共四十九页通过绘制残差图可以直观地观察到是否(sh fu)存在异方差,但是观察残差图的方法标准较为模糊,会遇到模型残差图很难判断的情形。所以只采用残差图的方式判定模型的方差形式是不够严谨的,必须配合下面几种正规的检验方法才有信服力。 (2)怀特检验法根据本章节介绍的该方法的原理,Stata可以直接得到检验结果。对模型

8、基本回归结束后,需要在命令窗口输入如下命令:estat imtest, white 共四十九页读怀特检验结果(ji gu)图:可见怀特检验的原假设是模型是同方差,备择假设是无约束异方差。怀特检验结果显示,模型以p值为0的检验结果显著地拒绝了原假设。结论与前面的残差图结果是一致的,但更具有说服力。此外,该检验还对异方差的的形式(skewness(偏斜)、kurtosis(峰度)进行了检验,结果显示偏斜的程度在统计上更加显著。共四十九页4、异方差的处理若检测结果是存在异方差,就要对异方差的问题进行处理,下面将会介绍Stata中常用的修正存在异方差的模型的方法。(1)稳健标准差加OLS法此方法适用(

9、shyng)于大样本的情况,Stata中所使用的命令语句是:reg y x1 x2 , robust显然从命令语句上看,与普通最小二乘法区别就是后面加上“robust”,表示在模型估计中采用的是稳健标准差。在实验中,以nerlove数据为例,来看此种修正的操作结果。在命令窗口中输入:reg lntc lnq lnpl lnpf lnpk, robust与图8.1异方差处理之前的回归结果比较,系数的估计量没有发生变化,而估计量的置信区间和标准差发生了变化。在稳健标准差这种方法估计下,各估计量的t检验p值发生了很大变化,在10%的置信度下,只有lnpk的系数未通过检验。共四十九页(2)WLS法(加

10、权最小二乘法)vwls 是进行加权最小二乘估计(gj)的命令,y x1 x2 依次填入被解释变量和解释变量,if是条件语句,in是范围语句,weight是权重语句,options的内容反映在下表中: 共四十九页在模型修正中,很重要的一步就是如何计算标准差序列(xli),下面介绍具体做法: 共四十九页在本实验中,在模型的基本回归结束后,使用WLS法对模型进行异方差的修正。具体做法是Stata命令窗口中输入如下命令可以(ky)得到图8.12所示结果:predict u, residualspredict yf, xbgen lnu2=ln(u2)gen yf2=yf2quietly reg lnu

11、2 yf yf2predictnl u2f = exp (xb()gen sd=sqrt(u2f)vwls lntc lnq lnpl lnpf lnpk , sd(sd)模型回归结果图看出,模型系数的估计值发生了很大变化,且系数估计的p值显示只有lnpl的系数估计值未通过检验。共四十九页另外,加权最小二乘法可以通过regress命令中的weight选项来实现。接着上文定义的有关变量,gen invar=1/u2fregress y x1 x2 (iweight=invvar)这两条命令以gen生成权重来进行基本回归(hugu)估计,得到与以上相同的回归(hugu)结果。共四十九页(4)FGL

12、S(可行广义(gungy)最小二乘法)对于(2)、(3)、(4)三种方法实际上是类似的,由于GLS、WLS使用到未知的V(X),使用时必须将V(X)已知化,实际上就是FGLS了。现代计量经济学多使用FGLS法。Stata中FGLS法操作步骤和命令的基本步骤如下:共四十九页reg y x1 x2 aweight=invvar输入此命令语句对模型加上得出的权重进行修正回归,这样就基本完成了FGLS法回归,可以得到一个(y )修正回归后的结果。那么在本实验中,使用FGLS方法来对模型进行修正回归的操作如下:predict u, residuals gen lnu2=ln(u2)然后进行回归,并得到拟

13、合值,quietly reg lnu2 lnq lnpl lnpf lnpkpredict g, xb 找到权重,对模型加上权重进行回归就可以得到图8.13的回归结果图。gen h=exp(g)gen invvar=1/hreg lntc lnq lnpl lnpf lnpk aweight=invvar 共四十九页结果图显示FGLS方法可以使模型修正为:lntc=-3.58+0.82lnq+0.47lnpl+0.48lnpf-0.37lnpk根据模型估计的p值得到只有lnpk的系数在5%的置信度下未通过检验,而在10%的置信度下全部的估计量通过了检验。经异方差处理后,将回归结果图8.13与处

14、理之前的回归结果图8.1相比较,估计量的值发生了变化,说明异方差的存在确实是影响了估计值的准确度。且修正后模型的拟合(n h)优度等指标都进一步改善,估计系数更多更显著地通过了t检验。总之,修正使得模型的回归估计更加精确。共四十九页第2节 自相关和可行(kxng)广义最小二乘法实验基本原理自相关是在运用计量经济学分析现象、建立模型(mxng)时又一违反球形扰动项假设的重要问题,即若存在i不等于j,使 , 就称模型存在自相关问题。从扰动项的协方差矩阵来看自相关问题就是,非对角线的元素不全为零。如果所建模型出现自相关,则模型的估计会出现以下问题:对于如何修正模型中存在的自相关问题,要做好两个工作:

15、一是自相关的检验准确地对所建立的模型进行检验,从而确定自相关是否存在;二是自相关的处理若发现模型存在自相关,要进行合理地修正模型重新进行估计。共四十九页共四十九页共四十九页共四十九页若解释变量满足严格(yng)外生性的假定,那么FGLS的估计效果是比较准确的。而若解释变量不满足“严格外生”仅仅满足“前定解释变量”的条件,则FGLS的估计效果是可能不一致的,而OLS估计量是一致的。(4)修改模型这个方法是认为模型自相关的产生可能是因为模型设定有误,通过修改模型达到消除自相关的目的。当然这个不是本章实验的重点,但对于计量经济学建立模型确实很重要。共四十九页实验内容和实验数据根据某统计资料,得到英国

16、政府1952-1995年间每月短期利率和长期利率的数据ukrates.dta。实验据此来考察(koch)英国政府如何根据长期利率(r20)的变化来调整短期利率(rs)。完整的数据在本书附带光盘data文件夹下“ukrates.dta”工作文件中。利用ukrates 数据,运用计量经济学建立模型来研究两利率之间的关系,并检验模型是否存在自相关问题,然后在Stata中对模型存在的自相关问题进行处理。共四十九页实验操作(cozu)指导共四十九页根据本实验中模型的具体形式基本回归(hugu)命令形式如下:reg D.rs LD.r20 输入该命令表示rs的一阶差分项对r20的滞后一阶差分项进行回归共四

17、十九页3、自相关检验(1)作图法在Stata中通过描绘残差项的自相关图与偏自相关图来判断模型的自相关情况。模型回归之后,在Stata命令窗口输入如下(rxi)命令生成模型的残差项:predict e, res 然后输入如下命令来生成模型的残差图: scatter eps time 使用散点图绘制命令scatter在这里绘制横轴是时间变量time,纵轴是模型残差项eps的散点图。在本实验中,输入如下命令得到图8.16残差图: scatter e month 此命令表示绘制的是以月为时间变量的残差图。此图横轴为时间,可以看到残差项随时间成连续变化(在一段时间内残差在0的同一侧),是典型的具有正自相

18、关的模型。共四十九页在本实验中输入如下命令: scatter e L.e看到本实验中残差项与其滞后一项的残差关系图,若模型不存在自相关关系,e与会散乱分布,而本图显示(xinsh)分布有向上倾斜的趋势,显然存在一阶正自相关。ac e 此ac命令表示生成变量的自相关图,在这里就是生成残差项e的自相关图从此残差项的自相关图,可以看出:样本自相关系数未很快衰减到阴影内部,反而在很长的时间里仍有比较大的自相关系数;所以样本是自相关的。 共四十九页也可以使用生成变量偏自相关(xinggun)的命令pac生成残差项的偏自相关图,stata中输入如下命令即可得到偏自相关图:pac e 偏自相关图的解读方法与

19、自相关图读法是很相似的,显然结果图给出了模型存在自相关的结论。如果使用自相关与偏自相关的实际值检验来判断模型是否存在自相关,可以使用如下命令:corrgram e,lag(10) 输入此命令可以得到变量e的自相关和偏自相关系数值及Q检验的列表图8.20,然后通过此结果判断变量e的自相关情况:共四十九页此结果图给出了样本的滞后1-10阶的自相关和偏自相关系数,可以看到自相关系数先后连续为正值或者连续为负值,且在很长的时间内仍然是显著自相关的(比如滞后10阶时,Q检验的Q值为0.0031仍很显著),所以从自相关系数可以看到变量e是存在显著自相关的。同样的解读方法可以得到偏自相关系数显示出e也是存在

20、自相关的,关于Q检验是时间序列中的基本检验,具体内容在时间序列可以查阅(chyu)。以上是介绍了各种图来直观判断自相关是否存在,由于看图判断法标准比较模糊,所以只能对模型的自相关粗略判断。共四十九页(2)BG检验BG检验的命令语句(yj)是:bgodfrey ,bgodfrey_options BG检验的基本命令是bgodfrey,命令后面的bgodfrey_options主要包括:共四十九页bgodfrey 以上命令stata默认其检验的是滞后一阶的自相关bgodfrey,lag(n) 此命令语句是检验滞后n阶的关系,但并不是说明存在n阶自相关本实验中,进行基本回归(hugu)生成残差后,在

21、命令窗口输入如下命令检验模型的滞后一阶自相关情况:BgodfreyBG检验结果图显示BG检验的p值很小,且结果显示BG检验原假设是模型不存在序列自相关。所以模型以p值0.0001显著拒绝原假设,即检验结果是模型存在序列相关。如果要检验该模型滞后期为半年的自相关情况,则在命令窗口中输入如下命令得到图8.22的检验结果:bgodfrey, lag(6)显然,检验结果显示在5%置信度下模型仍然存在自相关(p值为0.0084),实际上这种命令是一种不太准确的联合检验高阶自相关,时间序列篇会讲如何单独检验高阶自相关。 共四十九页(3)Box-pierce Q 检验与Bartlett检验Q检验的命令语句是

22、:wntestq varname if in ,lags(p) 该命令语句中varname中加入需要检验的变量名称,if表示检验的约束条件,in表示检验变量的范围,lags(p)表示检验变量滞后p阶的自相关情况。该命令默认p值为p=minfloor(n/2)-2,40。本实验中,在回归并生成残差后,在命令窗口中输入如下命令得到(d do)结果:wntestq e 或者在命令窗口中输入如下命令来检验模型滞后2阶的自相关情况:wntestq e, lag(2) 共四十九页Bartlett检验命令语句:wntestb varname if in ,options此命令语句中wntestb表示进行Ba

23、rtlett检验,varname表示需要检验的变量名称(mngchng),if表示此检验的约束条件,in表示变量的取值等范围,options的具体情况包括下表内容:共四十九页输入此命令后,Stata会生成一个白噪声检验图,图的最外面两条线表示临界线,形成一个区域,如果点全在内部则表明变量是白噪声序列,有点在区域之外则表示变量存在自相关。本实验中,回归并生成方差后,在命令窗口中输入如下(rxi)命令检验变量e的自相关情况,可以得到结果图:wntestb e 可以看到在图中有很大一部分点在临界线的外面,所以此结果图也表明变量存在自相关。共四十九页(4)DW检验DW检验的命令语句是:dwstat 或

24、者 estat dwatson在模型基本回归之后,输入此命令即可以进行DW检验。经验上,DW值在1.8-2.2之间时接受原假设,说明模型不存在一阶自相关。若DW值接近0或者接近4,则拒绝原假设,说明模型存在一阶自相关。其他DW值需要查表。得到上下限,进行推断(tudun)。另外DW检验存在模糊区域,即DW值若落在模糊区域则无法判断模型的自相关问题,需要用其他检验方法。共四十九页做完回归之后,在命令窗口输入如下(rxi)命令dwstat 可以看到结果图显示DW值为1.7,读者可进行查表检查,若落在模糊区域则需其他检验方法。共四十九页4、自相关处理(1)HAC稳健标准差处理和聚类稳健标准差处理HA

25、C稳健标准差处理在stata中命令语句:newey y x1 x2 xk if in weight, lag(p) options命令语句中newey表示对模型进行HAC稳健标准差处理,if表示进行对模型进行回归的约束条件,in表示回归变量的取值等的范围。Options的内容包括下表的内容:注意HAC标准差后面必须指明自相关阶数p。在本实验中,针对模型的自相关问题进行HAC处理时,在命令窗口输入如下(rxi)命令得的回归结果:newey D.rs LD.r20, lag(1)此命令表示使用HAC稳健标准差法进行估计模型,并设置解决的模型的自相关问题的自相关阶数是1.共四十九页与处理之前的回归结

26、果相比,模型解释变量的系数估计值未发生改变,但是标准差发生了变化,所以置信区间也相应发生变化。聚类稳健标准差处理在Stata中命令语句如下:reg y x1 x2 x3 ,cluster(state) 该命令语句中cluster(state)是说明聚类稳健标准差的聚类变量,所以state可以用选择的聚类变量来替代。本实验中,在命令窗口中输入(shr)如下以r20为聚类变量的聚类回归命令得到回归结果:reg D.rs LD.r20, cluster(r20)该处理后的回归结果与处理之前的回归结果相比,解释变量系数的估计值没有变化,只是标准差和相应的置信区间发生了变化。另外在对一个模型进行聚类回归

27、时,除了聚类变量在意义上很明确外,我们可以将模型中可能的变量分别代入聚类变量进行回归,然后选择导致的样本聚类较少的那个变量作为真正回归的聚类变量。共四十九页(2)可行广义最小二乘法可行广义最小二乘法在Stata中的命令语句为:prais y x1 x2 x3 if in ,optionsprais表示(biosh)可行广义最小二乘法的命令,if表示此回归的回归条件,in表示此回归的样本取值范围等,options的内容如下表所示:共四十九页另外,(1)y与x可以包含时间序列符号。(2)允许by,rolling,statsby,xi语句by表示在样本的一个子集基础上运行该命令statsby含义同b

28、y,但是其从每次命令运行后的数据中收集数据子集。rolling表示在移动子样本的基础上运行该命令xi表示在加入因素变量和交叉项后运行该命令以上几个命令词汇在实验中很少用到。Cochrane-Orcutt(1949)估计(此估计舍弃了第一期观测值)在Stata中的命令语句具体为:prais y x1 x2 x3 ,options corc此命令语句实际上是上面可行广义最小二乘法命令的corc具体形式,所以(suy)options包括的内容与上面除corc之外都相同。最常用的简单命令有两个如下所示:prais y x1 x2 x3 ,rho(dw) corc此Cochrane-Orcutt估计命令特定了求解的方法是dw法 prais y x1 x2 x3 , corc此命令表示此Cochrane-Orcutt估计默认了stata的rho估计方法,且无其他特定要求。共四十九页本实验中,在命令窗口中输入以下命令语句对模型进行Cochrane-Orcutt估计:prais D.rs LD.r20, corc 显然模型具体化为:,根据结果中的p值得到常数项未通过t检验。读此回归结果图,看到其原理就是不断试错迭代,最终得到一个合理的rho值可以消除自相关问题,且图的最后得出了修改模型后的DW值为2,位于(wiy)1.8-2.2中,即此时模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论