违反模型古典假定的计量经济问题.docx_第1页
违反模型古典假定的计量经济问题.docx_第2页
违反模型古典假定的计量经济问题.docx_第3页
违反模型古典假定的计量经济问题.docx_第4页
违反模型古典假定的计量经济问题.docx_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论违反模型古典假定的计量经济问题异方差性一、异方差性对于模型Yi=b0+b1X1i+b2X2i+L+bkXki+ui同方差性假设为i=1,2,L,nVar(ui)=s2i=1,2,L,n如果出现Var(ui)=si2i=1,2,L,n即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则称出现了异方差性。强调对于每一个样本点,随机误差项都是随机变量,服从均值为0的正态分布,所谓异方差性,是指这些随机变量服从不同方差的正态分布。我们可以通过下面两个图形比较同方差和异方差:在a同方差情况下,与任意选定的X相对应的Y的子总体具有相同的方差。在b异方差情况下,不同的X所对应的Y的子总体具有不同的方差。二、异方差的实际背景1经济现象本身的特点例研究居民消费问题,建立消费函数Ci=b0+b1Ii+uiIi=居民收入额Ci=居民支出额项ui具有异方差性,误差项Var(ui)=s的假定不符合实际经济现象。收入高的居民平均支出水平也高,收入低的居民在维持平均水平较低的每月日常支出后节余很少,很难有大的偶尔开支,因此偏离均值的程度就小。而收入高的居民在维持平均水平叫高的每月日常支出后节余仍然很多,完全有能力支出大的非日常项目,因此偏离均值的程度就大。收入水平不同的居民之消费行为的差异,在消费模型中的表现就是误差22略去某些变量若对被解释变量有重要影响的解释变量全都明确地引入模型并设立正确,不存在大的观测误差,误差项是由大量微小的随机误差聚合而成,一般说来不会违反同方差假定。但有时根据研究目的,有些经济变量被略去,不明确引入模型。若这些被略去的变量对被解释变量影响比较重要,一般呈现某种趋势,那么误差项的随机性和同方差性将被破1t统计量中包含有s,当不满足同方差假定时,s不再是总体方差s的无偏估计,间中也包含有随机误差项共同的方差s,所以当模型出现异方差性时,它的预测功能失效。坏。3模型的设立误差在实际中,往往为了便于估计而采用线性模型近似表示,设想一下,用一条直线去近似地表示一条曲线,在有的区间直线与曲线相距较近,能够很好地表示曲线的这一区间部分,误差较小,必然存在另外一些区间直线与曲线相距较远,不能够很好的表示曲线的这一区间部分,误差较大从而形成异方差性。4测量误差由于对变量的样本观察值的误差,随解释变量的增加,测量误差也趋于增加。因为在很大的范围内收集资料和保持它们的一致性及可靠性是比较困难的,此外,测量误差在时间范围内逐渐积累,误差项也趋于增加,误差项的方差呈递增趋势,随着抽样技术和资料搜集技术的改进,测量误差会逐渐减少,误差项的方差随时间呈递减趋势。这两种趋势都使模型具有异方差性。三、异方差性的后果1参数估计量非有效从前面有关参数估计量的线性性,无偏性和有效性的证明过程,可以看出线性性和无偏性的证明过程中没有利用同方差性的假定,所以当计量经济学模型出现异方差性,其普通最小二乘法参数估计量仍然具有线性性,无偏性,但不再具有有效性,即使样本趋于无穷大,仍然不具有渐近有效性。2变量的显著性检验失去意义222从而导致计算出的t统计量不再满足t分布,检验失去意义,其他检验(F)也是如此。3模型的预测失败一方面由于上述后果,使模型不具有良好的统计性质,另一方面,在观测值的置信区2四、异方差性的检验1图示法(1)Xiei2若ei不随Xi的变化而变化,则扰动项ui无异方差性,否则存在异方差性。2(2)Yi-ei2Spearman(斯皮尔曼)等级相关系数检验该方法用于检验是否存在异方差,观测值可以是大样本,也可以是小样本基本思路若扰动项是ui同方差的,那么残差ei的大小与解释变量Xi的取值无关。(Qui不可求,用ei代替ui)这可以通过二者的等级相关系数来反映。2检验步骤(1)用最小二乘法估计回归模型Y=b0+b1X1+b2X2+L+bKXK+u的回归系数bj(j=0,1,2,Lk)求出扰动项ui的估计值eiei=Yi-Yi显然,ei的异方差性与ui的异方差性等价,因此只要检验ei与Xi的相关性,便可确定ui的异方差性。但是在ei与Xi的简单相关系数的计算公式中,分子eixi是等于0的,即ei与Xi的简单相关系数恒等于0,所以不能用来衡量ei与Xi的关系,也就不能判断ui的异方差性,为此我们改用等级相关系数来检验ei与Xi的相关程度。(2)对解释变量Xi和残差ei分别按从小到大的顺序重新排列,并赋予1到n中的一个顺序号表示其等级。(若两个值相等,则等级取等级的平均数)(3)计算ei与Xi的等级差didi=Xi的等级ei的等级(4)计算等级相关系数r=1-6di2n(n2-1)其中n为样本容量(5)对等级相关系数进行显著性检验提出假设r近似服从均值为0,方差为1/(n-1)的正态分布r:N(0,1n-1)Z统计量Z=rn-1:N(0,1)H0:r=0无异方差性H1:r0有异方差性2r1n-1查表确定临界值3Za=24若ZZa,则拒绝H0:r=0,接受H1:r0,认为ui与Xi关系密切,ui存在异2方差性(等级相关系数显著)例题见于俊年P120页3HGlejser(戈里瑟)检验该方法不仅可以用于检验异方差的存在,更重要的是可以查明异方差的表现形式,这对异方差的修正非常重要。基本思路在残差ei关于解释变量的各种幂次影响关系中,确定出一个最显著的函数形式,它不仅可以说明异方差的存在,还确立了异方差的表现形式。检验步骤(1)用OLS估计回归模型的回归系数,求出扰动项ui的估计值ei。(2)用ei与解释变量Xi的不同幂次进行回归模拟,选择出最佳的回归估计式。例如:ei=b0+b1Xi+uiei=b0+b1Xi2+uiei=b0+b1Xi+uiei=b0+b11Xi+ui在对这些模型进行OLS估计的基础上,由R和标准差(t)检验,选择最优的拟合回归形若认为si与多个解释变量有关,则可用ei对多个解释变量回归,方法同上。2式。(3)对选择的最优拟合回归形式进行F检验,若显著则认为存在异方差性,否则再选择其他回归形式。2由于检验是试验性的,如果模型选不好,则检验不出是否存在异方差性。4GoldfeldQuandt(戈德菲尔特夸特)检验仅适用于大样本,而且具体步骤(1)将解释变量按观测值从小到大重新排队,被解释变量与解释变量保持原来的对应关系。4(2)将位于中间的c个观测值略去,通常cn4,剩下两个样本容量分别为n-c2的子样本(n与c应当同为奇数或同为偶数)。一个子样本解释变量的观测值较小,另一个子样本解释变量的观测值较大。(3)对两个子样本分别利用最小二乘法进行回归,并计算各自的残差平方和,记RSS1为解释变量的观测值较小的残差平方和,RSS2为解释变量观测值较大的子样本的残差平方和。(4)进行假设检验2=suH0:su122=L=sun2H1:su12,su22,Lsun2随Xi递增RSS2/RSS1/-k-1-k-1F=n-c2n-c2n-c-k-1,n-c-k-1:Fa22Fan-c-k-1,n-c-k-1224若FFa-k-1拒绝H0:su1=su2=L=sun,接受n-c2-k-1,n-c2222H1:su12,su22,Lsun2随Xi递增,说明随机扰动项存在异方差性。若F2s2s2s2sk,接受H0:r=0,表示扰动项无序列相关。若,拒绝H0:r=0,接受H1:r0,表示扰动项存在序列相关。DW=2s2s2s2s2k冯诺曼比与DW统计量的关系s2n-1sn4Durbin-Watson(杜宾瓦特森)检验。12是诊断自相关最著名的检验,其定义为DW=d=(e-eent=2tt-1n2tt=1)2DW统计量的最大优点就是简单易行。(1)DW检验的适用条件回归模型中包括截距项,DW统计量无法用来判定那些通过原点的回归模型的自相关问题。解释变量是非随机变量适用于一阶自相关检验ut=rut-1+Vtr0r称为自相关系数r0时,扰动项正序列相关,当r0时,扰动项负序列相关。对于自回归方程(因变量的滞后值作为解释变量)不适用。例Yt=b0+b1Yt-1+b2Xt+utDW统计量(2)检验步骤提出假设:2H0:r=0H1:r0(u无一阶自相关)(u存在一阶自相关)DW=(e-eent=2tt-1n2tt=1)2(ee=nt=2t2+et-12-2etet-1)n2tt=1et2+et-12-2etet-1)e=nnnt=2t=2t=2n2tt=1对于大样本et2et-12et2nnnt=2t=2t=1132et-12-2etet-1e因此DW=nnt=2t=2n2t-1t=2=t2etet-1=t2et=t2etet-1=21-n=t2et-1n=21-n2n2ut=rut-1+Vt的回归系数估计量r=eee我们知道nt=2nt=2tt-12t-1于是DW=2(1-r)因为r1,r是r的估计值r1,0DW4所以DW检验统计量的值域为0DW43r值r=-1r=0r=1DW值判断DW=4完全负相关DW=2无自相关DW=0完全正相关杜宾和瓦尔森给出了DW的两个临界值的下限dl和du,这些临界值取决于观察值个数n和解释变量个数k。n可取从6到200,k最大可达到20,而且给出2种显著性水平1%和5%下的DW值。DW的临界区域重要缺陷:有两个无结论区,一旦DW值落入则无法判断,必须增大样本容量,重新估计模型,重新检验。样本容量不小于15。五、解决序列相关的方法(一)广义差分法14差分法是一类克服序列相关性的有效的方法,差分法是将原模型变换为差分方程,分为一阶差分法和广义差分法。对于多元线性回归模型Yt=b0+b1X1t+b2X2t+L+bkXkt+ut假设扰动项u存在一阶序列相关ut=rut-1+Vt(1)(2)其中Vt满足普通最小二乘法的假设,并假设自回归系数r已知,且由(1)式r1Yt-1=b0+b1X1,t-1+b2X2,t-1+L+bkXk,t-1+ut-1(3)(1)r(3)得:Yt-Yt-1=b0(1-r)+b1(X1t-rX1,t-1)+b2(X2t-rX2,t-1)+L+bk(Xkt-rXk,t-1)+(ut-rut-1)(4)令Yt*=Yt-rYt-1b0*=b0(1-r)X1t*=X1t-rX1t-1X2t*=X2t-rX2t-1MXkt*=Xkt-rXkt-1于是有:Yt*=b0*+b1X1t*+b2X2t*+L+bkXkt*+Vtt=2,3,L,n(5)可以用OLS估计参数b0和b1,b2,L,bk,应该注意,变换后的数据由于Vt满足全部假定,变换后的模型(5)叫做广义差分模型,已没有自相关,因此*(X1t*,X2t*,L,Xkt*,Yt*)将损失一个观测值,这是因为变换Y1*=Y1-rY0,X11*=X11-rX10,L,中不存在X10,X20,L,Xk0和Y0为了避免这一损失,K.R.Kadiyala提出了对第一个观测值作如下变换15对模型估计可得b0,再利用b0=X11*=1-r2X11X21*=1-r2X21MXk1*=1-r2Xk1Y1*=1-r2Y1*b0(1-r)求得b0=b0*1-r当扰动项存在高阶序列相关时,假设自回归系数r1,r2,Lrm已知即ut=r1ut-1+r2ut-2+r3ut-3+L+rmut-m+Vt(6)多元线性回归模型Yt=b0+b1X1t+b2X2t+L+bkXkt+ut(7)的t-1t-m滞后项的回归模型分别为Yt-1=b0+b1X1,t-1+b2X2,t-1+L+bkXk,t-1+ut-1Yt-2=b0+b1X1,t-2+b2X2,t-2+L+bkXk,t-2+ut-2MYt-m=b0+b1X1,t-m+b2X2,t-m+L+bkXk,t-m+ut-m用(7)式减去r1乘以一阶滞后式、r2乘以二阶滞后式、rm乘以m阶滞后式得:Yt-r1Yt-1-r2Yt-2-L-rmYt-m=b0(1-r1-r2-L-rm)+b1(X1t-r1X1t-1-r2X1t-2-L-rmX1t-m)+b2(X2t-r1X2,t-1-r2X2,t-2-L-rmX2,t-m)+L+bk(Xkt-r1Xk,t-1-r2Xk,t-2-L-rmXk,t-m)+(ut-r1ut-1-r2ut-2-L-rmut-m)t=m+1,m+2,n令16Yt*=b0*=X1t*=X2t*=MXkt*=于是Y*=b0*+b1X1t*+b2X2t*+L+bkXkt*+Vt(8)(8)式满足普通最小二乘法估计的假设,可用OLS求估计值,因为在差分时损失了m个样本值,所以估计(8)式时,其样本观测点t=m+1,m+2,n,因此,若进行高阶差分,样本观测值的个数要比较多,以保证差分后估计回归系数时有足够的样本个数。(二)一阶差分法将原模型Yi=b0+b1X1i+b2X2i+L+bkXki+ui(i=1,2,,n)变换为VYi=b1VX1i+b2VX2i+L+bkVXki+(ui-ui-1)(9)其中VYi=Yi-Yi-1若模型存在完全一阶正自相关即(i=1,2,,n)u=rui-1+eiu=ui-1+ei(r=1)其中ei不存在序列相关,那么(9)满足OLS的基本假设,可用OLS估计(9)的参数。注意一阶差分模型不含有截距项。(三)r的估计(随机误差项相关系数)一阶线性自回归形式ut=rut-1+Vt-1r1r称为自相关系数r=uuu用OLS估计nt=2nt=2tt-12t-117ut2ut-12ruuuur=1-DW当样本容量很大时,有ntt-1t=2nn22tt-1t=2t=21从DW统计量中估计rQDW=2(1-r)12nnt=2t=2(符合相关系数定义)在小样本情况下(theil)泰尔建议n2(1-)+(k+1)2n-(k+1)2r=2d2nk方程自变量个数(不含截距项)r=eee大多数软件包都可以计算出DW统计量的值,那么我们就可以得到r的近似值,这种方法很容易使用,但只有在样本量很大时才能得到较理想的r值。2从OLS残差et中估计rQut=rut-1+Vtet=ret-1+Vttt-12t-13.杜宾(Durbin)两步法(钟宜P222)杜宾两步法适合于任意阶扰动项序列相关,为方便起见,不妨设多元线性回归模型的扰动项一阶序列相关。设给定模型为:Yi=b0+b1X1i+b2X2i+L+bkXki+uiui=rui-1+Vi(Vi服从基本假设)第一步,对模型进行广义差分变换,得Yi-rYi-1=b0(1-r)+b1(X1i-rX1i-1)+b2(X2i-rX2i-1)+L+bk(Xki-rXki-1)+Vi(Vi=ui-rui-1)移项得:Yi=b0(1-r)+rYi-1+b1(X1i-rX1i-1)+b2(X2i-rX2i-1)+L+bk(Xki-rXki-1)+Vi整理得:Yi=b0(1-r)+rYi-1+b1X1i-b1rX1i-1+b2X2i-b2rX2i-1+L+bkXki-bkrXki-1+Vi18令a1=b0(1-r)a2=b1a3=-b1ra4=b2a5=-b2rMa2k=bka2k+1=-bkr上式可写作Yi=a1+rYi-1+a2X1i+a3X1i-1+a4X2i+a5X2i-1+L+a2kXki+a2k+1Xkt-1+Vi对这个方程应用OLS,求得r的估计值r,在这里它是滞后变量Yi-1的系数。第二步:用r的估计值r对方程进行变换:令Y1*=Yi-rYi-1b0*=b0(1-r)X1i*=X1i-rX1i-1X2i*=X2i-rX2i-1MXki*=Xki-rXki-1得到Yi*=b0*+b1X1i*+b2X2i*+L+bkXki*+Vi应用OLS方法,求得参数估计值而b0=b0/(1-r)b0*,b1,b2,bk*这就是Durbin两步法,第一步求出自相关系数r的估计值,第二步利用求得的r,对参数bi(i=0,1,2,Lk)进行估计。这种方法不但求得了自相关系数的估计值,而且得出了模型参数的估计值,是一种简便可行的方法。(四)广义最小二乘法第三节多重共线性一、多重共线性(Multicollinearity)19对于模型yi=b0+b1x1i+b2x2i+L+bkxki+mii=1,2,n(2.8.1)其基本假设之一是解释变量x1,x2,L,xk是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。如果存在c1x1i+c2x2i+L+ckxki=0i=1,2,n(2.8.2)其中c不全为0,即某一个解释变量可以用其它解释变量的线性组合表示,则称为完全共线性。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性。二、实际经济问题中的多重共线性在实际经济问题中,由于经济变量本身的性质,导致计量经济学模型的解释变量之间往往存在不同程度的线性关系。下面通过几个例子加以说明。例如,以某一行业的企业为样本建立企业生产函数模型,以产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量。这些投入要素的数量往往与产出量成正比,产出量高的企业,投入的各种要素都比较多,这就使得投入要素之间出现线性相关性。如果以简单线性关系作为模型的数学形式,那么多重共线性是难以避免的。再如,我们建立一个服装需求函数模型,以服装需求量q为被解释变量,根据需求理论,选择收入I、服装价格p和其他商品价格为解释变量,于是有:qi=f(Ii,piL)+mii=1,2,n在该模型中,按照直观判断,解释变量收入与价格之间不应该相关,因为商品的价格并不随购买者的收入而发生变化。但是,调查数据却显示,它们之间确实存在着一定的相关性。进一步分析发现,高收入者经常在高档商场购买服装,低收入者一般在低档商场购买服装,同样的服装对于不同收入的购买者确实有不同的价格。这就产生了多重共线性。再例如,以相对收入假设为理论假设、以时间序列数据作样本建立居民消费函数:Ct=b0+b1It+b2Ct-1+mtt=1,2,n很显然,当期收入It与前期消费Ct-1之间具有较强的线性关系。一般经验告诉我们,对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。以截面数据作样本时,问题不那么严重,但仍然是存在的。三、多重共线性的后果计量经济学模型一旦出现多重共线性,如果仍采用普通最小二乘法估计模型参数,会产生下列不良后果:1完全共线性下参数估计量不存在多元线性模型Y=XB+N的普通最小二乘参数估计量为:$B=(XX)-1XY(2.8.3)20可见,由于此时,引起主对角线元素较大,所以(2.8.3)表示的普通最小XX0()XX如果出现如(2.8.2)上所示的完全共线性,显然,(2.8.3)中的不存在,无法得()XX-1到参数的估计量。2一般共线性下普通最小二乘法参数估计量非有效在一般共线性(或称近似共线性)下,虽然可以得到普通最小二乘法参数估计量,但是由参数估计量方差的表达式$2Cov(B)=sm(XX)-1-1二乘参数估计量非有效。3参数估计量经济含义不合理如果模型(2.8.1)中两个解释变量具有线性相关性,例如x1和x2,那么它们中的一个变量可以由另一个变量表征。这时,x1和x2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。4变量的显著性检验失去意义5模型的预测功能失效四、多重共线性的检验由于多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论