计量经济学的三种检验课件_第1页
计量经济学的三种检验课件_第2页
计量经济学的三种检验课件_第3页
计量经济学的三种检验课件_第4页
计量经济学的三种检验课件_第5页
已阅读5页,还剩283页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学检验一、多重共线性二、异方差三、自相关1计量经济学检验一、多重共线性1一:多重共线性多重共线性的性质多重共线性的原因多重共线性的后果多重共线性的诊断多重共线性的补救措施2一:多重共线性多重共线性的性质2回顾多元线性回归模型的若干假定零均值假定同方差假定无自相关假定随机项与自变量不相关非多重共线性3回顾多元线性回归模型的若干假定零均值假定3假定1零均值假定:E(ui)=0,i=1,2,….n对X1,X2的每个观测值,u可以取不同的值,考虑u的所有可能值,它们的总体平均值(期望值)等于0。4假定1零均值假定:E(ui)=0,i=1,2,….n4假定2同方差假定:Var(ui)=σ

u

2,i=1,2,…n上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。违反假定:异方差5假定2同方差假定:Var(ui)=σu2,i=1假定3无自相关假定:Cov(ui,uj)=0,i≠j,i,j=1,2…..n表明任意两次观测的ui,uj是不相关的,即u在某次的观测值与任何其它次观测中的值互不影响,称为无序列相关性。等方差性和无序列相关性称为高斯—马尔柯夫(Gauss-Markov)假定。违反假定:自相关6假定3无自相关假定:6假定4随机项与自变量不相关:Cov(ui,x1i)=0;Cov(ui,x2i)=0区分随机项u与每个自变量各自对y的影响。如果x是非随机变量,即x是在重复抽样中取某固定值,该条件自然满足。7假定4随机项与自变量不相关:7假定5解释变量之间不存在线性相关关系,即任意两个解释变量之间无确切的线性关系。用统计学语言,称为非共线性或非多重共线性。非完全共线性是指变量不能完全表示为其他变量的完全线性函数。违反假定:多重共线性8假定5解释变量之间不存在线性相关关系,即任意两个解释变量之间完全多重共线性完全共线性(Perfectcollinearity)的例子:X1X2X310505215757518909724120129X1和X2是完全线性相关的:X2=5X19完全多重共线性完全共线性(Perfectcollinear完全多重共线性若X2=5X1将其代入Y’=b0’

+b1’

X1+b2’

X2+b3’

X3Y’=b0’

+b1’

X1+b2’*5X1+b3’

X3=b0’

+(b1’+5b2’

X1+b3’

X3=b0’

+A

X1+b3’

X3三变量模型无法从A值中得到b1’

、b2’的值10完全多重共线性若X2=5X110接近完全多重共线性的情形多重共线性是一个极端的情形在实际中,很少遇到完全多重共线性的情况,常常是接近或高度多重共线性。亦即解释变量是接近线性相关的。例:《widget》教科书11接近完全多重共线性的情形多重共线性是一个极端的情形11问题多重共线性的性质是什么?多重共线性产生的原因是什么?多重共线性的理论后果是什么?多重共线性的实际后果是什么?在实际中,如何发现多重共线性?消除多重共线性的弥补措施有哪些?12问题多重共线性的性质是什么?12多重共线性的性质可以获得原始系数的一个线性组合的估计值。当解释变量之间存在完全线性相关或完全多重共线性时,不可能获得所有参数的唯一估计值。既然我们不能获得它们的唯一估计值,也就不能根据某一样本做任何统计推论(也即假设检验)13多重共线性的性质可以获得原始系数的一个线性组合的估计值。13多重共线性的原因例:消费函数Y=b0+b1X1+b2X2X1=income;X2=wealthX2=5X1Y=b0+b1X1+b25X1Y=b0+(b1+5b2)X114多重共线性的原因例:消费函数14多重共线性的原因所用的数据收集方法例:在X的一个限定的范围内抽样有关被抽样总体的约束:例:具有高收入的人倾向于有更多的财富也许有关低收入的富有的人和高收入的没钱人的数据不够充足。15多重共线性的原因所用的数据收集方法15多重共线性的原因模型设定:例:在模型中加入多项式项,特别是当X的取值范围很小的时候。变量之间有共同的时间趋势模型的过定(overdetermined)解释变量的数目多于观测的数目。16多重共线性的原因模型设定:16多重共线性的理论后果在存在高度多重共线性的情形下,即使多元回归方程的一个或者多个偏回归系数是统计不显著的,普通最小二乘估计量仍然是最优线性无偏估计量。17多重共线性的理论后果在存在高度多重共线性的情形下,即使多元回注意无偏性是一个重复抽样的性质,即:保持X不变,如果得到一些样本并用OLS计算这些样本估计量,则其平均值收敛于估计量的真实值。但这并不是某个样本估计值的性质,在现实中,我们经常无法得到大量的重复样本。18注意无偏性是一个重复抽样的性质,即:保持X不变,如果得到一些注意接近共线性并未破坏最小二乘估计量的最小方差性:在所有线性无偏估计量中,OLS估计量的方差最小。最小方差并不意味着方差值本身也比较小。19注意接近共线性并未破坏最小二乘估计量的最小方差性:在所有线性注意即使变量总体之间不线性相关,但却可能与某一样本线性相关多重共线性本质上是一个样本(回归)现象。原因:大多数经济数据不是通过试验获得。如:国民生产总值、价格、失业率、利润、红利等,是以其实际发生值为依据,而并非试验得到。20注意即使变量总体之间不线性相关,但却可能与某一样本线性相关2多重共线性的实际后果OLS估计量的方差和标准差较大。也就是说,OLS估计量的精确度下降。置信区间变宽。t值不显著,R2较高。OLS估计量及其标准差对数据的微小变化非常敏感,也就是说它们趋于不稳定。回归系数符号有误。难以衡量各个解释变量对回归平方和(ESS)或R2的贡献。21多重共线性的实际后果OLS估计量的方差和标准差较大。也就是说例:消费函数消费函数的结果:Y=24.77+0.94X1-0.04X2t(3.67)(1.14)(-0.53)R2=0.96,F=92.40X1是收入X2是财富高的R2表明收入和财富可以解释消费变化的96%22例:消费函数消费函数的结果:22结果分析没有任何一个斜率系数是显著的。财富变量的符号是错误的。高的F值意味着系数都等于0的联合假设不成立两个变量是如此地高度相关,以至于不能将二者的效应分离出来。23结果分析没有任何一个斜率系数是显著的。23例:消费函数如果将X2对X1回归,得到:X2=7.54+10.19X1(0.26)(62.04)R2=0.99表明,在X1和X2之间有近乎完全的线形关系24例:消费函数如果将X2对X1回归,得到:24例:消费函数Y只对收入回归:Y=24.45+0.51X1(3.81)(14.24)R2=0.96收入变量是高度显著的,但是在前一个模型中是不显著的25例:消费函数Y只对收入回归:25例:消费函数Y只对财富回归:Y=24.41+0.05X2t(3.55)(13.29)R2=0.96财富变量也是高度显著的,但是在前一个模型中是不显著的26例:消费函数Y只对财富回归:26多重共线性真的是一个问题吗?取决于研究目的如果是为了预测,多重共线性未必是坏事如果是为了估计参数(比如弹性、边际值等),多重共线性必定是坏事27多重共线性真的是一个问题吗?取决于研究目的27多重共线性的检验多重共线性是一个程度问题而不是存在与否的问题。由于多重共线性是在假定解释变量是非随机的条件下出现的问题,因而它是样本的特点,而不是总体的特征。28多重共线性的检验多重共线性是一个程度问题而不是存在与否的问题检验方法1R2较高但t值显著的不多。这是多重共线性的“经典”特征。29检验方法1R2较高但t值显著的不多。这是多重共线性的“经典”检验方法2解释变量两两高度相关。逐对检查解释变量之间的相关系数这些仅仅是一些有用的指示,经过这些探查后可能还会有多重共线性解释变量的组合或许具有相关性30检验方法2解释变量两两高度相关。30检验方法3辅助回归:将每个变量对其他剩余变量回归并计算相应的R2值,其中每一个回归都被称作是从属或者辅助回归。然后用Ftest检验R2是否显著地区别于0F=[R2/(k-1)]/[(1-R2)/(n-k)]k是X的数目如果F大于临界值,则R2是显著区别于0的计算较繁琐31检验方法3辅助回归:将每个变量对其他剩余变量回归并计算相应的例考虑Y对X1,X2,X3,X4,X5、X6这6个解释变量的回归辅助回归:用R12表示X1对其余X的回归的判决系数……32例考虑Y对X1,X2,X3,X4,X5、X6这6个解释变量的检验方法4方差膨胀因素(Varianceinflationfactor)其中R2j是Xj对其他X的辅助回归的判决系数这个指标度量方差增加的速度33检验方法4方差膨胀因素(VarianceinflationR2和VIF当R2增加时,VIF也随着增加如果大于10,就表明有问题34R2和VIF当R2增加时,VIF也随着增加34注意R2较高,标准差未必一定大。也就是说它不一定扩大估计量的标准差。辅助回归方程的R2可能只是多重共线性的一个“表面指示器”。更正规的表述为:“较高的R2既不是较高标准差的必要条件也不是充分条件,多重共线性本身并不必然导致较高的标准差。”35注意R2较高,标准差未必一定大。也就是说它不一定扩大估计量的总结检验多重共线性有许多种不同的方法,但却没有一种检验方法能够使我们彻底解决多重共线性问题。多重共线性是一个程度的问题,它是与样本相关的一种现象。有时我们必须综合运用以上各种手段来诊断多重共线性的严重程度。总之,没有一个简单的办法判断多重共线性问题。36总结检验多重共线性有许多种不同的方法,但却没有一种检验方法能补救措施如果t统计量大于2,就不用担心如果回归的R2大于任何一个X对其余Xs回归的R2,就不用担心如果仅仅是对预测感兴趣,并且解释变量的线性组合在未来仍然延续,就不用担心37补救措施如果t统计量大于2,就不用担心37补救措施(经验法则)从模型中删除不重要的解释变量获取额外的数据或者新的样本重新考虑模型先验信息变量变换其他补救措施38补救措施(经验法则)从模型中删除不重要的解释变量38从模型中删除不重要的解释变量对待严重的多重共线性问题,最简单的解决方法就是删除一个或多个共线性变量。导致“模型设定误差”,参数估计量可能是有偏的。建议不要仅仅因为共线性很严重就从一个经济上可行的模型中删除变量。所选模型是否符合经济理论是一个重要的问题。39从模型中删除不重要的解释变量对待严重的多重共线性问题,最简单获取额外的数据或者新的样本有些情况下,通过获得额外的数据(增加样本容量)就能削减共线性的程度。40获取额外的数据或者新的样本有些情况下,通过获得额外的数据(增获取额外的数据或者新的样本既然多重共线性是一个样本特征,那么在包括同样变量的另一样本中,共线性也许不象第一个样本那样高。关键是能否获得另一个样本,因为收集数据的费用很高。41获取额外的数据或者新的样本既然多重共线性是一个样本特征,那么

Y:消费支出;X1:收入;X2:财富10个观察值:Y=24.337+0.87164X1-0.0349X2se=(6.2801)(0.31438)(0.0301)t=(3.875)(2.7726)(-1.1595)R2=0.9682消费支出对于收入和财富的回归方程42

Y:消费支出;X1:收入;X2:财富消费支出对于收入和财富消费支出对于收入和财富的回归方程40个观察值:Y=2.0907+0.7299X1+0.0605X2t=(0.8713)(6.0014)(2.0641)R2=0.967243消费支出对于收入和财富的回归方程40个观察值:43重新考虑模型模型的不恰当设定可能是回归模型存在共线性的原因。省略一些重要的变量没有正确选择模型的函数形式例:需求函数Q=b0+b1p+b2pr+b3income+u变形成Q=b0+b1(p/pr)+b2income+u44重新考虑模型模型的不恰当设定可能是回归模型存在共线性的原因。先验信息根据以往的研究,我们或许知道有关参数值的某些信息,可以将这些信息用于当前的样本。假设先验信息是“正确”的,就“解决”了共线性问题。45先验信息根据以往的研究,我们或许知道有关参数值的某些信息,可例对《wideget》需求函数假设在过去估计过的对《wideget》需求函数中,收入系数为0.9,并且是统计显著的。如果收入系数的过去值没有多少改变的话,我们可以重新估计方程需求量=b0+b1*价格+b2*收入+u=b0+b1*价格+0.9*收入+u需求量-0.9*收入=b0+b1*价格+u46例对《wideget》需求函数假设在过去估计过的对《wid先验信息的缺陷获得外生的或先验的信息并不总是可行的。即使我们能够获得这一信息,但要假设先验信息在当前研究的样本中依然有效这个要求“太高”。47先验信息的缺陷获得外生的或先验的信息并不总是可行的。47变量变换有些情形,通过对模型中变量的变换能够降低共线性程度。例如:在对美国总消费支出的研究中(总消费支出作为总收入和总财富的函数),我们可以采取人均的形式,也就是说,作人均消费支出对人均收入和人均财富的函数,有可能在总消费函数中存在严重的共线性问题,而在人均消费函数中其共线性问题并没有那么严重。不能保证这样的一个变换总能够有助于问题的解决。48变量变换有些情形,通过对模型中变量的变换能够降低共线性程度。例假设我们具有消费、财富和收入的时间序列将会出现严重的多重共线性,因为这些变量随着时间作同方向的运动我们意欲估计Yt=b0+b1X1t+b2X2t+ut在时间t-1处的模型:Yt-1=b0+b1X1t-1+b2X2t-1+ut-1两个方程相减Yt-Yt-1=b1(X1t-X1t-1)+b2(X2t-X2t-1)+vt49例假设我们具有消费、财富和收入的时间序列49例这样做有时会解决问题,因为和原始变量相比,变量的差分也许不再共线但由此产生的问题是新的误差项v或许不再满足干扰项序列不相关的假设50例这样做有时会解决问题,因为和原始变量相比,变量的差分也许不例在多项式回归中,常常会遇到多重共线性我们可以将解释变量减去它的平均值,往往会减小多重共线性的程度51例在多项式回归中,常常会遇到多重共线性51其他补救措施时间序列数据和截面数据的结合要素分析或主成分分析岭回归法逐步回归法52其他补救措施时间序列数据和截面数据的结合52二、异方差同方差假定:Var(ui)=σ

u

2,i=1,2,…n上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。违反假定:异方差假设方差随着观测数据而变化就得到异方差性(heteroskedasticity)var(ui)=(σi)2随着观测数据而变化53二、异方差同方差假定:Var(ui)=σu2,i问题异方差的性质是什么?异方差的后果是什么?如何检验异方差的存在?如果存在异方差,有哪些补救措施?54问题异方差的性质是什么?54异方差的性质55异方差的性质55异方差的性质异方差问题多存在于横截面数据中,在时间序列中出现较少。规模效应:如果截面数据来自于一组规模差异很大的对象,在数据中就会存在异方差性。比如,小公司、中等的公司、大公司;低收入家庭、中等收入家庭、高收入家庭。在时间序列数据中,变量趋于具有相似的数量等级。56异方差的性质异方差问题多存在于横截面数据中,在时间序列中出现例:工资与企业规模平均工资随着厂商规模的增加而增加。见下表:57例:工资与企业规模平均工资随着厂商规模的增加而增加。见下表:工资与企业规模我们能指望工资的方差是不变的吗?方差随着厂商规模的增加而增加因此,厂商越大,支付的工资越多,但工资的变异性也更大(variability)58工资与企业规模我们能指望工资的方差是不变的吗?58例:储蓄与收入储蓄随着收入增加而增加,储蓄和支出的变异性也随着增加随着收入增加,人们具有更多的可以自由支配的收入,因此具有处置收入的更大的选择余地。59例:储蓄与收入储蓄随着收入增加而增加,储蓄和支出的变异性也随例:学习由于学习,人们的行为误差越来越小,方差将逐渐减小。随着打字时间的增加,每小时的打字错误逐渐减小。错字率时间60例:学习由于学习,人们的行为误差越来越小,方差将逐渐减小。异方差的后果OLS估计量仍然是线性的OLS估计量仍然是无偏的但无论是对大样本,还是小样本,OLS估计量不再具有最小方差性。也就是说,OLS估计量不再是有效的。根据常用估计OLS估计量方差的公式得到的方差通常是有偏的。因此,建立在t分布和F分布之上的置信区间和假设检验是不可靠的。61异方差的后果OLS估计量仍然是线性的61异方差的检验根据问题的性质残差的图形检验ParktestGlejsertestGoldfeld-QuandttestWhite检验62异方差的检验根据问题的性质621、根据问题的性质检验所考察问题的性质往往提供是否存在异方差的信息。例如:根据Paris和Houthakker关于家庭预算的开创性著作,发现在消费对收入的回归中,残差方差随收入的增加而增加。现在一般相类似的调查研究通常假设不同随机干扰项的方差不等。631、根据问题的性质检验所考察问题的性质往往提供是否存在异方差根据问题的性质检验事实上,在涉及不均匀单位的横截面数据中,异方差可能是常有的情况而不是例外。例如:在与销售、利率等相关的投资支出的横截面数据分析中,如果把小、中、大型公司聚集在一起加以抽样,就很可能存在异方差。在对与产出相关的平均成本的横截面数据研究中,如果样本包括小、中和大型公司,也可能存在异方差。64根据问题的性质检验事实上,在涉及不均匀单位的横截面数据中,异2、残差的图形检验干扰项方差是不可观测的,但是我们可以用残差平方来“代理”它。这是一种通过对残差进行分析得到有用信息的一种方法,称为残差分析法。这种方法在计量经济学中有着重要的应用。将残差平方对一个或多个解释变量描图,或者对Y的估计值Y’描图,根据这样的残差图可以为判断异方差的存在提供线索。652、残差的图形检验干扰项方差是不可观测的,但是我们可以用残差残差平方模式66残差平方模式66残差平方模式a图:变量与残差平方之间没有可观察到的系统模式,表明数据中可能不存在异方差。b~e图:数据中可能存在异方差67残差平方模式a图:变量与残差平方之间没有可观察到的系统模式,问题对于多元回归方程,将残差平方对每个解释变量描图,可能只有一个变量表现出b~e图的某个模式。这时,我们可以将残差平方对Y的估计值Y’描图,而不必对每个解释变量描图。由于Y’是各个X的线性组合,残差平方和对Y’的散点图可能会出现b~e某种模式,表明数据中可能存在异方差。避免将残差平方对每个解释变量描图的繁琐过程。68问题对于多元回归方程,将残差平方对每个解释变量描图,可能只有Parktest如果通过考察残差发现了异方差性的证据,我们可以作一个检验将方差对X变量回归ln(i)2=b1+b2lnXi+vi69Parktest如果通过考察残差发现了异方差性的证据,我们Parktest方差未知使用残差的平方作为代理变量(proxy)作回归:ln(ei)2=b1+b2lnXi+vi如果是多元模型,则将残差的平方对每个X变量回归,或者对Y的预测值回归如果b2是显著区别于0的,则表明模型有异方差性70Parktest方差未知70Glejsertest与Parktest类似将残差ei的绝对值对X回归回归的函数形式可以有所变化可以对X的平方根或者倒数1/X等进行回归如果具有显著的t统计量,则表明有异方差性

71Glejsertest与Parktest类似71Glejser建议的函数形式|ei|=b0+b1Xi+vi|ei|=b0+b1(

Xi)1/2

+vi|ei|=b0+b1(1/

Xi)

+vi72Glejser建议的函数形式|ei|=b0+b1Xi+vGlejsertest注意在Glejser所建议的回归方程中,误差项本身可能就存在异方差和序列相关问题。对于大样本,上述模型能够很好的检测异方差问题。Glejser检验可用作大样本的检测工具73Glejsertest注意在Glejser所建议的回归方程Goldfeld-Quandttest74Goldfeld-Quandttest74例30个家庭的收入和消费支出的截面数据。假设消费与收入有线性关系,但数据中存在形式为的异方差。为了进行Goldfeld-Quandt检验,用收入对数据排序,去掉中间的c=4个观测75例30个家庭的收入和消费支出的截面数据。假设消费与收入有线性7676分别对前13个和后13个数据进行回归,得到:由此结果,得到在5%的显著性水平下拒绝同方差的零假设77分别对前13个和后13个数据进行回归,得到:77Goldfeld-Quandttest1、流行的检验方法,可用于小样本2、去掉中间的C个观测是为了强调大方差组(RSS2)和小方差组(RSS1)之间的差别。检验的效力(即如果零假设是不真实的而拒绝零假设的概率)依赖于C的选择。Goldfeld和Quandt建议如果n=30,C=8,如果n=60C=16(然而Judge等建议如果n分别是30和60,C取4和10)78Goldfeld-Quandttest1、流行的检验方法,White检验假定模型:Y=b0+b1X1+b2X2+uWhite检验步骤:用OLS估计回归方程,得到残差ei然后作如下回归:ei2

=A0+A1X1+A2X2+A3X12

+A4X22

+A5X1X2+v求辅助回归方程的R2值。满足零假设,则不存在异方差。79White检验假定模型:Y=b0+b1X1+b2X2+u79White检验White证明辅助回归方程的R2值与样本容量n的乘积服从X2分布,自由度等于辅助回归方程中解释变量的个数(不包括截距项)如果X2值超过了所选显著性水平下的X2临界值,或者说X2值的p值很低,则可以拒绝不存在异方差的零假设,也就是说原回归方程存在异方差。80White检验White证明辅助回归方程的R2值与样本容量nWhite检验White检验的缺陷:过于一般化,如果有多个变量,则要在辅助回归方程中要包括这些变量、变量的平方(或者更高次幂)以及它们的就交叉乘积项,这会迅速降低自由度。因此,必须谨慎地引入太多的变量,有时可以去掉交叉乘积项。81White检验White检验的缺陷:过于一般化,如果有多个变异方差的其他检验方法Spearman秩相关检验Bartlett方差同质性检验Peak检验Breusch-Pagan检验CUSUMSQ检验82异方差的其他检验方法Spearman秩相关检验82异方差的补救措施(i)2已知的加权最小二乘法(WLS)(i)2未知时的变换重新设定模型83异方差的补救措施(i)2已知的加权最小二乘法(WLS)83加权最小二乘法(WLS)假定(i)2已知考虑上述厂商的例子,假设模型具有异方差性工资随着企业规模增加而增加,但是方差也随着增加84加权最小二乘法(WLS)假定(i)2已知84加权最小二乘法(WLS)从一个基本的模型开始:Yi=b0+b1Xi+uiY=工资,X=企业规模假设干扰项的真实方差(i)2是已知的在模型两边除以标准差:Yi/i=b0(1/i)+b1Xi/i+ui/i令:vi=ui/i85加权最小二乘法(WLS)从一个基本的模型开始:85加权最小二乘法(WLS)考察干扰项Var(vi)=E[(vi)2]=E[(ui)2/(i)2]=E(ui)2/(i)2=1因此,vi是同方差的,对变换后的模型使用OLS会得到参数的BLUE估计86加权最小二乘法(WLS)考察干扰项86加权最小二乘法(WLS)变换后的模型:Yi/i=b0(1/i)+b1Xi/i+ui/i是一个无常数项回归!Eviews命令:LsY/1/

X/87加权最小二乘法(WLS)变换后的模型:87加权最小二乘法(WLS)从直观上看,加权最小二乘法很简单,但是有一个重要的问题:如何知道或者如何找出真实的误差方差(i)2?在经济计量学的研究中,有关误差方差的信息是极少的,因此,如果想要使用WLS方法,常借助于似乎可靠的关于(i)2的假设,把原来的回归模型变换为能够满足同方差假定的模型,然后运用OLS法估计该模型。88加权最小二乘法(WLS)从直观上看,加权最小二乘法很简单,但(i)2未知时的变换情形1:误差与Xi成比例:平方根变换情形2:误差与Xi2成比例89(i)2未知时的变换情形1:误差与Xi成比例:平方根变换情形1:误差与Xi成比例:平方根变换将残差平方对Xi作散点图,发现为一个锥形(i)2=KXi这表明干扰项方差与Xi线性相关用Xi的平方根除模型,对模型进行变换90情形1:误差与Xi成比例:平方根变换将残差平方对Xi作散情形1:误差与Xi成比例:平方根变换这是一个没有常数项的回归。可以证明,该模型的干扰项是同方差的,因此可以使用OLS进行估计(实际上是WLS)91情形1:误差与Xi成比例:平方根变换91情形1:误差与Xi成比例:平方根变换如果模型中包括多个解释变量,可以根据图形找出合适的解释变量。如果有多个解释变量都可以,就不使用任何解释变量,而是利用Y的估计值Y’作为变换变量,因为Y’是解释变量的线性组合。92情形1:误差与Xi成比例:平方根变换如果模型中包括多个解释情形2:误差与Xi

2成比例残差平方对X作散点图,发现一个喇叭形这表明干扰项方差与X的平方成比例在模型的两边除以X,对模型进行变换93情形2:误差与Xi2成比例残差平方对X作散点图,发现一个喇情形2:误差与Xi

2成比例斜率变成了截矩,截矩变成了斜率。但是我们在估计出上面方程后还可以乘以Xi,回到原始模型94情形2:误差与Xi2成比例94重新设定模型除了“推测”以外,还可以重新设定回归函数,即选择一个不同的函数形式,这样也可以消除异方差。例如:用双对数模型代替线性回归模型,常常能够消除异方差。因为对数变换压缩了测定变量的尺度,从而把两个变量值之间10倍差异缩小为2倍差异。90是9的10倍,但ln90(=4.4998)只有ln9(=2.1972)的两倍95重新设定模型除了“推测”以外,还可以重新设定回归函数,即选择实例:规模经济纽约股票交易所(NYSE)最初极力反对经纪佣金率放松管制。在引入放松管制以前(1975年5月),NYSE向股票交易委员会(SEC)提交了一份经济计量研究报告,认为在经纪行业中存在着规模经济,因此(由垄断决定的)固定佣金率是公正的。NYSE所提交的经济计量分析基本上是围绕着以下回归函数进行:96实例:规模经济纽约股票交易所(NYSE)最初极力反对经纪佣金规模经济Y’=476000+31.348X-(1.083*10-6)X2t=(2.98)(40.39)(-6.54)R2=0.934其中,Y’=总成本,X=股票交易的数量从模型中可以看出,总成本与交易量正相关。但是由于交易量的二次方项系数为负,并且统计显著,这意味着总成本是以一个递减的速率增加。因此,NYSE认为在经纪行业中存在着规模经济,从而证明NYSE的垄断地位是正当的。97规模经济Y’=476000+31.348X-(1.083*1规模经济然而美国司法部反托拉斯局认为上述模型中所声称的规模经济只是幻想。因为上面函数存在异方差问题。这是因为在估计成本函数时,NYSE并未考虑到样本中所包括的小公司和大公司的差别,也就是说,NYSE没有考虑到规模因素。假设误差项与交易量成比例,反托拉斯局重新估计方程得到如下结果98规模经济然而美国司法部反托拉斯局认为上述模型中所声称的规模经规模经济Y’=342000+25.57X+(4.34*10-6)X2t=(32.3)(7.07)(0.503)二次项系数不仅统计不显著,而且其符号也发生了变化,因此在经纪行业中不存在规模经济,这就推翻了NYSE的垄断佣金结构的论点。99规模经济Y’=342000+25.57X+(4.34*10三:自相关无自相关假定:Cov(ui,uj)=0,i≠j,i,j=1,2…..n表明任意两次观测的ui,uj是不相关的,即u在某次的观测值与任何其它次观测中的值互不影响,称为无序列相关性。违反:自相关100三:自相关无自相关假定:100问题自相关的性质是什么?自相关的原因是什么?自相关的理论与实际后果是什么?如何诊断自相关?如果自相关的后果比较严重,如何采取措施加以补救?101问题自相关的性质是什么?101自相关的性质自相关问题通常是与时间序列数据有关在横截面数据中也可能产生自相关问题,称为空间相关某一季度工人罢工对本季度及下一季度产出影响某一家庭消费支出与另一家庭的消费支出102自相关的性质自相关问题通常是与时间序列数据有关102自相关产生的原因惯性模型设定误差蛛网现象数据加工103自相关产生的原因惯性103惯性大多数经济时间序列的一个显著特征就是惯性或者说是迟缓性。经济变量中表现出的一种持续的趋势许多经济变量都表现出商业循环比如:国民生产总值、就业、货币供给、价格指数比如:在经济复苏时,在这些变量中,具有某种内在的力量,使得前后期的数值之间相互依赖,后一期数据倾向于高于前一期数据,直到发生某些事件使增长停下来为止一个高的正的干扰之后会在下一期跟着一个高的正的干扰因此,在涉及时间系列数据的回归方程中,连续的观察值之间很可能是相关的104惯性大多数经济时间序列的一个显著特征就是惯性或者说是迟缓性。模型设定误差模型的不恰当设定意味着由于本应包括在模型中的重要变量未包括进模型中(过低设定的情形),或者是模型选择了错误的函数形式。由于模型设定误差,从不正确的模型中得到的残差将会呈现系统模式。假设我们在考察牛肉的需求,并将牛肉的价格和收入包括在模型中,但是不包括猪肉的价格如果猪肉的价格确实影响牛肉的需求,干扰项将包括这个系统效应,从而表现出自相关105模型设定误差模型的不恰当设定意味着由于本应包括在模型中的重要蛛网现象农产品供给:Yt=b0+b1Xt-1+ut106蛛网现象农产品供给:Yt=b0+b1Xt-1+ut106数据加工在实证分析中,通常需要加工原始数据季度数据是由月度数据加总后平均得到。107数据加工在实证分析中,通常需要加工原始数据107自相关的后果最小二乘估计量仍然是线性和无偏的但不再是有效的。OLS估计量的方差是有偏的。有时候,用来计算方差和OLS估计量标准差的公式会严重低估真实的方差和标准差,从而导致t值变大,这会使的从表面上看某个系数显著不为0,但事实并非如此。因此,通常所用的t检验和F检验一般来说是不可靠的。通常计算的R2不能测度真实R2108自相关的后果最小二乘估计量仍然是线性和无偏的108自相关的诊断残差图形法游程检验杜宾—瓦尔森检验109自相关的诊断残差图形法109残差图形法作残差对时间的散点图检查残差随时间的变动模式作残差对滞后残差(laggedresiduals)的散点图检查在一个和两个象限中的散点分布串110残差图形法作残差对时间的散点图110残差图形法111残差图形法111残差图形法自相关可以分为:正自相关:相邻的误差项倾向于共同上升,或共同下降负自相关:相邻误差项呈现出一增一减的运动模式零自相关:误差项之间不相关,也称序列不相关,此时满足基本假设112残差图形法自相关可以分为:112残差图形法113残差图形法113114114游程检验是一种正式的非参数检验的方法游程:同一符号或属性的不间断历程游程长度:游程中正负交替的个数。如果你预期残差是随机的,那么正负残差是随机混合在一起的如果残差是相关的,那么,就可能出现一组正的残差跟着一组负的残差的情况115游程检验是一种正式的非参数检验的方法115例例子:(+++++++)(-)(+++)(―――――)(++++)共有5个游程:一个7个正值的游程,一个1个负值的游程,一个3个正值的游程,一个5个负值的游程,一个4个正值的游程116例例子:(+++++++)(-)(+++)(―――――)(+问题与预期相比,从这20个观察值中所观察到的5个游程是太多了还是太少了?如果游程太多,意味着残差在频繁地变换着符号,表明存在着负序列相关。如果游程太少,意味着正的自相关。117问题与预期相比,从这20个观察值中所观察到的5个游程是太多了游程检验N—观察值的总个数(=N1+N2)N1—+号(正的残差)个数N2—-号(负的残差)个数k—游程个数游程临界值:在残差是独立的假设下,Swed和Eisenhart建立了一些特殊的表格,给出在N个观察值的随机次序下预期游程的临界值。118游程检验N—观察值的总个数(=N1+N2)118例N=20,N1=14,N2=6,k=5对于5%的游程临界值为5如果实际游程个数等于或者小于5,则拒绝假设(即残差是随机的),存在自相关。本例中,实际游程个数是5,因此拒绝残差随机的假设,换言之,本例存在自相关119例N=20,N1=14,N2=6,k=5119杜宾—瓦尔森检验(Durbin-WatsonTest)这是一个使用得最多、而且简单易行的检验DW统计量:120杜宾—瓦尔森检验(Durbin-WatsonTest)这是杜宾—瓦尔森检验几乎所有的计量经济学软件都提供DW统计量的数值比如,在Eviews的回归报告中121杜宾—瓦尔森检验几乎所有的计量经济学软件都提供DW统计量的数Eviews回归结果122Eviews回归结果122DW统计量的基本假设回归模型需包括一个截距项。因此,DW统计量无法用来判定通过原点的回归模型的自相关问题。变量X是非随机变量,也就是说,X是在重复抽样中固定的值。123DW统计量的基本假设回归模型需包括一个截距项。因此,DW统计DW统计量的基本假设随机干扰项的产生机制是:ut=ut-1+vt其中,-1<<1,称为自相关系数(coefficientofautocorrelation)vt:服从基本假设,不存在自相关干扰项在第t期的数值依赖于第t-1期的误差项的数值加上某个随机项对过去的依赖由自相关系数表示124DW统计量的基本假设随机干扰项的产生机制是:124DW统计量的基本假设该过程称为马尔可夫一阶自回归或一阶自回归,记为AR(1)一阶是指只有一期的滞后(laggedoneperiod)在许多计量经济工作中,都假设AR(1)过程,因为它较容易处理125DW统计量的基本假设该过程称为马尔可夫一阶自回归或一阶自回归DW统计量的基本假设在回归方程中,没有把因变量的滞后值作为解释变量。换言之,该检验对下面的模型不适用:Yt=b0+b1X+b2Yt-1+uth统计量

126DW统计量的基本假设在回归方程中,没有把因变量的滞后值作为解杜宾—瓦尔森检验D统计量的数值在0和4之间越靠近0,越表示有正自相关越靠近4,越表示有负自相关越靠近2,越表示无自相关127杜宾—瓦尔森检验D统计量的数值在0和4之间127杜宾—瓦尔森检验可以查DW临界值表,进行更准确的检验对于N=27,4个解释变量,查表的上下两个临界值:dl=1.08,du=1.76024dldu4-dl4-du零自相关负自相关无结论无结论正自相关128杜宾—瓦尔森检验可以查DW临界值表,进行更准确的检验024d自相关补救措施假设干扰项服从AR(1)过程ut=ut-1+vtvt:服从基本假设,不存在自相关原模型为:Yt=b0+b1Xt+ut(1)滞后一期的模型为:Yt-1=b0+b1Xt-1+ut-1用乘两边Yt-1=b0+b1Xt-1+ut-1(2)129自相关补救措施假设干扰项服从AR(1)过程129模型变换两个式子相减(1)-(2):Yt-Yt-1=b0(1-)+b1(Xt-Xt-1)+ut-ut-1其中,vt=ut

-ut-1,服从基本假设,不存在自相关因此,可以采用OLS估计该模型这个方程称为广义差分方程可以将这个方法用于更高阶的过程.如何估计?130模型变换两个式子相减(1)-(2):130几种估计的方法一阶差分法用DW统计量估计用最小二乘残差估计Hildreth-Lu搜索法其他估计方法131几种估计的方法一阶差分法131一阶差分法假设=1这个假设对许多经济时序数据是成立的误差项是完全正自相关的广义差分方程退化成了一阶差分方程模型变为:Yt-Yt-1=b1(Xt-Xt-1)+vt该模型没有截矩项因此,原来的常数项无法估计132一阶差分法假设=1132用DW统计量估计用DW统计量估计d=2(1-)=1-(d/2)133用DW统计量估计用DW统计量估计133用最小二乘残差估计用最小二乘残差估计et=et-1+vt作该回归,估计134用最小二乘残差估计用最小二乘残差估计134Hildreth-Lu搜索法设取某些数值,并用这些值估计广义差分过程挑选一个使残差平方和(RSS)最小的值135Hildreth-Lu搜索法设取某些数值,并用这些值估计其他估计方法Cochrane-Orcutt迭代法Cochrane-Orcutt两步法Durbin两步法最大似然法136其他估计方法Cochrane-Orcutt迭代法136例US的数据(1970-1987),估计以下模型:Yt=b0+b1Xt+utYt是NYSE的股票价格指数Xt是GNP(十亿美元)估计结果:Y=10.78+0.025X t(1.17)(7.47)R2=0.77

DW=0.4607137例US的数据(1970-1987),估计以下模型:137数据138数据138分析查DW临界值n=18,k=15%的临界值是:dl=1.158,du=1.391.因为dw统计量的计算值低于这两个值,所以存在正自相关139分析查DW临界值139补救措施从dw统计量计算的数值:=1-(d/2)=1-(0.4618/2)=0.7691估计广义差分方程:Yt-0.77Yt-1=b0(1-0.77)+b1(Xt-0.77Xt-1)+vt需要定义新变量:Y-0.77Y(-1),

X-0.77X(-1)Eviews命令:GenrLY=Y-0.77Y(-1)GenrLX=X-0.77X(-1)LsLYCLX因为有一期滞后,所以失去了第一期的数据140补救措施从dw统计量计算的数值:140结果结果:Y=-26.901+0.038Xt(-0.89)(4.48)R2=0.572d=1.362从d的数值看,自相关要好多了141结果结果:141其他补救措施可以用残差来估计

估计:et=et-1+vt结果:et=0.8923et-1

所以,的估计为0.8923然后,代入广义差分方程,回归142其他补救措施可以用残差来估计142分析估计广义差分方程:Yt-0.89Yt-1=b0(1-0.89)+b1(Xt-0.89Xt-1)+vt需要定义新变量:Y-0.89Y(-1),

X-0.89X(-1)Eviews命令:GenrLY=Y-0.89Y(-1)GenrLX=X-0.89X(-1)LsLYCLX因为有一期滞后,所以失去了第一期的数据143分析估计广义差分方程:143补救措施一阶差分法LSycxar(1)144补救措施一阶差分法144计量经济学检验一、多重共线性二、异方差三、自相关145计量经济学检验一、多重共线性1一:多重共线性多重共线性的性质多重共线性的原因多重共线性的后果多重共线性的诊断多重共线性的补救措施146一:多重共线性多重共线性的性质2回顾多元线性回归模型的若干假定零均值假定同方差假定无自相关假定随机项与自变量不相关非多重共线性147回顾多元线性回归模型的若干假定零均值假定3假定1零均值假定:E(ui)=0,i=1,2,….n对X1,X2的每个观测值,u可以取不同的值,考虑u的所有可能值,它们的总体平均值(期望值)等于0。148假定1零均值假定:E(ui)=0,i=1,2,….n4假定2同方差假定:Var(ui)=σ

u

2,i=1,2,…n上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。违反假定:异方差149假定2同方差假定:Var(ui)=σu2,i=1假定3无自相关假定:Cov(ui,uj)=0,i≠j,i,j=1,2…..n表明任意两次观测的ui,uj是不相关的,即u在某次的观测值与任何其它次观测中的值互不影响,称为无序列相关性。等方差性和无序列相关性称为高斯—马尔柯夫(Gauss-Markov)假定。违反假定:自相关150假定3无自相关假定:6假定4随机项与自变量不相关:Cov(ui,x1i)=0;Cov(ui,x2i)=0区分随机项u与每个自变量各自对y的影响。如果x是非随机变量,即x是在重复抽样中取某固定值,该条件自然满足。151假定4随机项与自变量不相关:7假定5解释变量之间不存在线性相关关系,即任意两个解释变量之间无确切的线性关系。用统计学语言,称为非共线性或非多重共线性。非完全共线性是指变量不能完全表示为其他变量的完全线性函数。违反假定:多重共线性152假定5解释变量之间不存在线性相关关系,即任意两个解释变量之间完全多重共线性完全共线性(Perfectcollinearity)的例子:X1X2X310505215757518909724120129X1和X2是完全线性相关的:X2=5X1153完全多重共线性完全共线性(Perfectcollinear完全多重共线性若X2=5X1将其代入Y’=b0’

+b1’

X1+b2’

X2+b3’

X3Y’=b0’

+b1’

X1+b2’*5X1+b3’

X3=b0’

+(b1’+5b2’

X1+b3’

X3=b0’

+A

X1+b3’

X3三变量模型无法从A值中得到b1’

、b2’的值154完全多重共线性若X2=5X110接近完全多重共线性的情形多重共线性是一个极端的情形在实际中,很少遇到完全多重共线性的情况,常常是接近或高度多重共线性。亦即解释变量是接近线性相关的。例:《widget》教科书155接近完全多重共线性的情形多重共线性是一个极端的情形11问题多重共线性的性质是什么?多重共线性产生的原因是什么?多重共线性的理论后果是什么?多重共线性的实际后果是什么?在实际中,如何发现多重共线性?消除多重共线性的弥补措施有哪些?156问题多重共线性的性质是什么?12多重共线性的性质可以获得原始系数的一个线性组合的估计值。当解释变量之间存在完全线性相关或完全多重共线性时,不可能获得所有参数的唯一估计值。既然我们不能获得它们的唯一估计值,也就不能根据某一样本做任何统计推论(也即假设检验)157多重共线性的性质可以获得原始系数的一个线性组合的估计值。13多重共线性的原因例:消费函数Y=b0+b1X1+b2X2X1=income;X2=wealthX2=5X1Y=b0+b1X1+b25X1Y=b0+(b1+5b2)X1158多重共线性的原因例:消费函数14多重共线性的原因所用的数据收集方法例:在X的一个限定的范围内抽样有关被抽样总体的约束:例:具有高收入的人倾向于有更多的财富也许有关低收入的富有的人和高收入的没钱人的数据不够充足。159多重共线性的原因所用的数据收集方法15多重共线性的原因模型设定:例:在模型中加入多项式项,特别是当X的取值范围很小的时候。变量之间有共同的时间趋势模型的过定(overdetermined)解释变量的数目多于观测的数目。160多重共线性的原因模型设定:16多重共线性的理论后果在存在高度多重共线性的情形下,即使多元回归方程的一个或者多个偏回归系数是统计不显著的,普通最小二乘估计量仍然是最优线性无偏估计量。161多重共线性的理论后果在存在高度多重共线性的情形下,即使多元回注意无偏性是一个重复抽样的性质,即:保持X不变,如果得到一些样本并用OLS计算这些样本估计量,则其平均值收敛于估计量的真实值。但这并不是某个样本估计值的性质,在现实中,我们经常无法得到大量的重复样本。162注意无偏性是一个重复抽样的性质,即:保持X不变,如果得到一些注意接近共线性并未破坏最小二乘估计量的最小方差性:在所有线性无偏估计量中,OLS估计量的方差最小。最小方差并不意味着方差值本身也比较小。163注意接近共线性并未破坏最小二乘估计量的最小方差性:在所有线性注意即使变量总体之间不线性相关,但却可能与某一样本线性相关多重共线性本质上是一个样本(回归)现象。原因:大多数经济数据不是通过试验获得。如:国民生产总值、价格、失业率、利润、红利等,是以其实际发生值为依据,而并非试验得到。164注意即使变量总体之间不线性相关,但却可能与某一样本线性相关2多重共线性的实际后果OLS估计量的方差和标准差较大。也就是说,OLS估计量的精确度下降。置信区间变宽。t值不显著,R2较高。OLS估计量及其标准差对数据的微小变化非常敏感,也就是说它们趋于不稳定。回归系数符号有误。难以衡量各个解释变量对回归平方和(ESS)或R2的贡献。165多重共线性的实际后果OLS估计量的方差和标准差较大。也就是说例:消费函数消费函数的结果:Y=24.77+0.94X1-0.04X2t(3.67)(1.14)(-0.53)R2=0.96,F=92.40X1是收入X2是财富高的R2表明收入和财富可以解释消费变化的96%166例:消费函数消费函数的结果:22结果分析没有任何一个斜率系数是显著的。财富变量的符号是错误的。高的F值意味着系数都等于0的联合假设不成立两个变量是如此地高度相关,以至于不能将二者的效应分离出来。167结果分析没有任何一个斜率系数是显著的。23例:消费函数如果将X2对X1回归,得到:X2=7.54+10.19X1(0.26)(62.04)R2=0.99表明,在X1和X2之间有近乎完全的线形关系168例:消费函数如果将X2对X1回归,得到:24例:消费函数Y只对收入回归:Y=24.45+0.51X1(3.81)(14.24)R2=0.96收入变量是高度显著的,但是在前一个模型中是不显著的169例:消费函数Y只对收入回归:25例:消费函数Y只对财富回归:Y=24.41+0.05X2t(3.55)(13.29)R2=0.96财富变量也是高度显著的,但是在前一个模型中是不显著的170例:消费函数Y只对财富回归:26多重共线性真的是一个问题吗?取决于研究目的如果是为了预测,多重共线性未必是坏事如果是为了估计参数(比如弹性、边际值等),多重共线性必定是坏事171多重共线性真的是一个问题吗?取决于研究目的27多重共线性的检验多重共线性是一个程度问题而不是存在与否的问题。由于多重共线性是在假定解释变量是非随机的条件下出现的问题,因而它是样本的特点,而不是总体的特征。172多重共线性的检验多重共线性是一个程度问题而不是存在与否的问题检验方法1R2较高但t值显著的不多。这是多重共线性的“经典”特征。173检验方法1R2较高但t值显著的不多。这是多重共线性的“经典”检验方法2解释变量两两高度相关。逐对检查解释变量之间的相关系数这些仅仅是一些有用的指示,经过这些探查后可能还会有多重共线性解释变量的组合或许具有相关性174检验方法2解释变量两两高度相关。30检验方法3辅助回归:将每个变量对其他剩余变量回归并计算相应的R2值,其中每一个回归都被称作是从属或者辅助回归。然后用Ftest检验R2是否显著地区别于0F=[R2/(k-1)]/[(1-R2)/(n-k)]k是X的数目如果F大于临界值,则R2是显著区别于0的计算较繁琐175检验方法3辅助回归:将每个变量对其他剩余变量回归并计算相应的例考虑Y对X1,X2,X3,X4,X5、X6这6个解释变量的回归辅助回归:用R12表示X1对其余X的回归的判决系数……176例考虑Y对X1,X2,X3,X4,X5、X6这6个解释变量的检验方法4方差膨胀因素(Varianceinflationfactor)其中R2j是Xj对其他X的辅助回归的判决系数这个指标度量方差增加的速度177检验方法4方差膨胀因素(VarianceinflationR2和VIF当R2增加时,VIF也随着增加如果大于10,就表明有问题178R2和VIF当R2增加时,VIF也随着增加34注意R2较高,标准差未必一定大。也就是说它不一定扩大估计量的标准差。辅助回归方程的R2可能只是多重共线性的一个“表面指示器”。更正规的表述为:“较高的R2既不是较高标准差的必要条件也不是充分条件,多重共线性本身并不必然导致较高的标准差。”179注意R2较高,标准差未必一定大。也就是说它不一定扩大估计量的总结检验多重共线性有许多种不同的方法,但却没有一种检验方法能够使我们彻底解决多重共线性问题。多重共线性是一个程度的问题,它是与样本相关的一种现象。有时我们必须综合运用以上各种手段来诊断多重共线性的严重程度。总之,没有一个简单的办法判断多重共线性问题。180总结检验多重共线性有许多种不同的方法,但却没有一种检验方法能补救措施如果t统计量大于2,就不用担心如果回归的R2大于任何一个X对其余Xs回归的R2,就不用担心如果仅仅是对预测感兴趣,并且解释变量的线性组合在未来仍然延续,就不用担心181补救措施如果t统计量大于2,就不用担心37补救措施(经验法则)从模型中删除不重要的解释变量获取额外的数据或者新的样本重新考虑模型先验信息变量变换其他补救措施182补救措施(经验法则)从模型中删除不重要的解释变量38从模型中删除不重要的解释变量对待严重的多重共线性问题,最简单的解决方法就是删除一个或多个共线性变量。导致“模型设定误差”,参数估计量可能是有偏的。建议不要仅仅因为共线性很严重就从一个经济上可行的模型中删除变量。所选模型是否符合经济理论是一个重要的问题。183从模型中删除不重要的解释变量对待严重的多重共线性问题,最简单获取额外的数据或者新的样本有些情况下,通过获得额外的数据(增加样本容量)就能削减共线性的程度。184获取额外的数据或者新的样本有些情况下,通过获得额外的数据(增获取额外的数据或者新的样本既然多重共线性是一个样本特征,那么在包括同样变量的另一样本中,共线性也许不象第一个样本那样高。关键是能否获得另一个样本,因为收集数据的费用很高。185获取额外的数据或者新的样本既然多重共线性是一个样本特征,那么

Y:消费支出;X1:收入;X2:财富10个观察值:Y=24.337+0.87164X1-0.0349X2se=(6.2801)(0.31438)(0.0301)t=(3.875)(2.7726)(-1.1595)R2=0.9682消费支出对于收入和财富的回归方程186

Y:消费支出;X1:收入;X2:财富消费支出对于收入和财富消费支出对于收入和财富的回归方程40个观察值:Y=2.0907+0.7299X1+0.0605X2t=(0.8713)(6.0014)(2.0641)R2=0.9672187消费支出对于收入和财富的回归方程40个观察值:43重新考虑模型模型的不恰当设定可能是回归模型存在共线性的原因。省略一些重要的变量没有正确选择模型的函数形式例:需求函数Q=b0+b1p+b2pr+b3income+u变形成Q=b0+b1(p/pr)+b2income+u188重新考虑模型模型的不恰当设定可能是回归模型存在共线性的原因。先验信息根据以往的研究,我们或许知道有关参数值的某些信息,可以将这些信息用于当前的样本。假设先验信息是“正确”的,就“解决”了共线性问题。189先验信息根据以往的研究,我们或许知道有关参数值的某些信息,可例对《wideget》需求函数假设在过去估计过的对《wideget》需求函数中,收入系数为0.9,并且是统计显著的。如果收入系数的过去值没有多少改变的话,我们可以重新估计方程需求量=b0+b1*价格+b2*收入+u=b0+b1*价格+0.9*收入+u需求量-0.9*收入=b0+b1*价格+u190例对《wideget》需求函数假设在过去估计过的对《wid先验信息的缺陷获得外生的或先验的信息并不总是可行的。即使我们能够获得这一信息,但要假设先验信息在当前研究的样本中依然有效这个要求“太高”。191先验信息的缺陷获得外生的或先验的信息并不总是可行的。47变量变换有些情形,通过对模型中变量的变换能够降低共线性程度。例如:在对美国总消费支出的研究中(总消费支出作为总收入和总财富的函数),我们可以采取人均的形式,也就是说,作人均消费支出对人均收入和人均财富的函数,有可能在总消费函数中存在严重的共线性问题,而在人均消费函数中其共线性问题并没有那么严重。不能保证这样的一个变换总能够有助于问题的解决。192变量变换有些情形,通过对模型中变量的变换能够降低共线性程度。例假设我们具有消费、财富和收入的时间序列将会出现严重的多重共线性,因为这些变量随着时间作同方向的运动我们意欲估计Yt=b0+b1X1t+b2X2t+ut在时间t-1处的模型:Yt-1=b0+b1X1t-1+b2X2t-1+ut-1两个方程相减Yt-Yt-1=b1(X1t-X1t-1)+b2(X2t-X2t-1)+vt193例假设我们具有消费、财富和收入的时间序列49例这样做有时会解决问题,因为和原始变量相比,变量的差分也许不再共线但由此产生的问题是新的误差项v或许不再满足干扰项序列不相关的假设194例这样做有时会解决问题,因为和原始变量相比,变量的差分也许不例在多项式回归中,常常会遇到多重共线性我们可以将解释变量减去它的平均值,往往会减小多重共线性的程度195例在多项式回归中,常常会遇到多重共线性51其他补救措施时间序列数据和截面数据的结合要素分析或主成分分析岭回归法逐步回归法196其他补救措施时间序列数据和截面数据的结合52二、异方差同方差假定:Var(ui)=σ

u

2,i=1,2,…n上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。违反假定:异方差假设方差随着观测数据而变化就得到异方差性(heteroskedasticity)var(ui)=(σi)2随着观测数据而变化197二、异方差同方差假定:Var(ui)=σu2,i问题异方差的性质是什么?异方差的后果是什么?如何检验异方差的存在?如果存在异方差,有哪些补救措施?198问题异方差的性质是什么?54异方差的性质199异方差的性质55异方差的性质异方差问题多存在于横截面数据中,在时间序列中出现较少。规模效应:如果截面数据来自于一组规模差异很大的对象,在数据中就会存在异方差性。比如,小公司、中等的公司、大公司;低收入家庭、中等收入家庭、高收入家庭。在时间序列数据中,变量趋于具有相似的数量等级。200异方差的性质异方差问题多存在于横截面数据中,在时间序列中出现例:工资与企业规模平均工资随着厂商规模的增加而增加。见下表:201例:工资与企业规模平均工资随着厂商规模的增加而增加。见下表:工资与企业规模我们能指望工资的方差是不变的吗?方差随着厂商规模的增加而增加因此,厂商越大,支付的工资越多,但工资的变异性也更大(variability)202工资与企业规模我们能指望工资的方差是不变的吗?58例:储蓄与收入储蓄随着收入增加而增加,储蓄和支出的变异性也随着增加随着收入增加,人们具有更多的可以自由支配的收入,因此具有处置收入的更大的选择余地。203例:储蓄与收入储蓄随着收入增加而增加,储蓄和支出的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论