第5章多重共线性_第1页
第5章多重共线性_第2页
第5章多重共线性_第3页
第5章多重共线性_第4页
第5章多重共线性_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Multi-CollinearityMulti-Collinearity 第第 五五 章章 多多 重重 共共 线线 性性问题的提出问题的提出 在前述基本假定下在前述基本假定下OLSOLS估计具有估计具有BLUEBLUE的优良性。然而实际问题中,这些基的优良性。然而实际问题中,这些基本假定往往不能满足,使本假定往往不能满足,使OLSOLS方法失效方法失效不再具有不再具有BLUEBLUE特性。估计参数时,必特性。估计参数时,必须检验基本假定是否满足,并针对基须检验基本假定是否满足,并针对基本假定不满足的情况,采取相应的补本假定不满足的情况,采取相应的补救措施。救措施。 检验基本假定是否满足的检验称

2、为检验基本假定是否满足的检验称为计计量经济学检验量经济学检验。回顾回顾6 6项基本假定项基本假定 (1 1)解释变量间不相关(无多重共线性)解释变量间不相关(无多重共线性) (2 2)E(uE(ui i)=0 )=0 (随机项均值为零)(随机项均值为零) (3 3)Var(uVar(ui i)=)= 2 2 (同方差)(同方差) (4 4)Cov(uCov(ui i, u, uj j)=0)=0(随机项无自相关)(随机项无自相关) (5 5)Cov(X, uCov(X, ui i)=0)=0(随机项与解释变量(随机项与解释变量X X不不相关)相关) (6 6)随机扰动项服从正态分布。)随机扰动

3、项服从正态分布。不满足基本假定的情形(不满足基本假定的情形(1 1) 1 1、通常不会发生随机扰动项均值不等于、通常不会发生随机扰动项均值不等于0 0的的情形。若发生也不会影响解释变量的系数,情形。若发生也不会影响解释变量的系数,只会影响截距项。只会影响截距项。 2 2、随机扰动项正态性假设一般能够成立,、随机扰动项正态性假设一般能够成立,就算不成立,在大样本下也会近似成立的。就算不成立,在大样本下也会近似成立的。所以不讨论此假定是否违背。所以不讨论此假定是否违背。不满足基本假定的情形(不满足基本假定的情形(2 2) 3 3、解释变量之间相关、解释变量之间相关=多重共线多重共线 4 4、随机扰

4、动项相关、随机扰动项相关=自相关自相关 5 5、随机扰动项方差不等于常数、随机扰动项方差不等于常数=异异方差方差 什么是多重共线性什么是多重共线性 多重共线性产生的后果多重共线性产生的后果 多重共线性的检验多重共线性的检验 多重共线性的补救措施多重共线性的补救措施本章讨论本章讨论第五章第五章 多重共线性多重共线性第一节第一节 什么是多重共线性什么是多重共线性一一. 多重共线性的概念多重共线性的概念 多重共线性:在多元线性回归模型中,解解释变量之间存在着完全的线性关系或接近释变量之间存在着完全的线性关系或接近的线性关系的线性关系 eg12233iiiiYXX12233+0iiXX12233+0i

5、iiXXv完全多重共线性完全多重共线性近似多重共线性近似多重共线性 例子例子1 1 消费与收入、财富的例子消费与收入、财富的例子 可支配收入与家庭财富之间有明可支配收入与家庭财富之间有明显的共线性关系,他们的相关系显的共线性关系,他们的相关系数高达数高达0.9989.0.9989. Y消费支出、收入和财富的截面数据消费支出、收入和财富的截面数据 单位:美元单位:美元消费支出收入财富7080810651001009901201273951401425110160163311518018761202002052140220220115524024351502602686例例2 2 课本例题课本例题

6、发展农业会减少财政收入吗?发展农业会减少财政收入吗? 财政收入模型财政收入模型: :iiiiiiiiuSZMCUMTPOPJZZGZNZCS6543210 VariableCoefficientStd. Errort-StatisticProb. 农业增加值农业增加值NZ-1.9075480.342045-5.5768880.0000工业增加值工业增加值GZ0.0459470.0427461.0748920.2936建筑业增加值建筑业增加值JZZ6.4583740.7657678.4338670.000总人口总人口TPOP0.0960220.0916604.4776460.0003最终消费最终

7、消费CUM0.0031080.0428071.0475910.9427受灾面积受灾面积SZM-0.0276270.048904-0.5649160.5776截距项截距项-5342.5078607.753-0.6311180.5432R-squared0.989654 Mean dependent var10049.04Adjusted R-squared0.986955 S.D. dependent var12585.51S.E. of regression1437.448 Akaike info criterion17.58009Sum squared resid47523916 Schwa

8、rz criterion17.90704Log likelihood-256.7013 F-statistic366.6801Durbin-Watson stat1.654140 Prob(F-statistic)0.000000财政收入模型的财政收入模型的EViewsEViews估计结果估计结果 不存在多重共线性只说明解不存在多重共线性只说明解释变量之间没有线性关系释变量之间没有线性关系, ,而不而不排除他们之间存在某种非线性排除他们之间存在某种非线性关系关系 1 1、经济变量的共同变化趋势、经济变量的共同变化趋势 许多变量在随时间的变化过程中往往许多变量在随时间的变化过程中往往存在共同的变

9、动趋势。例如在经济繁存在共同的变动趋势。例如在经济繁荣时期,收入、消费、储蓄、投资、荣时期,收入、消费、储蓄、投资、就业都趋向于增长;在经济衰退时期,就业都趋向于增长;在经济衰退时期,都趋向于下降。都趋向于下降。 二、产生多重共线性的原因二、产生多重共线性的原因2 2、模型中采用滞后变量、模型中采用滞后变量 在计量经济模型中,往往需要引入在计量经济模型中,往往需要引入滞后变量来反映真实的经济关系。滞后变量来反映真实的经济关系。 例如,例如,消费消费=f(=f(当期收入当期收入, , 前期收入)前期收入) 显然,两期收入间有较强的线性相显然,两期收入间有较强的线性相关性。关性。3 3、用截面数据

10、建立模型也可能出现、用截面数据建立模型也可能出现多重共线性多重共线性 比如建立企业生产函数模型,以产出比如建立企业生产函数模型,以产出量为解释变量,选择资本、劳动、技量为解释变量,选择资本、劳动、技术等投入要素为解释变量。而这些投术等投入要素为解释变量。而这些投入要素的数量往往与产出量呈正比,入要素的数量往往与产出量呈正比,产出量高的企业,投入的各种要素都产出量高的企业,投入的各种要素都比较多,这就使得投入要素之间出现比较多,这就使得投入要素之间出现线性相关性。线性相关性。 一般来讲,多重共线性难以避一般来讲,多重共线性难以避免,所以我们关心的不是多重免,所以我们关心的不是多重共线性的有无,而

11、是多重共线共线性的有无,而是多重共线性的程度。性的程度。1 1、参数估计值不确定、参数估计值不确定第二节第二节 多重共线性产生的后果多重共线性产生的后果一、完全多重共线性下的后果一、完全多重共线性下的后果例:以例:以二元线性回归模型为例二元线性回归模型为例00()(0023230 xx如两个解释变量完全相关:例如设,则、 的分子、分母均为(不定式)23则无法确定、的数值。22332322222323()()()()()()()yxxyxx xxxx x23222332222323()()()()()()()yxxyxx xxxx x 2 2、参数估计值的方差无限大、参数估计值的方差无限大23由

12、第四章得和 的方差为:22322222323()()xVarxxx x 22232222323()()xVarxxx x 即:即:22222222222222()()()()0 xxVarxxxx 3()Var 同理,易得23xx设 EVIEWS遇到完全多重共线性时,会显示 Near singular matrix,无法进行估计1、估计量的方差增大、估计量的方差增大22322223223()()xVarxxx x 2222231(1)x由于由于22323231xxrVar、 的线性相关性越高,越接近 ,( )会增大。对有同样的结论。1/1/(1-r1-r2 2) ) 称为方差膨胀因子称为方差膨

13、胀因子(Variance (Variance Inflating Factor)Inflating Factor),记成,记成VIFVIF。方差膨胀因子方差膨胀因子 二、不完全多重共线性下的后果二、不完全多重共线性下的后果2.对参数区间估计时,置信区间趋于变大对参数区间估计时,置信区间趋于变大3.假设检验容易作出错误的判断假设检验容易作出错误的判断 第三节第三节 多重共线性的检验多重共线性的检验一、简单相关系数检验法一、简单相关系数检验法 含义:简单相关系数检验法是利用解释变含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严量之间的线性相关程度去判断是否存在严重多重共线性

14、的一种简便方法。重多重共线性的一种简便方法。 判断规则:一般而言,如果每两个解释变判断规则:一般而言,如果每两个解释变量的简单相关系数量的简单相关系数( (零阶相关系数零阶相关系数) )比较高,比较高,例如大于例如大于0.80.8,则可认为存在着较严重的多,则可认为存在着较严重的多重共线性。重共线性。例如(例1) X2 X2 X3 X3 X2X2 1 1 0.999 0.999 X3X3 0.999 0.999 1 1 说明说明 X1X1、X2X2近似完全线性关系。可以判定近似完全线性关系。可以判定模型存在严重的多重共线性模型存在严重的多重共线性对对2525只股票价格变动情况进行实证分析,设置

15、模型如下:只股票价格变动情况进行实证分析,设置模型如下:ln(Y) =ln(Y) =1 1+2 2ln(Xln(X2 2)+)+3 3ln(Xln(X3 3)+u)+ut t, ,其中其中Y Y为股价价格,为股价价格,X2X2为交易日平均换手率,为交易日平均换手率,X3X3为每股收益,回归结果如下:为每股收益,回归结果如下:Dependent Variable: LOG(Y) Included observations: 25VariableCoefficient Std. Errort-StatisticProb. C2.9911 0.1426 20.9787 0.0000 LOG(X2)-

16、0.6589 0.1276 - 0.0000 LOG(X3)0.6752 - 5.8018 0.0000 R-squared0.8454 Mean dependent var1.7589 Adjusted R-squared0.8313 S.D. dependent var0.7670 S.E.of regression0.3150 Akaike info criterion0.6398 Sum squared resid2.1832 Schwarz criterion0.7860 Log likelihood-4.9972 F-statistic60.1321 Durbin-Watson s

17、tat0.66 Prob(F-statistic)0.0000 (1)写出回归方程;)写出回归方程; (2)请根据上表中已有数据,填写表中括)请根据上表中已有数据,填写表中括号处缺失结果(注意给出计算步骤)号处缺失结果(注意给出计算步骤) (3)进行统计检验)进行统计检验F检验和检验和t检验?检验? (4)已知)已知log(X2)和和log(X3)相关系数相关系数=-0.2767,请问是否存在严重的多重共线性?,请问是否存在严重的多重共线性? NZ NZ GZ GZ JZZ JZZ TPOP TPOP CUM CUM SZM SZM NZ NZ 1.000 1.000 0.973 0.973

18、0.983 0.983 0.928 0.928 0.989 0.989 0.226 0.226 GZ GZ 0.973 0.973 1.000 1.000 0.999 0.999 0.844 0.844 0.993 0.993 0.129 0.129 JZZ JZZ 0.983 0.983 0.999 0.999 1.000 1.000 0.864 0.864 0.996 0.996 0.155 0.155 TPOP TPOP 0.928 0.928 0.844 0.844 0.864 0.864 1.000 1.000 0.889 0.889 0.388 0.388 CUM CUM 0.98

19、9 0.989 0.993 0.993 0.996 0.996 0.889 0.889 1.000 1.000 0.185 0.185 SZM SZM 0.226 0.226 0.129 0.129 0.155 0.155 0.388 0.388 0.185 0.185 1.000 1.000 例如(引子) 注意:注意: 较高的简单相关系数只是多重共线性存在的较高的简单相关系数只是多重共线性存在的充分条件充分条件,而不是必要条件。特别是在多于,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并单相关系数

20、也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的不能简单地依据相关系数进行多重共线性的准确判断。准确判断。二、综合判断法二、综合判断法22(RRFt或)大, 值大; 值小,说明模型存在多重共线性2295%0.95RFRYtYt这是因为:和 值大,表明总离差中(假定)是由回归解释的,各解释变量对 的联合线性作用显著。在此前提下,若各个 值很小,说明各解释变量之间存在共线性,对 的独立作用不能分辨,故 检验不显著。 另外判断参数估计值的符号,如果不符合另外判断参数估计值的符号,如果不符合经济理论或实际情况,可能存在多重共线性。经济理论或实际情况,可能存在多重共线性。练习题4.5

21、从模型拟合结果可知,样本观测个数为27,消费模型的判定系数,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值: 除除t1t1外,其余的外,其余的t t值都很小。工资收入值都很小。工资收入X1X1的系数的的系数的t t检验值虽然显著,但该系数的估计值过大,该值为检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为工资收入对消费边际效应,因为它为1.0591.059,意味,意味着工资收入每增

22、加一美元,消费支出的增长平均将着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。超过一美元,这与经济理论和常识不符。 另外,理论上非工资另外,理论上非工资非农业收入与农业收入也是非农业收入与农业收入也是消费行为的重要解释变量,但两者的消费行为的重要解释变量,但两者的t t检验都没有检验都没有通过。这些迹象表明,模型中存在严重的多重共线通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。分对解释消费行为的单独影响。11. 009. 1121. 0,69. 06

23、6. 0452. 0,10. 617. 0059. 1,91. 092. 8133. 83210tttt第四节第四节 多重共线性的补救措施多重共线性的补救措施 一、增加样本容量一、增加样本容量样本数据太少,易产生多重共线性。样本数据太少,易产生多重共线性。 先验信息:在此之前的研究成果先验信息:在此之前的研究成果所提供的信息。所提供的信息。 利用某些先验信息,将信息重叠利用某些先验信息,将信息重叠的一些变量合为一个变量,从而的一些变量合为一个变量,从而消除共线性。消除共线性。二、利用先验信息二、利用先验信息接例接例1 假如认为消费对财富的变化率是对收假如认为消费对财富的变化率是对收入的相应变化

24、率的入的相应变化率的1/101/10,即,即a a3 3=1/=1/1010a a2 2 ,如何解决多重共线性?如何解决多重共线性? 将将a a3 3=1/=1/1010a a2 2 带入模型,可得带入模型,可得Y=Y=a a1+a2(X2+0.1X3)+ut1+a2(X2+0.1X3)+ut此时解释变量只有一个:此时解释变量只有一个:X2+0.1X3X2+0.1X3,此,此时再进行回归时再进行回归VariableVariableCoefficiCoefficiententStd. ErroStd. Error rt-Statistict-StatisticProb. Prob. C C24.

25、38724.3876.6106.6103.6893.6890.0060.006X X0.2510.2518 80.0180.01813.8213.828 80.0000.000R-squaredR-squared0.90.96060 Mean dependent varMean dependent var111.000111.000Adjusted R-Adjusted R-squaredsquared0.950.955 5 S.D. dependent varS.D. dependent var31.428931.4289S.E. of regressiS.E. of regressiono

26、n6.6806.680 Akaike info criterionAkaike info criterion6.8136.813Sum squared resiSum squared resid d357.02357.027 7 Schwarz criterionSchwarz criterion6.876.874 4Log likelihoodLog likelihood-32.06-32.066 6 F-statisticF-statistic191.20191.20Durbin-Durbin-Watson statWatson stat2.5452.545 Prob(F-statisti

27、c)Prob(F-statistic)0.0000.000回归结果回归结果 Y=Y=24.387+0.252(X24.387+0.252(X2 2+0.1X+0.1X3 3)+e)+et t 例如,例如,对国民经济生产函数研究,建立回归方对国民经济生产函数研究,建立回归方程:程:KLAYlnlnlnln取对数:KALY 若通过经济理论分析或经验判断可认为该经济系统存在规若通过经济理论分析或经验判断可认为该经济系统存在规模效益不变的特征,即有模效益不变的特征,即有1上述回归模型就转变为:上述回归模型就转变为:KLAYlnln)1 (lnlnLKLnLnALYLn 即可将即可将Y对对L和和K的二元

28、双对数线性回归模型转化为的二元双对数线性回归模型转化为劳劳动生产率(资本产出率)动生产率(资本产出率)Y/L对对劳动资本装备程度(劳动劳动资本装备程度(劳动对资本的投入率)对资本的投入率)K/L的一元双对数线性回归模型,避免的一元双对数线性回归模型,避免了多重共线性的影响。了多重共线性的影响。 lnlnln(lnln )YLAKL举例农业总农业总产值产值(亿元)(亿元)农业基农业基本建设本建设投资投资农业从农业从业人员业人员19901990227.12227.120.59690.5969796.95796.95253.51253.510.73110.7311929.55929.55295.24

29、295.240.9320.932937.92937.92396.34396.341.72751.7275919.53919.53574.05574.051.99311.9931795.03795.03739.63739.633.19343.1934799.09799.09950.67950.674.44014.4401796.96796.961997925.56925.569.21059.2105791.39791.391998973.37973.375.53555.5355795.77795.771010.921010.929.26929.2692799.14799.141037.27103

30、7.276.97216.9721776.43776.431061.611061.616.96756.9675766.93766.931099.71099.79.49699.4969765.79765.791150.791150.796.06996.0699744.79744.791317.291317.293.59593.5959729.99729.9920051396.151396.154.90334.9033702.49702.49农业总产值农业总产值(亿元)(亿元)农业基本建农业基本建设投资设投资农业从农业从业人员业人员VariableVariableCoefficientCoeffic

31、ientStd. ErrorStd. Errort tProb. Prob. C C3.3673.3670.3920.3928.598.59990.0000.000LOG(K/L)LOG(K/L)0.6360.6360.0710.0718.978.97000.0000.000R-squaredR-squared0.8520.852 Mean dependent vMean dependent varar0.0940.094Adjusted R2Adjusted R20.8410.841 S.D. dependent vS.D. dependent varar0.6710.671S.E. of

32、regS.E. of regressionression0.2680.268 A AICIC0.3170.317Sum squareSum squared residd resid1.0021.002 S SC C0.4140.414Log likelihLog likelihoodood(0.540)(0.540) F-statisticF-statistic80.45980.459Durbin-Durbin-Watson statWatson stat1.0201.020 ProbProb0.0000.000回归结果tLLnKLnYntLKLnLYLne 636. 0 364. 0 367

33、. 3 le 0.636 3.367 即三、变换模型形式三、变换模型形式1、差分变换、差分变换2、将小类指标合并成大类指标、将小类指标合并成大类指标3、模型对数变换、模型对数变换。1、利用差分变换利用差分变换 12233ttttYXXu设23ttXX如果与之间存在多重共线性,令1tttYYY222 1tttXXX333 1tttXXX2233ttttYXXu 一般讲,增量之间的线性关系远比总量之间的线性一般讲,增量之间的线性关系远比总量之间的线性关系弱得多关系弱得多。则模型变化为obsXFZEGDPXFZE(-1)19813309490129761982363854893309198340216076363819844694716440211985577387924694198665421013357731987745111784654219889360147047451198910556164669360199011362183201055619911314621280113621992159522

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论