《多重共线性2》PPT课件.ppt_第1页
《多重共线性2》PPT课件.ppt_第2页
《多重共线性2》PPT课件.ppt_第3页
《多重共线性2》PPT课件.ppt_第4页
《多重共线性2》PPT课件.ppt_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.3 4.3 多重共线性多重共线性 一、多重共线性的一、多重共线性的概念概念 二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性 三、多重共线性的后果三、多重共线性的后果 四、多重共线性的检验四、多重共线性的检验 五、克服多重共线性的方法五、克服多重共线性的方法 六、案例六、案例 一、多重共线性的概念 对于模型: Yi=0+1X1i+2X2i+kXki+i i=1,2,n 其基本假设之一是解释变量之间是互不相关的。 如果某两个或多个如果某两个或多个解释变量解释变量之间出现了相关性,则称为存之间出现了相关性,则称为存 在在多重共线性多重共线性( (MulticollinearityMulticollinearity) )。 如果存在不全为0的数c1、c2、ck,使 c1X1i+c2X2i+ckXki=0 i=1,2,n 即:某个解释变量完全可以由其它解释变量的线性组合来表示 则称为解释变量间存在完全共线性(perfect multicollinearity)。 完全共线性与近似共线性 如果存在不全为0的数c1、c2、ck,使 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 即:某个解释变量近似地可以由其它解释变量的线性组合来表示 则称为解释变量间存在近似共线性(approximate multicollinearity) 。 共线性示例 X1X2X3 105052 157575 189097 24120129 30150152 X2=5X1 完全共线性 X3=5X1+V 近似共线性 完全共线性下,X中至少有一列向量可由其他列向量(不包括第一列) 线性表出,这意味着:秩(X) X非列满秩 (XX)不满秩 (XX)-1 不存在 无法得到参数的估计量。 的OLS估计量为: 例:对离差形式的二元回归模型 如果两个解释变量完全相关,如x2= x1,则 这时,只能确定综合参数1+2的估计值: 这一后果的实际意义是:无法得到回归系数的唯一解,但可以得到这些 系数的线性组合的唯一解 Y=0+1X1+2X2+ Y=0+(1+2) X1+ 2、近似共线性下解释变量的单独作用无法区分 实际问题中的直接表现是:模型的回归系数经常表现出反常的现象! 例如1本来应该是正的,结果却是负的。 经验表明,如果存在这种反常情形,应该首先怀疑多重共线性。 经典假设下,回归系数j表达了在其它解释变量不变的情形下,Xj 对Y的单独作用(净影响) 如果模型中两个解释变量具有线性相关性,例如X2=X1 ,这时,X1 和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是 反映它们对被解释变量的共同影响 从而解释变量的单独作用无法无区分,1、2失去了应有的经济含 义 3、近似共线性下OLS估计量的方差变大 近似共线性下,可以得到OLS参数估计量,并且可以证明,此时参数 估计量依然满足线性、无偏和有效性,即OLS依然是BLUE 但是,此时参数估计量的方差会增大。参数估计量方差的表达式为 由于|XX|0,引起(XX) -1主对角线元素较大,使参数估计值的方 差增大 这意味着: (1)无法精确的估计参数(以较高的精度估计参数) (2)基于参数估计量的标准差的变量显著性检验失效 以二元线性模型 Y=0+1X1+2X2+ 为例: 恰为X1与X2的线性相关系数的平方r2 由于 0 r2 1,故 1/(1- r2 )1 方差膨胀因子 (Variance Inflation Factor, VIF) 显然:多重共线性的存在使得参数估计值的方差增大,其增加的倍数可 以采用1/(1-r2)衡量 当完全不共线时, r2 =0 当近似共线时, 00.8,比较严重 0.9,非常严重 若在OLS法下,出现以下现象,则可能意味着共线性的存 在: a、系数估计值的符号不合常理; b、R2与F值较大,方程具有显著性,但各参数估计值的t检 验值均较小,多个解释变量并不显著 说明各解释变量对Y的联合线性作用显著,但各解释变 量间存在共线性而使得它们对Y的独立作用不能分辨,故t检 验不显著。 2、经验判断法 将每个解释变量Xi对其它解释变量Xj进行回归, 观察其拟合优度R2和F检验值,如果某个Ri2接近1, Fi显著超出临界值,则表明该Xi与其它解释变量存在 多重共线性。 3、辅助回归检验法 计算每个回归系数的VIF或TOL 方差膨胀因子越大(或容忍度越小),表明模型的多重 共线性越强。 当VIF5或VIF10时,认为存在较严重的多重共线性。 4、方差膨胀因子和容忍度(VIF 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食生产函数: Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 + 1、用OLS法估计上述模型: R2接近于1; 给定=5%,得F临界值 F0.05(5,12)=3.11 F=638.4 15.19, 故认上述粮食生产的总体线性关系显著成立。 但X4 、X5 的参数未通过t检验,且符号不正确,故解释变量间可 能存在多重共线性。 (-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14) 2、检验简单相关系数 发现: X1与X4间存在高度相关性。 列出X1,X2,X3,X4,X5的相关系数矩阵: 3、找出最简单的回归形式 可见,应选第1个式子为初始的回归模型。 分别作Y与X1,X2,X4,X5间的回归: (25.58) (11.49) R2=0.8919 F=132.1 DW=1.56 (-0.49) (1.14) R2=0.075 F=1.30 DW=0.12 (17.45) (6.68) R2=0.7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论