第6章 多重共线性.ppt [Read-Only].pdf_第1页
第6章 多重共线性.ppt [Read-Only].pdf_第2页
第6章 多重共线性.ppt [Read-Only].pdf_第3页
第6章 多重共线性.ppt [Read-Only].pdf_第4页
第6章 多重共线性.ppt [Read-Only].pdf_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第第6 6章 章 多重共线性多重共线性 6 1 多重共线性及其产生的原因 6 1 1 6 1 1 多重共线性多重共线性 Multicollinearity Multicollinearity 的定义的定义 6 1 2 多重共线性产生的原因 根据经验 多重共线性产生的经济背景和原因有以下 几个方面 1 经济变量之间往往存在同方向的变化趋势 2 经济变量之间往往存在着密切的关联度 3 在模型中引入滞后变量也容易产生多重共线性 4 在建模过程中由于解释变量选择不当 引起了变量 之间的多重共线性 6 2 多重共线性造成的影响 6 2 1 完全共线性下参数估计量不存在 多元线性回归模型 6 2 2 近似共线性造成的影响 1 增大最小二乘估计量的方差 2 参数估计量经济含义不合理 3 变量的显著性检验和模型的预测功能失去意义 在多元线性回归模型中 参数显著性检验的t统计量为 间估计用于判断参数估计值的可靠性失去意义 变大的方差容易使预测的 区间 变大 从而降低预测精度 使预测失去意义 4 回归模型缺乏稳定性 6 3 6 3 多重共线性的检验多重共线性的检验 6 3 1 相关系数检验法 Klein判别法 EViews软件中可以直接计算 解释 变量的相关系数矩阵 命令方式 COR 解释变量名 菜单方式 将所有解释变量设置成一个数组 并在数组窗口中点击View Correlations 6 3 4 特征值检验 考察解释变量的样本数据矩阵 利用特征值还可以构造两个用于检验多重共线性的指标 条件数 或病态 数 C N C ondi t i on N um ber 和条件指数 或病态指数 C I C ondi t i on l ndex 其指标定义为 C N 最大特征值 最小特征值 这两个指标都反映了特征值的离散程度 数值越大 表明多重共线性越 严重 一般的经验法则是 C I 10即认为存在多重共线性 大于30认为存在 严重的多重共线性 6 3 5 根据回归结果判断 下的临界值 而发现 1 系数估计值的符号与理论分析结果相违 背 2 某些变量对应的回归系数t值偏低或不显著 3 当一个不 太重要的解释变量被删除后 或者改变一个观测值时 回归结果显著变 化 则该模型可能存在多重共线性 例6 3 1 分析我国居民家庭电力消耗量与可支配收入及居住面积 的关系 以预测居民家庭对电力的需求量 具体数据见表6 3 1 表6 3 1 我国居民家庭电力消耗量与可支配收入及居住面积统计资料 年度年度 年人均家庭电力消耗年人均家庭电力消耗 量 千瓦小时 量 千瓦小时 人均居住面积人均居住面积 平方米 平方米 年人均可支配收入年人均可支配收入 指数 指数 1978 1001978 100 1985198521 221 212 4512 45243 17243 17 1986198623 223 213 0213 02254 28254 28 1987198726 426 413 4913 49265 39265 39 1988198831 231 213 9413 94277 61277 61 1989198935 335 314 4214 42273 49273 49 1990199042 442 414 8714 87281 33281 33 1991199146 946 915 4415 44289 71289 71 1992199254 654 615 6415 64307 66307 66 1993199361 261 216 9916 99321 07321 07 1994199472 772 716 6516 65339 33339 33 1995199583 583 517 2517 25356 58356 58 1996199693 193 117 8217 82383 95383 95 19971997101 8101 818 3318 33399 85399 85 首先 作家庭电力消耗量电量与家庭可支配收入的回归模型 结果如下 可见 收入对用电量有很好的解释作用 然后 作用电量与住房面积的的回归方程 结果如下 同样 住房面积对电力也有很好的解释作用 作二元回归方程 结果如 下 表6 3 2 回归结果 住房面积的系数在方程 6 3 7 中是显著的 在方程 6 3 8 中不显 著 从F统计量值可以看出 收入和住房面积对电力消费量的共同影响是 显著的 1 相关系数检验 数组窗口中点击Vi ew C orrel at i ons 结果如表6 3 3 所示 表6 3 3 相关系数 X1与X2相关系数高达0 963124 两者高度正相关 图6 3 1 住房面积与收入之间的关系图 2 辅助回归模型检验 将住房面积对收入进行回归 住房面积与收入之间 存在显著的线性关系 3 方差膨胀因子检验 6 4 多重共线性的解决方法 6 4 1 保留重要的解释变量 去掉次要的或可替代的解释变量 6 4 2 利用先验信息改变参数的约束形式 根据经济理论或其他信息 找出参数间的某种关系 并将这种关系作为约束条 件与样本信息结合起来 进行有约束的最小二乘估计 例如 著名的C obb D ougl as生产函数中 6 4 3 变换模型的形式 对原设定的模型进行适当的变换 也可以消除或削 弱原模型中解释变量之间的相关关系 具体有三种变 换方式 一是变换模型的函数形式 二是变换模型的 变量形式 三是改变变量的统计指标 例6 4 1 在电力消费量函数中 电力消费量与收 入和住房面积之间可能是对数形式的模型 而不是线 性模型 我们利用对数模型拟合上述数据 结果如 下 表6 4 1 回归结果 与方程 6 3 8 相比 在对数模型中 收入和住房面积系数在统 计上都是显著的 回归模型在整体上也是显著的 说明我们原先设计 的线性回归模型是有误的 例6 4 2 根据表6 4 2 建立我国进口需求与G N P和消费价格指数之 间的关系模型 表6 4 2 我国进口支出与G N P和消费价格指数 单位 亿元人民币 年份GNP 当年价 进口总额IM消费价格指数CPI 19858989 11257 8100 0 198610201 41498 3106 5 198711954 51614 2114 3 198814922 32055 1135 8 198916917 82199 9160 2 199018598 42574 3165 2 199121662 53398 7170 8 199226651 94443 3181 7 199334560 55986 2208 4 199446670 09960 1258 6 199557494 911048 1302 9 199666850 511557 4328 0 199773142 711806 5337 2 199878017 811622 4334 5 根据表6 4 2中的数据 回归结果如表6 4 3所示 表6 4 3 回归结果 回归结果表明 在5 的显著性水平下 收入和价格的系数各自均不是统计显著 的 模型通过F检验 我们可以断定方程 6 4 5 中存在严重的多重共线性 为解决 这个问题 我们可以用实际进口额对实际收入进行回归 得到如下结果 表6 4 4 回归结果 这表明 实际进口额与实际收入显著正相关 这样 通过将名义变量 转换为实际变量 显然削弱了原模型中的多重共线性 6 4 4 综合使用时序数据与截面数据 在模型的参数估计中 如果模型利用的是时间序列数据 这时模型又 存在多重共线性 可考虑用时间序列数据与截面数据相结合的办法来修正 多重共线性对模型的影响 6 4 5 逐步回归法 从所有解释变量中间先选择影响最为显著的变量建立模型 然后再将 模型之外的变量逐个引入模型 每引入一个变量 就对模型中的所有变量 进行一次显著性检验 并从中剔除不显著的变量 逐步引入 剔除 引入 直到模型之外所有变量均不显著时为止 这种消除多重共线性的方 法称为逐步回归法也称Fri sch综合分析法 具体步骤为 1 利用相关系数从所有解释变量中选取相关性最强的变量建 立一元回归模型 2 在一元回归模型中分别引入第二个变量 共建立k 1个二元 回归模型 设共有k个解释变量 从这些模型中再选取一个较优 的模型 选择时要求模型中每个解释变量影响显著 参数符号 正确 调整的R 2值有所提高 3 在选取的二元回归模型中以同样方式引入第三个变量 如 此下去 直至无法引入新的变量时为止 6 4 6 增加样本容量 6 4 7 主成分回归 6 5 6 5 案例分析案例分析 我国旅游市场收入函数我国旅游市场收入函数 根据理论和经验分析 影响国内旅游市场收入Y的主要因素 除 了国内旅游人数和旅游支出以外 还可能与相关基础设施有关 为 此 考虑的影响因素主要有国内旅游人数X1 城镇居民人均旅游支出 X2 农村居民入均旅游支出X3 并以公路里程X4和铁路里程X5作为 相关基础设施的代表 统计数据如表6 5 1所示 试估计以下形式的计 量经济模型 其中 Y为全国旅游收入 亿元 X1为国内旅游人数 万人 次 X2为城镇居民人均旅游支出 元 X3为农村居民人均旅游支出 元 X4为公路里程 万km X5为铁路里程 万km 表6 5 1 1994 2003年中国旅游收入及相关数据 年年 份份 全国旅游全国旅游 收入收入 亿亿 元元 国内旅游人国内旅游人 数数 万人 万人 次次 城镇居民人城镇居民人 均旅游支出均旅游支出 元元 农村居民人农村居民人 均旅游支出均旅游支出 元元 公路里公路里 程程 万万 km 铁路里铁路里 程程 万万 km 19941023 552400414 754 9111 785 90 19951375 762900464 O61 5115 705 97 19961638 463900534 170 5118 586 49 19972112 764400599 8145 7122 646 60 19982391 269450607 0197 0127 856 64 19992831 971900614 8249 5135 176 74 20003175 574400678 6226 6140 276 87 20013522 478400708 3212 7169 807 01 20023878 487800739 7209 1176 527 19 20033442 387000684 9200 0180 987 30 利用EViews软件 输入Y X1 X2 X3 X4 X5等数据 采用 这些数据对模型进行OLS回归 结果如表6 5 2所示 表6 5 2 回归结果 由此可见 该模型可决系数很高 F检验值173 353 明显显著 但是X1 X5系数的t检验不显著 而且X5系数的符号与预期的相反 这表明很可能存在严重的多重共线性 1 多重共线性检验 1 相关系数检验相关系数检验 在命令窗口键入 COR Y X1 X2 X3 X4 X5 输出的相关系 数矩阵为 表6 5 3 相关系数矩阵 由相关系数矩阵可以看出 各解释变量相互之间的相关系数较 高 证实确实存在严重多重共线性 2 辅助回归模型检验 辅助回归模型检验 建立每个解释变量对其余解释变量的辅助回归模型 从以上辅助回归模型中的R2 F统计量的数值可以看出 解释变 量X1 X2 X3 X4 X5之间存在较为严重的多重共线性 3 方差膨胀因子检验 从以上辅助回归模型可知 VIF1 17 9 VIF2 19 2 VIF3 4 4 VIF4 10 9 VIF5 20 明显大于10 解释变量X1 X2 X3 X4 X5之间存在较为严重的多重共线性 2 修正多重共线性 逐步回归法 采用逐步回归的办法 去检验和解决多重共线性问题 分别 做Y对X 1 X2 X3 X4 X5的一元回归 结果如表6 5 4所示 表6 5 4 一元回归结果 被解释变量为Y 下同 解释变量X1X2X3X4X5 参数估计值0 0849 05211 66734 3322014 146 t统计量8 66613 1605 1976 4688 749 R20 9040 9560 7720 8390 905 调整的R20 8920 9500 743O 8200 894 其中 含有解释变量X2的回归方程 调整的R2最大 以X2为 基础 顺次加入其他变量逐步回归 结果如表6 5 5所示 表6 5 5 加入新变量的回归结果 一 变量X1X2X3X4X5Adj R2 X2 X10 030 2 153 6 194 4 287 0 966 X2 X38 017 5 748 1 716 0 858 0 949 X2 X46 737 6 645 10 908 2 658 0 972 X2 X57 851 2 909 285 178 0 462 0 945 经比较 新加入X4的方程 其调整的R2 0 972 改进最大 而且 各参数的t检验显著 选择保留X4 再加入其他新变量逐步回归 结 果如表6 5 6所示 表6 5 6 加入新变量的回归结果 二 变量X1X2X3X4X5Adj R2 X2 X4 X10 009 0 423 6 355 4 522 8 565 1 215 0 968 X2 X4 X34 216 3 945 3 222 3 068 13 629 4 693 0 987 X2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论