计量经济学第八讲

上传人：n*** IP属地：贵州上传时间：2020-04-03 格式：DOC 页数：18 大小：443KB 积分：20 举报 版权申诉

已阅读5页，还剩13页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

三多重共线性的检验一相关系数检验利用相关系数可以分析解释变量之间的两两相关情况在 EViews 软件中可以直接计算解释变量的相关系数矩阵命令方式 COR 解释变量名菜单方式将所有解释变量设置成一个数组并在数组窗口中点击 View Correlations 二辅助回归模型检验相关系数只能判断解释变量之间的两两相关情况当模型的解释变量个数多于两下并且呈现出较为复杂的相关关系时可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性即依次建立个辅助回归模型 k kixaxaxaxaax kkiiiii 1 1111110 如果其中某些方程显著则表明存在多重共线性所对应的变量可以近似地用其他解释变量线性表示辅助回归模型检验不仅能检验多元回归模型的多重共线性而且可以得到多重共线性的具体形式如果再结合偏相关关系检验还能进一步判定是哪些解释变量引起了多重共线性这有助于分析如何消除多重共线性的影响三方差膨胀因子检验对于多元线性回归模型的方差可以表示成 i b i ijiiij i VIF xxRxx bD 2 2 22 2 1 1 其中关于其他解释变量辅助回归模型的判定系数为 ii xR 为 2 i VIF 方差膨胀因子随着多重共线性程度的增强 VIF 以及系数估计误差都在增大因此可以用 VIF 作为衡量多重共线性的一个指标一般当时此时认为模型存在较严重的多10 VIF9 0 2 i R 重共线性另一个与 VIF 等价的指标是容许度 Tolerance 其定义为 iii VIFRTOL 1 1 2 显然当与其他解释变量高度相关时 10 TOL i x 因此一般当时认为模型存在较严重的0 TOL1 0 TOL 多重共线性四特征值检验考察解释变量的样本数据矩阵 knnn k k xxx xxx xxx X 21 22212 12111 1 1 1 当模型存在完全多重共线性时而0 1 XXkXrank 当模型存在严重的多重共线性时根据矩阵知识若0 X X 为矩阵个特征值则有 121 k 1 kXX的 0 121 K XX 这表明特征值中至少有一个近似地等于零因 1 2 1 ki i 此可以利用的特征值来检验模型的多重共线性实际计算时 X X 先对样本数据做标准化处理这样矩阵转化成解释变量的相 X X 关系数矩阵特征值也减少到个 k 利用特征值还可以构造两个用于检验多重共线性的指标病态数Condition Number 和病态指数 Condition Index 其指标 CI 定义为最大特征值最小特征值 CI 这两个指标都反映了特征值的离散程度数值越大表明多重共线性越严重一般当时认为存在严重的多 30 1000 CI或重共线性四多重共线性的解决方法设定计量经济模型的时候为了全面反映各方面因素的影响总是在理论和实践认识的基础上尽量选取被解释变量的所有影响因素这样在同时考虑多个影响因素的情况下很可能产生多重共线性问题在处理多重共线性之前首先应该明确以下两点第一多重共线性的主要后果是无法区分每个解释变量的单独影响因此如果建立模型的目的是进行预测只要模型的拟合优度较高即能正确反映所有解释变量的总影响并且解释变量的相关类型在预测期内保持不变则可以忽略多重共线性的问题但是如果是应用模型进行结构分析或政策评价即利用系数分析比较各个解释变量的单独影响则需要消除多重共线性的影响第二引起多重共线性的原因是模型中存在相关的解释变量所以消除多重共线性的根本方法只能是从模型中剔除这些变量但直接剔除变量可能会产生新的问题 1 模型的经济意义不合理例如生产函数中资金与劳动者人数通常是高度相关的但从中剔除任何一个要素都不太合适 2 如果剔除的是重要解释变量则这些变量的影响将反映在随机误差项中使模型产生异方差性或自相关性 3 若剔除不当还会产生设定误差的问题造成参数估计严重有偏因此为了解决这一矛盾剔除变量时应该全面慎重考虑根据解释变量的特点分别采用直接剔除和间接剔除两种方式一直接剔除次要或可替代的变量根据经济理论和实际经验设定计量经济模型时容易考虑过多的解释变量其中有些可能是无显著影响的次要变量还有一些变量的影响可以用模型中的其他变量来代替所以在估计模型之前为避免多重共线性的影响应该从模型中先剔除这些变量次要变量可以通过被解释变量与解释变量的相关系数检验相关图分析等统计分析加以鉴别利用辅助回归模型和特征值检验多重共线性时又可以提供解释变量之间相互替代性的信息二间接剔除重要的解释变量对于有重要影响的解释变量可以通过以下方式将其间接剔除 1 利用附加信息例如著名的 Cobb Douglas 生产函数中 KALY 劳动投入量 L 与资金投入量 K 之间通常是高度相关的如果已知附加信息规模报酬不变 1 则 1 L K ALKALY 或 L K A L Y 记 LKkLYy 则 C D 生产函数可以表示成 Aky 此时二元模型转化成一元模型当然不存在多重共线性的问题可以利用 OLS 法估计进而得到 A 1 a 又如设工业能源需求函数为 2211 xbxbay 其中分别为重轻工业总产值利用此模型不仅能反映工业 21 x x 经济增长对能源的需求情况而且可以反映工业结构变化对能源需求的影响但是重轻工业发展的共向性很可能使模型产生多重共线性由于分别是重轻工业的单位能耗如果根据历史统 21 b b 计资料测得重工业的单位能耗平均来说是轻工业单位能耗的即获得以下附加信息 0 倍 21 bb 则工业能源需求函数可以表示成 2 212 2212 xba xxba xbxbay 其中模型转化成一元模型估计出之后又 21 xxx 2 ba 得到从而在消除多重共线性影响的情况下得到工业能源 21 bb 需求函数 2211 xbxbay 2 变换模型的形式对原设定的模型进行适当的变换也可以消除或削弱原模型中解释变量之间的相关关系具体有三种变换方式一是变换模型的函数形式如将线性模型转换成双对数模型半对数模型多项式模型等二是变换模型的变量形式如引入差分变量相对数变量等三是改变变量的统计指标如将生产过程中的资金投入量取成固定资金或流动资金或两者之和劳动投入量取成职工人数或工资总额经济增长指标取成 GDP GNP 国民收入等再如投资函数 1210ttt YbYbbI 也可以变换成 ttt YaYaaI 2110 即以收入和收入增长来解释投资的增长情况 3 综合使用时序数据与横截面数据如果能同时获得变量的时序数据和横截面数据则先利用某类数据估计出模型中的部分参数再利用另一类数据估计模型的其余参数例如设某类商品的需求函数为 Pbxbbylnlnln 210 其中为商品需求量分别为居民收入和该商品价格并yPx 且已知在时序样本数据中高度相关为此分以下二步完成 Px与 1 收集最近一年该商品的销售量和居民收入的统计资料横截面数据由于商品价格在一年中的变化幅度不大所以将需求函数取成 ii xaaylnln 10 利用横截面资料估计该模型得到需求的收入弹性 1 a 2 原需求函数中的也是需求的收入弹性所以此时 1 b 11 ab 实际上假设历年的平均收入弹性与近期的收入弹性近似相等将原模型变换成 itt Pbby ln 10 其中再利用历年商品销售量居民收入和 ttt xayyln ln 1 价格的统计资料时序数据估计模型得到从而在消除多 10 bb 重共线性影响的情况下估计出需求函数 Pbxbbyln ln ln 210 从上述三种方法的处理过程可以看出最终还是通过减少模型中解释变量个数的方式即剔除引起多重共线性的变量来消除多重共线性的影响但并不是直接剔除有重要影响的解释变量模型中还是保留了这些变量的影响所以称之为间接剔除三逐步回归建立计量经济模型的时候一般是将解释变量全部引入模型然后再根据统计检验和定性分析从中逐个剔除次要的或产生多重共线性的变量选择变量是一个由多到少的过程而逐步回归选择变量时却是一个由少到多的过程即从所有解释变量中间先选择影响最为显著的变量建立模型然后再将模型之外的变量逐个引入模型每引入一个变量就对模型中的所有变量进行一次显著性检验并从中剔除不显著的变量逐步引入剔除引入直到模型之外所有变量均不显著时为止许多统计分析软件都有逐步回归程序但根据计算机软件自动挑选的模型往往统计检验合理经济意义并不理想因此实际应用中一般是依据逐步回归的原理结合主观分析来筛选变量具体步骤为 1 利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型 2 在一元回归模型中分别引入第二个变量共建立个二1 k 元回归模型设共有个解释变量从这些模型中再选取k 一个较优的模型选择时要求模型中每个解释变量影响显著参数符号正确值有所提高 2 R 3 在选取的二元回归模型中以同样方式引入第三个变量如此下去直到无法引入新的变量时为止例 5 服装需求函数根据理论和经验分析影响居民服装需求的主要因素有可支配收入 X 流动资产拥有量 K 服装类价格指数 P1 和总物价指数 P0 表 3 4 给出了有关统计资料表 3 4 服装需求函数有关统计资料年份服装需求可支配收入 X 流动资产拥有量 K 服装类价格指数 P1 总物价指数 P0 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 8 4 9 6 10 4 11 4 12 2 14 2 15 8 17 9 19 3 20 8 82 9 88 0 99 9 105 3 117 7 131 0 148 0 161 8 174 2 184 7 17 1 21 3 25 1 29 0 34 0 40 0 44 0 49 0 51 0 53 0 92 93 96 94 100 101 105 112 112 112 94 96 97 97 100 101 104 109 111 111 设服装需求函数为 KbPbPbXbaY 4321 01 1 相关系数检验键入 COR Y X K P0 P1 输出的相关系数矩阵为 YXKP0 X K P0 P1 0 9977 0 9834 0 9887 0 9755 0 9883 0 9877 0 9804 0 9695 0 97000 9918 可见每个因素都与服装需求高度相关而且解释变量之间也是高度相关的现按照逐步回归原理建立模型 2 建立一元回归模型根据理论分析可支配收入应该是服装需求最主要的影响因素相关系数检验也表明收入与服装需求的相关性最强所以以作为最基本的模型 bXaY 3 将其余变量逐个引入模型估计结果列入表 3 5 其中括号里的数字为统计量值 t XP1P0K 2 R 2 R XfY 0 11790 99500 9956 1 PXfY 0 1262 8 57 0 0378 0 57 0 99460 9958 0 PXfY 0 1030 5 67 0 0857 0 83 0 99480 9960 KXfY 0 1315 7 03 0 0388 0 74 0 99470 9959 0 1 PPXfY 0 1042 7 55 0 1866 2 47 0 3132 2 59 0 99700 9980 0 1 KPPxfY 0 0978 3 71 0 1972 2 24 0 3401 2 20 0 0144 0 30 0 99650 9980 从表 3 5 的估计结果可以看出在基本模型中引入 P1 之后的符号正确但 P1 的检验不显著同时拟合优度提高不 21 b bt 2 R 多反而下降同理再分别引入其他两个解释变量引入的变量 2 R 都不显著但相对来说模型的拟合优度最高所 0 PXfY 以再将该模型作为基本模型逐步引入其他变量引入 P1 之后模型中各个系数的符号合理解释变量的 t 检验也都是显著的并且拟合优度都有所提高在此基础上再引入 K 其检验不显 22 RR 和t 著为多余变量经过以上的逐步引入检验过程最终确定服装需求函数为 50 3 9970 0 9980 0 59 2 47 2 55 7 03132 0 11866 0 1042 0 45 12 22 DWRR t PPXY 从本例的讨论过程可以看出 1 模型中引入相关性较强的解释变量会影响系数的估计值和检验值这正是多重共线性的主要影响 t 2 在模型中增添解释变量不论其影响是否显著都会使的值 2 R 上升但的值却不一定增加增添不显著的解释变量甚至可能会 2 R 使的值下降所以比较不同模型的拟合优度时取比较合理 2 R 2 R 另外该需求模型还存在两个问题一是 DW 值接近于 4 可能存在自相关性二是样本容量太小却要考虑引入 4 个解10 n 释变量样本的自由度只有所以模型的估计结果51410 可能并不可靠过高的拟合优度也可能提供的是虚假信息本例只是为了说明多重共线性的处理过程实际应用中只有在样本容量较大的情况下才能考虑引入多个解释变量四主成分回归主成分回归 Principal Components Regression 简称 PCR 是根据多元统计分析中的主成分分析原理用于处理多重共线性模型的一种新的参数估计方法其基本原理是利用主成分分析将解释变量转换成若干个主成分这些主成分从不同侧面反映了解释变量的综合影响并且互不相关因此可以将被解释变量关于这些主成分进行回归再根据主成分与解释变量之间的对应关系求得原回归模型的估计方程主成分回归的具体步骤为 1 对原始样本数据做标准化处理这样矩阵即为解释X X 变量的相关系数矩阵 R 2 计算个特征值以及相应的标kR的 k 21 准化特征向量 k uuu 21 Auu AI 的根0 3 利用特征值检验多重共线性模型存在多重共线性时至少有一个特征值近似地等于零不妨设近似为零 kmm 21 这表明解释变量之间存在着个线性相关关系 mk 4 设解释变量已标准化个主成分为 kXXX k的 21 的标准差标准化 i iij ij X XX X 183 2211 22221212 12121111 kkkkkk kk kk XuXuXuZ XuXuXuZ XuXuXuZ 其中互不相关并且近似为零将标准化 i Z kmm ZZZ 21 的被解释变量关于个主成分进行回归得 Ym m ZZZ 21 193 2211 mmZ aZaZaY 5 根据主成分与解释变量之间的关系式 3 18 将其代入主成分回归方程 3 19 式求得用标准化数据表示的的回归方程 k XXX 21 kkX XXY 2211 系数与原模型中参数之间的关系为 i i b 203 2 1 1 0 k i ii i i y i xbyb ki S S b 其中分别为和的标准差由此可以计算出原回归模型 y S i Sy i x 中的参数进而得到 kkx bxbxbby 22110 例 6 中国民航客运量预测模型为了研究我国民航客运量的变化趋势及其成因经分析选择了以下解释变量居民消费额亿元 1 x 政府消费额亿元铁路客运量万人来华旅游入境人数 2 x 3 x 万人民航航线里程万公里并取中国民航客运量 4 x 5 x 万人作为被解释变量有关统计资料列入表 3 6 y 表 3 6 民航客运量及其影响因素的统计资料年份民航客运量y 居民消费额 1 x 政府消费额 2 x 铁路客运量 3 x 来华旅游人数 4 x 民航航线里程 5 x 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 231 298 343 401 445 391 554 747 997 1310 1442 1283 1660 2178 2886 3383 4038 5117 5555 5630 5755 1759 1 2005 4 2317 1 2604 1 2867 9 3182 5 3674 5 4589 0 5175 0 5961 2 7633 1 8523 5 9113 2 10315 9 12459 8 15682 4 20809 8 26944 5 32152 3 34854 6 36921 1 480 614 659 705 770 838 1020 1184 1367 1490 1727 2033 2252 2830 3492 4500 5986 6690 7852 8725 9485 81491 86389 92204 95300 99922 95712 95080 99693 94162 92578 93620 180 92 420 39 570 25 776 71 792 43 947 70 1285 22 1783 30 2281 95 2690 23 3169 48 2450 14 2746 20 3335 65 3311 50 4152 70 4368 45 4638 65 5112 75 5758 79 6347 84 14 89 16 00 19 53 21 82 23 27 22 91 26 02 27 72 32 43 38 91 37 38 47 19 50 68 55 91 83 66 96 08 104 56 112 90 116 65 142 50 150 58 1 多重共线性检验由于选择的影响因素较多所以估计模型之前应该先分析各个因素与被解释变量之间的关系以及因素之间的相关程度利用 SCAT 命令观察了与各个解释变量的相关图之后再用 COR 命y i x 令进行相关系数检验输出的相关系数矩阵为 y 1 x 2 x 3 x 4 x 1 x 0 9862 2 x 0 9869 0 9969 3 x 0 1199 0 1567 0 1569 4 x 0 9553 0 9377 0 9420 0 0779 5 x 0 9878 0 9778 0 9877 0 1140 0 9569 计算结果表明除铁路客运量之外其他因素与民航客运量 3 x 高度相关而且解释变量之间也是两两高度相关的为了进一步检验解释变量之间的相关关系利用 SPSS 软件计算出解释变量相关系数矩阵的特征值为 00133 0 019 0 041 0 028 1 911 3 54321 此时即标准化后的 01017 4 6 i XX 样本数据矩阵是一个病态矩阵而且病态条件数和病态指X X 数分别为 1000294100133 0 911 3 51 3023 542941 CI 因此模型存在严重的多重共线性如果此时用 OLS 法估计模型将得到以下估计结果 92 0 9862 0 48 1 95 0 31 0 01 0 92 0 0572 191477 0 0025 0 0027 0 0766 0 39 48 2 54321 DWR t xxxxxy 模型中所有解释变量的检验均不显著并且的系数符号不合理 t 2 x 2 主成分回归现采用主成分回归解决多重共线性问题根据 SPSS 软件的计算结果所对应主成分的累计贡献率贡献率为 21 ii 达到 98 77 对应的标准化特征向量为 21 993 0 965 0 120 0 996 0 992 0 1 u 00523 0 202 0 992 0 040 0 041 0 2 u 所以两个主成分为 543211 993 0 965 0 120 0 996 0 992 0XXXXXZ 543212 00523 0 202 0 992 0 040 0 041 0 XXXXXZ 其中均为标准化后的解释变量从主成分中各变量的系数值可 i X 以看出第一主成分主要反映了的变化即综 1 Z 5421 XXXX和合反映了与民航客运量正相关因素的影响第二主成分主要反映 2 Z 了客运量的变化即与民航客运量负相关因素的影响 3 X 在 SPSS 软件中可以自动生成主成分的样本值又称为样 21 Z Z 本得分值将其转入 EViews 软件后先对变量 Y 进行标准化处理 43 1982 91 2125 YYZGENR 再将标准化后的 Y 关于回归 21 Z Z LS YZ Z1 Z2 估计之后经检验模型还存在一阶和二阶自相关性所以再加上 AR 1 AR 2 项重新估计模型得到以下估计结果

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计量经济学第八讲

文档简介

温馨提示

最新文档

评论

计量经济学第八讲

文档简介

温馨提示

最新文档

评论

相关文档