计量经济学及其应用:第8章_第1页
计量经济学及其应用:第8章_第2页
计量经济学及其应用:第8章_第3页
计量经济学及其应用:第8章_第4页
计量经济学及其应用:第8章_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章

多重共线性8.1什么是多重共线性8.2多重共线性会产生什么样的后果8.3多重共线性的诊断8.4如何消除多重共线性8.5案例分析通过本章我们要知道8.1什么是多重共线性对于多元线性回归模型(8-2)如果某两个或多个解释变量之间出现了较强的近似相关性,并且是线性相关性,则称为多重共线性(multicollinearity)。如果存在其中不全为0,则称为解释变量的完全多重共线性(perfectmulticollinearity)

如果存在(8-3)(8-4)其中不全为0,为随机误差项,则称为一般共线性或近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。8.2多重共线性会产生什么后果多重共线产生的原因(1)经济变量之间存在内在联系,这是产生多

重共线性的根本原因。(2)经济变量在时间上具有相关的共同趋势。(3)解释变量中含有滞后变量。多重共线性的参数估计量

参数的估计以二元线性回归方程为例(8-5)当完全线性相关,设则其中:,,同理可得因此OLS无法估计出的值,回归分析无法进行。

若不完全相关则可设带入得由于因而是可以估计的参数的方差估计值的方差为:

将带入上式(8-9)可见,在完全线性相关的极端条件下,普通最小二乘法估计无法估计出参数值,因为估计值的方差为无穷大。(1)难以区分解释变量的单独影响。(2)参数估计值不稳定,模型缺乏稳定性。(3)参数估计量的回归系数符号有误,经济含义不合理。(4)变量的显著性检验失去意义。多重共线性的后果8.3多重共线性的检验1、不显著系数法不显著系数法是利用多元线性回归模型的拟合结果进行检验,这种方法适用于以下三种情况:(1)

很大,t较小(2)理论性强,检验值弱(3)新引入变量后,方差增大

2、拟合优度检验法(1)包含被解释变量的情形对于模型(8-2),依次删除变量

,形成k个具有k-1个解释变量的模型:

对这k个模型分别进行回归,得到k个判定系数,分别命名为

,在这k个判定系数中选择最大的,与模型(8-2)的判定系数最接近的那个判定系数,则其对应的被删除的解释变量对模型的贡献最小,是引起多重共线性最大的解释变量。

(2)不包含被解释变量的情形思路:对多元线性回归模型中各个解释变量相互建立回归方程,分别求出各回归方程的拟和优度,如果其中最大的一个接近1,就认为该变量可以被其他变量线性解释,则其所对应的解释变量与其余解释变量间存在多重共线性设某多元线性回归模型中原有K个解释变量

将每个解释变量对其他解释变量进行回归得

观察各个回归方程的拟合优度

选取其中接近1的进行如下F检验若说明存在解释变量可由其他的解释变量线性表示,即存在多重共线性;反之,不存在多重共线性。3、相关系数法思路:计算并检查解释变量中两两变量间的简单相关系数,若的绝对值接近1,则可以认为和存在较强的多重共线性。但需要特别注意的是,如果相关系数很大,则一定存在多重共线性,如果相关系数很小,不一定没有多重共线性。4、容许度与方差膨胀因子判别法容许度(tolerance)是检验共线性的常用统计量。对于自变量的容许度,定义为(8-11)方差膨胀因子(varianceinflationfactor,VIF)

对于多元线性回归模型,的方差可以表示成(8-12)VIF即为方差膨胀因子,定义为(8-13)一般认为:当VIF<5时,方程存在轻度的多重共线性;当5≤VIF<10,方程存在较严重的多重共线性;当VIF≥10时(此时),回归方程存在严重的多重共线性。

8.4如何消除多重共线性1、先验信息法先验信息法是指根据经济理论或者其他已有的研究成果事前确定回归模型参数间的某种关系,避免相互影响的解释变量出现在同一个模型之中,然后进行最小二乘估计,如此便消除了多重共线性。在估计Cobb-Douglas生产函数的时,建立如下模型由先验信息可知劳动投入量L与资金投入量K之间通常是高度相关的,如果按照经济理论“生产规模报酬不变”的假定,即,代入上式两边取对数(8-16)此时上式为一元线性回归模型,不存在多重共线性问题。2、改变变量的定义形式(1)用相对数变量替代绝对数变量如设需求函数为其中分别代表商品价格与替代商品价格

用两种商品价格之比作解释变量

(8-18)(2)删去模型中次要的或可替代的解释变量如果回归模型解释变量间存在较严重的多重共线性,根据经济理论、实践经验、相关系数检验、统计分析等方法鉴别变量是否重要及是否可替代,删去那些对被解释变量影响不大,或被认为不太重要的变量,就可减轻多重共线性。(3)差分法对回归模型中所有变量作差分变换也是消除多重共线性的一种有效方法。例如,对于时间序列数据、线性模型,就可将原模型变换为差分模型(8-19)其中

3、增大样本容量法以两个解释变量的线性回归模型为例,最小二乘估计量的方差为

(8-20)在给定的情况下,若增大的样本容量,则将增大,的方差和标准差将会减小。

4、逐步回归法逐步回归法又称Frisch综合分析法基本思想:先将被解释变量对每个解释变量作简单回归方程,称为基本回归方程。再对每一个基本回归方程进行统计检验,并根据经济理论分析选出最优基本方程,然后再将其他解释变量逐一引入,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响。8.5CASE(P133)

劳动力市场分割与就业

农民工就业问题关系到民生问题,只有农民工就业问题得到妥善解决,“三农”问题才能得到缓解,经济增长才能突破瓶颈。有研究表明劳动力市场分割会对就业产生负面影响。以下将建立模型分析劳动力城乡分割、行业分割、地区分割和单位分割对农民工就业的影响。表8-1给出了农民工就业与劳动力市场分割程度的数据。

(数据详情见教材P133)

为了分析各分割程度因素对农民工就业的影响,建立了如下多元线性回归模型:

其中FWL表示农民工就业数量;CXS表示劳动力城乡分割程度,CXS=(乡村人口数/城镇人口数+乡村就业人数/城镇就业人数)/2;HYS表示行业分割程度,HYS=第一产业就业人数/(第二产业就业人数+第三产业就业人数);DQS表示地区分割程度,由于北京市作为我国的政治、经济文化中心,在执行中央政府的各项劳动力政策和吸收外来劳动力方面具有典型性,故采用北京市外来人口的多少反映地区分割程度的大小,即DQS=2005年北京市外来人口数/当年北京市外来人口数;DWS表示单位分割程度,DWS=(当年国有单位就业人数/当年城镇集体单位就业人数+当年城镇集体单位就业人数/当年私营企业就业人数+当年国有单位就业人数/当年私营企业就业人数)/3。

选择各个变量,点右键Open/asGroup/Quick/EstimateEquation,键入“FWLCSXHYSDQSDWSc”,点击“OK”后得到回归结果如下:DependentVariable:FWLMethod:LeastSquaresDate:12/05/09Time:22:37Sample:19852005Includedobservations:21VariableCoefficientStd.Errort-StatisticProb.HYS-5393.2002231.373-2.4169880.0280DWS18.7318418.682901.0026200.3310DQS-188.5840329.7189-0.5719540.5753CSX-5908.668890.2571-6.6370360.0000C32769.121434.35022.845970.0000R-squared0.977118Meandependentvar12455.43AdjustedR-squared0.971398S.D.dependentvar3992.791S.E.ofregression675.2708Akaikeinfocriterion16.07236Sumsquaredresid7295850.Schwarzcriterion16.32106Loglikelihood-163.7598F-statistic170.8104Durbin-Watsonstat0.587795Prob(F-statistic)0.000000表8-2回归结果

从表8-2可以看出,判定系数

为0.977,调整后的判定系数

为0.971,拟合优度很高,然而DWS和DQS对应的Prob值分别为0.331和0.5753,都大于0.1,说明这两个变量对应的t统计量较小。表现为

很大,t很小,可能出现多重共线性。选中四个解释变量,点击右键Open/asGroup/View/Correlations,便得到解释变量之间的相关系数。CSXDQSDWSHYSCSX10.7520.8270.934DQS0.75210.9120.809DWS0.8270.91210.910HYS0.9340.8090.9101表8-3各解释变量之间的相关系数

从表8-3可以看出各解释变量之间的相关系数最小的是0.752,都很接近于1,可以认为模型存在多重共线性。为了进一步检测模型是否具有多重共线性,可作如下辅助回归:(8-21)(8-24)(8-23)(8-22)回归方程Prob(F-statistic)F值是否显著(1%的显著水平)(1)0.8780.0000是(2)0.9350.0000是(3)0.8370.0000是(4)0.9220.0000是表8-4辅助回归的相关结果

从表8-4知,辅助回归方程(8-21)至(8-24)都通过了1%显著水平下的F检验。说明四个解释变量中的每个变量都可由另外三个变量线性表示,即存在多重共线性。在得到辅助回归方程的判定系数的情况下,还可以通过容许度和方差膨胀因子来进行判别,直接将判定系数代入(8-11)式和(8-13)式即可,这里就不详述了。

以下采用逐步回归法排除多重共线性:分别作FWL与CSX

、HYS、DQS、DWS间的回归,得回归方程如下:(8-25)(8-26)(8-27)(8-28)可见,农民工就业受城乡分割程度的影响最大,因此选择模型(8-25)作为初始回归模型,将其他解释变量逐个引入,寻找最优回归方程(见表8-5)。cCSXHYSDQSDWS31549.98-8077.870.9670.00000.000031537.84-6103.68-3861.870.9760.00000.00000.022431654.77-6100.14-4046.6351.790.9760.00000.00000.03650.821832507.57-5982.00-5151.7310.960.9770.00000.00000.02820.3963表8-5逐步回归法

第1步,在初始模型中引入HYS,模型拟合优度提高,参数符号合理,变量也通过了显著性检验。因此,在模型中保留HYS。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论