第四章多重共线性_第1页
第四章多重共线性_第2页
第四章多重共线性_第3页
第四章多重共线性_第4页
第四章多重共线性_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章多重共线性1第一页,共三十六页,编辑于2023年,星期五为什么要放宽古典假定?为了不使问题复杂化,在此之前是从所有古典假定都满足的条件下,去讨论计量经济模型的估计与检验的基本理论和方法。在这种情况下:我们几乎可以直接运用统计学中的现成方法去估计模型中的参数,并得到令人满意的结果。我们也可以直接运用统计学中的假设检验方法对模型的显著性作各种统计检验。

然而,现实的经济活动是十分复杂的,这些古典假定经常会违反,我们经常不得不放宽古典假定条件,需要讨论假定违反以后的一些专门的计量方法。2第二页,共三十六页,编辑于2023年,星期五

基本假定的回顾与分析:●

零均值假定

(由于有正有负,一般说来,的假定是合理的。并且违背的话只是影响截距项,不影响斜率项。)

●同方差假定●无自相关假定●

解释变量与u不相关的假定在某些单一方程模型和联立方程模型的特殊情况下可能违反。●

无多重共线性假定●正态性假定(不影响OLS估计是BLUE)根据中心极限定理,样本容量无限增大时,OLS趋于正态分布结论:需要着重加以讨论的易于违反的主要是无多重共线性、同方差、无自相关等假定。3第三页,共三十六页,编辑于2023年,星期五引子:案例1:发展农业和建筑业会减少财政收入吗?

为了分析各主要因素对国家财政收入的影响,建立财政收入模型:其中:CS财政收入(亿元);

NZ农业增加值(亿元);

GZ工业增加值(亿元);

JZZ建筑业增加值(亿元);

TPOP总人口(万人);

CUM最终消费(亿元);SZM受灾面积(万公顷)

数据:样本时期1978年-2003年(资料来源:《中国统计年鉴2004》,中国统计出版社2004年版)

采用普通最小二乘法得到以下估计结果4第四页,共三十六页,编辑于2023年,星期五

VariableCoefficientStd.Errort-StatisticProb.农业增加值NZ-1.5350900.129778-11.828610.0000工业增加值GZ0.8987880.2454663.6615580.0017建筑业增加值JZZ-1.5270891.206242-1.2659890.2208总人口TPOP0.1511600.0337594.4776460.0003最终消费CUM0.1015140.1053290.9637830.3473受灾面积SZM-0.0368360.018460-1.9953820.0605截距项-11793.343191.096-3.6957040.0015R-squared0.995015Meandependentvar5897.824AdjustedR-squared0.993441S.D.dependentvar5945.854S.E.ofregression481.5380Akaikeinfocriterion15.41665Sumsquaredresid4405699.Schwarzcriterion15.75537Loglikelihood-193.4165F-statistic632.0999Durbin-Watsonstat1.873809Prob(F-statistic)0.000000财政收入模型的EViews估计结果特别关注:1、可决系数;2、F检验;3、t检验;4、参数符号5第五页,共三十六页,编辑于2023年,星期五

●可决系数为0.995,校正的可决系数为0.993,模型拟合很好。模型对财政收入的解释程度高达99.5%。●F统计量为632.10,说明0.05水平下回归方程整体上显著。

◆t检验结果表明,除了工农业增加值和总人口以外,其他因素对财政收入的影响均不显著,与预想不符合!◆农业增加值和建筑业增加值的回归系数是负数,

农业和建筑业的发展反而会使财政收入减少吗?!这样的结果显然与理论分析和实践经验不相符。为什么会出现这样的异常结果?如果模型设定和数据真实性没有问题,问题出在哪里呢?模型估计检验结果分析:6第六页,共三十六页,编辑于2023年,星期五经济分析:天津市粮食销售体制改革中粮食销量逐年增长,分析粮食销量的变化及原因。影响粮食销量的主要因素可能是人口数量、居民收入,以及与粮食相关的肉、蛋、鱼虾销售量等。变量选择:被解释变量Y粮食年销售量(万吨)解释变量:常住人口X2(万人)、人均收入X3(元)、肉销售量X4(万吨)、蛋销售量X5(万吨)、鱼虾销售量X6(万吨)模型设定:样本选择:选天津市粮食销售体制改革前1974年—1987年的有关数据为样本。数据收集:来源于《天津统计年鉴(1988)》(数据见下页)

案例2:天津市粮食销售量及影响因素分析7第七页,共三十六页,编辑于2023年,星期五8第八页,共三十六页,编辑于2023年,星期五估计参数:用OLS估计9第九页,共三十六页,编辑于2023年,星期五估计结果:取,查临界值表得

分析:

样本回归方程的较大,F检验也十分显著但是所有参数的t统计量均小于临界值(不显著)X4、X5的参数为正,而X6的参数为负,如何解释?

为什么也出现这种结果?事不过三,其中必有规律性!10第十页,共三十六页,编辑于2023年,星期五一、多重共线性本章讨论四个问题:●多重共线性的实质与产生的原因●多重共线性的后果●多重共线性的检测(判断)方法●多重共线性的补救方法11第十一页,共三十六页,编辑于2023年,星期五(一)什么是多重共线性1、多重共线性的概念

在多元回归模型中,各个解释变量之间可能存在一定的线性相关关系。可能会有三种情况:能找到不全为0的数,使得(正交变量)完全的线性关系不完全的线性关系完全无线性关系多重共线性——指解释变量间的线性关系,既包括完全的线性关系,又包括不完全的线性关系

12第十二页,共三十六页,编辑于2023年,星期五对多重共线性的理解应注意:▲两个或多个解释变量之间出现线性相关性,都称为存在多重共线性。▲在多元回归中,多重共线性几乎总是存在的,因此值得关注的多重共线性,主要不是有无的问题,而是程度的问题。▲无多重共线性只排除解释变量间的线性关系,并不排除相互之间的非线性关系。13第十三页,共三十六页,编辑于2023年,星期五2、多重共线性产生的原因

◆时间序列数据在时间上常有共同变动的趋势

如工业产值、商品零售额、固定资产投资常有共同趋势◆经济变量之间本身具有内在联系

如截面数据中某行业企业的资本量、劳动投入等都与企业规模相关◆某些决定性因素可能使各变量呈同方向的变化

如经济景气对各经济指标的同方向影响◆滞后变量引入模型后,同一变量的逐次值很可能存在相互联系

如:

14第十四页,共三十六页,编辑于2023年,星期五

(二)多重共线性产生的后果

1、OLS估计式变得不确定或不精确

(1)完全无多重共线性时各解释变量都分别独立地影响因变量,多元回归是否必要?以两个解释变量模型为例:当完全无多重共线性时则有这时这正是分别以和为解释变量的一元回归的参数估计式15第十五页,共三十六页,编辑于2023年,星期五

(2)解释变量完全线性相关时

——OLS估计式不确定

从偏回归系数意义看:在和完全共线性时,将肯定随而变化,将无法保持不变,去单独考虑对Y的影响(和的作用事实上不可区分)

▲从OLS估计式看:可以证明此时

(证明见教材P108)(3)解释变量不完全线性相关,但存在高度多重共线性时

——此时回归系数可以估计,但方差会变得很大,OLS估计式会不精确(后面论证)

16第十六页,共三十六页,编辑于2023年,星期五

2、OLS估计式方差变得很大,标准误差增大

(1)当和完全线性相关时——OLS估计式的方差成为无穷大

(证明见教材P109)(2)当和不完全线性相关时——OLS估计式的方差会增大,例如在二元回归时可证明(证明见教材P110)

当增大时,方差扩大因子VIF2

增大,也会增大,思考:

当时

(与一元回归比较)

当时17第十七页,共三十六页,编辑于2023年,星期五例如当时,引入任意不为0的数模型变换估计结果当时,所估计的的参数与真实的符号可能相反(3)当多重共线性严重时,甚至可能使估计的回归系数符号相反,得出完全错误的结论18第十八页,共三十六页,编辑于2023年,星期五(4)区间估计时,对总体参数的置信区间会趋于增大(共线性越严重,和越大,置信区间也增大)(5)严重多重共线时,假设检验作出错误判断的概率会增大因为,当因多重共线性使方差变大时会使t值减小,导致在无多重共线性时本应否定的“参数为0”的原假设而被接受。

19第十九页,共三十六页,编辑于2023年,星期五

(三)多重共线性的检验(判断是否严重)

1、利用解释变量之间的相关系数去判断(1)只有两个解释变量时:用二者相关系数判断

(2)两个以上解释变量时:可用两两变量的相关系数判断(K个变量可用相关系数矩阵)例如

注意:简单相关系数只是多重共线性的充分条件,不是必要条件。在有多个解释变量时,较低的相关系数也可能存在较严重多重共线性20第二十页,共三十六页,编辑于2023年,星期五2、直观判断法

(经验方法)以下情况的出现提示很可能存在多重共线性:(1)从定性分析认为一些是重要的解释变量,但其回归系数的标准误差较大,在回归方程中没有通过显著性检验(2)有些解释变量的回归系数所带正负号与定性分析结果违背(3)可决系数较高,F检验显著,但偏回归系数的t检验不显著21第二十一页,共三十六页,编辑于2023年,星期五3、方差扩大因子法(容许度)多元线性回归模型中,可分别以每个解释变量为被解释变量,作与其他解释变量的回归,这称为辅助回归。以为被解释变量作对其他解释变量的辅助线性回归为辅助回归的可决系数用表示。原回归方程中解释变量的参数估计值的方差可表示为(证明从略)其中的

VIFj

是变量所对应参数估计量的方差扩大因子,也称容许度。22第二十二页,共三十六页,编辑于2023年,星期五由

越大VIFj越大多重共线性越严重VIFj的大小可以反映解释变量之间存在多重共线性的严重程度。优点:可从数量上判断多重共线性的程度

(总是给出了一种经验规则)经验表明:

VIFj≥10时,也就是Rj2≥0.9说明该解释变量与其余解释变量之间有严重的多重共线性。方差扩大因子的作用23第二十三页,共三十六页,编辑于2023年,星期五(四)多重共线性的补救

1、增加样本容量

多重共线性的后果主要是参数估计量方差变大,例如一元回归中

因为式中为常数,确定后,当样本容量越大时,越大,可使减小,从而减轻多重共线性的影响

注意:●增大样本容量只能减轻多重共线性的影响,不能根本解决它,当时,仍有●增大样本容量有时十分困难,受到数据来源的限制24第二十四页,共三十六页,编辑于2023年,星期五

2、逐步回归法

基本思想:设法删除引起多重共线性但又不那么重要的变量。

用逐步回归方法发现产生共线性的解释变量,并将其剔除,从而减少多重共线性影响

方法:

这既是判断是否存在多重共线性的方法,又是解决多重共线性的方法,基本思路的框图为:(见下页)

存在的问题:

有可能删除重要变量,而引起设定误差!!使用逐步回归剔除变量时要格外小心!25第二十五页,共三十六页,编辑于2023年,星期五将Y对各个分别回归计算各以最大的作逐步回归的基础逐个将其他加入模型回归用F检验检验新加入的显著性F检验改善不显著F检验改善显著多余变量对先引入的变量的显著性无影响使先引入的变量参数发生明显变化或使t检验不显著剔除保留此变量出现多重共线性剔除此变量26第二十六页,共三十六页,编辑于2023年,星期五(五)案例分析中国国内旅游收入的分析研究目的:中国国内旅游市场发展迅速,需要定量地研究影响中国国内旅游市场发展的主要原因。经分析,可以旅游收入表示旅游市场发展,除了国内旅游人数和旅游支出外,还可能与旅游基础设施有关。模型设定:其中:——第t年全国旅游收入——国内旅游人数(万人)——城镇居民人均旅游支出(元)——农村居民人均旅游支出(元)——公路里程(万公里)——铁路里程(万公里)27第二十七页,共三十六页,编辑于2023年,星期五1994—2003年的统计数据

年份国内旅游收入Y(亿元)国内旅游人数X2(万人次)城镇居民人均旅游支出X3(元)农村居民人均旅游支出X4(元)公路里程X5(万公里)铁路里程X6(万公里)19941023.552400414.754.9111.785.9019951375.762900464.061.5115.705.9719961638.463900534.170.5118.586.4919972112.764400599.8145.7122.646.6019982391.269450607.0197.0127.856.6419992831.971900614.8249.5135.176.7420003175.574400678.6226.6140.276.8720013522.478400708.3212.7169.807.0120023878.487800739.7209.1176.527.1920033442.387000684.9200.0180.987.3028第二十八页,共三十六页,编辑于2023年,星期五OLS回归结果

29第二十九页,共三十六页,编辑于2023年,星期五结果分析该模型,可决系数很高,F检验值173.3525,明显显著。但是当时,

不仅、系数的t检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。

各解释变量的相关系数

各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。30第三十页,共三十六页,编辑于2023年,星期五用方差扩大因子法检验例如作X3对X2、X4、X5、X6的辅助回归得方差扩大因子为:由于,根据经验,说明X3与其他解释变量间有严重多重共线性。其他变量间的多重共线性可用类似方式检验。31第三十一页,共三十六页,编辑于2023年,星期五修正多重共线性

采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4、X5、X6的一元回归。一元回归结果:变量X2X3X4X5X6参数估计值0.08429.052311.667334.33242014.146t统计量8.665913.15985.19676.46758.74870.90370.95580.77150.83940.90540.89170.95040.74270.81950.8936加入X3的方程最大,以X3为基础,顺次加入其他变量逐步回归

32第三十二页,共三十六页,编辑于2023年,星期五加入新变量回归结果(一)X2X3X4X5X6X3、X20.0298(2.1530)6.1940(4.2872)0.9659↑X3、X48.0206(5.7513)1.7106(0.8550)0.9486↓X3、X56.7356(6.6523)10.9117

(2.6628)0.9718↑X3、X67.8512(2.9101)285.012(0.4621)0.9450↓新加入X5的方程,改进最大,

且t检验显著——保留X5,再加入其他新变量逐步回归

33第三十三页,共三十六页,编辑于2023年,星期五加入新变量的回归结果(二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论