计量经济学-庞皓-第二版-第四章-多重共线性(公式详细)市公开课一等奖省赛课获奖课件_第1页
计量经济学-庞皓-第二版-第四章-多重共线性(公式详细)市公开课一等奖省赛课获奖课件_第2页
计量经济学-庞皓-第二版-第四章-多重共线性(公式详细)市公开课一等奖省赛课获奖课件_第3页
计量经济学-庞皓-第二版-第四章-多重共线性(公式详细)市公开课一等奖省赛课获奖课件_第4页
计量经济学-庞皓-第二版-第四章-多重共线性(公式详细)市公开课一等奖省赛课获奖课件_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章多重共线性计量经济学第1页引子:

发展农业会降低财政收入吗?

为了分析各主要原因对财政收入影响,建立财政收入模型:其中:CS财政收入(亿元);NZ农业增加值(亿元);GZ工业增加值(亿元);JZZ建筑业增加值(亿元);TPOP总人口(万人);CUM最终消费(亿元);SZM受灾面积(万公顷)数据样本时期1978年-年(资料起源:《中国统计年鉴》,中国统计出版社年版)采取普通最小二乘法得到以下预计结果第2页财政收入模型EViews预计结果VariableCoefficientStd.Errort-StatisticProb.

农业增加值工业增加值建筑业增加值总人口最终消费受灾面积截距-1.9075480.0459476.4583740.0960220.003108-0.027627-5432.5070.3420450.0427460.7657670.0916600.0428070.0489048607.753-5.5768881.0748928.4338671.0475910.072609-0.564916-0.6311180.00000.29360.00000.30570.94270.57760.5342R-squared0.989654AdjustedR-squared0.986955S.E.ofregression1437.448Sumsquaredresid47523916Loglikelihood-256.7013Durbin-Watsonstat1.654140

Meandependentvar10049.04

S.D.dependentvar12585.51

Akaikeinfocriterion17.58009

Schwarzcriterion17.90704

F-statistic366.6801

Prob(F-statistic)0.000000第3页

●可决系数为0.9897

,校正可决系数为0.9870,模型拟合很好。模型对财政收入解释程度高达98.9%。●F统计量为366.68,说明0.05水平下回归方程整体上显著。●t检验结果表明,除了农业增加值、建筑业增加值以外,其它原因对财政收入影响均不显著。●农业增加值回归系数是负数。

农业发展反而会使财政收入降低吗?!

这么异常结果显然与理论分析和实践经验不相符。若模型设定和数据真实性没问题,问题出在哪里呢?模型预计与检验结果分析第4页第四章多重共线性

本章讨论四个问题:

●什么是多重共线性●多重共线性产生后果●多重共线性检验●多重共线性补救办法第5页第一节什么是多重共线性

本节基本内容:

●多重共线性含义●产生多重共线性背景

第6页

在计量经济学中所谓多重共线性(Multi-Collinearity),

不但包含完全多重共线性,还包含不完全多重共线性。在有截距项模型中,截距项能够视为其对应解释变量总

是为1。对于解释变量,假如存在不全为0数,使得则称解释变量之间存在着完全多重共

线性。

一、多重共线性含义第7页或者说,当时,表明在数据矩阵中,最少有一个列向量能够用其余列向量线性表示,则说明存在完全多重共线性。用矩阵表示,解释变量数据矩阵为:第8页不完全多重共线性

实际中,常见情形是解释变量之间存在不完全多重共线性。常见是解释变量之间存在不完全多重共线性。即对于解释变量,存在不全为0数,使得

为随机变量。这表明解释变量只是一个近似线性关系。其中,注意这里增加了一个随机变量第9页假如X矩阵中Rank(X)=k,则认为k-1个解释变量之间不存在多重共线性。需要强调是:解释变量之间不存在线性关系,并非不存在非线性关系,当解释变量存在非线性关系时,并不违反多重共线性假定。第10页

,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归(这个说法是不太准确),每个参数

j都能够经过Y对Xj一元回归来预计。回归模型中解释变量关系

相关系数来解释上述问题能够表述以下:1.

,解释变量间完全共线性。此时模型参数将无法确定。

,解释变量间存在一定程度线性关系。实际中常碰到情形。2.3.第11页

二、产生多重共线性背景

多重共线性产生经济背景主要有几个情形:

1.经济变量之间含有共同改变趋势。

比如,对于时间序列数据,收入、消费、就业率等,在经济上升时期均展现出增加趋势,当经济下滑时,又都展现出下降趋势。此时变量之间相关性就比较强。

2.模型中包含滞后变量。

当建模过程中引入滞后变量,因为变量时间序列之间往往展现出较强线性关系,所以也会造成多重共线性比较严重。

第12页3.利用截面数据建立模型也可能出现多重共线性。

利用截面数据建模,不一样截面变量改变与发展规模相关,会出现共同增加趋势,比如,资本、劳动力,科技、能源投入等要素投入都展现出规模经济特征。4.样本数据本身原因。

抽样仅仅局限于总体中解释变量取值一个有限范围,使得变量变异不够大;或因为总体受限,多个解释变量样本数据之间存在,这是都会引发多重共线性(事实这种情况几乎不可防止)。第13页第二节多重共线性产生后果

本节基本内容:●完全多重共线性产生后果●不完全多重共线性产生后果第14页一、完全多重共线性产生后果1参数预计值不确定当解释变量完全线性相关时X矩阵秩小于k,此时OLS预计式不确定。这里以两个解释变量回归模型为例,说明完全共线性影响。原式:,采取其离差形式由最小二乘预计得两个偏回归系数表示式以下:假定,这里是非零常数,将其分别带入上式可得:第15页很显著上式是未定式,无法用OLS方法进行预计。从回归模型建模思想看,完全多重共线性使得解释变量前面偏回归系数失去了原有经济学含义,无法区两个解释变量对被解释变量各自影响。第16页一、完全多重共线性产生后果2参数预计量方差无限大

仍以两个变量多元回归为例,由OLS方法得出偏回归系数方差以下式:在完全共线性情况下带入上式得:这表明,在解释变量之间存在完全共线性时,参数预计量方差将变成无限大。第17页

二、不完全多重共线性产生后果

完全多重共线性只不过是一个极端情形。通常,解释变量之间会存在不一样程度线性关系,此时能够得到关于偏回归系数预计值,不过会因为线性关系强弱会影响参数预计结果。

1.参数预计值方差增大

仍以只有两个解释变量回归模型为例,X2与X3不完全共线性关系表示为:其中,

第18页第19页第20页第21页2.对参数区间预计时,置信区间变大0.000.500.990.999第22页3.当存在严重多重共线性时,假设检验轻易做犯错误判断

存在严重多重共线性时,首先是参数预计置信区间扩大,会使得接收一个本应拒绝假设概率增大。另外,在对回归系数原假设(如β3=0)检验中,因为,在存在共线性情况下会使得参数预计值方差增大,t统计量降低,增加了接收偏回归系数为0假设。4.可能造成可决系数较高,但对各个参·数单独t检验却可能不显著,甚至可能使预计回归系数符号相反,得出完全错误结论。第23页

第三节多重共线性检验

本节基本内容:

●简单相关系数检验法●方差扩大(膨胀)因子法●直观判断法●逐步回归法第24页一、简单相关系数检验法

含义:简单相关系数检验法是利用解释变量之间线性相关程度去判断是否存在严重多重共线性一个简便方法。

判断规则:普通而言,假如每两个解释变量简单相关系数比较高,大于0.8(经验值),则可认为存在着较严重多重共线性。第25页

注意:

较高简单相关系数只是多重共线性存在充分条件,而不是必要条件。尤其是在多于两个解释变量回归模型中,有时较低简单相关系数也可能存在多重共线性。所以并不能简单地依据相关系数进行多重共线性准确判断。(换句话说就是假如解释变量之间相关系数很高那么模型存在多重共线性问题,但假如模型存在多重共线性问题不能得出变量相关系数非常高这个结论。)第26页

二、方差扩大(膨胀)因子法

统计上能够证实,解释变量参数预计式方差可表示为

:

其中是变量方差扩大因子,其中其中是多个解释变量辅助回归可决系数。

第27页经验规则方差膨胀因子越大,表明解释变量之间多重共性越严重。反过来,方差膨胀因子越靠近于1,多重共线性越弱。经验表明,方差膨胀因子≥10时,说明解释变量与其余解释变量之间有严重多重共线性,且这种多重共线性可能会过分地影响最小二乘预计。第28页三、直观判断法

1.当增加或剔除一个解释变量,或者改变一个观察值时,回归参数预计值发生较大改变,回归方程可能存在严重多重共线性。

2.从定性分析认为,一些主要解释变量回归系数标准误差较大,在回归方程中没有经过显著性检验时,可初步判断可能存在严重多重共线性。第29页3.有些解释变量回归系数所带正负号与定性分析结果违反时,很可能存在多重共线性。4.解释变量相关矩阵中,自变量之间相关系数较大时,可能会存在多重共线性问题。第30页四、逐步回归检测法

逐步回归基本思想

将变量逐一引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入解释变量逐一进行t检验,当原来引入解释变量因为后面解释变量引入而变得不再显著时,则将其剔除。以确保每次引入新变量之前回归方程中只包含显著变量。在逐步回归中,高度相关解释变量,在引入时会被剔除。因而也是一个检测多重共线性有效方法。第31页第四节多重共线性补救措施

本节基本内容:

●修正多重共线性经验方法●逐步回归法第32页一、修正多重共线性经验方法

1.剔除变量法把方差扩大因子最大者所对应自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重多重共线性。注意:

若剔除了主要变量,可能引发模型设定误差。第33页

2.增大样本容量假如样本容量增加,会减小回归参数方差,标准误差也一样会减小。所以尽可能地搜集足够多样本数据能够改进模型参数预计。问题:增加样本数据在实际计量分析中常面临许多困难。第34页

3.变换模型形式

普通而言,差分后变量之间相关性要比差分前弱得多,所以差分后模型可能降低出现共线性可能性,此时可直接预计差分方程。问题:差分会丢失一些信息,差分模型误差项可能存在序列相关,可能会违反经典线性回归模型相关假设,在详细利用时要慎重。第35页

4.利用非样本先验信息

经过经济理论分析能够得到一些参数之间关系,能够将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘预计。比如,考虑一下模型:第36页

5.横截面数据与时序数据并用首先利用横截面数据预计出部分参数,再利用时序数据预计出另外部分参数,最终得到整个方程参数预计(例子)。注意:这里包含着假设,即参数横截面预计和从纯粹时间序列分析中得到预计是一样。第37页第38页

6.变量变换变量变换主要方法:(1)计算相对指标。如由总量指标改为人均指标或结构相对数(比重)等。(2)将名义数据转换为实际数据。如将名义数据剔除价格影响后引入模型建模。(3)将小类指标合并成大类指标。如在引例中,将工业增加值、建筑业增加值合并成第二产业增加值。变量数据变换有时可得到很好结果,但无法确保一定能够得到很好结果。第39页

二、逐步回归法(1)用被解释变量对每一个所考虑解释变量做简单回归。(2)以对被解释变量贡献最大解释变量所对应回归方程为基础,按对被解释变量贡献大小次序逐一引入其余解释变量。若新变量引入改进了

和检验,且回归参数t检验在统计上也是显著,则在模型中保留该变量。第40页若新变量引入未能改进和检验,且对其它回归参数预计值t检验也未带来什么影响,则认为该变量是多出变量。若新变量引入未能改进和检验,且显著地影响了其它回归参数预计值数值或符号,同时本身回归参数也通不过t检验,说明出现了严重多重共线性。第41页

第五节案例分析一、研究目标要求提出研究问题——为了规划中国未来国内旅游产业发展,需要定量地分析影响中国国内旅游市场发展主要原因。二、模型设定及其预计影响原因分析与确定——影响原因主要有国内旅游人数,城镇居民人均旅游支出,农村居民人均旅游支出,并以公路里程次和铁路里程作为相关基础设施代表。理论模型设定其中:——第t年全国国内旅游收入第42页年份国内旅游收入Y(亿元)国内旅游人数X2(万人次)城镇居民人均旅游花费X3(元)农村居民人均旅游花费X4(元)公路里程X5(万km)铁路里程X6(万km)19941023.552400414.754.9111.785.9019951375.762900464.061.5115.705.9719961638.463900534.170.5118.586.4919972112.764400599.8145.7122.646.6019982391.269450607.0197.0127.856.6419992831.971900614.8249.5135.176.743175.574400678.6226.6140.276.873522.478400708.3212.7169.807.013878.487800739.7209.1176.527.193442.387000684.9200.0180.987.304710.7110200731.8210.2187.077.445285.9121200737.1227.6193.057.546229.74139400766.4221.9345.707.717770.62161000906.9222.5358.377.80数据搜集与处理1994年—年中国旅游收入及相关数据

第43页该模型,可决系数很高,F检验值593.4168,显著显著。不过当时、不但、系数t检验不显著,而且系数符号与预期相反,这表明很可能存在严重多重共线性。

OLS预计结果第44页计算各解释变量相关系数

表明各解释变量间确实存在严重多重共线性X2X3X4X5X6X2

1.000000

0.867192

0.566024

0.945539

0.891303X3

0.867192

1.000000

0.811726

0.805129

0.956903X4

0.566024

0.811726

1.000000

0.487669

0.790144X5

0.945539

0.805129

0.487669

1.000000

0.812921X6

0.891303

0.956903

0.790144

0.812921

1.000000第45页三、消除多重共线性采取逐步回归法检验和处理多重供线性问题。分别作Y对X2、X3、X4、X5、X6一元回归大小排序为:X2、

X3、X6、X5、X4。以X2为基础,顺次加入其它变量逐步回归,过程从略(见教材)变量参数预计值0.058814.022519.610322.59573025.062t统计量18.24889.30903.27108.70849.13920.96520.87840.47140.86340.87440.96230

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论