2023-计量经济学之多重共线性_第1页
2023-计量经济学之多重共线性_第2页
2023-计量经济学之多重共线性_第3页
2023-计量经济学之多重共线性_第4页
2023-计量经济学之多重共线性_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Econometrics第四章

多重共线性Multi-Collinearity计量经济学Econometrics

引子:国内生产总值增加会减少财政收入吗?为了分析各主要因素对国家财政收入的影响,建立财政收入(亿元)(CZSR)为被解释变量,财政支出〔亿元〕〔CZZC〕、国内生产总值(亿元)(GDP)、税收总额(亿元)(SSZE)等为解释变量的计量模型。数据样本时期:1978年-2021年的统计数据。设定的理论模型为:采用普通最小二乘法得到以下估计结果Econometrics财政收入模型的EViews估计结果VariableCoefficientStd.

Errort-StatisticProb.截距119.0786107.12361.1116000.275财政支出0.1223550.0488462.5049100.017国内生产总值-0.0341040.005068-6.7291010.000税收总额1.1811570.06967616.952040.000R-squared0.999791Mean

dependent

var18185.1Adjusted

R-squared0.999770S.D.

dependent

var26129.6S.E.

of

regression395.9401Akaike

info

criterion14.9105Sum

squared

resid4703056.Schwarz

criterion15.0901Log

likelihood-249.4791Hannan-Quinn

criter.14.9717F-statistic47897.29Durbin-Watson

stat1.02514Econometrics可决系数为0.99979,校正的可决系数为0.99977,模型拟合很好。模型对财政收入的解释程度高达99.9F统计量为47897.29,说明0.05水平下回归方程整体上很显著。t检验结果说明,各个解释变量对财政收入的影响均显著,但是国内生产总值对财政收入的回归系数的符号为负,即经济增长反而会使财政收入减少。这显然与理论分析和实践经验不相符。为什么会出现这样的异常结果?如果模型设定和数据真实性没问题,问题会出在哪里呢?模型估计与检验结果分析Econometrics第四章

多重共线性本章讨论五个问题:什么是多重共线性多重共线性的经济背景多重共线性产生的后果多重共线性的检验多重共线性的补救措施Econometrics一、多重共线性的含义或者说,

时,表明在数据矩阵

中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。,如果存在不全为0的之间存在着完全的多重完全的多重共线性对于解释变量数

,使得则称解释变量共线性Econometrics不完全的多重共线性若解释变量,存在不全为0的数,使得其中,

为随机变量则称

具有近似的多重共线性Econometrics,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数

j都可以通过Y

Xj

的一元回归来估计。回归模型中解释变量的关系可能表现为三种情形:(1),解释变量间完全共线性。此时模型参(2)数将无法确定。(3)

,解释变量间存在一定程度的线性关系。实际中常遇到的情形。Econometrics二、产生多重共线性的背景多重共线性产生的经济背景主要有几种情形:1.经济变量之间具有共同变化趋势。时间序列数据:经济繁荣时期,各根本经济变量〔收入、费、投资、价格〕都趋于增长;衰退时期,又同时趋于下降横截面数据:变量变化与开展规模有关,例如在生产函数中资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小2.模型中包含滞后变量。例如,消费=f(当期收入,前期收入〕3.样本数据自身的原因。抽样取值有限Econometrics三、

多重共线性产生的后果1、完全共线性下参数估计量无意义OLS估计量为:如果存在完全共线性,那么(X’X)-1不存在,无法得到唯一的参数估计量。Econometrics这时,实际只能确定综合参数

1+

2的估计值X1和X2前的参数

1、

2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。

1、

2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如

1本来应该是正的,结果恰是负的。以离差形式的二元回归模型为例如果两个解释变量完全相关,如x2=x1,则y

=

b1

x1

+

b2

x2

+

mEconometrics四、多重共线性的检验本节根本内容:简单相关系数检验法方差扩大〔膨胀〕因子法直观判断法逐步回归法两个问题(1)是否存在(2)哪些变量存在?Econometrics1、简单相关系数检验法计算解释变量之间的相关系数或相关矩阵判断规那么:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)相较高,例如大于0.8,那么可认为存在着较严重的多重共线性。注意:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件Econometrics2、方差扩大〔膨胀〕因子法统计上可以证明,的方差可表示为(Variance

Inflation

Factor),即是变量其中的

的方差扩大因子其中是Xj关于其余解释变量的辅助回归的可决系数Econometrics经验规那么方差膨胀因子越大,说明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验说明,方差膨胀因子≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。Econometrics3、直观判断法根据经验,通常以下情况的出现可能是由于存在多重共线性当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时有些解释变量的回归系数所带正负号与定性分析结果违背时模型的可决系数较高,F检验显著,回归系数的方差较大,t值较小,即在统计上均不显著。Econometrics4、逐步回归检测法逐步回归的根本思想将变量逐个的引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,那么将其剔除以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效Econometrics五、多重共线性的补救措施本节根本内容:修正多重共线性的经验方法逐步回归法Econometrics1、修正多重共线性的经验方法(1).剔除变量法把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。注意:

如果剔除了重要变量,可能引起模型的设定误差。Econometrics(2).增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。问题:增加样本数据在实际计量分析中常面临Econometrics(3).变换模型形式(一般适用于时间序列数据)一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。

问题:差分会丧失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。Econometrics(4).利用非样本先验信息通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。Econometrics(5).横截面数据与时序数据并用首先利用横截面数据估计出局部参数,再利用时序数据估计出另外的局部参数,最后得到整个方程参数的估计。注意:这里包含着假设,即参数的横截面估Econometrics(6).变量变换变量变换的主要方法:(1)计算相对指标(2)将名义数据转换为实际数据(3)将小类指标合并成大类指标(4)对数变换变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。Econometrics2、逐步回归法〔1〕用被解释变量对每一个所考虑的解释变量做简单回归。〔2〕以对被解释变量奉献最大的解释变量所对应的回归方程为根底,按对被解释变量奉献大小的顺序逐个引入其余的解释变量。(a)如果新变量的引入改进了

检验,且回归参数的t

检验在统计上也是显著的,那么在模型中保留该变量。Econometrics(b)如果新变量的引入未能改进

检验,且对其他回归参数估计值的t

检验也未带来什么影响,那么认为该变量是多余变量。如果新变量的引入未能改进

检验,且显著地影响了其他回归参数估计值的数值或符号,同时本身的回归参数也通不过t

检验,说明出现了严重的多重共线性。已被引入回归方程的变量在引入新变量后,也可能失去重要性而被剔除。Econometrics六、案例分析一、研究的目的要求提出研究的问题——为了规划中国未来国内旅游产业的开展,需要定量地分析影响中国国内旅游市场开展的主要因素。二、模型设定及其估计影响因素分析与确定——影响因素主要有国内旅游人数

,城镇居民人均旅游支出

,农村居民人均旅游支出

,并以铁路里程

作为相关根Econometrics数据的收集与处理1994年—2021年中国旅游收入及相关数据年份国内旅游收入Y(亿元)国内旅游人数X2(万人次)城镇居民人均旅游花费X3(元)农村居民人均旅游花费X4(元)铁路里程X5(万公里)19941023.552400414.754.95.9019951375.762900464.061.55.9719961638.463900534.170.56.4919972112.764400599.8145.76.6019982391.269450607.0197.06.6419992831.971900614.8249.56.7420003175.574400678.6226.66.8720013522.478400708.3212.77.0120023878.487800739.7209.17.1920033442.387000684.9200.07.3020044710.7110200731.8210.27.4420055285.9121200737.1227.67.5420066229.74139400766.4221.97.71Econometrics该模型可,

决系数较高,F检验值225.85,明显显著。但是当

时、OLS估计的结果不仅X5的系数不显著,而且X3、X5的符号与预期相反,这说明可能存在严重的多重共线性。Econometrics计算各解释变量的相关系数说明各解释变量间确实存在严重的线性关系X2X3X4X5X21.0000000.8371350.8464170.962193X30.8371351.0000000.8241650.902770X40.8464170.8241651.0000000.884279X50.9621930.9027700.8842791.000000Econometrics将每个解释变量分别作为被解释变量对其余的解释变量进行辅助回归,回归所得到的可决系数和方差扩大因子的数值见下表。被解释变量可决系数

的值方差扩大因子X20.931214.5349X30.83105.9172X40.78564.6642X50.961826.1780经验说明,方差扩大因子VIFj≥10时,通常说明该解释变量与其余解释变量之间有严重的多重共线性,这里X2、X5的方差扩大因子远大于10,说明存在严重多重共线性问题。Econometrics三、消除多重共线性将各变量进行对数变换,再对以下模型进行估计结果:可决系数很高F检验显著性高系数都显著所有解释变量的符号都与实际意义相符Econometrics另一案例——中国粮食生产函数根据理论和经验分析,影响粮食生产〔

Y〕的主要因素有:农业化肥施用量〔X1〕;粮食播种面积

(X2)成灾面积(X3); 农业机械总动力(X4);中农国业粮劳食动生力产的(X相5)关数据,建立中国粮食生产函数:Y=

0+ 1

X1

+ 2

X2

+ 3

X3

+ 4

X4

+ 4

X5

+uEconometricsEconometrics2、检验简单相关系数发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:Econometrics3、找出最简单的回归形式分别作Y与X1,X2,X3,X4,X5间的回归:(25.58)(11.49)R2=0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论