第八章 多重共线性:解释变量相关会有什么后果.ppt_第1页
第八章 多重共线性:解释变量相关会有什么后果.ppt_第2页
第八章 多重共线性:解释变量相关会有什么后果.ppt_第3页
第八章 多重共线性:解释变量相关会有什么后果.ppt_第4页
第八章 多重共线性:解释变量相关会有什么后果.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二部分,回归分析在实践中,基本假设的违背:基本假设不满足的情况。(1)模型设置有错误;所选模型设置正确。(2)解释变量之间存在多重共线性。(3)随机误差序列具有异方差性;(4)随机误差序列中存在序列相关性。所选模型设置正确,解释变量之间没有完美的线性关系,误差项的方差是常数,误差项之间没有相关性。基本假设,基本假设,基本假设,基本假设,第8章多重共线性,多重共线性,1。多重共线性的性质。多重共线性的实际后果。多重共线性的诊断。克服多重共线性的方法。案件。1.多重共线性的性质:1。完全多重共线性;2.近似(不完全)多重共线性。对于模型yi=0 1x1i2x2i kxki I=1,2,n,其基本

2、假设之一是解释变量相互独立。如果两个或多个解释变量之间存在相关性,则称为多重共线性。完全共线性很少见,但一般在一定程度上是共线性,即近似共线性。一个奇怪的模式,商店销售=B1营业区B2店员号B3店租金B4宣传费用ui为什么奇怪?用这种方式来解释事物,以及生产函数的多重共线性,与其说是“解释”,不如说是“蛊惑”。如果技术保持不变,劳动力和资本投资将会是相等的比例。例如,每增加一台缝纫机,就必须增加一名工人。此时,输入完全共线,也就是说,它们以相等的比例变化。在多渠道广告中,不可能区分销售变化来自哪种广告形式。各种广告形式之间往往存在共线性。为什么我们不能容忍多重共线性?模型中的变量违背常识。例如

3、,一些积极因素已经被“计算”成消极因素模型,这应该尽可能简单。奥卡姆剃刀:如果它是不必要的,不要添加实体,并产生多重共线性。背景经济变量有一个共同的变化趋势。哲学观点:事物是普遍联系的。接触的程度各不相同。多重共线性经常发生。如果回归方程中的几个独立变量之间有很强的相关性,这些独立变量可以相互解释。我们只能留下一个独立变量:让y=x1 x2 c,其中x1=ax2。那么y=ax2 x2 c=(a 1)x2 c模型包含滞后变量,用横截面数据建模也可能导致多重共线性。“补充产品”和“替代品”的样本数据是有原因的。心理学家的调查数据往往来自大学生,8.1多重共线性的本质,表8-1,每次x2上升1,x3

4、就会下降2,这是完全的共线性。它们之间的函数关系是x3=300-2x2,也就是说,x3中的一列数字可以被x2完全替换,反之亦然。此时,无法根据表12-1中的数据估算回归方程。当解释变量之间存在完全线性相关或完全多重共线性时,我们不可能获得所有参数的唯一估计值。因为我们不能得到他们的唯一估计,所以我们不能根据某个样本做出任何统计推断。在完全多重共线性的情况下,如果解释变量X1、X2、Xk之间存在线性关系,则不可能在多元回归模型中估计和假设检验单个回归系数。当变量之间存在线性关系时,存在不全为零的常数。这种关系完全是多重共线性,变量之间的相关系数为1。事实上,解释变量之间往往存在不完全的线性关系:

5、有些数字不全为零,其中vi是一个随机项。解释变量之间完全或不完全的线性关系称为多重共线性。由于经济变量的性质,多重共线性是强还是弱,这是普遍的。假设10,8.2接近或不完全多重共线性,在接近或不完全多重共线性的情况下,x4包含x2中的大部分信息,而x2几乎是完全重复的信息。用这种方法得到的回归方程很奇怪:总体上有很好的解释能力,但在每一个解释变量上都与常识相反。OLS估计量的多重共线性、方差和协方差、OLS估计量的方差和协方差的示意图提供了估计量b的置信度信息。样本越接近,统计量的变化程度就越小,根据该样本估计的参数就越准确。r23是T XT2值和XT3值之间的相关系数,是影响b2方差的因素,

6、也是影响误差项U方差2的因素,OLS估计量的变异程度越大,样本量越大,OLS估计量的变异程度越小。var(b2)公式中的t很大,分母也很大。var(b2)对均值的变异程度越大,OLS估计量的变异程度越小,X2和X3的相关系数越大,b2的方差越大。如果X2和X3完全相关,r23=1,并且var(b2)不能计算,如果c1X1i c2X2i ckXki=0 i=1,2,n,其中: ci不全是0,如果c1X1i c2X2i ckXki vi=0 i=1,2,n,其中ci不全是0,vi是随机误差项,1。解释变量之间存在完美的多重共线性;2.接近/完美/高度多重共线性,不可能获得所有参数的唯一估计值,也不

7、可能基于样本进行任何统计推断。OLS估计量仍然是最佳线性无偏估计量。注:除非完全共线,多重共线性并不意味着违反基本假设;因此,即使存在高度的多重共线性,OLS估计仍然具有良好的统计特性,例如线性。问题是,即使OLS仍然是最好的估计方法,它也不是“完美的”,特别是它不能给出统计推断中真正有用的信息。OLS估计仍然是最优线性无偏估计,但它不代表单样本估计的性质(如最小方差等)。),多重共线性本质上是一种样本(回归)现象。当存在不完全多重共线性时,参数估计的方差和标准差变大,容易使样本计算的T值小于临界值,误导参数为0的推断,并可能从模型中排除重要的解释变量。概念:差异膨胀系数。根据P76的第4章,

8、R2增加了b2和b3的方差(或标准差),并增加(或扩大)。1/(1-R2)是方差膨胀因子,VIF),当完全不共线时,R2=0,当近似共线时,R2=0。时间序列样本:在经济繁荣时期,所有基本经济变量(收入、消费、投资和价格)都趋于增加;在经济衰退期间,它往往会同时下降。横截面数据:在生产函数中,资本投入和劳动力投入高度相关,无论是大企业还是小企业。补充:多重共线性的主要原因(理解),(1)与经济变量相关的共同趋势,(2)滞后变量的引入。在经济计量模型中,通常需要引入滞后的经济变量来反映真实的经济关系。例如,消费=f(当前收入,以前的收入)显然,这两个时期的收入之间有很强的线性相关性。(3)样本数

9、据的局限性,由于很难收集到完全符合理论模型要求的样本数据,特定样本中可能存在一定程度的多重共线性。一般经验:时间序列数据样本:简单的线性模型,通常具有多重共线性。横断面数据样本:问题不那么严重,但多重共线性仍然存在。8.4多重共线性的实际后果,(1)普通最小二乘估计量的方差和标准差较大,(2)置信区间较宽,(3)T值不显著,(4)R2值较高,但T值不完全显著。(5)普通最小二乘估计量及其标准差对数据的微小变化非常敏感,并且往往不稳定。(6)回归系数的符号是错误的(7)很难测量每个解释变量对回归平方和或R2的贡献。在高度共线性的条件下,很难衡量每个解释变量对整个R2的贡献。8.5多重共线性的诊断

10、是去相关。(1)多重共线性是一个程度问题,而不是存在问题。(2)因为多重共线性是在解释变量是非随机的假设下的问题,所以它是样本的特征,而不是整体的特征。我们不是“检测多重共线性”,而是测量给定样本的多重共线性。根据一些经验规则,或者在具体的应用中,它可以给我们提供一些关于多重共线性存在的线索,多重共线性的线索1,(1)高R2但没有很多显著的t值(2)解释变量之间的高度成对相关(3)检验偏相关系数检验偏相关(4)从属或辅助回归,或者辅助回归,检验模型中哪个变量与其他变量高度共线的方法是使每个变量回归到其他剩余变量并计算相应的R2值。多重共线性线索2,(5)方差膨胀因子随着R22的增加,b2和b3

11、的方差也增加或扩大。方差扩展因子与b2和b3呈线性关系,单调递增。两个自变量之间的关系越密切,回归系数的变异程度越大。没有一种测试方法可以完全解决多重共线性问题。没有简单的方法来解决这个多重共线性问题。方差扩展因子检验经验法则。VIF表示除了Ri之外的所有其他变量加到模型中引起的方差扩展。较大的方差扩展因子表明解释变量中存在冗余信息。判断系数Ri2=0.9,VIF=10,判断系数Ri2=0.8,VIF=5。当VIF8或10时,多重共线性被认为是显著的,并且Xi是冗余变量。如果多个变量的方差扩展因子较大,则方差扩展因子最大的变量是多余的。8.6多重共线性一定不好吗?如果研究是用模型来预测解释变量

12、的未来均值,多重共线性本身并不一定是件坏事。如果研究不仅是为了预测,而且是为了可靠地估计所选模型的参数,严重的共线性将是一件“坏事”,因为它将导致估计器的标准偏差增加。如果要精确地估计一组系数(例如,两个系数的和或差),那么即使存在多重共线性,也可以达到目的。(2)估计多重共线性的范围,即判断哪些变量存在共线性。(1)没有单一的方法来衡量多重共线性;(2)有一些经验规则,可以在具体应用中为判断多重共线性的存在提供一些线索。任务:注意:1。对于多解释变量模型,采用综合统计检验方法。在OLS方法下,如果R2值和F值较大,而T检验值较小,说明各解释变量对Y的联合线性效应显著,但解释变量之间存在共线性

13、,使得它们对Y的独立效应不可区分,所以T检验不显著。第三,诊断多重共线性时,R2值较高,但解释变量T值无统计学意义。这是共线性的典型特征。首先,检查是否存在多重共线性(1) (2)。其次,对于两个解释变量的模型,用简单相关系数法计算这些解释变量之间的相关系数。如果某些相关系数较高(如超过0.8),则可认为存在严重的共线性。3.多重共线性诊断,得到X1和X2之间的简单相关系数。如果|r|接近1,则表明两个变量之间存在很强的多重共线性。然而,这个标准是不可靠的。有时,成对相关系数可能较低,但仍可能存在共线性。、和进一步确定是哪些变量引起的。3.从属回归或辅助回归(判断系数的检验方法)。第一步:将模

14、型中的每个解释变量与其他解释变量进行回归作为解释变量(这些回归称为从属回归或辅助回归,Ste:2:首先观察这些辅助回归对应的拟合优度(或判断系数);然后,这些辅助回归通过H0f检验进行检验:RJ.2=0,Xji=1 x1 2x 2 xli。如果最初的假设被拒绝,XJ和其他解释变量之间存在显著的线性关系。3。相依回归或辅助回归(判断系数检验法),Rj2:的J解释变量对其他解释变量回归方程的判断系数相对较大,接近1 (1-Rj2)相对较小,因此给定显著性水平,计算F值并与相应的临界值进行比较,判断是否存在相关性。以便Fj的值更大。4.克服多重共线性的方法。排除引起多重共线性的变量,找出引起多重共线性的解释变量并排除它们。(补充)逐步回归法:用Y作为解释变量,将解释变量逐一引入,形成回归模型。对模型进行估计,根据拟合优度的变化确定新引入的变量是否独立。如果拟合优度发生显著变化,这意味着新引入的变量是独立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论