




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第1 1页页 多重共线性(Multicollinearity)一词由弗里希(Ragnar Frisch,18951973)于1934年引入。 第四章第四章 多重共线性多重共线性 原意是指回归模型中的部分或全部解释变量之间存在完全的线性关系,是对假定MLR.3的违背,后来人们将这个概念扩展到近似的线性关系。 多重共线性是多元回归建模过程中最常遇到的问题。本章中我们首先分析与界定完全多重共线性与多重共线性,探讨多重共线性可能引起的后果,然后介绍多重共线性的诊断与
2、缓解多重共线性的补救措施。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第2 2页页学习目标:1、了解多重共线性的概念、能区分完全的多重共线性与多重共线性;2、了解多重共线性产生的原因;3、理解多重共线性引起的后果;4、理解并掌握多重共线性的诊断;5、掌握缓解多重共线性问题的处理方法。重点与难点: 理解多重共线性是一种样本现象; 深刻理解多重共线性的理论后果与实际后果; 掌握多重共线性的诊断及多重共线性问题的 处理方法。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计
3、学院计量经济教研室山东财经大学统计学院计量经济教研室第第3 3页页 第一节第一节 多重共线性问题及其对建模的影响多重共线性问题及其对建模的影响 一、多重共线性的含义一、多重共线性的含义 广义的多重共线性包括完全多重共线性和近似多重共线性。狭义的的多重共线性指的是近似多重共线性。如果不特加说明,本章使用的是狭义的多重共线性。(一)完全多重共线性 多元线性回归模型的古典假定MLR.3是,模型中解释变量之间不存在完全的线性相关关系,此机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4 4页页对于模型对于模型
4、yi= 0+ 1x1i+ 2x2i+ kxki+ui i=1,2,n时就称解释变量(1,2,., )jxjk之间不存在完全的多重共线性。 即:若存在一组不全为零的常数012,k 0 如果存在某解释变量是其他解释变量的线性组合,则称为存在完全多重共线性(Complete Multicollinearity, Exact Multicollinearity)使得:01 1220kkxxx机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5 5页页用矩阵表示,解释变量的观测值矩阵为)1(211221212111
5、111knknnnkkxxxxxxxxxX当存在完全共线性时: rank(X) R2,则xl,xj间的多重共线性对回归模型是有害的。例例4.2 建立电信业务总量的计量经济模型。经初步分析,认为影响电信业务总量变化的主要因素是邮政业务总量、总人口数、市镇人口占总人口的比重、人均GDP、居民人均消费水平。9个地区的样本数据。试检验解释变量之间的多重共线性。 机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3333页页样本标号电信业务总量y邮政业务总量x1总人口数x2市镇人口比重x3人均GDPx4人均消费水平
6、x511.51630.527511.58230.26371.8790.89622.26570.636711.71710.27632.2871.07033.82450.802611.85170.28142.9391.33145.92300.958911.98500.28623.9231.74658.75511.133412.11210.29044.8542.236612.08751.332912.23890.29375.5762.641712.68951.443412.36260.29926.0532.834822.64941.662812.48100.30406.3072.972931.323
7、81.984412.59090.30896.5343.143 电信业务总量及相关指标数据机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3434页页CoefficientStd. Errort-StatisticProb.C-124.5040456.2935-0.2728590.8027X135.7397216.047402.2271350.1123X216.9699847.308530.3587090.7436X3-300.2670390.8775-0.7681870.4983X4-5.3169439
8、.897531-0.5371990.6284X5-0.26962919.74999-0.0136520.9900R-squared0.991815Mean dependent var11.22609Adjusted R-squared0.978173S.D. dependent var10.00546S.E. of regression1.478215Akaike info criterion3.854269Sum squared resid6.555361Schwarz criterion3.985752Log likelihood-11.34421Hannan-Quinn criter.3
9、.570529F-statistic72.70254Durbin-Watson stat2.969320Prob(F-statistic)0.002496 EViews输出结果机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3535页页(2)R2 = 0.9918,拟合优度很高,但而每个回归参数的t检验在统计上都不显著,这符合多重共线性的“经典”特征,说明模型中可能存在严重的多重共线性。从EViews输出结果看:(1)从经济理论角度讲,影响电信业务总量变化的主要因素中邮政业务总量与电信业务总量负相关;而
10、总人口数、市镇人口占总人口的比重、人均GDP、居民人均消费水平应与电信业务总量正相关。但模型变量邮政业务总量、市镇人口占总人口的比重、人均GDP、居民人均消费水平的系数估计出现符号错误,与预期不一致。根据经验判别法,说明模型中可能存在严重的多重共线性。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3636页页(3)下面用Klein判别法进行分析。首先计算出解释变量间的简单相关系数矩阵: 因为其中x4与x5之间的简单相关系数(0.9986)大于模型的样本决定系数(0.9918),所以根据Klein判别法
11、,断定模型中存在严重的多重共线性。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3737页页二、辅助回归法二、辅助回归法01 1221111)jjjjjkkxxxxxx1, 2,jk 设解释变量为k个,即x1,x2, , xk。我们分别以其中的一个对其它所有的解释变量进行回归,得 k个回归方程: 每个回归方程求其决定系数,不妨设为: 222212,jkRRRR 对于多元线性回归模型来说,如果分别以每个解释变量为被解释变量,作与其他解释变量的回归,这称为辅助回归。 机动 目录 上页 下页 返回 结束 2
12、022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第3838页页 在这些决定系数中寻其最大者,不妨设 Rj2最大,由第一节分析我们知道:多元线性回归模型01 122iiikikiyxxxuxj的系数估计量的方差为2222221var()() (1)()(1)uujjijjjijjxxRxxR jxjx2jjRx由于度量了与其他解释变量的线性相关程度,这var()j 增大的趋势越快,说明变量间种相关程度越强,机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第
13、3939页页(1-Rj2)为自变量xj的容忍度(Tolerance)。211jjVIFR 多重共线性越严重,反之, 与其他解释变量的线性相关程度越弱,说明变量间的多重共线性越弱。 为此,我们定义:jx 其倒数称为方差扩大因子(Variance Inflation Factor)简记为VIF),即: 经验表明,当VIFj10时,自变量xj与其它自变量之间的多重共线性程度就非常大了,以至于足以影响到OLSE的稳定性(方差增大) 。 机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4040页页注:注: 也可以
14、用k个自变量所对应的方差扩大因子的平均数来度量多重共线性。当模型中全部k个自变量所对应的方差扩大因子的平均数大于10时,就表明存在严重的多重共线性。用VIF去度量共线性也难免受到批评。如(4.5)所示, (jVar 2u与21() ,njijixx21(1)jjVIFR依赖于3个因子:21()njijixx2u一个高的VIF可被一个低的 或一个高的 所抵消。换句话说,一个高的VIF既不是导致高多重共线性和高的标准误的必要条件,也不是其充分条件。因此,一个高的VIF度量出来的高多重共线性不一定是高的标准误的原因。在所有这些讨论中,高和低这两个用语都是机动 目录 上页 下页 返回 结束 2022-
15、3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4141页页相对而言的。在实际应用中,最好把 作为一个参考指标,与直观判断法中的其他特征联合起来综合判定。jVIF 在EViews中,不能直接计算解释变量的方差扩大因子,而是需要根据VIF的定义式计算得到。55xVIF的对例4.2,计算解释变量值的过程如下: 辅助回归方程FZHG 的EViews输出结果首先建立一个以x5为被解释变量,其余解释变量为解释变量的辅助回归方程,命名为“FZHG”:机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大
16、学统计学院计量经济教研室第第4242页页Dependent Variable: X5CoefficientStd. Errort-StatisticProb. C4.61359311.319070.4075950.7044X10.4135410.3497081.1825300.3025X2-0.2789941.189533-0.2345410.8261X3-6.0041799.429268-0.6367600.5589X40.4716950.0846265.5738500.0051R-squared0.999055 Mean dependent var2.096556Adjusted R-sq
17、uared0.998109 S.D. dependent var0.860614S.E. of regression0.037423 Akaike info criterion-3.432872Sum squared resid0.005602 Schwarz criterion-3.323303Log likelihood20.44792 Hannan-Quinn criter.-3.669322F-statistic1056.707 Durbin-Watson stat1.817349Prob(F-statistic)0.000003机动 目录 上页 下页 返回 结束 2022-3-620
18、22-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4343页页然后在主窗口命令行输入:scalar vif =1/(1-FZHG.R2),该命令的含义是建立一个取值为此式的变量vif,其中R2就是2R 执行后在主窗口的左下角状态栏上会出现“vif succes-sfully created”的字样,同时工作表中产生一个叫做vif的新变量,双击此变量,主窗口左下角的状态栏上便会出现:Scalar VIF =1057.707,这个数值很大,根据前面的准则可以认为解释变量之间存在严重的多重共线性。三、特征值与病态指数三、特征值与病态指数k个自变量(不包含常数项)的样
19、本数据构成一个nk的矩阵X,若自变量间存在共线性,则称X为病态的。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4444页页 经验判断法则是:若K100,则认为多重共线性的程度很小;若100K1000,则认为多重共线性的程度中等或比较严重;若K1000,则认为多重共线性的程度非常严重。 为一个kk的方阵,其特征根由大到小排列 X X就存在非常小的特征根(并且有几个共线关系,就有几个很小的特征根)。则X X12,.,k 依次快速递减,如果X为病态的,1kK定义病态数为:以及病态指数:1kCIK机动 目录
20、 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4545页页另一准则是,如果病态指数10CI30,认为多重共线性的程度中等,而如果CI30,则认为多重共线性的程度非常严重。四、法勒格劳伯(FarrarGlauber)检验 FarrarGlauber提出的检验是三种检验的结合提出的检验是三种检验的结合。第一种检验是。第一种检验是2 2检验,它检验多元回归模型中所有检验,它检验多元回归模型中所有解释变量之间存在共线性及共线性的程度。第二种检解释变量之间存在共线性及共线性的程度。第二种检验是验是F检验,用来确定哪些解释
21、变量是多重共线的。检验,用来确定哪些解释变量是多重共线的。第三种检验是第三种检验是t检验,用来找出造成解释变量多重共检验,用来找出造成解释变量多重共线性原因的是哪些变量。线性原因的是哪些变量。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4646页页第一,第一, 2 检验检验若若k个变量个变量x1, x2, xk满足满足rij=0, ij,i,j=1,2,k,则则说这说这k个变量是个变量是正交正交的。的。基本思想:基本思想:11121221112kkkkrrrrrrA设相关系数矩阵为:设相关系数矩阵为
22、:其中:其中:), 2 , 1,(kjiLLLrjjiiijij 由A可以看出,当解释变量存在完全共线性时,|A|=0;当解释变量互相正交时,|A|=1。因此可以认为当解释变机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第4747页页量存在多重共线性时,0|A| t /2 ,则认为,则认为xj和和xi的偏相关系数是显著的,也就是的偏相关系数是显著的,也就是xj和和xi是是引起多重共线的原因。若引起多重共线的原因。若t t /2,则认为,则认为xj和和xi不是引起多不是引起多重共线的原因。重共线的原因。
23、构造统计量:构造统计量:计算计算xj与其余每一个解释变量的偏相关系数与其余每一个解释变量的偏相关系数:), 2 , 1,()1)(1()1)(1(1kijirkiijjji机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5050页页 在结束我们关于侦察多重共线性的讨论之际,我们强调指出,本节所讨论的各种方法实质上都类似于垂钓,我们无法知道一种方法在任一特定的应用中是否灵验,而且没有更为有效的方法。因为多重共线性问题就出现在研究者对于一个给定的样本施加不了多少控制的场合之中。机动 目录 上页 下页 返回
24、结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5151页页第三节第三节 多重共线性问题的处理多重共线性问题的处理 如果通过检验,发现模型中存在严重的多重共线性,是不是一定不好呢?这要视模型的具体用途而定。如果模型只是用来进行预测,只要多重样本决定系数(R2, )足够大即可,无需消除多重共线性。但如果模型是用来进行结构分析和政策评价,由于多重共线性影响到每个自变量系数估计的正确性和有效性,所以应设法消除多重共线性的影响,确保模型的可用性。 2R下面介绍几种常用的处理多重共线性问题的方法。 机动 目录 上页 下页 返回 结束 2022
25、-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5252页页一、增加样本观测值一、增加样本观测值 如果多重共线性是由样本引起的(例如测量误差或偶然的样本),但解释变量的总体不存在多重共线性,则可以通过收集更多的观测值增加样本容量,避免或减弱多重共线性。对于时间序列资料就是增大观测次数,对于截面数据资料就是增加观测对象,或者把时间序列资料与截面数据资料结合起来使用。现利用两个解释变量的线性回归模型 01 122iiiiyxxu作一说明。 由(4.8)可知,该模型参数的OLSE方差为:机动 目录 上页 下页 返回 结束 2022-3-62022-3-
26、6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5353页页 将增加,将增加,r12趋向于总体相关系数,是某一个趋向于总体相关系数,是某一个确定的值,从而确定的值,从而 将会减少,这样就会提将会减少,这样就会提高估计值高估计值 的精度。的精度。从上两式可以看出,当增大样本容量时,则从上两式可以看出,当增大样本容量时,则,)(211 xxi222)(xxi)(),(21VarVar21,注意:注意: 当解释变量总体存在多重共线性时,增加样本容量当解释变量总体存在多重共线性时,增加样本容量也无助于减轻多重共线的程度。也无助于减轻多重共线的程度。 )1 ()()(21221
27、121rxxVariu)1()()(21222222rxxVariu机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5454页页二、删去不重要的解释变量二、删去不重要的解释变量 对待严重的多重共线性问题,一个最简单的解决办法就是删去那些产生多重共线性、对因变量影响不大且人们认为不重要的解释变量,使模型中剩下那些对因变量起重要作用的解释变量,然后对仅包含重要解释变量的模型应用普通最小二乘法。但应注意的是,由于把删去的解释变量对因变量的影响归入随机项中,有可能使随机项不满足零均值的假设,这时所得的参数估计值
28、可能是有偏的,即产生确定性偏倚。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5555页页三、利用三、利用“先验先验”信息信息 先验信息既包括从经济理论也包括从实际统先验信息既包括从经济理论也包括从实际统计资料中获得的解释变量之间关系的信息。如果计资料中获得的解释变量之间关系的信息。如果我们研究的回归模型存在多重共线性,而线性相我们研究的回归模型存在多重共线性,而线性相关的解释变量之间的关系可由事前信息得到。则关的解释变量之间的关系可由事前信息得到。则只要把事前知道的关系包含进回归模型中,多重只要把事
29、前知道的关系包含进回归模型中,多重共线性就会消失。共线性就会消失。例如柯布例如柯布道格拉斯生产函数为:道格拉斯生产函数为:其中,其中,Q为产出,为产出,K为资本,为资本,L为劳动力,为劳动力,A,为参数。将上式转化为对数形式:为参数。将上式转化为对数形式:uQAL K elnQ = lnA +lnK +lnL + u机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5656页页 因为资本和劳动力之间是高度相关的,所以因为资本和劳动力之间是高度相关的,所以lnK和和 lnL之间也是高度相关的,对数模型存在着
30、高度的多重之间也是高度相关的,对数模型存在着高度的多重共线性。共线性。 若根据先验信息知道该地区规模报酬不变,则根据经济学理论,知: 1利用利用 + =1将对数模型转化为:将对数模型转化为:uLKALylnlnln式中,式中,y/L为人均产出,为人均产出,K/L为人均资本量。上式即为为人均资本量。上式即为人均单位产出对人均资本量的一元回归模型,多元回归人均单位产出对人均资本量的一元回归模型,多元回归存在的多重共线性就被消除了。存在的多重共线性就被消除了。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5
31、757页页又如,消费函数为:又如,消费函数为: 01 122yxxu01122()3yxxu1223zxx01yzuy为消费支出,为消费支出,x1为收入,为收入,x2为财富。为财富。 就变为一元回归模型,多重共线性就消除了。就变为一元回归模型,多重共线性就消除了。1232从收入与财富的关系来看,是高度相关的。但根据大从收入与财富的关系来看,是高度相关的。但根据大量的统计数据可以总结出:量的统计数据可以总结出:将该关系式代入,则上式可化为:将该关系式代入,则上式可化为:令:令:则:则:机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大
32、学统计学院计量经济教研室第第5858页页 这是先验信息法的一个变种。其基本做法是:首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。例:例:对于中国家用轿车需求模型012lnlnlnttttypIu四、横截面数据与时间序列数据并用四、横截面数据与时间序列数据并用目的是要估计价格弹性 和收入弹性 。12机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第5959页页 在时间序列分析中,价格和收入变量一般都有高度共线性的趋势。托宾提出了解决此问题的一种方法:即如果
33、拥有关于消费者定点追踪的横截面数据,如城镇或农村居民住户调查数据,就可能可靠地估计收入弹性 。令收入弹性的横截面估计为 ,就可以将前述时间序列回归写成2*2*01lntttypu*2lnlnttyyI其中 这样就可以得到价格弹性的估计值。值得注意的是这里包含着假设:收入弹性的横截面估计和从纯粹时间序列分析中得到的估计是一样的。当横截面估计在不同截面之间没有大的变化时这是一个值得考虑的方法。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6060页页 五、变量变换五、变量变换 有时可以通过对模型中变量进行
34、变换能够实现降低共线性的目的。常用的变量变换方式有:1.使用相对指标。如原来的变量性质是总量指标,可转换为人均指标或结构相对数(比重)指标等。经过这样处理的数据有时可以降低共线性。2.将名义数据转换为实际数据。将名义数据剔除价格影响后反映的信息在统计上常常是指纯的物量的变化,不包含价格变动的影响,有助于描述现象之间真实的数量变化关系。因此在多数经济分析中采用“实际”数据而不机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6161页页是名义数据,将名义数据转换为实际数据有助于降低多重共线性。 需要指出,变
35、量数据的变换有时可得到较好的结果,但谁也无法保证一定可以得到很好的结果。3.将小类指标合并成大类指标。例如,如果模型中自变量包括工业增加值、建筑业增加值,由于二者之间呈现高度线性相关,可将其合并成第二产业增加值。这一合并有助于消除多重共线性。六、变换模型的形式六、变换模型的形式 有时作为解释变量的某些经济变量之间出现了高度相关,但当我们的研究目的是为了预测,并不需要区分机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6262页页 这些相关的解释变量单独对因变量的影响时,我们可以根据问题的需要对原模型加以
36、变形,使新的模型不再出现多重共线性。 例如,例如,某产品的销售量y取决于其出厂价格x1、市场价格x2和市场总供应量x3,设定模型为:0112233lnlnlnlniiiiiyxxxu通常通常 x1 、 x2 是高度相关的,如果研究的目的主要是是高度相关的,如果研究的目的主要是为了预测某厂该产品销售量,则可以用相对价格为了预测某厂该产品销售量,则可以用相对价格x1/x2 代替代替x1 、 x2 对对y的影响,的影响, 采用采用机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6363页页ln(x1/x2)为
37、解释变量,建立如下对数回归模型:从而克服了x1与x2的相关性。101232lnlnlnxyxux 另外,也可以采用差分法,将原模型变形为差分模型形式进而减低多重共线性。因为一般而言,差分后变量之间的相关性要比差分前要弱得多,所以差分后的模型可以有效地降低出现共线性的可能性,此时可直接估计差分方程。但因为差分常常会丢失一些信息,差分模型的误差项可能是序列相关的,会违背经典线性回归模型的相关假设,在具体运用时要慎重。机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6464页页七、逐步回归法七、逐步回归法 为
38、了选出所有系数具有显著性而且相互之间不存在严重多重共线性的自变量进入回归方程,可以采用对所有子集回归方程进行“全局比较”,寻找“最优子集回归”。 在实际应用中,我们经常使用的是一种简化的方法,即“局部比较”方法,包括逐步剔除法、逐步添加法和逐步回归法。局部比较”方法得到的回归方程不一定是“最优”的,而只是较好的。但由于需要的计算量远远小于“全局比较”方法,这些方法(尤其是逐步回归法)所以还是得到了广泛应用。 机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6565页页1.逐步剔除法(后退法,Backwa
39、rd Regression)。先建立一个包括所有可能自变量的回归方程,然后逐个剔除作用不显著的自变量,直到方程中所包括的自变量都有显著作用为止。这种方法的缺点是,先剔除的变量不一定总是不显著的,在剔除别的变量后,其作用有可能变得显著,但整个过程是“只出不进”,最终有可能漏掉起重要作用的变量;2.逐步添加法(前进法,Forward Regression)。先从一个自变量开始,再将显著变量逐个引入回归方程。这个方法有一个问题是,先期引入的自变量,随着其他变量的引人,由于多重共线性其作用可能变得不显著了,但整个过程是“只进不出”,最终会引入作用不显著的自变量;机动 目录 上页 下页 返回 结束 20
40、22-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6666页页3.逐步回归法(Stepwise Regression)。逐步回归可以克服逐步剔除法和逐步添加法的缺陷。其基本思想是“有进有出”,根据各个自变量重要性的大小,每次选一个重要自变量进入回归方程,同时将不显著的变量剔除掉。这种方法要求首先估计被解释变量对每一个解释变量的回归方程,这些回归方程叫做基本回归方程。对每一个基本回归方程进行统计检验,并根据经济理论分析这些回归方程,从中选出最合适的基本回归方程,然后再逐一加入其它的解释变量,重新再作回归。根据这个新加的解释变量的边际贡献(样本决定
41、系数的增加量)和标准差,并考察对每个回归系数的影响,作如下的分析判断:机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6767页页 第一,如果新加进的解释变量改进了R2,并且其它回归系数在统计上仍是显著的,那么,就可以认为新加进去的解释变量是有用的,作为模型中的解释变量予以保留。 第二,如果加进去的解释变量未能改进R2,对其它回归系数也没有影响,则不作为解释变量。 第三、如果新加进的解释变量不仅改进了R2,并且主要是显著地影响了回归系数的符号或数值,致使某些回归系数达到不能接受的地步,则可断言产生了严重
42、的多重共线性。 这个新加进的变量在经济理论上可能十分重要,但由于它与其它解释变量存在线性相关关系,使得普通最小机动 目录 上页 下页 返回 结束 2022-3-62022-3-6山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室第第6868页页二乘法估计失效。但舍弃的结果往往会不利于全面地、尽可能精确地描述经济现象,而且还可能会带来随机项与模型中的解释变量相关。这时再进行进一步检验,若相关的两个解释变量中一个可由另一个来解释,则可以略去其中对因变量影响较小的一个,保留影响较大的一个。 如此继续下去。一般地说,第t步是在未选的自变量中,选一个自变量与其他已经选择的自变量一起所组成t元回归方程,并使该方程有更大的2R个选入回归方程的自变量是真正重要的,需要对每一个进入回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年3D打印技术的器官打印进展
- 农业银行2025黑河市秋招无领导小组面试案例题库
- 2025年3D打印的个性化医疗植入物
- 中国银行2025秋招面试典型题目及参考答案湖北地区
- 工商银行2025吉安市秋招无领导小组面试案例题库
- 工商银行2025张家口市秋招无领导模拟题角色攻略
- 中国银行2025萍乡市信息科技岗笔试题及答案
- 建设银行2025上饶市小语种岗笔试题及答案
- 建设银行2025兰州市秋招结构化面试经典题及参考答案
- 中国银行2025石家庄市秋招英文面试题库及高分回答
- 2025年海关关务测试题及答案
- (正式版)DB3302∕T 1180-2025 《高速公路建设韧性指标体系》
- 2025年8月广东深圳市光明区住房和建设局招聘一般专干5人备考练习题库及答案解析
- 中康科技腾讯健康:2024年消费者健康洞察呼吸系列报告-鼻炎鼻窦炎篇预览版
- 《煤矿安全规程(2025)》防治水新旧条文对照
- 2025年IT技术支持工程师招聘面试问题及答案解析
- GB 16807-2025防火膨胀密封件
- 挤压模具工特殊工艺考核试卷及答案
- 2025-2026学年外研版八年级英语上册教学计划及进度表
- 麻醉医生进修汇报课件
- (2025年标准)灵活用工协议书
评论
0/150
提交评论