版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同时进入模型后就会带来多重共线性问题。4,E+113,E+112.E+111.E+110.E+00(2)解释变量与其滞后变量同作解释变量。4.E+113.E+112.E+111.E+110.E+004.E+113.E+112.E+111.E+110.E+00GDPGDP(-1)0.E+001.E+112.E+113.E+114.E+113 .多重共线性的后果(1)当匕xj=1,X为降秩矩阵,则(X'X)-1不存在,P=(X&
2、#39;X)-1X'Y不可计算。(2)若底x田,即使hix1,仍具有无偏性。E(?)=E(X'X)-1X,y=E(X'X)-1X,(X+u)=+(X'X)-1X,E(u)=:.(3)当kxxj口1时,X'X接近降秩矩阵,即X'Xt0,Var()=仃2(X'X)-1变得很大。所以3丧失有效性。以二解释变量线性模型为例,当rxixj=0.8时,Var(的为rxixj=0时的Var(g)的2.78倍。当rxixj=0.95时,Var(g为rxi为=0时的Var(F)的10.26倍。4 .多重共线性的检验(1)初步观察。当模型的拟合优度(R2)很
3、高,F值很高,而每个回归参数估计值的方差Var(耳)又非常大(即t值很低)时,说明解释变量间可能存在多重共线性。(2) Klein判别法。计算多重可决系数R2及解释变量间的简单相关系数"j若有某个人为R2,则X,为间的多重共线性是有害的。(3)回归参数估计值的符号如果不符合经济理论,模型有可能存在多重共线性。(4)增加或减少解释变量个数时,回归参数估计值变化很大,说明模型有可能存在多重共线性。(5)此外还有其他一些检验方法,如主成分分析法等,很复杂。5 .多重共线性的克服方法5.1 直接合并解释变量当模型中存在多重共线性时,在不失去实际意义的前提下,可以把有关的解释变量直接合并,从而
4、降低或消除多重共线性。如果研究的目的是预测全国货运量,那么可以把重工业总产值和轻工业总产值合并为工业总产值,从而使模型中的解释变量个数减少到两个以消除多重共线性。甚至还可以与农业总产值合并,变为工农业总产值。解释变量变成了一个,自然消除了多重共线性。5.2 利用已知信息合并解释变量通过经济理论及对实际问题的深刻理解,对发生多重共线性的解释变量引入附加条件从而减弱或消除多重共线性。比如有二元回归模型yt=-0+口1xti+|:,2xt2+ut(7.20)xi与X2间存在多重共线性。如果依据经济理论或对实际问题的深入调查研究,能给出回归系数4与2的某种关系,例如%=喏i(7.21)其中九为常数。把
5、上式代入模型(7.20),得yt=:0+:1Xti+-,I,lXt2+ut=l:-10+:1(xti+.,Xt2)+ut(7.22)令Xt=Xti+-Xt2得yt=+'-iXt+ut(7.23)模型(7.23)是一元线性回归模型,所以不再有多重共线性问题。用普通最小二乘法估计模型(7.23),得到国,然后再利用(7.21)式求出同。下面以道格拉斯(Douglass)生产函数为例,做进一步说明。Yt=KLt:Cteut(7.24)其中Yt表示产出量,Lt表示劳动力投入量,Ct表示资本投入量。两侧取自然对数后,LnYt=LnKt+二LnLt+-LnCt+ut(7.25)因为劳动力(LJ与资
6、本(Ct)常常是高度相关的,所以LnLt与LnCt也高度相关,致使无法求出区P的精确估计值。假如已知所研究的对象属于规模报酬不变型,即得到一个条件:+:=1利用这一关系把模型(7.25)变为LnYt=LnKt+二LnLt+(1-:)LnCt+ut整理后,YtLtLn()=LnKt+:Ln()+ut(7.26)'Ct''Ct'''变成了Ln(Yt/Ct)对Ln(Lt/Ct)的一元线性回归模型,自然消除了多重共线性。估计出支后,再利用关系式0+P=1,估计P。5.3 增加样本容量或重新抽取样本这种方法主要适用于那些由测量误差而引起的多重共线性。当重新
7、抽取样本时,克服了测量误差,自然也消除了多重共线性。另外,增加样本容量也可以减弱多重共线性的程度。5.4 合并截面数据与时间序列数据这种方法属于约束最小二乘法(RLS)。其基本思想是,先由截面数据求出一个或多个回归系数的估计值,再把它们代入原模型中,通过用因变量与上述估计值所对应的解释变量相减从而得到新的因变量,然后建立新因变量对那些保留解释变量的回归模型,并利用时间序列样本估计回归系数。下面通过一个例子具体介绍合并数据法。设有某种商品的销售量Yt模型如下,(7.29)LnYt=l:o+!::;iLnPt+FzLnIt+ut其中Yt表示销售量,Pt表不平均价格,It表不消费者收入,下标t表于时
8、间。在时间序列数据中,价格Pt与收入It一般高度相关,所以当用普通最小二乘法估计模型(7.29)的回归系数时,会遇到多重共线性问题。首先利用截面数据估计收入弹性系数隹。因为在截面数据中,平均价格是一个常量,所以不存在对国的估计问题。把用截面数据得到的收入弹性系数估计值国代入原模型(7.29)。得LnYt=|:o+|'iLnPt+?2Ln11+ut移项整理LnYt-%LnIt=勾+:iLnPt+ut变换后的因变量(LnYt-良LnIt)用Zt表示,则Zt=-0+-iLnPt+ut(7.30)这时已排除收入变量的影响。模型已变换为一元线性回归模型。利用时间序列数据对模型(7.(30) 通最
9、小二乘(OLS)估计,求出国,国。这样便求到相对于模型(7.29)的估计式,LnY=?0+口LnPt+国Ln11其中m是用截面数据估计的,息,国是由时间序列数据估计的。由于把估计过程分作两步,从而避免了多重共线性问题。显然这种估计方法默认了一种假设,即相对于时间序列数据各个时期截面数据所对应的收入弹性系数估计值都与第一步求到的艮相同。当这种假设不成立时,这种估计方法会带来估计误差。5.5逐步回归法(1)用被解释变量对每一个所考虑的解释变量做简单回归。并给解释变量的重要性按可决系数大小排序。(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按解释变量重要性大小为顺序逐个引入其余的解释
10、变量。这个过程会出现3种情形。若新变量的引入改进了R2,且回归参数的t检验在统计上也是显著的,则该变量在模型中予以保留。若新变量的引入未能改进R2,且对其他回归参数估计值的t检验也未带来什么影响,则认为该变量是多余的,应该舍弃。若新变量的引入未能改进R2,且显著地影响了其他回归参数估计值的符号与数值,同时本身的回归参数也通不过t检验,这说明出现了严重的多重共线性。舍弃该变量。案例1:关于中国电信业务总量的计量经济模型(file:coline2)经初步分析,认为影响中国电信业务总量变化的主要因素是邮政业务总量、中国人口数、市镇人口占总人口的比重、人均GDP、全国居民人均消费水平。用1991-19
11、99年数据建立中国电信业务总量计量经济模型如下,Lny=24.94+2.16X1-3.03X2+33.7X3+1.29X4-2.03X5(0.7)(1.6)(-0.8)(1.0)(1.5)(-1.2)R2=0.9944,F=106.3,DW=3.4,T=9,(1991-1999),t0.05(3)=3.18,R=0.99,而每个回归参数的t检验在统计上都不显著,这说明模型中存在严重的多重共线性。DependentVariable:LOG(Y)Method:LeastSquaresDate:04/18/04Time:07:58Sample:19911999Includedobseivations
12、:9VariableCoefficientStd.Errort-StatisticProbCX1X2X3X4>S24.9366038452070.6485110.562921636311.3623221,5999300.2079-3.0345513.996712-0.7611660.5019337133332939431023495D.38141.288B600.83406915452670,2200-2.0271911.664341-1.2180140.3103R-squned0.9943B5Meandependentvar2013502AdjustedR-squared0.90502
13、7S.D.dependentvar1.018022SEofregression124570Akaikeinfocriterion-1093179Sumsquaredresid0046553Schwarzcriterion-0.961696Loglikelihcod10,91930F-statistic106.2583Durbin-Watsonstat3.408677Prob(F-statistic)00014214LOG(Y)403020104030201011.411.611.812.012.212.412.640X100.51.01.52.04011.411.611.812.012.212
14、.412.600.263020100.270.280.290.300.314LOG(Y)31X30403020100LOG(Y)X44030201001.01.52.02.53.03.50.5iiin12345LOG(Y)X5下面用Klein判别法进行分析。首先给出解释变量间的简单相关系数矩阵。因为其中有一个简单相关系数大于R2=0.9944,所以根据Klein判别法,模型中存在严重的多重共线性。Ln(y)X1X2X3X4X5Ln(y)1.0000x10.98331.0000x20.99380.98951.0000x30.98750.97000.98821.0000x40.98200.9628
15、0.98720.96781.0000x50.98150.97030.98880.96540.99861.0000用逐步回归法筛选解释变量。(1)用每个解释变量分别对被解释变量做简单回归,以可决系数为标准确定解释变量的重要程度,为解释变量排序。Lny=-0.39+2.06X1(-2.1)(14.3)R2=0.9668,F=204,T=9Lny=-33.26+2.91x(-22.2)(23.6)R2=0.9875,F=555,T=9Lny=-18.46+70.75X3(-14.9)(16.6)R2=0.9752,F=275.5,T=9Lny=-0.49+0.56X4(-2.5)(13.8)R2=0
16、.9644,F=189.7,T=9Lny=-0.42+1.16X5(-2.2)(13.5)R2=0.9633,F=183.5,T=9之所以取半对数模型,是因为y与X1,X3,X4,X5分别呈指数关系。解释变量的重要程度依次为X2,X3,X1,X4,X5。(2)以Lny=-33.26-291X2为基础,依次引入X3,X1,X4,X5。首先把X3引入模型,Lny=-29.9+2.24X2+16.76X3(-6.9)(2.7)(0.8)R2=0.988,F=265.5,T=9因为X3的引入使各回归系数的t值下降,同时X3的系数也未通过t检验,所以应剔除X3。接着把Xi引入模型,Lny=-33.37+
17、2.92X2-0.007xi(-3.2)(3.2)(-0.01)R2=0.9875,F=237.9,T=9同理剔除Xi引入X4Lny=-31.94+2.79X2+0.022X4(-3.4)(3.3)(0.14)R2=0.9876,F=238.7,T=9同理剔除X4引入X5Lny=-34.97+3.06X2-0.062X5(-3.4)(3.4)(-0.17)R2=0.9876,F=238.7,T=9同理剔除X5,最后确定的模型是Lny=-33.26+2.91X2(-22.2)(23.6)R2=0.9875,F=555,T=9或者用解释变量之间相关系数值最小的X1和X4同做解释变量与Lny回归,得
18、Lny=-0.48+1.08X1+0.28X4(-3.4)(2.7)(2.5)R2=0.98,F=184,T=9用EViews求相关系数矩阵(1)点击Quick键并依次选择GroupStatistics,Correlations,将出现一个要求填写序列名的对话框(SeriesList),填好序列名后按OK。(2)在Workfile窗口中用鼠标选中序列名,点击Show键,OK键,从而打开数据组(Group)窗口。在数据组窗口点击View键选择Correlationso)表1变量y,X1,x2,x3,x4,x5的数据电信业务总量y邮政业务总量X1中国人口数X2市镇人口比重X3人均GDPX4人均消费
19、水平X519911.51630.527511.58230.26371.8790.89619922.26570.636711.71710.27632.2871.07019933.82450.802611.85170.28142.9391.33119945.92300.958911.98500.28623.9231.74619958.75511.133412.11210.29044.8542.236199612.08751.332912.23890.29375.5762.641199712.68951.443412.36260.29926.0532.834199822.64941.662812.4
20、8100.30406.3072.972199931.32381.984412.59090.30896.5343.143资料来源:中国统计年鉴2000案例2:(file:B1E4)1998年农村居民食品支出(处理多重共线性)1998年31省市自治区农村居民人均年食品支出(food,元)、人均年总支出(EX,元)和人均年可支配收入(IN,元)DependentVariable:FOODMethod:LeastSquaresDate:0WW2Time:05:49Sample:131Includedobservations:31VariableCoefficientStd.Errort-Statist
21、icProb.CEXIN27567330.50769030.B474790339140.0551099.2125290.041317-25E41B5000000.000000160-0105945R-squared0.948247Meandependentvar877.2419AdjustedR-squared0.944650S.D.dependentvar2731305S.E.ofregression64.31622Akaikeinfocriterion8419389Sumsquaredresid116824.1Schwarzcriterion8.558162Loglikelihood-17
22、14876F-statilstic25&5145Durbin-Watsonstat0977692Prob(F-statistic)0000000见散点图2,food与IN是正相关的(0.89),但估计结果回归系数确是负的。显然与事实不符、与经济理论不符。原因是EX和IN之间的多重共线性(高度相关)所致。从下表可以看出都r(Ex,in)=0.9537大于可决系数0.9482。按克莱茵判别准则模型存在严重的多重共线性。2000FOOD1500一1000500-EX0-I.1000200030004000500060010002000300040005000CorrelationMatrix
23、EX|INEX1.0000000.9637201N09537201.000000另外,如果用food只对IN回归,回归系数是正的。与上述二元回归结果中的IN的回归系数相比,符号都是反的。这也说明上述二元回归结果中存在多重共线性。R2=0.79,F=110,T=31效果很好。Foodt=285.5945+0.2571Int(4.7)(10.5)处理方法是用food只对EX回归。DependentVariable:FOODMethad:LeastSquaresDate:01DW2Time:06:19Sample:131Includedobseivations:31VariableCoefficie
24、ntStdError(-StatisticProbC253464332,5643779370230.0000EX0.3729220.01809420.610490.0000R,squared0.936094Meandependentvr877.2419AdjustedR-squared0933890SD.dependentvar273.1305S.E.ofregression7D22B70Akaikeinfocriterion8565798Sumsquarednesid1430219Schwarzcriterion8.658313Loglikelihood-174.7570F-statisti
25、c424.7922Durbin-Watsonstat0729924ProbJF-statistic)0.000000obsFOODEXIN11215.082873.23952.322911.391976.73395.73616.91298.542405.324592.191056.451858.65867.381577.121981.486898.871702.682579.797799.691471.462383.68805.331464.642253.191775.044206.895406.87101117.012336.783376.78111361.82890.653814.5612
26、732.141333.051863.06131101.642025.092946.3714899.371538.24204815804.641595.092452.8316700.781240.31864.0517918.951699.432172.24181107.231889.172064.85191370.72683.183527.1420808.821414.761971.921767.421246.122018.3122831.081343.351720.4623871.831440.771789.1724757.551094.391334.4625801.991312.311387
27、.2526497.41710.261231.527590.91181.381405.5928556.85939.551393.0529694.621117.791424.7930706.561327.631721.1731713.341450.291600.14资料来源:中国统计年鉴1989o案例3:(file:nonli14)中国私人轿车拥有量决定因素分析(多重共线性特征)1985-2002年中国私人轿车拥有量以年增长率23%,年均增长55万辆的速度飞速增长。考虑到目前农村家庭购买私人轿车的现象还很少,在建立中国私人轿车拥有量模型时,主要考虑如下因素:(1)城镇居民家庭人均可支配收入;(2)
28、城镇总人口;(3)轿车产量;(4)公路交通完善程度;(5)轿车价格。“城镇居民家庭人均可支配收入”、“城镇总人口数”和“轿车产量”可以直接从统计年鉴上获得。“公路交通完善程度”用全国公路里程度量,也可以从统计年鉴上获得。由于国产轿车价格与进口轿车价格差距较大,而且轿车种类很多,做分种类的轿车销售价格与销售量统计非常困难,所以因素“轿车价格”暂且略去不用。定义变量名如下:Y:中国私人轿车拥有量(万辆)X1:城镇居民家庭人均可支配收入(元)X2:全国城镇人口(亿人)X3:全国汽车产量(万辆)X4;全国公路长度(万公里)1000800600400200040002000400060008000100
29、08006004002000X301002003004001000800600200000800600_40cL20080100120140160180CorrelationMatrixXIX2K3X4XI1.0000000.98302209584650.929555X20.98302210000000.9628560.950705X30.95846509628561.0000000.955281X409295550.95S7S509652811.000000DependentVariable:YMelhad:LeastSquaresDate:02/025Tims:20:10Sample:19
30、852002Includedobservations:18VariableCoefficientStd.Errort'StalisticProbCX1X2X3X4-925.6637163.8137-56507110.00010.0067020.02342402434240311562,9420104,365040.7460770.46890.4116640.5D7786081050604322772g2851.56012。4.9542900.0003R-squared0.936721Meandependentvar284.2606AdjustedR-squared0.982635S.D
31、,dependentvar278.4439S.E.ofregression36,69198AkaikeinfocriterionW27313Sumsquaredresid17501.92Schwar2criterion10.52045Loglikelihood-87.45014F-statistic241.4995Durbin-Watsonstat1400855Prob(F-statistic)0.000000看相关系数阵,丫与X1,X2,X3,X4的相关系数都在0.9以上,但输出结果中,解释变量X1,X2,X3的回归系数却通不过显著性检验。这预示着解释变量之间一定存在多重共线性。看散点图,把Y与X3,X4处理成线性关系,把Y与X1,X2处理成募函数(抛物线)关系,得结果如下,DependentVariable:YMethod:LeastSquaresDate:02/02A)5Time:20:10Sample:19852002Includedobservations:18VariableCoefficientStd曰ort-StartisticProb.C440.74711124087392093500020XV23.3IE-0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化验员资格考试模拟题及答案详解
- 2026青岛科技大学招聘人员14人备考题库及一套参考答案详解
- 2026青海海北建工工程建设有限公司招聘1人备考题库附答案详解(精练)
- 2026鲁南发展投资控股(枣庄)集团有限公司招聘第二批急需紧缺人才3人备考题库含答案详解(典型题)
- 2026黑龙江佳木斯市汤原县社会保险事业中心招聘公益性岗位人员3人备考题库及一套完整答案详解
- 2026黑龙江黑河市孙吴县社区卫生服务中心招聘2人备考题库附答案详解(a卷)
- 中国稀土集团有限公司2026届春季校园招聘备考题库及一套完整答案详解
- 国航股份上海分公司乘务员岗位2026届高校毕业生校园招聘备考题库及答案详解参考
- 台阶-课件-第二课时
- 2026年绿色供应链管理法律风险防范手册
- 数字经济赋能传统产业转型路径分析
- 眼科手术分级详细目录
- 煤矿掘进工安全培训内容课件
- 2025年西安市8中小升初试题及答案
- 机械设备保修期服务方案及保证措施
- 《贵州省涉路工程安全技术指南(试行)》
- 2025年湖南省中考物理试卷(含解析)
- 食品安全日管控、周排查及月调度记录表
- 《资治通鉴》与为将之道知到课后答案智慧树章节测试答案2025年春武警指挥学院
- 数字生活产数人才练习试题及答案
- 数据新闻教程 课件 第6章 数据新闻的叙事
评论
0/150
提交评论