多元线性回归中多重共线性的处理_第1页
多元线性回归中多重共线性的处理_第2页
多元线性回归中多重共线性的处理_第3页
多元线性回归中多重共线性的处理_第4页
多元线性回归中多重共线性的处理_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、csu多元线性回归中多重共线性的处理回归分析结课论文姓名:班级:学号:指导老师:liuwenying2011/1/12目录多元线性回归中多重共线性的处理31. 引言32. 多元线性回归32.1 多元线性回归分析的基本假定42.2 回归参数的最小二乘估计及其性质42.3 上海市全社会固定投资影响因素分析43. 多重共线性6多重共线性的诊断方差扩大因子法74. 主成分回归75. 岭回归105.1 岭参数选择115.2 用岭回归选择变量116. 三次回归结果比较分析167. 参考文献17附录183多元线性回归中多重共线性的处理摘要:多元线性回归中,研究一个变最与多个变量之间的线性相关关系,多个变 量

2、之间难免存在多重共线性,故利用普通最小二乘估计所得结果不理想。在消除多重 共线性问题时,本文利用方差扩大因子对多重共线性进行判别。主要使用主成分分析 和岭回归来对多重共线性问题进行了探讨。同时,结合实际经济问题,对上海市全社 会固定资产投资影响因素问题进行了完整的实证分析。关键词:多元线性回归最小二乘估计多重共线性 主成分分析 岭回归在生产实践中,人们关心的某些指标往往同时受到多个变量的影响,多元线性回 归研究的就是因变量y与P个白变帚不卷,之间的线性回归关系。多元线性回归与 一元线性回归的基本假设唯一不同之处为要求该P个自变最之间不存在线性关系,不 然最小二乘估计结果就会存在很大的问题。本文

3、参照上海市统计年鉴2010中的数据,提取XI国有经济投资,X2集体经 济投资,X3股份制经济投资,X4港澳台、外商投资,X5地区生产总值,X6社会存量, X7财政收入,X8财政支出,以研究影响上海市社会固定资产投资(INV)的因素。酋 先使用最小二乘估计得到回归方程,发现结果很不理想,由方差扩大因子法可知变量 之间存在严重的多重共线性。为消除多重共线性,使用主成分回归,得到回归方程。 而近代回归分析针对多重共线性,提出一种改进最小二乘估计的方法一一岭回归。本 文亦利用岭回归,对文中实证分析的内容进行研究,最终得到岭回归方程。在文章最后,比较分析最小二乘估计、主成分分析和岭回归的回归方程,在定性

4、 和定量方面给出分析结果。2.多元线性回归1在实际的经济活动中,某一现象的变动经常受多种现象变动的影响。影响因变最 的自变最通常不是一个,而是多个,这就产生了测定多因素之间的相关关系的问题。研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系, 称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。假定因变量y与p个口变量冯,冷,之间的回归关系可以用线性函数来近似反映。 多元线性回归模型的一般形式如下:Y=/?o + /?1Xi + .+ /7pXp + (1)其中,£是随机扰动项:A,02,/p是总体回归参数。名表示在其他自变最保持 不变的情况下,

5、|变量兀变动一个单位所引起的因变量Y平均变动的单位数,因此乂 叫做偏回归参数。2.1多元线性回归分析的基本假定多元线性回归模型基本假定如下表所示:表格1多元线性回归基本假定假定名称假定条件对扰动项£的假定正态性£N(0,CT2)且Cov(q,弓)一0 (心j)零均值同方差互独立对自变量X的假定非随机解释是确定型变最不相关解释变量间不存在 线性相关关系对X与0的假定不相关Cov(X,w)=0符合基本假定的多元回归模型称为标准的多元线性回归模型。这些假定对于回归 模型的估计和检验是很重要的,如果无法满足这些假定,模型参数的普通最小二乘估 计将存在一系列问题。2.2回归参数的最小

6、二乘估计及其性质多元线性回归模型中回归参数的估计可用最小二乘法进行估计,有残差平方和rss = &2 = Y根据微积分中求极小值的原理,可知残差平方和RSS存在极小值,欲使RSS达到 最小,RSS对回归方程中的回归参数"o,A,几的偏导数必须等于零。将RSS对 "o,A,0p求偏导,并令其等于零,加以整理后可得到P+1个方程(称为正规方程组 或标准方程),通过求解这一方程组便可以得到0o,A,几。多元线性回归模型中回归参数的最小二乘估计最是随机变量。数学上可以证明, 在标准假定条件可以得到满足的情况下,多元回归模型中回归参数最小二乘估计量是 最优线性无偏估计量(BL

7、UE)和一致估计量。在标准的多元回归模型中,高斯马尔可 夫定理成立。2.3上海市全社会固定投资影响因素分析本文从上海统计年鉴20丄0中得到相关数据,分别为INV社会固定资产投资, X丄国有经济投资,X2集体经济投资,X3股份制经济投资,X4港澳台、外商投资,X5 地区生产总值,X6社会存星,X7财政收入,X8财政支出。由于数据年限限制,选取 1993年2009年的数据进行多元线性回归,其中各变量单位均为亿元。6建立回归模型!NV =几+人氏+佚卷+娱卷用SPSS软件计算出回归系数见输出结果表格2回归系数表模型非标准化系数标准系数tSig共线性统计戢B标准误差试用版容差VIF1(常 fit)10

8、8828170655638.541国有经济838.2043654.108003.02050075集体经济2.035.9670802.104069.1079306股份制经济1.296.3303853.928.004.01661.097港澳台、外商投负1.372.272.2395.042.001.07014.289地区生产总值社会存量-.122.097394 1.263.242.002619.414-.169.160-.21$ 1.056.322.004271.710财政收入.674.402.4001.676.132.003362.377财政支出.529.3283531.612146.003304

9、.770a因变显二社会固定资产投资因而INV对8个门变星的线性回归方程为INV = 10&828 + 0.838X+2.035x2+1.296X3+1.372x4-0.122x5 - 0.169 + 0.674x7 + 0.529%表格3模型汇总方程1 复相关系数999R方999调整R方997估计的标准误66658表格4方差分析表平方和df均方FSig.方程1 回归28217182.11783527147.765793 820.000残差35546.06884443.259总计2825272 8.18516分析表3和表4,发现上述回归方程的拟合优度接近于1,且整体显著性检验的F 值为7

10、93.820,伴随概率为O.OOO,小于显著性水平0.05。所以总体上來说,INV对 8个自变量的线性关系成立,也就是说INV可以由该8个变最回归得到。再分析表2, 发现X5地区生产总值,X6社会存量的回归系数均小于0。但是实际上,地区生产总 值越大,社会存最越多,越有利于全社会I司定资产投资额的增加,因此这两个自变量 的回归系数没有经济意义。而且各个回归系数的t统计最的伴随概率都较大,也就是说 5在0.05的显著性水平下,只有xl, X3和X4的回归系数通过统计检验。当多元线性回归出现经济意义检验通不过时,首先考虑是否违背了多元线性回归 基本假设中的自变量间无多重共线性假设。表格5因变量对自

11、变量的简单相关系数表1NVXIX2X3X4X5X6X7X8INV1.000.910460.930.870.990.98098098XI0.911 00-0.220.740 650880.91089089X2-0.460.221.000.680.41-0.58-0.53-0.59-0.57X30.930.740681.000.840.960.920.950.95X40.870.65-0410.841.000.840.83081083X50.990.880.580.960.851.000.990 991.00X60.980.91-0.530.920.830.991.000.990.99X70.98

12、0.89-0.590.950.810.990.991.001.00X80.980.89-0.570950821.000.991.001.00从表5中得到,口变量XIX8之间的简单相关系数存在很大的值,几乎接近于1, 所以不得不承认,变量间存在多重共线性。3. 多重共线性最小二乘法的基本假设当中,要求自变最"。,人几之间不存在多重共线性,如 果存在不全为零的P+1个数Cp,使得2q+ q%i +%=(),i = l,2,n(4)则自变量耳兀一Xp之间存在若完全的多重共线性。在实际问题中完全的多重共线 性并不多见,常见的是(4)式近似成立的情况,即存在不全为0的P+1个数G,q,Cp,

13、使得q + q电+CpaO,i = l,2,n(5)当门变最齐,冯幵存在(5)式的关系时,称为口变量爲,卷Xp之间存在多重共 线性,也称为复共线性。在实际经济问题的多元回归分析中,多重共线性的情形很多。当使用最小二乘估计时,估计量间的相关性从小到大增加时,估计量的方差会增 加得很快,因而0。,A,几的估计精度就会很差。多重共线性的诊断一一方差扩大因子法对自变量:作中心标准化,则X*X* = (1J为门变量的相关阵。记C = (qj)=(x*x*)_1称其主对角线元素为自变量Xj的方差扩大因子。其中var(/?j) = C1Jcr/I, jp其中,Lij为亏的离差平方和。WFj的大小反映了自变量

14、之间是否存在多重共线性,因此可由它來度量多重共线 性的严重程度。经验表明,当>10时,就说明白变量£与其他自变最之间有严重 的多重共线性,且这种多重共线性可能会过渡的影响最小二乘估计量。从表2中可得到,只有X2集体经济的方差扩大因子小于10,其他均在10以上, 由此看出,其他7个变量与其他变量之间有严重的多重共线性。4. 主成分回归3主成分分析是多元统计分析的一个基本方法,是对数据做一个正交旋转变换,也 就是对原变量做一些线性变换,变换后的变量是正交的。在统计模型中,变量的信息常用变量的变差(方差)來反映。因为统计模型中, 可把变差很小的屋近似看做常量,而变差很大的量往往在模型

15、中起重要作用。在实际 处理多元统计问题时,常遇到这样的情况:变量个数P较多,彼此间存在多重共线性, 因而使得观测数据有一定程度上的信息这是门然希望用较少的几个(设m<p) 综合变量(主成分)來代替原來较多变量,使得几个综合变量彼此互不相关,且尽可 能多地反映原变量的信息(变差)。基于这种思想,产生了主成分分析。若用m个主 成分來概括原变量,那么p个变量的n次观测数据,就可以简化为m个主成分的n 次观测。应用主成分分析方法对8个自变量提収主成分,主要是计算8个变量的相关矩阵 的特征值。表格6解释的总方差成份初始特征值提取平方和载入合计方差的累积%合计方差的%累枳%167388422734.

16、2276.7388422784.22728391048394.7103.346432299.0324.057.71799.7495013.16199910600405299.9617.002.02499 9858.001.015100.000提取方法:主成份分析。图表1碎石图表格7特征向量Fact or 1Factor?Fact or 3Factor4FactorsFact or 6Fact or 7FactorsXI0.33340.4682-0.4156-0.190606475-0.1745003440.0989X20.23320.85460.20050.325202549005530.03

17、230.0119X30.3717-0.17000.11770.82710.15540.2409-0.18760.1333X40.33050.074408556-031500.2066005670.03790.0822X50.38460.0319-002640.1129-001350.28900.26800.S259X60.38100.1113-0.1020-0.24460.5080-03231-061700.1701X70.38300.02930.1458-004390.4125-0.29570.69660.2940X80.38840.04170.09470.00690.412507036-0

18、.15320.4100相关系数矩阵的特征值(Eigenvalues of the Correlation Matrix )输岀有8个特征 值,其中,第一个特征值的方差百分比为84.227%,即其贡献率为84.227%:第2个 特征值的方差百分比为10.483%,即其贡献率为10.483%,前两个特征值的累计方差 白分比,即累计贡献率为94.71%o表明原来8个变量反映的信息可由两个主成分反映 94.71%, 一般来说,累计方差百分比(累计贡献率)达到70%以上,即可认为比较满 意,所以只选取第一个主成分进行分析。碎石图也显示,只有第1个特征值大于1。第一个主成分为Factoil = 0.333

19、4齐 一02332卷 + 0.3717 + 0.3305% + 03846卷 + 0.3810% + 0.3830冯 + 0.3884卷现在用INV对第一个主成分Factorl做普通最小二乘回归,得到主成分回归的回 归方程:INV = 592.81+0.395 lFactorl(8)表格8回归系数表模型非标准化系数标准系数tSigB标准误芒试用版1 (常呈)REGR factor score 1for analysis 1592.810039593.0000.01539836.37425 862.000.000a.因变虽:社会固定资产投资表格9模型汇总模型RR方调整R方标准佔计的谋1.989、

20、.978.977203.2622a 预测变昴:(常量) REGR factor score 1 for analysis 1. b因变尿社会崗定资产投资表格10方差分析表Anovab模型平方和df均方FSig1回归残差总计2.731E7942464.5112.825E7115162.731E762830.967434.662 000“a. 预测变园(常虽) REGR factor score1 for analysis 1.b. 因变虽:社会网定资产投资表格11共线性诊断模型维数待征值条件索引方差比例(常 fit)REGR factor score1 for analysis 11 11.00

21、01 0001.00.0021.0001 000.001.00a因变駅社会尚定资产投资从表9模型汇总中可以得到回归的拟合优度,R方达到0.978,调整的R方有0.977, 由此可知,上海市社会固定资产投资的97%可以由Factor 1来解释。方差分析表中得 到F值为434.662,在0.05的显著性水半下,回归方程整体显苦。再从回归系数表中 得到常数项和Factorl的回归参数所对应的t值均较大,在0.05的显苦性水半下显苦 不为零。从共线性诊断表中也可以得到,这时的回归方程己经不存在多重共线性。因此还 原后的主成分回归方程为:INV = 592.81+ 0.132否-0.092三 + 0.1

22、47% + 0.131x4+ 0.152 + 0.15%+0.151X7+0.153X5分析式(9),发现集体经济投资前的系数是负的,由于从社会固定资产投资的组 成來看,它是由国有经济投资,集体经济投资,股份制经济投资和港澳台、外商投资 四个部分组成,所以四个部分对全社会固定资产投资均起到促进作用。因此,主成分 分析结果仍然存在问题。5. 岭回归4岭回归(Ridge estimate)是由Hoerl和Kennard于1970年提出的。自1970年 以來,这种估计的研究和应用得到广泛的重视,称为目前最有影响的一种有偏估计。、"|'|变量之间存在多重共线性,X X «

23、o时,可以设想给X'X加上一个正常数矩阵ld(k>0),那么x'x + kl接近奇异的程度就会比XX接近奇异的程度小得多。与LS 估计0相比,岭估计是把X'X换成X'X + kl得到的。当X呈病态时,X X的特征根至 少有一个非常接近于0。而X'X+kl得特征根4 + k,A + k接近于零的程度就会得到 改善,从而“打破”原來设计阵地复共线性,使岭估计比LS估计有较小的均方误差。考虑量纲问题,先对数据做标准化处理,为了计算方便,标准化后的设计矩阵依 旧用X表示,定义为(k) = (X X + kl f1 X y(10)称(10)式为"的

24、岭回归估计,其中,k为岭参数。2(k)作为"的估计应比最小 二乘估计2稳定,当k = o时的岭回归估计2(0)就是普通最小二乘估计。5.1岭参数选择5首先进行岭迹分析,当岭参数k在(0,s)内变化时,2k)是k的函数,在平面坐 标系上把函数几(k)描画出来,画出的曲线称为龄迹。在实际应用中,可以根据岭迹曲 线的变化形状來确定适当的k值和进行自变量的选择。在岭回归中,龄迹分析可以用来了解各自变量的作用及自变量间的相互关系。岭参数选择中有岭迹法,如果最小二乘估计看來乂不合理之处,如估计值以及正 负号不符合经济意义,则希與能通过采用适当的岭估计2(k)来加以一定程度的改善, 岭参数k值的选

25、择就显得尤为重要。选择k值的一般原则是:1)各回归系数的岭估计基本稳定;2)用最小二乘估计时符号不合理的回归系数,其岭估计的符号变得合理;3)回归系数没有不符合经济意义的绝对值:4)残差半方和增大不多。5.2用岭回归选择变量岭回归的一个重要应用是用它來选择变量,选择变量通常原则是:1)岭回归的计算中,设计矩阵X已经中心化和标准化了,故可直接比较标准化 岭回归参数的大小。可剔除掉标准化岭回归系数比较稳定且绝对值很小的自变 量。2)当k值较小时,标准化岭回归系数的绝对值并不很小,但不稳定,随着k的 增加迅速趋于零。像这样岭回归系数不稳定、震动趋于零的自变量,可以剔除。3)去掉标准化岭回归系数很不稳

26、定的I变量。如果有若干个岭回归系数不稳定, 究竟去掉几个,去掉哪儿个,这并无一般原则,这需根据去掉某个变量后觅新 进行岭回归分析效果确定6。现在使用岭回归对上海市社会固定资产投资进行分析,用SPSS得到以下结果0.600000-0400000-OJOOOOO-o.oooooo-ojoooocr0400000-RIDGE TRACEX2X3*X5o o o8o o Q9 2 0§ a o° o o o n°°O00000000000sSSSSSo8888888880000000200000400000 60000080000100000X7X8K图表2岭迹

27、图从岭迹图中,可以直观的看到,当k = 060时,岭迹大体上达到了稳定。按照岭迹法,应取k = 06。再用岭回归进行变星选择,因为从岭迹图看到口变星X2有较稳定且绝对值较小的 回归系数,根据变星选择第一条原则,该变量应该去掉。门变量X3.X7和X8的岭回归 系数很不稳定,趋于零,因此也考虑去掉。那么最后留下的变ffl xl, x4, X5和X6就 可以去建立一个回归方程。表格12标准化岭回归系数表SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES (K RSQ X1X2 X3X4X5X6X7 X8.00000 .99874.364531.0804

28、88.385014.239004-.394162-.218286.400210.352830.05000 .99706.196166.090514.210683.156721.147452.103906.130070.144510.10000 .99613.185877.076637.179410.155906.148987.123210.133717.144501.15000.99522180968.065808.163718.154192.148053.130662.135109.143948.20000 .99424.177310.057040.154178.152030.146802.

29、134240.135573.143181.25000.99319.174142.049672.147708.149749.145517.136054.135574.142314.30000 .99207.171245.043326.142985.147489.144257.136923.135310.141397.35000 .99087.168536.037768.139347.145309.143033.137233.134882.140455.40000 .98961.165977.032841.136426.143227.141846.137188.134347.139501.4500

30、0 .98828.163546.028436.134002.141250.140693.136909.133739.138543.50000 .98690.161230.024467.131936.139372.139572.136471.133081.137587.55000 .98547.159017.020872.130134.137588.138479.135921.132387.136637.60000 .98398.156899.017601.128534.135891.137413.135292.131669.135693.65000 .98245154868.014611.12

31、7089.134273.136371.134606130933.134758.70000.98087152918.011870.125769.132728.135352.133880.130185.133833.75000.97926151044.009349.124547.131250.134354.133126.129430.132918.80000 .97760.149239.007023.123407.129832.133376.132351.128670.132014.85000 .97591.147500.004874.122335.128470.132416.131563.127

32、909.131121.90000.97418.145822.002883.121319.127159.131475.130766.127147.130239.95000 .97243144201001035.120350.125895.130550.129965.126388.1293691 0000.97064.142634-.000684.119423.124675.129642.129161.125630.128510表12中第1列为岭参数k,第2列是决定系数",第310列是标准化岭回归 系数,其中第1行k二0的数值就是普通最小二乘估计的标准化回归系数。可以看出,当k=0.6时

33、,各岭回归系数2化)趋于稳定。变量X2的岭回归系数迅 速减小,并从正值变为负值,应考虑剔除,与岭迹法所得结果一致。RCGE TRACE0.500000-X4X6O0.250000-'0.000000"OJ50000-o.wxxxxr0.000000.10000000000 300000.40000 O.SOOOO 0.60000图表3去除x2后的岭迹图15RIDGE TRACEX3KX4KX5KX6KX7KXBK no 3 916#0.000000 200000 40000OeOOOO0.80000K图表4去除xl以后的岭迹图从图3中可以看到,变量xl和X5的岭回归系数表很不

34、稳定,且随着k的变化很 快趋于零,所以考虑剔除。然后再进行岭回归,发现去掉xl, X2和X5以后,重新做 岭回归分析,岭迹基本稳定,因此去掉它们是合理的。表格13标准化岭回归系数表R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF KKRSQX3X4X6X7X8.00000.97956.065861.128762.632916-.417154.601832.02000.97796.032560.171293.324366.175440.308153.04000.97734.057860.170875.300127.204926.2743

35、2406000Q7680076701169901285576259202.08000.97628.090939.169070.274982.215349.249919.10000.97578.101981.168400.266686.215887.243332.12000.97529.110738.167849.259911.215556.238257.14000.97480.117810.167376.254216.214807.234133.16000.97432.123606.166954.249324.213846.230658.18000.97383.128413.166563.24

36、5047.212778.227647.20000.97334.132440.166188.241254.211659.224986.22000.97283.135840.165822.237851.210520.222594.24000.97232.138730.165459.234766.209378.220416.26000.97180.141199.165094.231946.208244.218412.28000.97126.143317.164725.229347.207124.216551.30000.97071.145139.164350.226936.206021.214810

37、.32000.97014.146711.163970.224688.204937.213171.34000.96956.148068.163582.222579.203871.211619.3600096896149240.163188.220593.202825.210143.38000.96835.150251.162787.218713.201798.208734.40000.96772.151123.162380.216929.200790.207383.42000.96707.151871.161967.215229.199800.206084.44000.96641.152512.

38、161547.213605.198827.204832.46000.96573.153057.161123.212049.197870.203622.48000.96504.153518.160693.210555.196930.202450.50000.96433.153902.160259.209116.196004.201312.52000.96360.154219.159821.207728.195094.200207.54000.96286.154475.159379.206387.194197.199130.56000.96211.154677.158934.205089.1933

39、14.198080.58000.96134.154830.158486.203830.192444.197056.60000.96055.154937.158035.202607.191586.196054.62000.95975.155005.157582.201418.190740.195074.64000.95894.155036.157127.200261.189905.194114.66000.95812.155034.156670.199133.189082.193172.68000.95728.155001.156212.198033.188269.192249.70000.95

40、642.154941.155752.196958.187466.191342.72000.95556.154855.155292.195907.186673.190452.74000.95468.154746.154831.194879.185890.189576.76000.95379.154616.154369.193873.185116.188715.78000.95289.154467.153908.192886.184351.187867.80000.95197.154300.153446.191919.183595.187032从上述标准化岭回归系数表中得到,岭参数k在0.40.6

41、之间时,岭参数己经基 本稳定,再参照复决定系数R?,当k=o,6时,R2 = 0.96055依然很大,因而可以选取 岭参数k=0.06o然后给定k=0.6,重新作岭回归。表格14 k=0.6时的岭回归Run MATRIX procedure:* Ridge Regression with k = 0.6 *Mult R.9800782RSquare.9605532Adj RSqu.9426229SE31&3021425ANOVA tabledfSSMSRegress5.000 27138249 5427649.9Residual11.000 111447&8 101316.25

42、F valueSig F53.57136360.00000024Variables in the EquationB/SE(B)BSE(B)BetaX3.52143210836499 15493746.2335073X4.9072630.1926096.15803484.7103720X6.1564022.0140460.202607111.1350384X7.3226658.0276231.191585811.6809933X8.2938699.0230909.196053812.7266531Constant853.8749807136.4627396.00000006.2572024得到

43、INV对x3, x4, x6, X7和X8的标准化岭回归方程为INV = 0.1549冯 + 0.1580X4 + 0.2026電 +0.1916x7 + 0.1961 冷(11)未标准化的岭回归方程为INV = 853.8750 + 0.5214 冯 + 0.9073洛 + 0.1564 Xg + 0.3227X, + 0.2939卷 (12)从式(丄2)可得,使用岭回归得出的回归方程是这样解释上海市社会固定资产投 资的形成,在其他变屋保持不变的假定下,其中股份制经济投资每增加一个单位,则 全社会固定资产投资增加0.5214个单位;港澳台、外商投资每增加一个单位,则全社 会固定资产投资增加0

44、.9073个单位;社会存量每增加一个单位,全社会固定资产投资 增加0.1564个单位;财政收入每增加一个单位,全社会固定资产投资增加0.3227个 单位;财政支出每增加一个单位,全社会固定资产投资增加0.2939。6. 三次回归结果比较分析普通最小二乘回归方程为INV = 108.828+0.838西 + 2.035吃 +1.296% +1.372x4-0.122X5 -0.169 +0.674x7 +0.529主成分回归方程为INV = 592.81+0.132络-0.092x2 + 0.147x3 + 0.13+ 0.152电 + 0.15+O.151x7+O.153xg岭回归的回归方程为

45、INV = 853.8750 + 0.5214x3 + 0.9073旨 + 0.1564 + 0.3227% + 0.2939兀表格15回归结果比较方法复相关系数R方调整的R方估计的标准误最小二乘估计0. 9990. 9990. 99766. 658主成分回归0. 9890. 9780. 977203. 2622岭回归0.9800.9610.943318.3021从表(15)可得,最小二乘法的拟合优度最高,且估计的标准误最小。但是综合 以上的分析,可知最小二乘的回归结果最差,多重共线性严重。主成分分析的拟合优度达到了 97%以上,估计标准误为203. 2622,所得结果已经 不存在多重共线性,只是结果的满意度还是较低,可能的原因是回归方程违背了基本 假定中的其他几条,还需要继续分析研究。而岭回归的拟合优度达到了 94%以上,三者之间最小的一个,而估计的标准误达到 318.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论