多元回归分析的步骤_第1页
多元回归分析的步骤_第2页
多元回归分析的步骤_第3页
多元回归分析的步骤_第4页
多元回归分析的步骤_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、三、研究方法本文采取多元线f生回归的方法来设定并建立模型,再利用逐步回归来对变量予以确认 和剔除。逐步回归是通过筛选,挑选偏回归平方和贡献最大的因子建立回归方程,在 决定是 否引入一个新的因素时,回归方程要用方差比进行显著性检验。如果判别该影响 因子通过显 著性检验,那么可选入方程中,否则就不应该进入到回归方程,回归方程中剔除一个变量的 标准也是用方差比进行显著性检验剔除偏回归平方和贡献最小的变量,无论是入选回归方程 还是从回归方程中剔除符合条件的选人项和剔除项为止,逐步回归的方法剔除了对因变量影 响小的因素减小了分析问题的难度,提高了计算效率和回归方程的稳定性有较好的预测精度。运用多元线性回

2、归预测的基本思路是在确定因变量和多个自变量以及它们 之间的尖 系 后,通过设定自变量参数的回归方程对因变量进行预测。具体如下二 C + 3iX 1 + HzX 2 4- + 3nX n式中:丫表示为粮食总产量,c和a为回归系数,C、a是待定参数,X为所选取的影 响因素-多元线性回归方法可分为强行进入法、消去法、向前选择法、向后剔除法和逐步进 入法等,本文运用SPSS22.0软件,对选择的自变量全部进入回归模型,即强行进入法进行 预测。该模型的优点是方法简单、预测速度快、外推性好等。四、分析与结果本文选取6个解释变量,研究河南省粮食产量y,解释变量为:XI粮食播种 面积,X2农 业从业人,X3农

3、用机械总动力,X4农田有效灌溉面积,X5化肥施用折纯量,X6农村用电 量。以河南省粮食产量为因变量,以如上6个解释变量为自变量做多元线性回归(数据选取 2014年河南统计年鉴,见附录一)。用SPSS故变量的相尖分析,从相尖矩阵(表4-1)中可以看出y与自变量的相矢系 数 大多都在() 9以上,说明所选择变量与y高度线性相矢,用y与自变量做多元线性回归是合 适的。X1X2 X3X4X5X6X11.687.965.918.927.970.978X2.6871.686.456.448.731.616X3.965.6861.946.930.990.985X4.918.456.9461.961.921.

4、960X5.927.448.930.9611.901.965X6.970.731.990.921.9011.979y.978.616.985.960.965.9791用SPSS故变量系数分析(表4-2)(常数)-6733.268X18.315X2.155X3-.199X42.619X55.770X61.086表42系数标准错误3146.9692.765.296.1052.6872.4925.174Beta.262.121-.607.1691.047.089-2.1403.007.524-1.901.9742.315.210显著性.041.006.604.068.338.028.835从(表4-

5、2)中可以得到解释变量与因变量之间的方程为:y =-6733.268+8.315X1+ 0.155X2 -0.199X3 +2.619X45.77X5+1.086X6表4-3变异数分析回归残差估计平方和40712064.1261149417.67941861481.805df2834平均值平方6785344.02141050.631165.292显著性.000从(表4-3)中发现F=165.292,说明6个自变量整体对因变量y产生显著 线性影 响。 但从表(4-2)中不难发现农业从业人员、农田有效灌溉面积、农村用电量的P值较大,说明方程某些解释变量并不显著,对没有通过检验的回归系数,在一定程

6、度上说明他们对应的自变量在方程中可有可无,一般为了使模型简化,需要剔除不显著的自 变量,重新建立回归方程。而且粮食播种面积、农业从业人员、农田有效灌溉面积、化肥施 用折纯量、农村用电量对国民总收入起正影响,农用机械总动力却对国民总收入起负影响, 与常识相违背,可能存在多重共线性。应用SPSS进行异方差性检验。用斯皮尔曼相尖系数检验异方差性也就是检验随机误差 项的方差与解释变量观测值之间的相矢性。若相尖系数较高,则存在异方差性,则不能通过 异方差f生检验,此时可能会导致参数OLS估计的方差增大,”佥验失效,预测精度降 低。表4-4相尖Stan dard Error ofX1 X2 X3 X4 X

7、5 X6 P redicted ValueSpeX11.000.441.439.377.434.439-.090armanX2.4411.000.993.952.991.993-.303的rhoX3.439.9931.000.951.9981.000-.277X4.377.952.9511.000.950.951-.258X5.434.991.998.9501.000.998-.294X6.439.9931.000.951.9981.000-.277Standard Error ofP redicted Value-.090-.303 -.277-.258-.294 -.2771.0000.3

8、03 ,从表4-4中发现残差绝对值预与解释变量的皮尔逊相尖系数最高为不能认为残差绝对值与解释变量显著相矢。所以不存在异方差T生。应用SPSS进行自相矢检验。检验自相尖性就是检验针对不同的样本点与随机误差项之间是否不相矢。如果存在某种相尖性,则认为出现了序列相尖性。若存在自相矢 性,参数估计量仍然是线性的、无偏的,但非有效;0LS估计量的被估方差是有偏的且会被低估,因而会使相应的t值变大;甚至模型的t和F统计检验失效;导 致最小二乘估计量对抽样波动非常敏感。首先用杜宾和沃特森检验法来判断其是否存在自相 矢性。表45模型摘要986a 973 967202.609551.616由表45得到DW检验为

9、1.616。查表可知在1%勺上下界中k=6, n=36的dl=0- 99 , du=1.59 ,可知du<DW<4-du该模型不存在一阶自相尖性。从上述已知数据不存在异方差性和一阶自相矢性,用SPSS进行多重共线性检验。若存 在多重共线性,将会引起参数估计量不存在;近似共线性下0LS估计量非有效;参数估计量 经济含义不合理;变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外;模 型的预测功能失效。表4-6系数B标准错误Beta允差VIF(常数) 6733.2683146.969-2.140.041X18.3152.765.2623.007.006.1297.731X2.1

10、55.296.121.524.604.01854.325X3-.199.105-.607-1.901.068.010103.768X42.6192.687.169.974.338.03230.852X55.7702.4921.0472.315.028.005208.612X61.0865.174.089.210.835.005182.444从表4-6中可以发现XI粮食播种面积的VIF明显小于10,说明存在共线性。由于模 型 存在多重共线性,我们对模型进行调整,应用SPSS进行逐步回归来消除多重共线性。表牛7 系数模型B标准错误BetaT显著性(常数)-1945.9211136.720-1.712.097X14.921X54.360.223.8931.287.13722.038.0003.388.002剔除变量x2 , x3, x4 x6后的R2 =0.984可知解释变量与因变量xl粮食播种面积,x5化 肥施用折纯量之间的相尖系数R2 =0.967 ,两者图度相尖,说明拟合程度很高。从表4-7中发 现P值都小于。.5,说明通过显著t生检验。最终得到最最新范本,供参考!优回归方程为:y = -1945.921 + 4.92% +4.36X5通过影响粮食产量因素的多元线性回归分析,最后得到确定的模型表明河南粮食产量受粮食播种面积和化肥施用量的影响最大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论