关于影响GDP的回归分析课程设计.doc_第1页
关于影响GDP的回归分析课程设计.doc_第2页
关于影响GDP的回归分析课程设计.doc_第3页
关于影响GDP的回归分析课程设计.doc_第4页
关于影响GDP的回归分析课程设计.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.关于影响gdp的回归分析摘要:gdp是体现国民增长状况和人民群众客观生活质量的重要指标。为了研究影响gdp的潜在因素,通过收集到的样本数据,运用课本学过的回归分析知识,建立与gdp有影响的自变量与因变量间的多元回归模型,借助统计软件spss对样本做出初等模型,同时结合统计专业知识对初等模型做f检验、t检验、异方差检验以及多从共线性检验等,确立最终的经验回归方程。再通过得到的经验回归方程对未来我国gdp预测,最后通过对做出来的模型分析得出gdp的主要影响因素,结果表明该模型具有较高的拟合度,对提高gdp具有一定的现实意义。关键字:gdp 多元线性回归 检验引言国内生产总值(gross domestic product,简称gdp)是指按市场价格计算的一个国家或地区所有常住单位在一定时期内生产活动最终产品和劳务的价值,是目前用于反映一个国家或地区的经济增长的最重要指标。在当今欧美主导的经济发展理论下,衡量一个国家的综合国力不仅是国家的军事力量、国家影响力,而更看重国家的经济实力,而gdp就是一个国家经济实力的最好表现,具有国际可比性,是联合国国民经济核算体系(sna)中重要的总量指标,为世界各国广泛使用并用于国际比较。众所周知2008年我国的gdp跃居世界第三位,是仅次于美国、日本的第三大经济国,而2009年在金融危机的影响下我国gdp稳中求进,依然保持着9.0%的增长态势。提高gdp已经成为经济发展潮流,利用国家有限资源,推动经济发展势在必行。要保持经济的增长就需要抓住主要因素,提高gdp。一、数据收集从中国统计年鉴得到我国1990-2012年国内生产总值gdp、进出口总额、固定资产投资、年底从业人数的统计数据。数据收集(数据来自中国统计年鉴中国国家统计局网站/):数据基于全国范围内各年年末的数据统计,样本数据见附录1。二、模型设定由数据分析,可初步设定模型为:,其中y表示gdp;表示进出口总额;表示固定资产投资;表示年底从业人数;表示在没有任何因素影响下的gdp值;表示进出口总额对gdp的影响;表示固定资产投资对gdp的影响;表示年底从业人数对gdp的影响;为模型误差。三、参数估计通过普通最小二乘法做全回归得到如下表:表1系数a模型非标准化系数标准系数tsig.共线性统计量b标准 误差试用版容差vif1(常量)-332413.84253316.433-6.235.000进出口总额.387.083.2054.668.000.04820.878固定资产投资.943.047.68719.871.000.07812.886从业人数5.321.785.1396.777.000.2204.549a. 因变量: gdp由表1可得全回归方程为:四、模型的检验与处理(一)自相关检验1.绘制,的的散点图如下:图1 ,的的散点图由图1可看出残差序列随机的分布在第一、二、三、四象限,说明残差序列不存在自相关。2.dw检验表2模型汇总b模型rr 方调整 r 方标准 估计的误差durbin-watson1.999a.998.9986694.6311.817a. 预测变量: (常量), 从业人数, 固定资产投资, 进出口总额。b. 因变量: gdph0:根据样本容量n为25,解释变量的数目k(包括常数项)为4查dw分布表,得到临界值和分别为1.12和1.66。由表2可知dw=1.817,所以,拒绝h0,认为残差序列不存在自相关。(二)异方差的检验与处理1.异方差检验1.1绘制残差图如下:图2 e与x1间的残差图由图1可看出残差e值随x1值的增大而增大,具有明显的规律,认为残差序列存在异方差。图3 e与x2间的残差图由图1可看出残差e值随x2值的增大而增大,具有明显的规律,认为残差序列存在异方差。图4 e与x3间的残差图由图1可看出残差e值随x3值的增大而增大,具有明显的规律,认为残差序列存在异方差。1.2等级相关系数法表3相关系数e进出口总额固定资产投资从业人数spearman 的 rhoe相关系数1.000.518*.484*.484*sig.(双侧).011.019.019n23232323进出口总额相关系数.518*1.000.996*.996*sig.(双侧).011.000.000n23232323固定资产投资相关系数.484*.996*1.0001.000*sig.(双侧).019.000.n23232323从业人数相关系数.484*.996*1.000*1.000sig.(双侧).019.000.n23232323*. 在置信度(双测)为 0.05 时,相关性是显著的。*. 在置信度(双测)为 0.01 时,相关性是显著的。由表3可得,对应p值=0.0110.05,认为残差绝对值与自变量显著相关,存在异方差;,对应p值=0.0190.05,认为残差绝对值与自变量显著相关,存在异方差;,对应p值=0.0190.05,认为残差绝对值与自变量显著相关,存在异方差。2.异方差的处理使用加权最小二乘法消除异方差表4对数似然值b幂-2.000-258.582-1.500-251.595-1.000-244.994-.500-238.830.000-233.244.500-228.9221.000-227.561a1.500-230.5912.000-236.673由表4可知,在m=1时对数似然函数达到极大,因而幂指数m的最优取值为m=1。表5系数未标准化系数标准化系数tsig.b标准误试用版标准误(常数)-384758.79030688.287-12.538.000x1.301.093.160.0493.237.004x2.979.064.627.04115.292.000x36.104.466.269.02113.113.000由表5可知,x1,x2,x3所对应的t检验的p值都小于0.05,认为自变量与因变量有明显的线性关系。加权最小二乘法的回归方程为:表6模型摘要复相关系数.999r 方.998调整 r 方.997估计的标准误.000对数似然函数值46.283由表6可知,r方为0.998接近于1,说明回归方程拟合度好。表7anova平方和df均方fsig.回归.0003.0002766.385.000残差.00019.000总计.00022由表7可知,f值为2766.385,概率p值为0.0000.05,说明回归方程的显著性好。(三)多重共线性的诊断与处理1.多重共线性的诊断表8系数a模型非标准化系数标准系数tsig.共线性统计量b标准 误差试用版容差vif1(常量)-332413.84253316.433-6.235.000进出口总额.387.083.2054.668.000.04820.878固定资产投资.943.047.68719.871.000.07812.886从业人数5.321.785.1396.777.000.2204.549a. 因变量: gdp从表6可看出,x1,x2的方差扩大因子较大,分别为vif1=20.878,vif2=12.886,都大于10,说明这两自变量与其余自变量间存在多重共线性。表9共线性诊断a模型维数特征值条件索引方差比例(常量)进出口总额固定资产投资从业人数113.4071.000.00.00.00.002.5702.446.00.01.03.003.02312.094.004.000103.0501.00a. 因变量: gdp从表7可看出,最大的条件数,说明自变量间存在严重的多重共线性,这与方差扩大因子法的结果一致。表中第4行常量与从业人数的系数都为1,说明二者之间存在很强的多重共线性;表中第3行进出口总额与固定资产投资的系数分别为0.52和0.83,说明二者之间也存在多重共线性。2.多重共性的处理采用主成分回归法消除多重共线性表10解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %12.72290.73890.7382.72290.73890.7382.2488.27999.017.2488.27999.0173.029.983100.000.029.983100.000提取方法:主成份分析。表8中有3个主成分的特征值,最大的是,最小的是。方差百分比反映主成分所能解释数据变异的比例,也就是包含元数据的信息比例。第一个主成分的方差百分比等于90.738%,含有原始3个变量大部分信息量,因此去一个主成分已经足够了。现在用y对前一个主成分做普通最小二乘得到如下表:表11系数a模型非标准化系数标准系数tsig.b标准 误差试用版1(常量)168539.1335442.04030.970.000regr factor score 1 for analysis 1145982.5465564.348.98526.235.000a. 因变量: gdp由表9可得出主成分回归的回归方程:表12模型汇总b模型rr 方调整 r 方标准 估计的误差1.985a.970.96926099.105a. 预测变量: (常量), regr factor score 1 for analysis 1。b. 因变量: gdp由表12可看出,r方为0.97,说明回归方程拟合度好。表13anovab模型平方和df均方fsig.1回归4.688e1114.688e11688.293.000a残差1.430e10216.812e8总计4.831e1122a. 预测变量: (常量), regr factor score 1 for analysis 1。b. 因变量: gdp由表13可看出,f值为688.293,其对应的p值为0.0000.05,说明回归方程是显著的。用第一主成分做因变量,以3个原始自变量为自变量做线性回归,所得的回归系数就是所需要的线性组合的系数。如下表:表10系数a模型非标准化系数标准系数tsig.b标准 误差试用版1(常量)-6.918.000.进出口总额4.603e-6.000.362.固定资产投资3.244e-6.000.350.从业人数8.686e-5.000.337.a. 因变量: regr factor score 1 for analysis 1由表10可得出:还原后的主成分回归方程为:每个回归系数的解释也是非常合理的。五、预测在获得模型参数估计值后,又经过了上述一系列检验而选出的最优(或较优)回归方程,还必须对模型的预测能力加以检验。假设2014年的进出口总额为442497.38亿元,固定资产投资为525176.079亿元,年底从业人数为77031.44万人。由回归方程可得2014年gdp的预测值:参考文献1 苏理云、陈彩霞、高红霞,2012,spss19统计分析基础与案例应用教程,北京希望电子出版社,p158-184附录1年份gdp进出口总额固定资产投资年底从业人数19804545.6570.0910.94236119859016.02066.72543.249873199018667.85560.14517.064749199121781.57225.85594.565491199226923.59119.68080.166152199335333.911271.013072.366808199448197.920381.917042.167455199560793.723499.920019.368065199671176.624133.8(22974.0)68950199778973.026967.224941.169820199884402.326849.728406.270637199989677.129896.229854.771394200099214.639273.232917.7720852001109655.242183.637213.5727972002120332.751378.243499.9732802003135822.870483.555566.6737362004159878.395539.170477.4742642

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论