基于逐步回归分析法的国家财政收入模型分析_第1页
基于逐步回归分析法的国家财政收入模型分析_第2页
基于逐步回归分析法的国家财政收入模型分析_第3页
基于逐步回归分析法的国家财政收入模型分析_第4页
基于逐步回归分析法的国家财政收入模型分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 应用数理统计 中期第一次作业 基于逐步回归分析法的国家财政收入模型分析SY1107409 胡亮(北京航空航天大学机械工程及自动化学院工业与制造系统工程系,北京,100191)【摘要】中国国家财政收入与农业总产值、工业总产值、建筑业总产值、服务业总产值、全国人口总量、成灾面积六个变量有关。本文利用SPSS Statistics对数据对国家财政收入y 与其相关因素进行回归分析。发现六个变量之间存在较强的多重共线性,继而利用逐步回归法对模型进行修改。结果表明,国家财政收入受服务业总产值和全国总人口影响最大。【关键词】财政收入;多重线性;逐步回归法。一 引言逐步回归理论简介在经济模型的建立中,由于经

2、济指标较之一般指标更为综合,包含信息交性强,指标间多重共线性现象在经济模型建立过程中不可避免。多重共线性的存在,一方面使得入选的经济指标作为其他指标的综合反映,无法独立反映与经济总量之间的结构因果关系;另一方面,多重共线性使得统计检验失效,回归模型缺乏稳定性,可靠程度低。因而在进行经济模型建立时,必须充分考虑经济指标变量间的多重共线性问题,保证变量间的相互独立。最常用于克服模型变量的多重共线性问题有三类方法:排除引起共线性的变量;差分法;减小参数估计量的方差。后两类方法都只能减轻多重共线性对模型的影响,而第一类方法,从根本上寻找引起多重共线性的解释变量,将其排除出原模型,因而更为有效。本文将该

3、原理的应用逐步回归方法引入财政收入模型的建立问题中。在应用回归分析去处理实际问题时一个关键问题就是如何选择回归自变量。一般情况下,人们罗列出来可能与因变量有关的自变量往往很多,其中有一些变量对因变量可能没有影响或影响很小。如果在建立回归模型时将这样一些变量都包含进来,不但计算量大,而且估计和预测的精度也会下降。而且某些情况下,许多自变量的观测数据的获得代价较大,如果这些自变量被错误地选进模型,也会引起经济成本的升高。另外,自变量太多,往往存在共线性。正是由于这些原因,在应用回归分析中对进入模型的自变量作精心选择是十分必要的。目前利用逐步回归分析方法即利用自变量和因变量的一系列同步观测数据,通过

4、对相关矩阵的变换和数理统计的假设检验,逐步将显著性的自变量选入回归方程中,同时每引入一个新变量后又要对老变量逐个检查,将变得不显著性的自变量从回归方程中剔除,重复步骤,直到所有模型外的变量都不能引入,模型内的变量都不能被剔除为止,最终建立一个最优回归方程。二 问题的提出在回归分析中,对自变量的选择很重要。逐步回归法能使回归式保留几个最为显著的自变量。我们以财政收入(亿元)为因变量,选择的自变量如下:为农业总产值(亿元);为工业总产值(亿元);为建筑业总产值(亿元);为服务业总产值(亿元);为全国人口总量(万人);为成灾面积(万公顷)(据2011年中国统计年鉴获得各年份的统计数据)。如表1所示,

5、选取1978年、1980年、1985年、1990年至2009年13年的相关统计数据建立回归模型。表2.1 数据统计年份农业总产值工业总产值建筑业总产值服务业总产值全国人口总量(万人)成灾面积(千公顷)财政收入19781117.51607.0138.2872.596259244571132.2619801454.11996.5195.5982.098705297771159.9319852506.43448.7417.92585.0105851227052004.8219904954.36858.0859.45888.4114333178192937.1019915146.48087.11015

6、.17337.1115823278143149.4819925588.010284.51415.09357.4117171258933483.3719936605.114188.02266.511915.7118517231344348.9519949169.219480.72964.716179.8119850313825218.10199511884.624950.63728.819978.5121121222686242.20199613539.829447.64387.423326.2122389212347407.99199713852.532921.44621.626988.112

7、3626303078651934018.44985.830580.5124761251819875.95199914106.235861.55172.133873.41257862673411444.08200013873.640033.65522.338714.01267433437413395.23200114462.843580.65931.744361.61276273179316386.04200214931.547431.36465.549898.91284532716018903.64200314870.154945.57490.856004.71292

8、273251621715.25200418138.465210.08694.364561.31299881629726396.47200519613.477230.810367.374919.31307561996631649.29200621522.391310.912408.688554.91314482463238760.20200724658.1110534.915296.5111351.91321292506451321.78200828044.2130260.218743.2131340.01328022228361330.35200930611.1135239.922398.81

9、47642.11334742123468518.30表2.2 描述统计量N极小值极大值均值标准差农业总产值231117.530611.113256.1448119.4032工业总产值231607.0135239.944301.21140167.4884建筑业总产值23138.222398.86325.5155997.7578服务业总产值23872.5147642.143357.10342249.2402全国人口总量(万人)2396259133474122036.4810351.229成灾面积(千公顷)2316297.31650000000034374.00000000000025392.414

10、630434780004767.928352014070000财 政 收 入231132.2668518.3018062.257419707.80863在解释变量与被解释变量之间一一建立散点图:由散点图可以看出因变量Y(财政收入)与自变量X1(农业总产值),X2(工业总产值),X3(建筑业总产值),X4(服务业总产值)、X5(成灾面积)之间基本存在着线性关系,初步估计建立的是线性模型。三 模型的建立根据题目要求,建立的线性回归分析模型如下:其中, 为因变量的预测值或估计值。,,为自变量。和,为回归系数。为了使以上线性回归分析方法达到最优,就要要求自变量,,首先满足以下两个条件:(1)在线性回归

11、分析模型中, 要包含所有对影响显著的自变量, 消除对影响不显著的自变量;(2)模型包含的各自变量之间不存在多重共线性即各自变量之间不存在线性关系或近似线性关系。表3.1 描述统计量N极小值极大值均值标准差农业总产值231117.530611.113256.1448119.4032工业总产值231607.0135239.944301.21140167.4884建筑业总产值23138.222398.86325.5155997.7578服务业总产值23872.5147642.143357.10342249.2402全国人口总量(万人)2396259133474122036.4810351.229成灾

12、面积(千公顷)2316297.31650000000034374.00000000000025392.414630434780004767.928352014070000财 政 收 入231132.2668518.3018062.257419707.80863首先本文利用社会统计学软件SPSSl3.0,对所有因素进行相关分析,采用Pearson相关系数,输出结果如下:表3.2 相关性财 政 收 入农业总产值工业总产值建筑业总产值Pearson 相关性财 政 收 入1.000.929.989.991农业总产值.9291.000.968.962工业总产值.989.9681.000.993建筑业总产

13、值.991.962.9931.000服务业总产值.995.958.997.996全国人口总量(万人).702.882.779.756成灾面积(千公顷)-.246-.181-.217-.225Sig. (单侧)财 政 收 入.000.000.000农业总产值.000.000.000工业总产值.000.000.000建筑业总产值.000.000.000.服务业总产值.000.000.000.000全国人口总量(万人).000.000.000.000成灾面积(千公顷).129.205.160.152N财 政 收 入23232323农业总产值23232323工业总产值23232323建筑业总产值232

14、32323服务业总产值23232323全国人口总量(万人)23232323成灾面积(千公顷)23232323服务业总产值全国人口总量(万人)成灾面积(千公顷)Pearson 相关性财 政 收 入.995.702-.246农业总产值.958.882-.181工业总产值.997.779-.217建筑业总产值.996.756-.225服务业总产值1.000.761-.213全国人口总量(万人).7611.000-.051成灾面积(千公顷)-.213-.0511.000Sig. (单侧)财 政 收 入.000.000.129农业总产值.000.000.205工业总产值.000.000.160建筑业总产

15、值.000.000.152服务业总产值.000.164全国人口总量(万人).000.408成灾面积(千公顷).164.408.N财 政 收 入232323农业总产值232323工业总产值232323建筑业总产值232323服务业总产值232323全国人口总量(万人)232323成灾面积(千公顷)232323表3.2中每一组数字由上到下分别表示:Pearson相关系数、单边检验的显著性概率和样本的个数。本文主要考察农业总产值、工业总产值、建筑业总产值、服务业总产值、全国人口总量和成灾面积与财政收入的关系,因此主要分析财政收入所在行即可。分析发现前四个因素相关性很大,最后一个因素相关性较大。为了更

16、全面的考察问题,避免遗漏重要因素的影响,本文初步假设不剔除变量。简单对数据进行回归分析,所得输出结果入下: 表3.3给出了全模型检验的值、值的单边检测的显著性水平。表3.3 Anovah模型平方和df均方FSig.1回归8.457E918.457E92029.418.000a残差87513730.085214167320.480总计8.545E9222回归8.519E924.259E93288.446.000b残差25905377.541201295268.877总计8.545E9223回归8.524E932.841E92661.020.000c残差20288558.689191067818.

17、878总计8.545E9224回归8.529E942.132E92475.536.000d残差15504363.24518861353.514总计8.545E9225回归8.529E932.843E93325.699.000e残差16241363.20619854808.590总计8.545E9226回归8.533E942.133E93387.547.000f残差11335743.75918629763.542总计8.545E9227回归8.536E951.707E93319.359.000g残差8743382.27317514316.604总计8.545E922a. 预测变量: (常量),

18、服务业总产值。b. 预测变量: (常量), 服务业总产值, 全国人口总量(万人)。c. 预测变量: (常量), 服务业总产值, 全国人口总量(万人), 农业总产值。d. 预测变量: (常量), 服务业总产值, 全国人口总量(万人), 农业总产值, 建筑业总产值。e. 预测变量: (常量), 服务业总产值, 农业总产值, 建筑业总产值。f. 预测变量: (常量), 服务业总产值, 农业总产值, 建筑业总产值, 工业总产值。g. 预测变量: (常量), 服务业总产值, 农业总产值, 建筑业总产值, 工业总产值, 成灾面积(千公顷)。h. 因变量: 财 政 收 入表3.4给出了全模型的回归系数。根据

19、表3,所得回归模型的结果为:表3.4 系数a模型非标准化系数B标准 误差1(常量)-2058.496616.989服务业总产值.464.0102(常量)26337.3004131.660服务业总产值.511.009全国人口总量(万人)-.249.0363(常量)15964.7155875.980服务业总产值.560.023全国人口总量(万人)-.141.058农业总产值-.380.1664(常量)7798.0586313.396服务业总产值.443.054全国人口总量(万人)-.058.063农业总产值-.659.190建筑业总产值1.087.4615(常量)1979.063531.794服务

20、业总产值.426.051农业总产值-.815.089建筑业总产值1.327.3806(常量)2206.134463.649服务业总产值.227.084农业总产值-.994.100建筑业总产值1.550.336工业总产值.211.0767(常量)4104.637943.741服务业总产值.267.078农业总产值-.946.093建筑业总产值1.398.311工业总产值.181.070成灾面积(千公顷)-.077.034表3.5模型汇总h模型RR 方调整 R 方标准估计误差1.995a.990.9892041.401602.998b.997.9971138.098803.999c.998.997

21、1033.353224.999d.998.998928.091335.999e.998.998924.558596.999f.999.998793.576427.999g.999.999717.15870a. 预测变量: (常量), 服务业总产值。b. 预测变量: (常量), 服务业总产值, 全国人口总量(万人)。c. 预测变量: (常量), 服务业总产值, 全国人口总量(万人), 农业总产值。d. 预测变量: (常量), 服务业总产值, 全国人口总量(万人), 农业总产值, 建筑业总产值。e. 预测变量: (常量), 服务业总产值, 农业总产值, 建筑业总产值。f. 预测变量: (常量),

22、服务业总产值, 农业总产值, 建筑业总产值, 工业总产值。g. 预测变量: (常量), 服务业总产值, 农业总产值, 建筑业总产值, 工业总产值, 成灾面积(千公顷)。h. 因变量: 财 政 收 入表3.5为模型小结。列出了回归方程常用统计量,回归方程复相关系数、系数、修正的系数,估计的标准误差等。可以看出随着模型中自变量个数的增加,系数的值也在不断增加,估计的标准误差不断降低。一般地,修正的值能较确切地反映拟合度。修正的值越大拟合程度越高。四 模型的解释图 4.1图4.1为带有正态曲线的标准化残差直方图。从中可以看到绝大部分观测量随机的落在正态曲线内,我们可以认为回归方程拟合的效果较好。另一

23、方面从所给的六个自变量中我们经过逐步回归得到两个对国家财政收人影响较显著的自变量即服务业总产值和建筑业总产值对财政收人影响显著。服务业总产值方面,在国家扩大内需、刺激消费的各项政策措施积极作用下,国内消费市场活跃,调动了人们的购买消费热情,拉动了国民经济的增长。建筑业方面,近年来房地产行业已经成为我国经济收入的主要来源,房价的升高构成了我国国民经济收入很大的一部分,同时住房问题是人们都亟待解决的问题,人们购买热情的提高也极大的促进了经济的增长。五 逐步回归法分析为了解决以上两个问题, 最有效的方法是采用逐步回归分析方法。其基本思想是在所考虑的全部因素中, 按其对作用显著程度的大小, 由大到小地

24、逐个引入到回归方程中,而那些对作用不显著的变量可能自始至终都未被引入到回归方程中。另一方面, 已被引入到回归方程的变量在引入新的变量后也可能因为转变成对作用不显著因素而被剔除。六 结论从统计数据可以看出,服务业作为第三产业对我国财政收入的影响很大,我们知道传统的产业部门已经趋于饱和,想要有所突破已经越来越困难,发展空间有限,而第三产业是三大产业中最具有发展潜力的产业,这说明我们的发展还不够充分,需要加快第三产业的发展。加快第三产业是我国率先实现现代化的客观要求。第三产业发展水平是衡量现代经济社会发达程度的重要标志,许多发达国家和地区的发展经验表明,当经济发展到一定阶段时,第三产业的发展速度普遍

25、高于第一产业和第二产业。我国的经济发展在总体上处于工业化的中后期阶段,不失时机地加快第三产业发展具有深远的战略意义。加快发展第三产业是促进就业和提高人民生活水平的重要手段。第三产业行业多、门类广,是吸纳劳动力就业的重要载体。随着经济发展和生活水平的提高,消费需求不断创新和升级,第三产业将成为我国新的经济增长点,其加快发展将充分满足人民群众日益增长的物质和文化生活的需要。政策建议:1.重点发展交通、邮电等“瓶颈”产业。随着市场经济的发展,交通、邮电业等流通领域已成为沟通城乡,连接国民经济各部门、各地区的纽带。我国的交通邮电基础设施相对薄弱,运输工具陈旧落后,远不能适应大流通的需要,今后应加强交通、邮电等基础行业的投入、引进先进设备对现有设备进行技术改造,吸纳多种经济成分参与发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论