财政收入的逐步回归分析_第1页
财政收入的逐步回归分析_第2页
财政收入的逐步回归分析_第3页
财政收入的逐步回归分析_第4页
财政收入的逐步回归分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

财政收入的逐步回归分析摘要:财政收入是国民经济基础,是实现国家职能的财力保证。本文采用SPSS19.0多元统计软件中的逐步回归分析方法,得出影响我国财政收入的显著性变量,建立国家财政收入回归模型,并将所得的模型给予合理的经济解释。关键词:财政收入;逐步回归;显著性;SPSS 1.引言财政收入是指国家财政参与社会产品分配所取得的收入,是实现国家职能的财力保证1。一方面,国家可通过控制财政收入的计划和执行情况,起到宏观调控的效果;其次,在安排和预测财政一般收入的过程中,也能够了解到经济系统的变化过程,从而及时发现经济系统运行中可能存在的问题并加以纠正;此外,通过对财政一般收入中的各分项收入进行预测,能够及时地发现现行税制和政策是否适应经济发展情况,产业结构是否合理。因此,有必要建立一套科学的国家财政收入模型使收入预算尽量适应经济形势的变化,及时反映政府的宏观经济政策和政府活动对经济的影响。本文选取1990年-2009年20个年度的国家财政收入数据,采用线性回归中的逐步回归方法,利用SPSS多元统计软件得出影响我国财政收入的显著性变量,建立国家财政收入回归模型,并将所得的模型给予合理的经济解释。2.提出问题2.1 提出自变量与因变量从定性分析的角度来说,财政收入会受到各种不同因素的影响,如:农业总产值、工业总产值、建筑业总产值、人口数、社会消费品零售总额、国土受灾面积等等。本文选取财政收入y(亿元)为因变量,自变量选取如下:第一产业国内生产总值x1(亿元), 第二产业国内生产总值x2(亿元),第三产业国内生产总值x3(亿元), 人口数x4(万人),社会消费品零售总额x5(亿元),受灾面积x6(万公顷)。由中国统计年鉴获取20个年份的统计数据,见表1。表1 1990-2009年财政收入与部分项目的统计数据年份yx1x2x3x4x5x61990 2937.10 5062.00 7717.40 5888.42 8300.1 38474.00 1991 3149.48 5342.20 9102.20 7337.10 9415.6 55472.00 1992 3483.37 5866.60 11699.50 9357.38 10993.7 51332.00 1993 4348.95 6963.76 16454.43 11915.73 14270.4 48827.00 1994 5218.10 9572.69 22445.40 16179.76 18622.9 55046.00 1995 6242.20 12135.81 28679.46 19978.46 23613.8 45824.00 1996 7407.99 14015.39 33834.96 23326.24 28360.2 46991.00 1997 8651.14 14441.89 37543.00 26988.15 31252.9 53427.00 1998 9875.95 14817.63 39004.19 30580.47 33378.1 50145.00 1999 11444.08 14770.03 41033.58 33873.44 35647.9 49979.50 2000 13395.23 14944.72 45555.88 38713.95 39105.7 54688.00 2001 16386.04 15781.27 49512.29 44361.61 43055.4 52214.60 2002 18903.64 16537.02 53896.77 49898.90 48135.9 46946.10 2003 21715.25 17381.72 62436.31 56004.73 52516.3 54505.80 2004 26396.47 21412.73 73904.31 64561.29 59501.0 37106.26 2005 31649.29 22420.00 87598.09 74919.28 67176.6 38818.23 2006 38760.20 24040.00 .54 88554.88 76410.0 41091.41 2007 51321.78 28627.00 .36 .95 89210.0 48992.35 2008 61330.35 33702.00 .44 .99 .1 39990.03 2009 68518.30 35226.00 .78 .09 .4 47213.69 2.2做散点图,设定理论模型作数据散点图,并进行线性拟合,观察因变量与自变量之间关系是否有线性特点。散点图和线性拟合结果如图1所示。(b)(d)(c)(a)(e)(f)图1因变量与各自变量的散点图(a)财政收入与第一产业国内生产总值散点图,R2线性=0.933;(b)财政收入与第二产业国内生产总值散点图;R2线性=0.986(c)财政收入与第三产业国内生产总值散点图,R2线性=0.993;(d)财政收入与人口数散点图,R2线性=0.784;(e)财政收入与社会消费品零售总额散点图,R2线性=0.979;(f)财政收入与受灾面积散点图,R2线性=0.152;从图1中不难发现,财政收入与第一产业国内生产总值、第二产业国内生产总值、第三产业国内生产总值、社会消费品零售总额及人口数具有较强的线性关系,而与受灾面积没有明确的线性关系。决定系数R2线性由大到小顺序为:Y-x3;Y-x2; Y-x5;Y-x1; Y-x4;Y-x6。我们知道由决定系数R2开方即为线性相关系数R。线性相关系数越接近于1,Y与X的线性相关程度就越大,线性趋势越明显。显然,财政收入和受灾面积的线性趋势并不明显,用线性回归模型方法来研究变量关系不太合理,故剔除变量x6。(事实上,这样5个变量用逐步回归分析得到的结果与全部自变量的结果相同。这也从另一方面验证了逐步回归模型的科学性。)而其他5个自变量与因变量财政收入均是高度线性相关的,故用线性回归是合适的。这样,我们可以建立财政收入的线性回归模型,模型如下:Y=a+b1x1+b2x2+b5x5 (1)其中Y为因变量, x1,x2,x5,为自变量,a和b1,b2,b5为回归系数。各变量符号的定义见表2。表2 线性回归模型中各变量的含义财政收入(亿元)第一产业国内生产总值(亿元)第二产业国内生产总值(亿元)第三产业国内生产总值(亿元)人口数(万人)社会消费品零售总额(亿元)但问题是所有与因变量呈强线性关系的这5个自变量都是显著性变量,都会在回归模型中?若这5个变量间有多重共线性关系将如何进行线性回归模型拟合? 3解决问题的方法和计算结果为解决以上两个问题,我们对实验数据采取线性回归中的逐步回归方法。3.1 逐步回归分析方法简介逐步回归(Stepwise Regression)是一种常用的消除多重共线性、选取 “最优”回归方程的方法,在进行自变量选择时优于其他的回归方法(如前进法、后退法等)。具体做法是将逐个引入自变量,引入的条件是该自变量经F检验是显著的,每引入一个自变量后,对已选入的变量进行逐个检验,如果原来引入的变量由于后面变量的引入而变得不再显著,那么就将其剔除。引入一个变量或从回归方程中剔除一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新变量之前回归方程中只包含显著的变量。这个过程反复进行,直到既没有不显著的自变量选入回归方程,也没有显著自变量从回归方程中剔除为止。23.2 线性回归的结果及分析将输入移去的变量列入表3。从表3中可以看出第三产业国内生产总值(亿元),人口数(万人),社会消费品零售总额(亿元)这三个自变量经过逐步回归过程被选择进入了回归方程。选择的判据是变量进入回归方程的F的概率不大于0.05,剔除的判据是变量进入回归方程的F的概率不小于0.10。选择的过程是,最先引入了变量,建立了模型1;接着引入变量,没有变量被剔除,建立了模型2(含有、);最后引入变量,没有变量被剔除,建立了模型3,故最终的模型中含有变量、。表3 输入移去的变量a模型输入的变量移去的变量方法1第三产业国内生产总值(亿元).步进(准则: F-to-enter 的概率 = .100)。2人口数(万人).步进(准则: F-to-enter 的概率 = .100)。3社会消费品零售总额(亿元).步进(准则: F-to-enter 的概率 = .100)。a. 因变量: 财政收入(亿元)表4 模型汇总d模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.996a.993.9921755.03733.9932446.208118.00021.000b.999.999483.34885.007220.314117.00031.000c1.0001.000250.48691.00047.299116.000a. 预测变量: (常量), 第三产业国内生产总值(亿元)。b. 预测变量: (常量), 第三产业国内生产总值(亿元), 人口数(万人)。c. 预测变量: (常量), 第三产业国内生产总值(亿元), 人口数(万人), 社会消费品零售总额(亿元)。d. 因变量: 财政收入(亿元)表4显示各模型的拟合情况,模型3的复相关系数R=1.000,可决系数=1.000,调整可决系数为1.000,标准估计的误差为250.48691。可见模型3的拟合度较高,变量、的作用显著。表5 方差分析 Anovad模型平方和df均方FSig.1回归7.535E917.535E92446.208.000a残差.77318.043总计7.590E9192回归7.586E923.793E916235.715.000b残差.82417.107总计7.590E9193回归7.589E932.530E940318.220.000c残差.0581662743.691总计7.590E919a. 预测变量: (常量), 第三产业国内生产总值(亿元)。b. 预测变量: (常量), 第三产业国内生产总值(亿元), 人口数(万人)。c. 预测变量: (常量), 第三产业国内生产总值(亿元), 人口数(万人), 社会消费品零售总额(亿元)。d. 因变量: 财政收入(亿元)表5显示各模型的方差分析结果。方差分析结果表明,当回归方程为模型1、2、3时,其显著性概率值均小于0.000,即拒绝总体回归系数均为0的原假设。因此,最终的回归方程应当包含这、这3个自变量,且方程拟和效果很好。表6显示方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数Partial Correlation、共线性统计的容差Collinearity statistic Tolerance。可见,模型3方程外的各变量偏回归系数经检验,P值均大于0.05,故不能引入方程。已排除的变量d模型Beta IntSig.偏相关共线性统计量容差VIF最小容差1第一产业国内生产总值(亿元)-.326a-4.390.000-.729.03727.312.037第二产业国内生产总值(亿元)-.288a-.949.356-.224.004226.482.004人口数(万人)-.174a-14.843.000-.964.2234.478.223社会消费品零售总额(亿元)-.487a-2.240.039-.477.007142.547.0072第一产业国内生产总值(亿元)-.074b-2.105.051-.466.02148.303.021第二产业国内生产总值(亿元).042b.476.641.118.004243.501.004社会消费品零售总额(亿元)-.245b-6.877.000-.864.007153.208.0073第一产业国内生产总值(亿元)-.009c-.391.701-.100.01663.380.005第二产业国内生产总值(亿元).016c.353.729.091.004245.232.002a. 模型中的预测变量: (常量), 第三产业国内生产总值(亿元)。b. 模型中的预测变量: (常量), 第三产业国内生产总值(亿元), 人口数(万人)。c. 模型中的预测变量: (常量), 第三产业国内生产总值(亿元), 人口数(万人), 社会消费品零售总额(亿元)。d. 因变量: 财政收入(亿元)表7显示各模型的偏回归系数B、标准差Std. Error、常数Constant、标准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。按照线性回归模型建立的方程为:Y=62835.600+0.661x3-0.547x4-0.141x5 (2)方程中的常数项,偏回归系数、,经t检验、的P值均为0.000,按=0.10水平,均有显著性意义。表7 系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准 误差试用版零阶偏部分容差VIF1(常量)-3084.353618.453-4.987.000第三产业国内生产总值(亿元).476.010.99649.459.000.996.996.9961.0001.0002(常量)66585.5044696.87914.177.000第三产业国内生产总值(亿元).550.0061.15097.945.000.996.999.543.2234.478人口数(万人)-.585.039-.174-14.843.000.839-.964-.082.2234.4783(常量)62835.6002494.39525.191.000第三产业国内生产总值(亿元).661.0171.38440.066.000.996.995.115.007144.290人口数(万人)-.547.021-.163-25.813.000.839-.988-.074.2084.813社会消费品零售总额(亿元)-.141.021-.245-6.877.000.989-.864-.020.007153.208a. 因变量: 财政收入(亿元)表8 残差统计量a极小值极大值均值标准 偏差N预测值3040.945168788.171920556.745519985.7077420标准 预测值-.8762.413.0001.00020预测值的标准误差75.598209.508105.43838.82020调整的预测值3008.193669416.562520605.941520091.2599220残差-336.33871437.84424.00000229.8625520标准残差-1.3431.748.000.91820Student 化残差-2.2222.105-.0671.13620已删除的残差-920.68561636.11237-49.19601385.5276420Student 化已删除的残差-2.5872.397-.0721.24120Mahal距离.78112.3422.8503.28520Cook 的距离.0002.249.265.67020居中杠杆值.041.650.150.17320a. 因变量: 财政收入(亿元)表8显示残差统计的结果,标准化残差的绝对值最大为1.748,小于设定值3。如超过3,则显示具体观察单位Case number 的标准化残差,以帮助发现离群点。图2财政收入的预测值与其Student化残差散点图从图2中可以看到,所有观测量随机地落在垂直围绕-12.5的范围内,预测值与Student化残差值之间没有明显的关系,所以回归方程应该满足线性与方差齐性的假设且拟和效果较好。图3带有正态曲线的标准化残差直方图从图3中可以看到绝大部分观测量随机地落在正态曲线内,同样,我们可以认为回归方程拟合的效果较好。4讨论4.1 模型检验按照线性回归模型建立的方程为:Y=62835.600+0.661x3-0.547x4-0.141x5 (2)将1990-2009年的第三产业国内生产总值(亿元), 人口数(万人), 社会消费品零售总额(亿元)代入公式(2),并计算与实际财政收入的相对误差,见表9。表9 1990-2009年预测与实际财政收入对比结果年份预测财政收入(亿元)实际财政收入(亿元)相对误差199030172937.10-0.03199130033149.480.05199233783483.370.03199338714348.950.11199453475218.10-0.02199564596242.20-0.03199673097407.990.01199786458651.140.001998100999875.95-0.0219991139511444.080.0020001358313395.23-0.0120011627616386.040.0120021876818903.640.0120032176321715.25-0.0020042601826396.470.0120053136231649.290.0120063869538760.200.0020075158651321.78-0.0120086081861330.350.0120096870968518.30-0.00注:相对误差=1-预测财政收入(亿元)/实际财政收入(亿元).从上述表中的可以看出相对误差绝对值最大为0.11,最小为0.00,大部分为0.01、0.02、0.03,可见我们的模型与实际特别是近期还是比较吻合的,但是也有许多不足之处。可能是我们对财政收入的影响因素考虑过少,这也是我们以后对模型改进时所要考虑的方面。4.2 模型解释从公式(2)中可知,回归模型中第三产业对财政收入的影响最为显著。这正与国家积极调整产业结构,倡导服务业全面发展的经济政策相符合。第三产业发展迅速,增加了国家收入弹性,特别是金融、期货交易、房地产业、仓储物流业、软件等现代服务业和高薪产业的发展及近年来08奥运会、亚运会、世博会对旅游业的带动,极大提高了服务业对财政收入的贡献。而人口数对财政收入的贡献为负线性关系。这与近年来我国人口老龄化趋势,人口基数仍在上涨及社会福利提高有关。众所周知,人口基数不变或稍微增大时,人口老龄化,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论