




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用数理统计国家财政收入的回归分析院(系)名称 专 业 名 称 学 生 姓 名任 课 教 师 2013年12月目 录摘 要1符号说明11引言12解决问题的方法和计算结果3 2.1 样本数据的选取与整理3 2.2 模型的建立与分析4 2.3 分析结果93 结论10参考文献11国家财政收入的多元线性回归模型摘要:本文以多元线性回归为出发点,选取了我国自1990至2011年间的财政收入为因变量,并初步选取了6个影响因素,进一步利用统计软件SPSS对以上数据进行了筛选,采用多元逐步线性回归的方法,从而找到了能反映财政收入与各因素之间关系的“最优”回归方程: 进而得出结论,国家财政收入与建筑业、工业总产
2、值和人口数具有显著地线性关系。关键词:多元逐步线性回归;财政收入;SPSS0符号说明变 量符号 财政收入(亿元)Y工业总产值(亿元)X1 农业总产值(亿元)X2受灾面积(万公顷)X3 建筑业总产值(亿元)X4 人口总数(万人)X5 社会商品销售总额(亿元)X61 引言 改革开放以来,我国的国民经济取得了快速发展,经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府根据国家的财政收入,通过预算安排,用于环境保护、社会保障以及政府行政管理等,从而不断提高人民的生活水平,早日实现中华民族的伟大复兴。因此,为了更好地制订下一年的财政税收政策,研究影响国家财政收入
3、的主要因素是十分必要的。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,进而对他们之间的关系作一下回归,从而通过已有的数据建立最优的线性回归模型。建立最优的线性回归模型,一方面要求该模型包含所有对因变量财政收入有显著影响的自变量,另一方面要求该模型中所包含的自变量个数尽可能的少,不含无意义的变量。选择最优模型的方法很多,但各有利弊。全部比较法是把所有可能的自变量的各种组合方式回归方程都求出来,然后比较,选出最优的。对于变量数较少时,该方法比较有优势,但当随着变量数的增加,该方法的计算量也变得越来越大,使得该方法不太实用。向后法,也称为只出不进法,在不
4、显著的变量比较少时常常采用该方法,但在开始建立方程可能自变量过多,计算繁琐,现在也不太常用。向前法,也称只进不出法,由于其本身的特点,使得变量一旦引入方程,就不会剔除。这样得到的模型,由于变量间可能存在相关关系,故不能保证所有的变量都是显著。本文采用的是逐步回归法,也成为有进有出法,它是向前法和向后法的一种结合,克服了前两种方法的缺点,将变量一一引入,每引入一个变量后都要对老变量进行逐个检验,将变得不显著的变量从回归模型中剔除,保证了模型含有的都是有显著影响的自变量。 本文首先分析了可能影响财政收入的因素,找到最有可能的因素,包括工业总产值,农业总产值,建筑业总产值,社会商品销售总额,人口数,
5、受灾面积等。然后从国家统计数据网上查取了1990-2011年这22年间的年度财政收入及主要影响因素的数据,利用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。在寻找最优回归方程过程中,首先以国家财政收入为因变量,以工业总产值,农业总产值,建筑业总产值,社会商品销售总额,人口数,受灾面积分别为自变量,绘制散点图,初步判断财政收入与各因素之间是否具有线性关系。为了更加直观的分析财政收入与各因素的关系,利用SPSS软件计算了各个变量之间的相关系数,定量的分析了财政收入与各因素之间的相关性大小。最后,为了得到最佳回归模型以及最优回归方程,利用SPSS软件对
6、该数据进行深层次的分析,利用逐步回归分析原理,求得了最优回归方程,并对其残差进行分析,来进一步检验回归模型的拟合性。2解决问题的方法和计算结果2.1 样本数据的选取与整理本文在进行统计时,查阅国家统计数据网中国统计年鉴2012中收录的1990年至2011年连续22年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这20年的工业总产值,农业总产值,建筑业总产值,社会商品销售总额,人口数和受灾面积等因素为自变量,分析它们之间的联系。根据选择的指标,从国家统计数据网查选数据,整理如表2-1所示。表2-1 1990-2011年财政收入及其影响因素统计表工业(亿元)
7、农业(亿元)受灾面积(千公顷)建筑业(亿元)人口(万人)社会商品零售总额(亿元)财政收入(亿元)199018689.227662.13847413451143338300.12937.1199122088.688157554721564.31158239415.63149.48199227724.219084.7513322174.411717110993.73483.3719933969310995.5488273253.511851714270.44348.95199451353.0315750.5550464653.311985018622.95218.1199554946.862034
8、0.9458245793.812112123613.86242.2199662740.1622353.7469918282.212238928360.27407.99199768352.6823788.4534279126.512362631252.986511424541.9501451006212476133378.19875.95199972707.0424519912578635647.911444.08200085673.6624915.85468812497.612674339105.713395.23200195449.0261
9、79.65221515361.512762743055.416386.042002110776.527390.846946 18527.112845348135.918903.642003142271.229691.854506 23083.812922752516.321715.252004187220.7362393710629021.451299885950126396.472005251619.539450.93881834552.013075668352.631649.292006316588.940810.84109141557.113144879145.238760.220074
10、05177.148892.94899251043.713212993571.651321.7820085074485800281132802114830.161330.35200954831160361.04721476807.74133450132678.468518.30201069859169319.83742696031.13134091156998.483101.51201184426981303.932471116463.32134735183918.6103874.432.2 模型的建立与分析2.2.1 散点图为了直观地观察各因素与财政收入之间是否具有线
11、性关系。根据表2-1的数据画出各个因素与国家财政收入的散点图如图2-1所示。 (a) (b) (c) (d) (e) (f) 图2-1 各因素与国家财政收入的散点图 由图2-1各因素与国家财政收入的散点图可以得到,工业总产值、农业总产值、建筑业以及社会商品零售总额与国家财政收入基本上具有良好的线性关系,国家财政收入与人口总数具有正比关系,由于人口总数成指数增长模型,初步认为人口总数与国家财政收入不具有明确的线性关系。另外,由图c,国家财政收入与受灾面积也不具有明确线性关系。2.2.2 相关性研究 为了进一步的确定国家财政收入与工业总产值、农业总产值、受灾面积、建筑业、人口总数及社会商品零售总额
12、之间是否具有显著的相关性,下面通过SPSS软件来计算各因素间的相关系数大小,定量的研究各因素与财政收入的相关性。 表2-2 各因素与国家财政收入的相关性检验财政收入工业总产值农业总产值受灾面积建筑业财政收入Pearson 相关性1.998*.981*-.636*.998*显著性(双侧).000.000.001.000N2222222222工业总产值Pearson 相关性.998*1.974*-.644*.997*显著性(双侧).000.000.001.000N2222222222农业总产值Pearson 相关性.981*.974*1-.622*.979*显著性(双侧).000.000.002.
13、000N2222222222受灾面积Pearson 相关性-.636*-.644*-.622*1-.643*显著性(双侧).001.001.002.001N2222222222建筑业Pearson 相关性.998*.997*.979*-.643*1显著性(双侧).000.000.000.001N2222222222人口总数Pearson 相关性.820*.794*.898*-.456*.812*显著性(双侧).000.000.000.033.000N2222222222社会零售商品总额Pearson 相关性.996*.991*.992*-.623*.996*显著性(双侧).000.000.00
14、0.002.000N2222222222相关性人口总数社会零售商品总额财政收入Pearson 相关性.820.996*显著性(双侧).000.000N2222工业总产值Pearson 相关性.794*.991显著性(双侧).000.000N2222农业总产值Pearson 相关性.898*.992*显著性(双侧).000.000N2222受灾面积Pearson 相关性-.456*-.623*显著性(双侧).033.002N2222建筑业Pearson 相关性.812*.996*显著性(双侧).000.000N2222人口总数Pearson 相关性1*.858*显著性(双侧).000N2222社
15、会零售商品总额Pearson 相关性.858*1*显著性(双侧).000N2222*. 在 .01 水平(双侧)上显著相关。*. 在 0.05 水平(双侧)上显著相关。从上表数据可知,国家财政收入与工业总产值的相关系数为0.998,与农业总产值的相关系数为0.981,与建筑业的相关系数为0.998,与人口总数相关系数为0.820,与社会零售商品总额的相关系数为0.996,它们的概率P值都小于显著性水平,应拒绝零假设,认为两总体之间存在线性相关关系。而财政收入与受灾面积的相关系数为0.636,相关性较小。2.2.3逐步线性回归分析为了得到最优回归方程,因此,选取国家财政收入作为因变量,工业总产值
16、、农业总产值、人口数、受灾面积、建筑业及社会零售商品总额作为自变量,利用逐步回归的方法,采用SPSS软件对上述变量进行回归分析,所得结果如下所示。表2-3输入移去的变量模型输入的变量移去的变量方法1建筑业X4.步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。2工业总产值X1.步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。3人口总数X5.步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .
17、100)。a. 因变量: 财政收入Y 通过逐步回归产生的三种模型1、2、3,模型1的自变量只有X4,模型2的自变量有X4和X1,模型3的自变量有X5、X4和X1。表2-3显示变量的引入和剔除,以及引入或剔除的标准。选择的判据是变量进入回归方程的F的概率不大于0.05,剔除的判据是变量进入回归方程的F的概率不小于0.10。表2-4 模型汇总模型RR 方调整 R 方标准 估计的误差1.998a.996.9961818.225272.999b.997.9971527.186803.999c.998.9981280.91570a. 预测变量: (常量), 建筑业X4。b. 预测变量: (常量), 建筑
18、业X4, 工业总产值X1。c. 预测变量: (常量), 建筑业X4, 工业总产值X1, 人口总数X5。d. 因变量: 财政收入Y表2-4显示了各模型的拟合情况。模型3的自相关系数(R)为0.999,判断系数为0.998。从统计变量的改变看,模型1的改变值绝对大于其他两个模型,这说明与该模型相关的自变量X4是因变量很好的预测。表2-5 方差分析表Anova模型平方和df均方FSig.1回424117410626645.4245266.463.000b残差66118862.541203305943.127总965212回
19、82828716215908.4143737.177.000c残差44313691.136192332299.533总965213回54735815737365.8493544.571.000d残差29533410.418181640745.023总96521a. 因变量: 财政收入Yb. 预测变量: (常量), 建筑业X4。c. 预测变量: (常量), 建筑业X4, 工业总产值X1。d. 预测变量: (常量), 建筑业X4, 工业总产值X1, 人口总数X5。 由表2-5可知,模型3的P值为0.00<0.05,
20、拒绝原假设,认为因变量与其他三变量X4、X1和X5之间有线性关系。表2-6 回归系数模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)1724.308522.8553.298.004建筑业X4.883.012.99872.570.0002(常量)1631.011440.2223.705.002建筑业X4.493.128.5573.850.001工业总产值X1.053.017.4423.058.0063(常量)-27809.8909816.072-2.833.011建筑业X4.348.118.3932.950.009工业总产值X1.068.015.5644.410.000人口总数X5
21、.242.081.0533.001.008a. 因变量: 财政收入Y 由表2-6可知,各模型的偏回归系数、标准化的偏回归系数及其对应的检验值;还显示了模型中的各变量与因变量的零阶相关、偏相关和部分相关;还有多重共线性统计量。根据模型3可以建立多元线性回归方程为:表2-7 各个模型置信度上限模型B 的 95.0% 置信区间上限1(常量)2814.965建筑业X4.9082(常量)2552.406建筑业X4.761工业总产值X1.0903(常量)-7187.087建筑业X4.595工业总产值X1.100人口总数X5.411a. 因变量: 财政收入Y 表2-8 已排除的变量模型Beta IntSig
22、.偏相关共线性统计量容差1工业总产值X1.442b3.058.006.574.006农业总产值X2.092b1.403.177.306.042社会零售商品总额X6.218b1.543.139.334.009人口总数X5.028b1.202.244.266.341受灾面积X3.009b.501.622.114.5872农业总产值X2.103c1.962.065.420.042社会零售商品总额X6.294c2.731.014.541.009人口总数X5.053c3.001.008.578.307受灾面积X3.012c.769.452.178.5853农业总产值X2-.116d-1.118.279-
23、.262.009社会零售商品总额X6.047d.178.861.043.001受灾面积X3.007d.510.617.123.574a. 因变量: 财政收入Yb. 模型中的预测变量: (常量), 建筑业X4。c. 模型中的预测变量: (常量), 建筑业X4, 工业总产值X1。d. 模型中的预测变量: (常量), 建筑业X4, 工业总产值X1, 人口总数X5。表2-7显示各模型变量的有关统计量,对模型3来说,它的偏回归系数的P值都大于0.05,接受原假设,不能把这些变量加入方程中,故而排除该变量。表2-8 残差统计量极小值极大值均值标准 偏差N预测值1579.2633102694.890627186.856828823.9418522残差-2424.534911869.26514.000001185.8975022标准 预测值-.8882.620.0001.00022标准 残差-1.8931.459.000.92622a. 因变量: 财政收入Y表2-8是残差统计结果。主要显示预测值、标准化预测值、残差和标准化残差等统计量的最大值、最小值、均值和标准差。可见标准化残差的最大绝对值为1.459。2.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45512-2025纺织品定量化学分析聚苯并咪唑纤维与某些其他纤维的混合物
- GB/T 18867-2025电子气体六氟化硫
- 高考语文社会责任试题及答案
- 高考作文情感认知的试题与答案
- 火灾报警的应急预案(3篇)
- 行政法学重要案例分析及试题
- 商场高层火灾应急预案范文(3篇)
- 2025年程序员考试复习秘籍试题及答案
- 2025年法学概论考试的应试准备与试题及答案
- 行政法与公共管理理论的结合剖析试题及答案
- 传感器技术-武汉大学
- 健康养老照护课程设计
- 广东省中山一中等七校联合体2025届高考临考冲刺历史试卷含解析
- 福建省城市隧道工程施工质量验收标准
- DB32∕T 1649-2010 公路养护工程预算编制办法及定额
- DLT 1053-2017 电能质量技术监督规程
- 十年(2015-2024)高考真题英语分项汇编(全国)专题 22 完形填空(新高考15空)(学生卷)
- 山东省济南市章丘区章丘市第四中学2024年高一下数学期末达标检测试题含解析
- 化妆品中二恶烷的检测方法
- 江苏省盐城市射阳实验中学2023-2024学年中考二模物理试题含解析
- 中医食疗学智慧树知到期末考试答案2024年
评论
0/150
提交评论