人均食品支出_第1页
人均食品支出_第2页
人均食品支出_第3页
人均食品支出_第4页
人均食品支出_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计 课程论文 题目:运用spss软件对我国人均食品支出的影响因素的统计分析学号姓名贡献成绩 指导教师陈彩霞日期运用spss对我国人均食品支出的影响因素的分析摘要 随着21世纪世界的逐步发展,中国的国力日益强大,人民的生活水品也逐步提高,而人均食品支出也越来越大。这是什么原因造成的结果呢?因此我们选取了2002年到2012年这十年的数据,对居民消费价格指数(CPI)、人均收入、农产品价格指数对人均食品支出的影响以及恩格尔系数作出了回归分析。从数据上,我们可以发现人均食品支出、人均收入在逐年增长,且增长的幅度较大,居民消费价格指数与农产品价格指数也在增长,但增长的较慢,而恩格尔系数则几乎没有

2、什么波动。我们根据所选取的数据做出来相对应的模型,并对这些模型进行验证,通过CPI、人均收入、农产品价格指数的变动对人均食品支出的不同影响程度,从而发现这些因素对人均食品支出的实际情况,并利用这些数据对今后人均食品支出作出预测。回归模型1:运用多元回归分析,由于自变量之间存在共线性,因此得出农产品价格指数对人均食品支出影响不显著。 (1)回归模型2:运用多元回归的逐步分析法,剔除回归系数未通过0.05的显著检验,保留通过的,得到“最优”回归方程。 (2)关键字:回归分析 逐步回归 人均食品支出 人均收入 CPI 农产品价格指数 1、 引言 人均食品支出可以反映人民的消费状况,反映人民的生活水品

3、以及人们对满足生存、发展、享受和需要所达到的程度,更能反映一段时期一个国家的消费水平和发展水品。本问题要求通过收集整理数据,掌握对城镇人均消费支出的影响因素,利用spss软件进行多元回归分析,求出回归方程,进行统计检验(包括回归方程的显著性检验,回归系数的显著性检验)以及残差的检验;然后进行估计和预测。2、 多元线性回归理论基础2.1 多元线性回归的概念 设自变量的观测值及因变量对应的观测值满足关系式 (3) 式中,是相互独立且都服从正态分布的随机变量。根据最小二乘法,由n个观测值确定参数的估计值后,得到公式的估计值称为多元线性回归方程。建立多元线性回归方程的过程以及对回归方程与回归数所做的显

4、著性检验,称为多元线性回归分析或多元线性回归。如果将带入多元线性回归方程,记,则与之间的偏差平方和,由 可得到多元线性回归的正规方程组。通过解正规方程组,即可以算出求出回归方程。2.2 回归方程的显著性检验与一元线性回归方程相类似,多元线性回归方程的总平方和SST也可以分解为剩余平方和SSE和回归平方和SSR,即SST=SSR+SSE (4) 式中, 而,因此 如果SSR的数值较大,SSE的数值便比较小,说明回归的效果好。如果SSR的数值较小,SSE的数值便比较大,说明回归的效果差。理论上已经证明:当原假设为,并且成立时,且SSR与SSE相互独立, (5) (6)为的无偏估计。因此,给出显著性

5、水平,即可进行回归方程的显著性检验。2.3 回归系数的显著性检验 一个多元线性回归方程显著,并不表示方程中的每一个自变量对因变量的影响都是重要的。因此为了对的重要程度作出比较与检验,有必要找出一个与有关的统计量。由于是随机变量的线性函数,各都服从正态分布,所以式中,是正规方程组的系数矩阵的逆矩阵中第行第列的元素。还可以证明,与SSE相互独立。当原假设为并且成立时,由服从分布,推出 (7) 因此,给出显著性水平,即可进行回归常数与回归系数的显著性检验,得到各个是否显著的结论。2.4 多元线性回归的估计与预测 与一元线性回归方程类似,多元线性回归方程的应用也包括点预测和区间预测等内容。当,且统计量

6、,为为正规方程组的逆矩阵中第k行第j列的元素,因此,当n比较大,与与比较接近时,的方差比较小,用预测的效果比较好。作区间预测时,统计量 (8)式中,MSE=,由置信水平求出P|t|=中的临界值后,若记 (9)则P=,便是时的预测区间,而为区间的半径。当n比较大,比较接近时, (10)3、 数据来源及符号说明3.1 数据来源 所有的数据均来自中国统计年鉴2002-2012年十年的数据,如下:年份人均食品支出人均收入CPI折合的CPI(以2001年=100)农产品生产价格指数折合的农产品价格指数恩格尔系数20022271.84 8177.40 99.299.299.799.737.72003241

7、6.92 9061.22 101.2100.39104.4104.937.120042709.60 10128.51 103.9104.31113.1117.7237.720052914.39 11320.77 101.8106.18101.4119.3736.720063111.92 12719.19 101.5107.78101.2120.835.820073628.03 14908.61 104.8112.95118.5143.1536.320084259.81 17067.78 105.9119.61114.1163.3437.920094478.54 18858.09 99.3118

8、.7897.6159.4236.520104804.71 21033.42 103.3122.7110.9176.7935.720115506.33 23979.20 105.4129.32116.5205.9636.320126040.85 26958.99 102.6132.68102.7211.5236.23.2 符号说明.表示人均食品支出.表示人均收入.表示居民消费价格指数(CPI).表示农产品价格指数.恩格尔系数恩格尔系数表示是食品支出总额占个人消费支出总额的比重。4、 回归方程的建立及检验4.1 多元回归分析直接进入法 以人均收入、居民消费价格指数、农产品价格指数,恩格尔系数为方程

9、的自变量,人均食品支出为因变量,利用spss做回归分析,得到回归系数等表,比较Sig.与0.05的大小关系,得出自变量与因变量的关系是否显著,而则可以看出回归方程所拟合的效果是否好。4.1.1 spss所产生的结果 表1模型汇总b模型RR 方调整 R 方标准 估计的误差11.000a1.0001.00023.48677a. 预测变量: (常量), x4, x3, x1, x2。b. 因变量: y 上面所定义模型表示:确定系数的平方根()为1.000,确定系数()为1.000,调整后的确定系数为1.000,标准误差为23.48677。值越大所反映的自变量与因变量的共变量比率越高,模型与数据的拟合

10、程度越好。 表2Anovab模型平方和df均方FSig.1回归16324741.62344081185.4067398.434.000a残差3309.7706551.628总计16328051.39210a. 预测变量: (常量), x4, x3, x1, x2。b. 因变量: y 方差分析表:列出了变异源,自由度,均方,F值及对F的显著性检验。回归平方和为16324741.623,残差平方和3309.770,F统计量的值为7398.434,Sig(显著性水平),则拒绝原假设,认为所有回归系数同时与0有显著差异,自变量与因变量之间存在显著的线性关系,自变量的变化确实能反映因变量的线性变化,回归

11、方程显著,若F,所以回归。(2) 回归系数的显著性检验(t检验): 表5系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)-4937.552771.548-6.400.001x1.160.013.79012.140.000.008125.344x236.3688.210.3264.430.004.006160.407x3-3.0702.303-.094-1.333.231.007146.829x469.03414.973.0424.610.004.4092.445a. 因变量: y回归系数的显著性检验是检验各个自变量对因变量y的影响是否显著,从而找出哪些

12、自变量对y的影响是重要的,哪些是不重要的。假设为:。若令假设成立,说明对因变量y具有显著的影响。采用t检验。若|t|或者pa,拒绝原假设,认为该回归系数与0有显著差异,该自变量与因变量之间存在显著的线性关系,它的变化确实能较好地反映因变量的线性变化,应该保留在回归方程中。若|t|a,接受原假设,认为该回归系数与0无显著差异,该自变量与因变量之间不存在显著的线性关系,它的变化无法反映因变量的线性变化,应该剔除出回归方程中,所以后续应采用逐步回归分析,得出最优的回归方程。在此回归系数表中,t为回归系数检验统计量,Sig为相伴概率值p,p(常量)=0.0010.05,p()=0.0000.05,p(

13、)=0.0040.05,p()=0.004,所以回归方程是显著的。4.2.3回归方程系数的检验: 在以上系数表中,t为回归系数检验统计量,Sig为相伴概率值p,p(常量)=0.0000.05,p()=0.0000.05,p()=0.0030.05, p()=0.0040.05,说明系数都显著。4.3 残差检验 前面我们已经就方程拟合好坏、回归方程的线性性以及参数的显著性进行了建模分析。在回归分析中还有一项很重要的检验需要进行,这就是下面要介绍的残差分析。在回归分析中,测定值与按回归方程预测的值之差即为残差,以表示。残差遵从正态分布N(0,)。(-残差的均值)/残差的标准差,称为标准化残差,以表

14、示。遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率0.05。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归直线拟合。显然,有多少对数据,就有多少个残差。残差分析就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰。 图1残差向量如则学生化残差如果样本回归模型对数据拟合是良好的话,那么.4.3.1 残差的正态性检验 图2 图3由以上分别为残差的直方图和累积概率图(P-P图),其中直方图的分布为正太分布,而累积概率图可以看出点存在于直线的周围,构成线性的关系,这是对残差的正态性检验,可以由图像得到残差是具有

15、正态性的。4.3.2 残差的独立性检验用Durbin-Watson检验,其参数称为Dw或D。D的取值范围是0D4。其统计学意义为:D2,残差与自变量相互独立;D2,残差与自变量负相关。 表11模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson11.000a1.0001.00023.486773.069a. 预测变量: (常量), x4, x3, x1, x2。b. 因变量: y由表可知Dw=3.069,在D的取值范围中,且大于2,所以残差具有独立性,并残差与自变量负相关。4.3.3 残差的方差齐性检验 图4 图5 图6 图7 图8 我们看到这就是需要的散点图,纵坐标是标准化的参差值,横坐标是估计值,如果散点图拟合的直线平行于横坐标,那么就可以认为残差是齐性的。 利用残差所提供的信息,我们可以得到模型的假设是合理的以及及数据是可靠的,也证明了回归模型能够很好的解释数据。五、结论 本文意在通过统计软件SPSS对多因素影响下的人均食品消费的多元统计回归分析,来帮助人们了解影响人均食品消费的因素,在本文中首先根据实际情况猜想可能对因变量人均食品消费的几个自变量因素,人均收入,CPI,农产品价格指数,恩格尔系数等存在线性关系,并作出散点图,回归分析表,方差分析表等数据得出初步多元回归模型 (15)由于自变量之间存在相关性,对因变量产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论