财政收入和国家生产总值之间的一元线性回归分析_第1页
财政收入和国家生产总值之间的一元线性回归分析_第2页
财政收入和国家生产总值之间的一元线性回归分析_第3页
财政收入和国家生产总值之间的一元线性回归分析_第4页
财政收入和国家生产总值之间的一元线性回归分析_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

财政收入和国家生产总值之间的一元线性回归分析一、设计目的为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合SPSS数据处理软件对数据的处理解决实际问题。本设计是利用方差分析等对财政收入和柜内生产总值进行分析,并利用SPSS数据处理软件进行求解。二、设计问题现有1992~2006年财政收入和生产总值(单位:亿元)的数据,如表所示,请研究财政收入和国内生产总值之间的线性关系。由此我们利用这些数据做出国内生产总值关于财政收入的线性回归方程。三、设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。设其中有两个变量X与Y,我们可以用一个确定函数关系式:y=u(𝑥)大致的描述Y与X之间的相关关系,函数u(𝑥)称为Y关于X的回归函数,方程y=u(𝑥)成为Y关于X的回归方程。一元线性回归处理的是两个变量x与y之间的线性关系,可以设想y的值由两部分构成:一部分由自变量x的线性影响所致,表示x的线性函数a+bx;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。可得一元线性回归模型y=a+bx+ε。式中,自变量x是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y称为响应变量或因变量。由于ε是随机误差,根据中心极限定理,通常假定ε~N(0,𝜎2),𝜎2是未知参数。确定Y与X之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此,我们可以用线性方程:y=a+bx大致描述变量Y与X之间的关系;回归分析一般分为一元线性回归和多元线性回归,本文采用一元线性回归。回归分析的基本思想是:虽然自变量和因变量之间没有严格的,确定性的函数关系,但可以设法找出最能代表他们之间关系的数学表达式。四、设计程序1、定义3个变量,分别为year(年份),x(国内生产总值),y(财政收入)并输入数据。如图4.1和4.2。图4.1图4.22、做散点图,观察两个变量的相关性。依次选择菜单→图形→旧对话框→散点/点状→简单分布,将国内生产总值作为x轴财政收入作为y轴,得到如图4.3所示的散点图。图4.3由上图可以看出两变量具有较强的线性关系可以用一元线性回归来拟合两变量。3、一元线性回归分析设置(1)选择菜单“分析→回归→线性”,打开“线性回归”对话框,并按图4.4所示进行设置。图4.4(2)“统计量”对话框设置:单击“统计量(S)…”按钮,打开“线性回归:统计量”对话框,并按图4.5所示进行设置。图4.5 (3)“图形”对话框设置:单击“绘制(T)…”按钮,打开“线性回归:图”对话框,并按图4.6所示进行设置。图4.6(4)“保存”对话框设置:单击“保存(S)…按钮,打开”线性回归:保存“对话框,并按图4.7所示进行设置。图4.7(5)“选项”对话框设置:单击“选项(O)…”打开线性回归:选项“对话框,并按图4.8所示进行设置。图4.8五、结果分析1、模型汇总表,主要是回归方程的拟合优度检验,表中显示相关系数R决定系数R方,调整的相关系数的平方和估计值的标准误差等信息,这些信息反映了因变量和自变量之间的线性相关强度。从表中可以看出R=0.989,说明自变量与因变量之间的相关性很强。R方等于0.979说明自变量x可以解释因变量y的97.9%的差异性。模型汇总表b模型RR平方调整后R方标准估计的误差1.989a.979.9771621.66312a.预测变量:(常数),xb.因变量:y2、方差分析表,显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设“:回归系数B=0”成立的概率为0.000,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。方差分析表a模型平方和自由度平均值平方F显著性1回归1557492999.81911557492999.819592.250.000b残差34187286.770132629791.290总计1591680286.58914a.财政收入:yb.预测值:(常数),x3、回归系数表,常数项、非标准化的回归系数B值及其标准差、标准化的回归系数值、统计量t值以及显著性水平。从表中可以看出,回归系数的常数项为-4993.281,自变量国内生产总值的回归系数为0.197。因此可以得出回归方程:财政收入y=-4993.281+0.197*国内生产总值x回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设,这也说明了回归系数的显著性,说明建立线性模型是恰当的。回归系数表a模型非标准化系数标准系数T显著性B标准误差Beta1(常量)-4993.281919.356-5.431.000x.197.008.98924.336.0005、残差统计表,依次列出了预测值、标准预测值、预测值的标准误差、调整的预测值、残差、标准残差、student化残差、已剔除的残差、student化已剔除的残差、马氏距离、cook距离以及居中杠杆值。残差统计表a最小值最大值均值标准偏差N预测值315.950936589.832014925.193310547.4878515标准预测值-1.3852.054.0001.00015预测值的标准值418.964983.777570.042165.91015调整的预测值-494.305435325.964814789.414710469.8480915残差-1928.812503167.41895.000001562.6736915标准残差-1.1891.953.000.96415Stud.残差-1.2392.189.0381.06715刪除的残差-2093.780273977.67529135.778671927.9423315Stud.刪除的残差-1.2682.646.0841.16515Mahal距离.0014.219.9331.18115Cool距离.000.825.132.25115居中杠杆值.000.301.067.08415a.因变量:财政收入6、图5-6和图5-7是残差分布直方图和观测累计概率P-P图.再回归分析中总是假设残差服从正态分布,这两个图就是根据样本数据的计算结果显示残差分析实际情况.从残差分布的直方图与附于其上的正态分布曲线的比较,可以观察出残差分析的正态性.同时,从观测量累计概率P-P图也可以看出残差分布服从正态性。图5-6图5-7六、设计总结通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,对一元线性回归以及线性回归的方差分析、相关系数的显著性检验有了更深刻的了解,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。在实现这道题的过程中我应用了SPSS软件,学会了一些软件的应用,更加熟练的操作该软件进行一些数据上的处理。致谢本论文是在张玉春老师的悉心指导下完成的,老师渊博的知识,严谨的治学态度,一丝不苟的工作作风,平易近人的性格都是我学习的楷模。在此谨向

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论