用SPSS做回归分析学习教案_第1页
用SPSS做回归分析学习教案_第2页
用SPSS做回归分析学习教案_第3页
用SPSS做回归分析学习教案_第4页
用SPSS做回归分析学习教案_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1用用SPSS做回归做回归(hugu)分析分析第一页,共34页。一、简介一、简介(jin ji)在现实生活中,客观事物常受多种因素影响在现实生活中,客观事物常受多种因素影响(yngxing),我们记录下相应数据并加以分析,目的是为,我们记录下相应数据并加以分析,目的是为了找出对我们所关心的指标(因变量)了找出对我们所关心的指标(因变量)Y有影响有影响(yngxing)的因素(也称自变量或回归变量)的因素(也称自变量或回归变量)x1、x2、xm,并建,并建立用立用x1、x2、xm预报预报Y的经验公式:的经验公式:mmmxbxbxbbxxxfY 2211021),(从而从而(cng r)用以

2、进行预测或控制,达到指导生产活用以进行预测或控制,达到指导生产活动的目的。动的目的。多元线性回归多元线性回归第1页/共34页第二页,共34页。以年龄以年龄(ninlng)为为自变量自变量x,血压为因,血压为因变量变量y,可作出如下,可作出如下散点图:散点图:年龄394745476545674267563650392144血压144120138145162142170124158154136142120120116年龄645659344248451720195363292569血压162150140110128130135114116124158144130125175例例1、某医学研究所对、某

3、医学研究所对30个不同年龄的人的血压(高压)个不同年龄的人的血压(高压)进行了测量进行了测量(cling),得到如下数据:,得到如下数据:第2页/共34页第三页,共34页。 为了判断经验公式是否可用线性函数为了判断经验公式是否可用线性函数(hnsh)来拟合来拟合,可以画出散点图观察。其方法如下:,可以画出散点图观察。其方法如下:第3页/共34页第四页,共34页。第4页/共34页第五页,共34页。双击双击改变改变(gibin)显示格式显示格式改变改变(gibin)坐标轴的显示坐标轴的显示第5页/共34页第六页,共34页。为了为了(wi le)求得求得经验公式,可通经验公式,可通过如下步骤进行过如

4、下步骤进行:从散点图可以从散点图可以看出年龄看出年龄(ninlng)与与血压有线性关血压有线性关系:系:第6页/共34页第七页,共34页。当自变量和当自变量和因变量选好因变量选好后,点击后,点击(din j) OK 键键第7页/共34页第八页,共34页。)(1)1(222为为样样本本数数为为自自变变量量个个数数,NPPNRPRRa 1.Model为回归方程模型编号为回归方程模型编号(不同方法对应不同模型不同方法对应不同模型)2.R为回归方程的复相关系数为回归方程的复相关系数3.R Square即即R2系数,用以判断自变量对因变量的影响有多大,但这并不意味着越大越好系数,用以判断自变量对因变量的

5、影响有多大,但这并不意味着越大越好自变量增多时,自变量增多时,R2系数会增大,但模型的拟合度未必更好系数会增大,但模型的拟合度未必更好4.Adjusted R Square即修正即修正R2,为了,为了(wi le)尽可能确切地反映模型的拟合度,用该参数修正尽可能确切地反映模型的拟合度,用该参数修正R2系数偏差,它未必随变量个数的增加而增加系数偏差,它未必随变量个数的增加而增加5.Std. Error of the Estimate是估计的标准误差是估计的标准误差结果说明结果说明(shumng)常用统计量:常用统计量:第8页/共34页第九页,共34页。1.Sum of Squares为回归平方和

6、(为回归平方和(Regression)、残差平方和()、残差平方和(Residual)、总平方和()、总平方和(Total)2.df 为自由度为自由度3.Mean Square4.F5.Sig 为大于为大于F的概率,其值为的概率,其值为0.000,拒绝回归系数为,拒绝回归系数为0的原假设:的原假设:b0=b1=0即认为即认为(rnwi)回归方程显著性成立回归方程显著性成立结果结果(ji gu)说明说明方差方差分析:分析:第9页/共34页第十页,共34页。1.Model 为回归方程模型编号为回归方程模型编号2.Unstandardized Coefficients 为非标准化系数,为非标准化系数

7、,B为系数值,为系数值,Std.Error为系数的标准差为系数的标准差3.Standardized Coefficients 为标准化系数为标准化系数4.t 为为t检验,是偏回归系数为检验,是偏回归系数为0(和常数项为和常数项为0)的假设检验的假设检验5.Sig. 为偏回归系数为为偏回归系数为0 (和常数项为和常数项为0)的假设检验的显著性水平的假设检验的显著性水平(shupng)值值6.B 为为Beta系数,系数,Std.Error 为相应的标准差为相应的标准差结果结果(ji gu)说明说明回归系回归系数分析:数分析:第10页/共34页第十一页,共34页。 第一导丝盘速度第一导丝盘速度Y是合

8、成纤维抽丝的重要因素,它与电流是合成纤维抽丝的重要因素,它与电流的周波的周波(zhub)X有密切关系,由生产记录得:有密切关系,由生产记录得:周波周波X 49.250.049.349.049.049.549.849.950.250.2速度速度Y 16.717.016.816.616.716.816.917.017.017.1 试求试求Y对对X的经验的经验(jngyn)回归直线方程,并求误回归直线方程,并求误差方差差方差2的无偏估计值。的无偏估计值。 检验检验X与与Y之间是否存在显著的线性关系(取之间是否存在显著的线性关系(取=0.01)?)?例例. 概率论与数理统计概率论与数理统计(sh l

9、tn j)P267 例例第11页/共34页第十二页,共34页。20.04720.33890.0019yx 0.010.01117.1282(1,8)11.260.9675(8)0.765FFRR检验检验(jinyn)说明线性说明线性关系显著关系显著操作步骤:操作步骤:AnalyzeRegression Linear StatisticsModel fit Descriptives结果结果(ji gu):第12页/共34页第十三页,共34页。mmmxbxbxbbxxxfY 2211021),(对于多元线性回归主要需研究对于多元线性回归主要需研究(ynji)如下几个问如下几个问题:题:1)建立因变

10、量建立因变量Y与与x1、x2、xm的经验公式(回归的经验公式(回归方程)方程)2)对经验公式的可信度进行检验对经验公式的可信度进行检验3)判断每个自变量判断每个自变量xi(i=1, , m)对对Y的影响是否显著的影响是否显著(xinzh)?4)利用经验公式进行预报、控制及指导生产利用经验公式进行预报、控制及指导生产5)诊断经验公式是否适合这组数据诊断经验公式是否适合这组数据第13页/共34页第十四页,共34页。mmnxbxbxbbxxxfY 2211021),(0:2100 mbbbbH方差分析的主要方差分析的主要(zhyo)思想是把思想是把 yi 的总方差进的总方差进行分解:行分解: MSS

11、ESSyyyyyynidefiniiinii 121212模型模型(mxng)平方和平方和误差误差(wch)平平方和方和二、多元线性回归二、多元线性回归1.参数估计方法参数估计方法最小二乘法最小二乘法2.回归方程显著性的检验回归方程显著性的检验就是检验以下假设是否就是检验以下假设是否成立(采用方差分析法):成立(采用方差分析法):第14页/共34页第十五页,共34页。 如果自变量对如果自变量对Y的影响显著,则总方差主要应由的影响显著,则总方差主要应由xi引起,也引起,也就是原假设不成立就是原假设不成立(chngl),从而检验统计量为:,从而检验统计量为:)()()1(均均方方误误差差模模型型均

12、均方方EMSMMSkmESSkMSSF 方差来方差来源源自由度自由度平方和平方和均方均方Fp值值自变量自变量mMSSMMSMMSEMSp随机误随机误差差n-m-1ESSEMS和和n-1TSS多元多元(du yun)线性回归的方差分析表:线性回归的方差分析表:第15页/共34页第十六页,共34页。 在实际问题中,影响因变量在实际问题中,影响因变量Y的因素(自变量)可的因素(自变量)可能很多。在回归方程中,如果漏掉了重要因素,则能很多。在回归方程中,如果漏掉了重要因素,则会产生大的偏差;但如果回归式中包含的因素太多会产生大的偏差;但如果回归式中包含的因素太多,则不仅使用不便,则不仅使用不便(bbi

13、n),且可能影响预测精度。,且可能影响预测精度。如何选择适当的变量,建立最优的回归方程呢?如何选择适当的变量,建立最优的回归方程呢? 在最优的方程中,所有在最优的方程中,所有(suyu)变量对因变量变量对因变量Y的影响都的影响都应该是显著的,而所有应该是显著的,而所有(suyu)对对Y影响不显著的变量都不影响不显著的变量都不包含在方程中。选择方法主要有:包含在方程中。选择方法主要有:逐步筛选法逐步筛选法(STEPWISE) (最常用最常用(chn yn)向前引入法向前引入法(FORWARD)向后剔除法向后剔除法(BACKWARD)等等逐步回归逐步回归变量选择问题变量选择问题第16页/共34页第

14、十七页,共34页。开始开始(kish)对不在方程中的变对不在方程中的变量考虑量考虑(kol)能否引入?能否引入?引入变量引入变量(binling)能能对已在方程中的变对已在方程中的变量考虑能否剔除?量考虑能否剔除?能能剔除变量剔除变量否否筛选结束筛选结束否否逐步回归的基本思想和步骤:逐步回归的基本思想和步骤:第17页/共34页第十八页,共34页。某地区大春某地区大春粮食产量粮食产量 y 和大春粮食和大春粮食播种面积播种面积x1、化肥用量、化肥用量x2、肥猪发、肥猪发展头数展头数x3、水稻抽穗水稻抽穗(chu su)扬扬花期降雨量花期降雨量x4的数据如的数据如下表,寻求下表,寻求大春粮食产大春粮

15、食产量的预报模量的预报模型。型。YX1X2X3X4309.0137.04.015.027.0400.0148.06.026.038.0454.0154.010.033.020.0520.0157.018.038.099.0516.0153.013.041.043.0459.0151.010.039.033.0531.0151.015.037.046.0558.0154.016.038.078.0607.0155.027.044.052.0541.0155.036.051.022.0597.0156.046.053.039.0558.0155.047.051.028.0619.0157.048.

16、051.046.0618.0156.060.052.059.0742.0159.096.052.070.0805.0164.0191.057.052.0859.0164.0186.068.038.0855.0156.0195.074.032.0例例2、大春粮食产量的预报、大春粮食产量的预报(ybo)模型模型第18页/共34页第十九页,共34页。1)按按GraphsScatter Simple顺序展开对话框顺序展开对话框2)将将y选入选入Y Axis,然后将其余变量逐个选入,然后将其余变量逐个选入X Axis ,绘出散点图,观察,绘出散点图,观察(gunch)是否适宜用线性方程是否适宜用线性方程

17、来拟合。来拟合。1.初步初步(chb)分析(作图分析(作图观察)观察)第19页/共34页第二十页,共34页。1)按按StatisticsRegression Linear顺序顺序(shnx)展开对话框展开对话框2)将将y作为因变量选入作为因变量选入Dependent框中,然后将其余框中,然后将其余变量选入作为自变量选入变量选入作为自变量选入Independent(s)框中框中3.Method框中选择框中选择(xunz)Stepwise(逐步回归逐步回归)作为分析作为分析方式方式4.单击单击Statistics按钮按钮,进行需要的选择,进行需要的选择,单击单击Continue返回返回(fnhu)

18、5.单击单击OK按钮执行按钮执行2. 回归模型的建立回归模型的建立第20页/共34页第二十一页,共34页。被引入与被剔除被引入与被剔除(tch)的变量的变量回归方程模型回归方程模型(mxng)编号编号引入回归方程的自变量名称引入回归方程的自变量名称(mngchng)从回归方程被剔除的自变量名称从回归方程被剔除的自变量名称回归方程中引入或剔除自变量的依据回归方程中引入或剔除自变量的依据3. 结果分析结果分析第21页/共34页第二十二页,共34页。由复相关系数由复相关系数R=0.982说明该预报说明该预报(ybo)模型高度显著,可用于该地区模型高度显著,可用于该地区大春粮食产量的短期预报大春粮食产

19、量的短期预报(ybo)常用常用(chn yn)统计量统计量第22页/共34页第二十三页,共34页。方差分析表方差分析表第23页/共34页第二十四页,共34页。回归方程为:回归方程为:432359. 1626. 5100. 1059.205xxxy 按常识理解,粮食产量和播种面积关系密切,但预报按常识理解,粮食产量和播种面积关系密切,但预报(ybo)模型中,变量模型中,变量x1未引入,这是因为:未引入,这是因为:多年来该地区的大春粮食播种面积变化甚微,近于多年来该地区的大春粮食播种面积变化甚微,近于(jn y)常数,因而对产量的影响不大而失去其重要性常数,因而对产量的影响不大而失去其重要性。回归

20、系数分析回归系数分析(fnx)第24页/共34页第二十五页,共34页。 在汽油中加入两种化学在汽油中加入两种化学(huxu)添加剂,观察它添加剂,观察它们对汽车消耗们对汽车消耗1公升汽油所行里程的影响,共进行公升汽油所行里程的影响,共进行9次试验,得到里程次试验,得到里程Y与两种添加剂用量与两种添加剂用量X1、X2之间之间数据如下:数据如下:xi1010120231xi2001102213yi15.8 16.0 15.9 16.2 16.5 16.3 16.8 17.4 17.2试求里程试求里程Y关于关于X1、X2的经验的经验(jngyn)线性回归方程,线性回归方程,并求误差方差并求误差方差2

21、的无偏估计值。的无偏估计值。例例. 概率论与数理统计概率论与数理统计(sh l tn j)P280 例例第25页/共34页第二十六页,共34页。12215.64680.41390.31390.0387yxx 0.0130.6202(2,6)10.920.9543FFR 检验说明检验说明(shumng)线线性关系显著性关系显著结果结果(ji gu):第26页/共34页第二十七页,共34页。 在实际问题中,常会在实际问题中,常会(chnghu)遇到变量之间关系遇到变量之间关系不是线性的相关关系,而是某种曲线的非线性相关关不是线性的相关关系,而是某种曲线的非线性相关关系。此时首先要确定回归函数的类型

22、,其原则是:系。此时首先要确定回归函数的类型,其原则是:1.根据问题的专业知识或经验根据问题的专业知识或经验(jngyn)确定确定2.根据观测数据的散点图确定根据观测数据的散点图确定常选曲线类型:常选曲线类型:双曲线、幂函数曲线、对数双曲线、幂函数曲线、对数(du sh)曲线、指曲线、指数曲线、倒数指数曲线、数曲线、倒数指数曲线、S形曲线形曲线三、非线性回归三、非线性回归第27页/共34页第二十八页,共34页。鼠标在选项上点击鼠标在选项上点击(din j)右键可看到相应模型右键可看到相应模型类型类型操作步骤:操作步骤:AnalyzeRegression Curve Estimation结合结合

23、SPSS的曲线模型的曲线模型(mxng)选择:选择:第28页/共34页第二十九页,共34页。 测量测量(cling)13个样品中某种金属含量个样品中某种金属含量Y与该样品与该样品采集点距中心观测点的距离采集点距中心观测点的距离X,有如下观测值:,有如下观测值:xi23457810yi106.42108.20109.58109.50110.00109.93110.49xi111415161819yi110.59106.62110.90110.76111.00111.20求求Y关于关于(guny)X的的关系式。关系式。106.30941.7172lnyx 例例. 概率论与数理统计概率论与数理统计(sh l tn j)P286 例例第29页/共34页第三十页,共34页。首先首先(shuxin)绘出散点图:绘出散点图:Graphs Scatter Simple 步骤步骤(bzhu): 根据散点图的形态可以认为变量根据散点图的形态可以认为变量X与与Y之间具之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论