


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计分析与SPSS的应用(第五版)(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利 用SPSS提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两 门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和 第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。选择fore和phy两门成绩体系散点图步骤:图形 旧对话框 散点图 简单散点图定义 将fore导入Y轴,将phy导入X轴,将sex导入设置标记确定。3D.0D-20.00-40.0050.00 SO .00
2、7D.OO 80.0090001D0J0sex0 fetnstemale接下来在SPS输出查看器中,双击上图,打开图表编辑在图表编辑器中,选择“元素”菜单 选择总计拟合线 选择线性应用再选择元素 菜单点击子组拟合线 选择线性应用。60.00-60.00-40.DO-2Q,0O-sex' female1 mileJ - fwnalBmaleP2 mL) = 0.1B2 ferrrale:岸 綺性三D20G mnlu; R2 江吒=0.1550|y16.18+0.16Tr4Q.OO50.001!I50.0070.0030 BO90.001 00.00分析:如上图所示,通过散点图,被解释变量
3、 y(即:fore)与解释变量phy 有一定的线性关系。但回归直线的拟合效果都不是很好。2、请说明线性回归分析与相关分析的关系是怎样的相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断 之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量
4、的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来, 才能达到研究和分析的目的。线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。3、请说明为什么需要对线性回归方程进行统计检验一般需要对哪些方面进行检验检验其可信程度并找出哪些变量的影响显著、哪些不显著。主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、 残差分析等。线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释 变量和解释变量之间确实存在显著的线性关系。回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性
5、关系是否显著,用线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略向前、向后、逐步。5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请 利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产 量.sav ”。方法:采用“前进“回归策略。步骤:分析 回归 线性 将粮食总产量导入因变量、 其余变量导入自变量方法项选“前进”确定。如下图:(也可向后、或逐步)已输入/除去变量a模型已输入变量已除去变量方法1施用化肥量(kg/公顷)向前(准则:F-to-enter 的
6、 概率 <=.050 )2风灾面积比例(%)向前(准则:F-to-enter 的 概率 <=.050 )3向前(准则:年份F-to-enter 的概率 <=.050 )4总播种面积(万公顷)向前(准则:F-to-enter 的 概率 <=.050 )a.因变量:粮食总产量(y万吨)模型摘要模型RR平方调整后的R平方标准估算的错误1.960 a.922.9192.975 b.950.9473.984 c.969.9664.994 d.989.987a.预测变量:(常量),施用化肥量(kg/公顷)b.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例(%)c.预测变
7、量:(常量),施用化肥量(kg/公顷),风灾面积比例(%),年份d.预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例(%),年份,总播种面积(万公顷)ANOVA模型平方和自由度均方F显著性1回归残1.000 b差总33计342回归残2.000 c差32计总343归回3.000 d差残.35631计总344归回4.000 e差残.67530计总34a.因变量:粮食总产量(y万吨)b. 预测变量:(常量),施用化肥量(kg/公顷)c. 预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例()d. 预测变量:(常量),施用化肥量(kg/公顷),风灾面积比例(),年份e. 预测变量:(
8、常量),施用化肥量(kg/公顷),风灾面积比例(),年份,总播种面积(万 公顷)系数模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)施用化肥量(kg/公顷).960.000.0002(常量)施用化肥量(kg/公顷).000.000风灾面积比例().0003(常量)施用化肥量(kg/公顷)风灾面积比例().737.000.000.000年份.323.0004(常量)施用化肥量(kg/公顷).749.000.000风灾面积比例().000年份总播种面积(万公顷).344.334.141.000.000a.因变量:粮食总产量(y万吨)结论:如上4个表所示,影响程度中大到小依次是:施用化肥量(
9、kg/公顷),风灾面积比例(),年份,总播种面积(万公顷)。(排除农业劳动者人数(百万人)和粮食播种面积(万 公顷)对粮食总产量的影响)易9除农业劳动者人数(百万人)和粮食播种面积(万公顷)后:步骤:分析 回归 线性 将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷),风灾面积比例(),年份,总播种面积(万公顷)导入自变量方法项选“输入”确定。如下图:系数a模型非标准化系数标准系数t显著性B标准错误贝塔1(常量).000年份.334.000顷)总播种面积(万公.344.141.000顷)施用化肥量(kg/公.749.000风灾面积比例().000a.因变量:粮食总产量(y万吨)粮食
10、总产量回归方程:丫=+、一家产品销售公司在 30个地区设有销售分公司。为研究 产品销售量(y)与该公司的销售价格(x1 )、各地区的年人均收入 (x2)、广告费用(x3)之间 的关系,搜集到30个地区的有关数据。进行多元线性回归分析所得的部分分析结果如下:ModelSum of SquaresDfMean SquareFSig.RegressionResidualTotal.729Un sta ndardized Codfficie ntstSig.B(Co nsta nt)X1X2X31)将第一张表中的所缺数值补齐。2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回
11、归系数的意义。3)检验回归方程的线性关系是否显著4)检验各回归系数是否显著5)计算判定系数,并解释它的实际意义。6)计算回归方程的估计标准误差,并解释它的实际意义。(1)模型平方和自由度均方F显著性1归回.13差残26计总.729(2) Y= X1+(3) 回归方程显著性检验:整体线性关系显著(4) 回归系数显著性检验:各个回归系数检验均显著(5) 略(6) 略7、对参加SAT考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩 以及性另麼据。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条 件下,分析阅读成绩对数学成绩的线性影响是否显著。方法:米用进入回归策略。步骤:
12、分析 回归 线性 将MathSAT导入因变量、其余变量导入自变量确定。结果如下:已输入/除去变量a模型已输入变量已除去变量方法1Gender,Verbal SAT b输入a. 因变量:Math SATb. 已输入所有请求的变量。模型摘要模型RR平方调整后的R平方标准估算的错误1.710 a.505.499a.预测变量:(常量),Gender, Verbal SATANOVA模型平方和自由度均方F显著性1回归残差总计2159161.000 ba.因变量:Math SATb.预测变量:(常量),Gender, Verbal SAT系数模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)Verb
13、alSAT.686.055.696.000.000Gender.190.001a.因变量:Math SAT因概率P值小于显著性水平(),所以表明在控制了性别之后,阅读成绩对数学成绩有 显著的线性影响。8试根据“粮食总产量.sav ”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。采用二次曲线步骤:图形旧对话框拆线图简单个案值定义将粮食总产量导入线的表征 确定结果如下:3Q0DZ Hl10000.30-飢iQDaji严2001X3 丹iIIIIIIIIIIIIIrII1 IInI1 IvIIIVIiiIr2 3 4 S G 7 0 S 1
14、011 »Z13141S1617101Qni 222024252G2720X>M31i32 333W5再双击上图“元素”菜单 添加标记应用接下来:分析 回归 曲线估计 粮食总产量导入因变量、年份导入变量,点击年份 在模型中选择二次项、立方、幕点击“保存”按钮 选择保存”预测值”继续 确曲线拟合附注已创建输岀注释03-MAY-2018 09:28:44输入数据薛薇统计分析与spss的应用(第五版)第9章SPSS回归分析习题粮食总产量.sav活动数据集数据集1过滤器无宽度(W)无拆分文件无工作数据文件中的行数35缺失值处理对缺失的定义用户定义的缺失值被视作缺失。已使用的个案任何变量
15、中带有缺失值的个案不用于分析。语法CURVEFIT/VARIABLES=lscl WITH nf/CONSTANT/MODEL=LINEAR QUADRATIC CUBICPOWER/PRINT ANOVA/PLOT FIT/SAVE=PRED .资源处理器时间00:00:用时00:00:使用从第一个观测值到最后一个观测值预测从使用周期后的第一观察到最后一个观测值变量已创建或已修FIT_1CURVEFIT 和 MOD_1 LINEAR 中具改有nf的lscl 的拟合FIT_2CURVEFIT和 MOD_1 QUADRATIC 中具有nf的Iscl 的拟合FIT_3CURVEFIT和 MOD_1
16、 CUBIC 中具有nf的lscl 的拟合FIT_4CURVEFIT和 MOD_1 POWER 中具有nf的lscl 的拟合时间序列设置输出量PRINT = DEFAULT仃 SET)保存新变量NEWVAR = CURRENT自相关或偏自相关图中的最大滞后数MXAUTO = 16每个交叉相关图的最大延迟数MXCROSS = 7每个过程生成的最大新变量数MXNEWVAR = 4每个过程的最大新个案数MXPREDICT = 1000MISSING = EXCLUDECIN = 95TOLER = .0001 CNVERGE = .001 ACFSE = IND未指定 未指定CONSTANT用户缺失
17、值处理置信区间百分比值在回归方程中输入变量的容差最大迭代参数变化计算标准的方法自相关的错误季节周期长度值在绘图中标记观测值的变量包括方程由于模型项之间存在接近共线性,该二次模型无法拟合。由于模型项之间存在接近共线性,该立方模型无法拟合。模型描述模型名称MOD_1因变量1粮食总产量(y万吨)方程式1线性(L)2二次项(Q)3立方(U)4幕a自变量年份常量已包括值在绘图中标记观测值的变未指定旦 量对在方程式中输入项的容许.0001a.此模型需要所有非缺失值为正。个案处理摘要数字个案总计35排除的个案a0预测的个案0新创建的个案0a.任何变量中带有缺失值的个案无需分析。变量处理摘要变量从属自变量粮食
18、总产量(y万吨)年份正值的数目3535零的数目00负值的数目00缺失值的数目用户缺失00系统缺失00粮食总产量(y万吨)线性(L)模型摘要RR平方调整后的R平方标准估算的错误.935.874.870自变量为年份ANOVA平方和自由度均方F显著性回归(R)残差总计13334.000自变量为年份系数非标准化系数标准系数t显著性B标准错误贝塔年份(常量).935.000.000二次项(Q)模型摘要RR平方调整后的R平方标准估算的错误.936.875.872自变量为年份ANOVA平方和自由度均方F显著性回归(R)残差总计13334.000自变量为年份系数非标准化系数标准系数t显著性B标准错误贝塔年份* 2.180.012.936.000(常量).000已排除的项输入贝塔t显著性偏相关最小容差年份a.000.000a.已达到输入变量的容许界限立方(U)模型摘要R
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论