




已阅读5页,还剩149页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,第四章SPSS统计技术,SPSS基本操作及描述统计相关分析T检验方差分析2检验回归分析,.,数据的输入和保存NANotAnswered.NAPNotAppropriate.DKDontKnow,画图数据分组描述统计頻数描述,SPSS基本操作及描述统计,.,数据-排序数据-拆分转换-计算转换编码,基本操作,.,像年龄变量、收入变量、成绩变量都是典型的连续变量。这就是我们前面介绍的Pearson相关。,相关分析,.,例从某系随机选取了40名大学生进行追踪研究,分别在入学后一周、第一学年末、第二学年末和第三学年末共4次英语词汇测验推算得到的被试的英语词汇量(单位:千)。表中的变量如下:性别(0表示女生,1表示男生),test1(入学后一周词汇量),test2(第一学年末词汇量),test3(第二学年末词汇量),test4(第三学年末词汇量)。想计算并检验学生英语词汇量四次测验之间的相关系数。,.,.,在进行相关分析之前,可以使用Graphs菜单中的Scatter命令作散点图。,散点图是以点的分布反映变量之间相关情况的统计图形,根据图中的各点分布走向和密集程度,大致可以判断变量之间的关系。,.,按顺序GraphsScatter单击,打开Scatterplot散点图主对话框。,1、Simple简单散点图,只显示一对相关变量的散点图,4、3-D三维散点图,显示三个相关变量之间的散点图,3、Matrix矩阵散点,在矩阵中显示多个相关变量之间的散点图,2、Overlay重叠散点图,可显示多对相关变量的散点图,.,把test1选择作为Y轴变量,把test2选择作为X轴变量。,.,结果:,.,矩阵散点图在矩阵变量框内要选择两个或两个以上的变量,.,.,编辑散点图,.,选中图中的点,打开Properties图形属性对话框,选择Marker点选项卡。在选项卡中,选择点的类型(Type)、点的大小(Size)、点的外周线(BorderWidth)以及点的颜色(Color)。,.,选择分析菜单下的相关分析下两个变量间的相关分析选项,菜单,.,2单击按钮,3单击OK,1选择变量,皮尔逊相关系数,如果两变量相关显著,需要标注,显著性检验选项,.,将、指定为。,.,结果和讨论,.,每个变量有三行数据,第一行是该变量与其他变量之间的相关系数,右上角标有“”的表示在0.01水平上是显著的。Sig.(2-tailed)双尾t检验结果,对于相关系数为0的假设成立的概率。N为参与相关系数计算的有效观测量数。,.,结论:r=0.886,P=0.0000.01,拒绝H0。可以认为test1和test2之间有正的直线相关关系。,H0:=0,即test1和test2无直线相关关系。,相关性检验,.,等级变量的相关分析,前面介绍了等级相关,下面看如何利用SPSS来实现这种计算。,.,例:12名学生的两门功课成绩评定分数见下表。问这两门功课的成绩是否具有一致性?,.,优1良2中3,数据,.,课程A,课程B,数据录入,.,选择分析菜单下的相关分析下两个变量间的相关分析选项,菜单,.,.,2单击按钮,3单击OK,1选择变量,斯皮尔曼相关系数,.,结论:rs=0.657,P=0.0200.05,接受原假设,方差齐,.,方差分析表,如果P0.05接受原假设,0.093/0.25=3.72,.,多重比较(LSD法),1,2间有差异,1,3间没差异,2,3间没差异,.,多重比较(SNK法),每一列表示一个亚组,亚组中的无差异,不同亚组间p0.05,.,练习:某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别,.,2.随机区组(或单位组、配伍组)设计的方差分析,例2下表是11名战士在不同海拔高度的血氨值()。试作方差分析,.,1行3列(指标变量、处理组分组变量、单位组分组变量),数据格式,.,AnalyzeGeneralLinearModels(一般线性模型)Univariate(单变量),检验步骤,.,Univariate对话框,多重比较,.,Univariate:Model对话框,.,Univariate:Model对话框,.,PostHocMultipleComperisonsforObservedMeans对话框,.,Options对话框,.,点击“OK”,运行结果,.,结果输出,.,有效数据例数统计,.,分组统计描述(均数、标准差),.,方差分析表,.,首先是所用方差分析模型的检验,P值为0.003,P小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量海拔分组,p小于0.01有统计学意义;第四行是战士编号,有统计学意义,但是我们这里不关心,.,均数估计,.,多重比较,.,练习,例8.1对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂养后所增体重有无差别?,.,.,回归分析的意义回归分析就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。,回归分析,.,相关分析与回归分析的区别联系?,(一)概念:,1.相关分析,用一个指标来表明现象间共变的相互依存关系的密切程度。广义的相关分析包括相关分析(狭义的相关分析)和回归分析。,2.回归分析,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),来近似地表达变量间的平均变化关系。,.,(二)相关分析与回归分析的区别,1.相关分析中不必确定自变量和因变量;而在回归分析中,必须事先确定自变量和因变量,且只能从自变量去推测因变量,而不能从因变量去推断自变量。2.相关分析不能指出变量关系的具体形式;而回归分析能确切的指出变量之间关系的具体形式,可根据回归模型从已知量估计和预测未知量。3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。,.,(三)相关分析与回归分析的联系,有共同的研究对象,常常必须互相补充。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。简单说:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。,.,相关程度与回归预测,r,r=0:无法预测;r=1:预测完全准确,没有误差。,.,(二)回归分析理解,.,回归分析的种类,SimpleLinearregression,.,回归模型的类型,一个自变量,两个及两个以上自变量,回归模型,多元回归,一元回归,线性回归,非线性回归,线性回归,曲线回归,.,线性回归分析概述,.,通过样本数据建立一个回归方程后,不能立即就用于对某个实际问题的预测。因为,应用最小二乘法求得的样本回归直线作为对总体回归直线的近似,这种近似是否合理,必须对其作各种统计检验。一般经常作以下的统计检验。,.,回归方程的显著性检验,(1)拟合优度检验回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。(自变量引起的离差平方和,占总离差平方和的比重)回归方程的拟合优度检验一般用确定系数R2实现。该指标是建立在对总离差平方和进行分解的基础之上。,.,(2)回归方程的显著性检验(F检验)回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。回归方程的显著性检验一般采用F检验,利用方差分析的方法进行。,.,SPSS原假设:统计的就是F值的概率,即计算F值所对应的P值原假设:回归方程不显著,.,(3)回归系数的显著性检验(t检验)所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验。之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因变量变化的自变量。因此,可以通过回归系数显著性检验对每个回归系数进行考察。原假设:回归系数=0,.,回归参数显著性检验的基本步骤。提出假设计算回归系数的t统计量值根据给定的显著水平确定临界值,或者计算t值所对应的p值(后者为spss用的方式)作出判断,.,回归分析的步骤,1.绘制散点图,观察x和y是否有线性关系。2.建立回归模型。3.回归方程显著性检验。4.计算回归估计标准误差。5.根据建立的模型进行预测。,.,例某医生为了探讨缺碘地区母婴TSH水平的关系,随机抽取10对数据如下,试求脐带血TSH水平y对母血TSH水平x的直线回归方程。,.,输入移去的变量b模型输入的变量移去的变量方法1VAR00002a.输入a.已输入所有请求的变量。b.因变量:VAR00003,结果,模型汇总模型RR方调整R方标准估计的误差1.681a.463.396.32848a.预测变量:(常量),VAR00002。,.,Model为回归方程模型编号(不同方法对应不同模型)R为回归方程的复相关系数RSquare即R2系数,用以判断自变量对因变量的影响有多大,但这并不意味着越大越好自变量增多时,R2系数会增大,但模型的拟合度未必更好AdjustedRSquare即修正R2,为了尽可能确切地反映模型的拟合度,用该参数修正R2系数偏差,它未必随变量个数的增加而增加Std.ErroroftheEstimate是估计的标准误差,.,Anovab模型平方和df均方FSig.1回归.7451.7456.908.030a残差.8638.108总计1.6099a.预测变量:(常量),VAR00002。b.因变量:VAR00003,系数a模型非标准化系标准系数tSig.B标准误差试用版1(常量)2.994.6104.912.001VAR00002.997.379.6812.628.030a.因变量:VAR00003,.,SumofSquares为回归平方和(Regression)、残差平方和(Residual)、总平方和(Total)df为自由度MeanSquare方差检验的结果sig0.05说明回归模型在0.05的显著性水平上是显著的。5.标准化系数表示该系数对因变量的影响,绝对值大影响就大。6.根据最后一张表,回归系数在0.05的显著性水平上显著,可以建立回归模型。,.,练习某国营农场在试验田上研究耕种深度对水稻产量的关系,所得资料如下表。试求水稻产量与耕种深度的直线回归方程。,.,练习:为了研究旅行社广告费用对销售额的影响,收集到7家旅行社的销售额与广告费用的数据如下表。试进行回归分析。,.,.,以年龄为自变量x,血压为因变量y,可作出如下散点图:,练习:某医学研究所对30个不同年龄的人的血压(高压)进行了测量,得到如下数据:,.,对于多元线性回归主要需研究如下几个问题:,建立因变量Y与x1、x2、xm的经验公式(回归方程)对经验公式的可信度进行检验判断每个自变量xi(i=1,m)对Y的影响是否显著?利用经验公式进行预报、控制及指导生产诊断经验公式是否适合这组数据,.,方差分析的主要思想是把yi的总方差进行分解:,模型平方和,误差平方和,二、多元线性回归,参数估计方法最小二乘法回归方程显著性的检验就是检验以下假设是否成立(采用方差分析法):,.,如果自变量对Y的影响显著,则总方差主要应由xi引起,也就是原假设不成立,从而检验统计量为:,多元线性回归的方差分析表:,.,在实际问题中,影响因变量Y的因素(自变量)可能很多。在回归方程中,如果漏掉了重要因素,则会产生大的偏差;但如果回归式中包含的因素太多,则不仅使用不便,且可能影响预测精度。如何选择适当的变量,建立最优的回归方程呢?,在最优的方程中,所有变量对因变量Y的影响都应该是显著的,而所有对Y影响不显著的变量都不包含在方程中。选择方法主要有:,逐步筛选法(STEPWISE)(最常用)向前引入法(FORWARD)向后剔除法(BACKWARD)等,逐步回归变量选择问题,.,开始,对不在方程中的变量考虑能否引入?,引入变量,能,对已在方程中的变量考虑能否剔除?,能,剔除变量,否,筛选结束,否,逐步回归的基本思想和步骤:,.,某地区大春粮食产量y和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据如下表,寻求大春粮食产量的预报模型。,例2、大春粮食产量的预报模型,.,按GraphsScatterSimple顺序展开对话框将y选入YAxis,然后将其余变量逐个选入XAxis,绘出散点图,观察是否适宜用线性方程来拟合。,1.初步分析(作图观察),.,按StatisticsRegressionLinear顺序展开对话框将y作为因变量选入Dependent框中,然后将其余变量选入作为自变量选入Independent(s)框中,Method框中选择Stepwise(逐步回归)作为分析方式,单击Statistics按钮,进行需要的选择,单击Continue返回单击OK按钮执行,2.回归模型的建立,.,被引入与被剔除的变量,回归方程模型编号,引入回归方程的自变量名称,从回归方程被剔除的自变量名称,回归方程中引入或剔除自变量的依据,3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鱼类肠道微生物与营养吸收-洞察及研究
- (2025年标准)汽车交接协议书
- 2025年回收物品保密协议书
- (2025年标准)划扣款协议书
- (2025年标准)韩国创业协议书
- 2025年车辆使用合同协议书
- (2025年标准)企业合购协议书
- (2025年标准)运输费用协议书
- (2025年标准)赠送房子赠予协议书
- (2025年标准)老婆摔伤赔偿协议书
- 结构施工图审图要点
- 电影赞助招商方案
- 医务人员人文素养提升系列讲座
- 危险化学品的安全储存和使用
- 精神障碍社区康复服务 基本情况登记表(模板)、精神障碍社区康复服务协议(模板)
- 一种新型离心擒纵式速度稳定机构的制作方法
- 世界和中国芍药栽培区的分布及地理气候因子的综合分析
- 口腔科车针分类
- 急性st段抬高型心肌梗死
- 幼儿文学课件完整版
- GB/T 21709.8-2008针灸技术操作规范第8部分:皮内针
评论
0/150
提交评论