《SPSS方差分析》PPT课件.ppt_第1页
《SPSS方差分析》PPT课件.ppt_第2页
《SPSS方差分析》PPT课件.ppt_第3页
《SPSS方差分析》PPT课件.ppt_第4页
《SPSS方差分析》PPT课件.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章,方差分析,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析,6.1 方差分析简介,(1) 方差分析的概念 事件的发生往往与多个因素有关,但各个因素对事件发生的中的用作用是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。如农业研究中土壤、肥料、日照时间等因素对某种农作物产量的影响,不同饲料对牲畜体重增长的效果等,都可以使用该着分析方法来解决。 (2) 方差分析的基本原理 方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个: 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异 实验条件,即不同的处理造成的差异,称为组间差异。,6.1 方差分析简介,(3) 方差分析常用术语 观测变量:也叫因变量,如上例中的作物产量; 控制变量:影响实验结果的自变量,也称因子,如上例中的品种、施肥量等; 水平:控制变量的不同类别,如A品种,B品种;10公斤化肥、20公斤化肥、30公斤化肥等; 随机因素:因素的水平与实验结果的关系是随机的,即不确定因素。 (4) 方差分析的两个基本假设 观测变量各总体应服从正态分布 ; 观测变量总体的方差应相等,即方差具有齐性:,6.1 方差分析简介,(5) 方差分析的一般步骤 第1步 方差分析条件检测。 服从正态分布和方差齐性、控制变量的类别(即水平数量)有限 第2步 提出原假设。 第3步 构造检验的统计量。 第4步 统计决策。,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析,6.2 单因素方差分析,6.2.1 基本概念及统计原理 (1) 基本概念 单因互方差分析(One-way ANOVA)也称一维方差分析,它检验由单一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统计意义,或者说它们是否来源来同一总体。 (2) 统计原理 单因素方差分析采用的统计推断方法是计算F统计量,进行F检验。总的变异平方和记为SST,分解为两部分:一部分是由控制变量引起的离差,记为SSA(组间Between Groups离差平方和);另一部分是由随机变量引起的离差,记为SSE(组内Within Groups离差平方和)。于是有: SST=SSA+SSE 其中:,SSA=,SSE=,6.2 单因素方差分析,F统计量是平均组间平方和与平均组内平方和的比值,计算公式为: 从F值的计算公式可以看出,如果控制变量的不同水平对观测变量有显著影响,那么观测变量的组间离差平方和就必然大,F值也就较大;反之,如果控制变量的不同水平没有对观测变量造成显著影响,那么组内离差平方和的影响就会比较小,F值就比较小。,6.2 单因素方差分析,(3) 分析步聚 第1步 提出零假设:H0为控制变量不同水平下观测变量各总体均值无显著差异,即: 第2步 选择检验统计量:方差分析采用的是F统计量,服从(k-1,n-k)个自由度的F分布。 第3步 计算检验统计量的观测值和概率p值:如果控制变量对观测变量造成了显著影响,观测变量总的变差中控制变量影响所造成的比例相对于随机变量就会较大,F值显著大于1;反之,F值接近于1。 第4步 给出显著性水平,作出决策:如果相伴概率p值小于显著性水平 ,则拒绝零假设;反之,认为控制变量不同水平下各总体均值没有显著差异。,6.2 单因素方差分析,6.2.2 SPSS实例分析 【例6.1】用四种饲料喂猪,共19头分为四组,每一组用一种饲料。一段时间后称重,猪体重增加数据如下表所示,比较四种饲料对猪体重增加的作用有无不同。,6.2 单因素方差分析,第1步 分析:由于考虑的是一个控制变量(饲料)对一个观测变量(猪体重)的影响,而且是4种饲料,所以不适宜用独立样本T检验(仅适用两组数据),应采用单因素方差分析。 第2步 数据的组织:数据分成两列,一列是猪的体重,变量名为“weight”,另一变量是饲料品种(变量值分别为1,2,3,4),变量名为“fodder”,输入数据并保存。 第3步 方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同的饲料folder影响下的体重weight)的总体服从方差相等的正态分布,且各组方差具有齐性。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的,因此必须对方差相等的前提进行检验。,6.2 单因素方差分析,不同饲料的方差齐性检验结果,方差齐性检验的H0假设是:方差相等。从上表可看出相伴根据Sig.=0.995 (0.05)说明应该接受H0假设(即方差相等)。故下面就用方差相等的检验方法。,6.2 单因素方差分析,几种饲料的方差检验(ANOVA)结果,上表是几种饲料方差分析的结果,组间(Between Groups)平方和(Sum of Squares)为20538.698,自由度(df)为3,均方为6846.233;组内(Within Groups)平方和为652.159,自由度为15,均方为43.477;F统计量为157.467。由于组间比较的相伴概率Sig.(p值)=0.0000.05,故应拒绝H0假设(四种饲料喂猪效果无显著差异),说明四种饲料对养猪的效果有显著性差异。,6.2 单因素方差分析,第4步 多重比较分析:通过上面的步骤,只能判断4种饲料喂猪效果是否有显著差异。如果想进一步了解究竟是哪种饲料与其他组有显著性的均值差别(即哪种饲料更好)等细节问题,就需要在多个样本均值间进行两两比较。由于第3步检验出来方差具有齐性,故选择一种方差相等的方法,这里选LSD方法;显著性水平默认取0.05;,6.2 单因素方差分析,第5步 运行主要结果及分析:,多重比较(Multiple Comparisons)结果,从整个表反映出来四种饲料相互之间均存在显著性差异,从效果来看是第4种最好,其次是第3种,第1种最差。,6.2 单因素方差分析,均值折线图,上图为几种饲料均值的折线图,可以看出均值分布比较陡峭,均值差异也较大。,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析,6.3 多因素方差分析,6.3.1 基本概念及统计原理 基本概念 多因素方差分析用来研究两个及两个以上的控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个控制因素对观测变量的影响,也能够分析多个控制因素的交互作用对观测变量产生影响,进而最终找到利于观测变量的最优组合。 多因素方差分析不仅需要分析多个控制变量独立作用对观测变量的影响,还要分析多个控制变量的交互作用对观测变量的影响,及其他随机变量对结果的影响。因此,需要将观测变量总的离差平方各分解为3个部分: 多个控制变量单独作用引起的离差平方和; 多个控制变量交互作用引起的离差平方和; 其他随机因素引起的离差平方和。,6.3 多因素方差分析,(2) 统计原理 以两个控制变量为例,多因素方差分析将观测变量的总离差平方和分解为:SST=SSA+SSB+SSAB+SSE 设控制变量A有k个水平,变量B有r个水平 ,则SSA的定义为(SSB的定义类似):,其中, 为因素A第i个水平和因素B第j个水平下的样本观测值个数, 为因素A第i个水平下观测变量的均值。,其中, 是因素A、B在水平i、j下的观测变量均值。,6.3 多因素方差分析,在固定效应模型中,各F统计量为:,在随机效应模型中, 统计量不变,其他两个F统计量分别为:,6.3 多因素方差分析,(3) 分析步骤 第1步 提出零假设:多因素方差分析的零假设H0是:各控制变量不同水平下观测变量各总体均值无显著差异,控制变量各效应和交互作用效应同时为0,即控制变量和它们的交互作用对观测变量没有产生显著性影响。 第2步 构造检验统计量:多因素方差分析采用的是F统计量,根据效应模型选择。 第3步 计算检验统计量的观测值和概率p值:SPSS会自动将相关数据代入各式,计算出检验统计量的观测值的概率p值(也称相伴概率值Sig.)。 第4步 给出显著性水平 ,作出决策。,6.3 多因素方差分析,6.3.2 SPSS实例分析 【例6.2】研究一个班三组不同性别的同学(分别接受了三种不同的教学方法)在数学成绩上是否有显著差异,数据如下表。,6.3 多因素方差分析,第1步 分析:需要研究不同教学方法和不同性别对数学成绩的影响。这是一个多因素(双因素)方差分析问题。 第2步 数据组织:如上表的变量名组织成4列数据。 第3步 变量设置:按“分析|一般线性模型| 单变量”的步骤打开单变量对话框。并将“数学”变量移入因变量框中,将“组别”和“性别”移入固定因子中,如下图:,6.3 多因素方差分析,第4步 设置方差齐性检验:由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,单击“选项”按钮,选中“方差齐性检验”,显著性水平 设为默认值0.05。 第5步 设置控制变量的多重比较分析:单击“两两比较”按钮,如下图,在其中选出需要进行比较分析的控制变量,这里选“组别”,再选择一种方差相等时的检验模型,如LSD。,6.3 多因素方差分析,第6步 选择建立多因素方差分析的模型种类:打开“模型”对话框,本例用默认的全因子模型。 第7步 以图形方式展示交互效果:设置方式如下图。,6.3 多因素方差分析,第8步 对控制变量各个水平上的观察变量的差异进行对比检验:选择“对比”对话框,对两种因素均进行对比分析,用“简单”方法,并以最后一个水平的观察变量均值为标准。 第9步 主要结果及分析,表示了各控制因素的个案数,即分组描述情况。,是对数学进行方差齐性检验的结果,可以看出方差无显著差异,应用前面的LSD方法的结果。,6.3 多因素方差分析,该表是进行多因素方差分析的主要部分,由于指定建立全因子模型,因此总的离差平方和分为3个部分:多个控制变量对观察量的独立作用、交互作用及随机变量的影响。,6.3 多因素方差分析,这是组别变量的均值比较结果,可以看第1,2组与第3组比较的均值差异均显著。,6.3 多因素方差分析,性别比较图,从上图可看出,不同性别之间的成绩也有显著性差异。,6.3 多因素方差分析,不同教学方法的比较,由于在前面检验方差具有齐性,从LSD结果看出其均值第0组第2组第1组。,6.3 多因素方差分析,交互作用的影响图,从上图可知两因素的交互作用对数学的学习成绩具有显著性影响。,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析,6.4 协方差分析,6.4.1 基本概念及统计原理 基本概念 协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。 例如,研究某种药物对病症的治疗效果,如果仅仅分析药物本身的作用,而不考虑不同患者自身不同的体质,那么很可能得不到结论或得到的结论不正确。因此,在分析时应尽量排除这些因素的影响。 协方差将那些很难控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对观察量的影响,从而实现对控制变量效果的准确评价。,6.4 协方差分析,统计原理 以单因素协方差分析为例,总的离差平方和表示为:,协方差仍采用F检验,F统计量的计算公式为:,6.4 协方差分析,分析步骤 第1步 提出零假设:协方差分析的零假设H0是:控制变量和协变量对观测变量均无显著性影响。 第2步 选择检验统计量:协方差分析采用的是F统计量 ,其计算公式同前。 第3步 计算检验统计量的观测值和概率p值。 第4步 给出显著性水平 ,作出决策。,6.4 协方差分析,6.4.2 SPSS实例分析 【例6-3】已知一个班三组同学的入学成绩和分别接受了三种不同的教学方法后的数学成绩如下表所示,试研究这三组同学在接受了不同的教学方法后在数学成绩上是否有显著性差异。,6.4 协方差分析,第1步 分析:入学成绩肯定会对最后成绩有所影响,这里着重分析不同教学方法的影响,应将入学成绩(数学基础)的影响去除,考虑用协方差分析。 第2步 数据组织:将姓名、数学、入学成绩和组别分别定义为:“name:”、“math”、“entrance”和“group”。 第3步 检验协方差分析的前提条件:该前提条件是各组方差是否一致和协变量“entrance”与控制变量“group”是否具有交互作用。,左表是方差的齐性检验结果,由于其相伴概率值Sig.=0.1310.05,因此认为各组的方差具有齐性。,6.4 协方差分析,上表是检验控制变量与协变量是否具有交互作用,从其中可看出group与entrance的交互作用项Sig.=0.7840.05,因此认为它们之间没有交互作用。,6.4 协方差分析,从以上分析可知,例6-3是满足协方差分析中关于方差齐性和协变量与控制变量之间没有交互作用这两个基本条件的,因此可用协方差分析来处理。 第4步 执行协方差分析:其设置与单变量分析相似。 第5步 主要结果及分析。,可以看出入学成绩的影响是不显著的,而教学方法的影响是显著的。,The End,第七章,相关分析,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,7.1相关分析简介,(1) 函数关系与相关关系 变量之间的关系可以分为两种:一种是函数关系,另一种是相关关系。函数关系是一一对应的确定性关系,比较容易分析和测度。可是在现实世界中,变量间的关系往往并不是简单的确定性关系,也就是说,变量之间有着密切的关系,但又不能由一个或几个变量的值确定另一个变量的值,即当自变量x取某一值时,因变量y的值可能会有多个。这种变量之间的非一一对应的、不确定性的关系,称之为相关关系。 (2) 相关分析基本概念 衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。相关系数是衡量变量之间相关程度的一个指标,总体的相关系数用表示,样本的相关系数用r表示。,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,7.1二元变量相关分析,(1) 基本概念 二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相关分析和二元定序变量的相关分析。 (2) 统计原理 二元定距变量的相关分析 :定距变量又称为间隔(interval)变量(即连续属性变量),变量值之间可以比较大小,可以用加减法计算出差异的大小。 Pearson简单相关系数及t统计量,7.1二元变量相关分析,定序变量的相关性分析 :定序变量又称为有序(ordinal)变量、顺序变量、等级变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等)。定序变量的相关系数用斯皮尔曼(Spearman)相关系数和肯德尔(Kendalls )相关系数来衡量。 Spearman相关系数及Z统计量,Kendalls等级相关系数 及Z统计量,7.2 二元变量相关分析,(3) 分析步骤 第1步 计算相关系数r:利用样本数据计算样本相关系数,样本相关系数反映了两变量间线性相关程度的强弱。相关系数的取值范围界于-1与1之间,即-1r1 当0r 1,表明变量之间存在正相关关系; 当-1 r0,表明变量之间存在负相关关系; 当|r|=1时,表示其中一个变量的取值完全取决于另一个变量,二者即为函数关系; 当r=0时,说明变量之间不存在线性相关关系,但这并不排除变量之间存在其它非线性相关的可能。,根据经验可将其相关程度分为几种:当|r|0.8时视为高度相关;当0.5|r|0.8时视为中度相关;当0.3 |r|0.5时视为低度相关;当|r|0.3时说明变量之间的相关性很弱。,第2步 对样本来自的两总体是否存在显著的线性关系进行推断:由于存在抽样的随机性和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的两总体是否具有显著的线性相关性,需要通过假设检验的方式对样本的总体进行统计推断。 提出零假设H0:即两总体无显著的线性关系; 构造检验统计量:由于不同的相关系数采用不同的检验统计量,因此在相关分析时,不同的过程需要构造不同的检验统计量; 计算检验统计量的观测值及对应的概率p值; 对两总体的相关性进行推断:如果检验统计量的概率p值小于给定的显著性水平,应拒绝零假设,即认为两总体之间存在显著性线性关系;反之,应接受零假设。,7.2二元变量相关分析,(4) SPSS实现举例 【例7-1】为了分析父亲与儿子身高之间的相关性,现抽样了12对父子的身高,数据如下表。请对其进行相关性分析(显著性水平取0.05)。,7.2二元变量相关分析,第1步 分析:身高是定距变量,考虑用Pearson相关系数来衡量。 第2步 数据的组织:分成两列,一列是父亲的身高,另一列是儿子的身高。,7.2二元变量相关分析,第3步 选择菜单“分析相关双变量”,打开如图7-1所示的对话框,将“father”和“son”两变量移入“变量”框中;“相关系数”选择Pearson;在“显著性检验”中选择“双侧检验”;,7.2二元变量相关分析,第4步 主要结果及分析。,其中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。从表中可看出,相关系数为0.7030,说明呈正相关,而相伴概率值Sig.=0.0050.05,因此应拒绝零假设(H0:两变量之间不具相关性),即说明儿子身高是受父亲身高显著性正影响的。,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,(1) 基本概念 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。偏相关系数的数值和简单相关系数的数值常常是不同的,在计算简单相关系数时,所有其他自变量不予考虑。 (2) 统计原理 控制一个变量和控制两个变量的偏相关系数分别为:,7.3 偏相关分析,检验的统计量为:,(3)统计分析步骤 第1步 根据公式计算偏相关系数; 第2步 对样本来自的两总体是否存在显著性相关进行推断。 提出零假设H0:即两总体的偏相关系数与零无显著性差异; 选择检验统计量:偏相关分析选择的是t统计量; 计算t值及对应的概率p值; 决策:如果相伴概率p值小于给定的显著性水平,则应拒绝零假设,认为两总体的偏相关系数与零有显著性差异;否则,接受原假设。,7.3 偏相关分析,(4) SPSS实现举例 【例7-3】 下表是四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度4个气候因素中哪些因素有关。,7.3 偏相关分析,56,7.3 偏相关分析,第1步 分析:这4个气候因素彼此均有影响,分析时应对生长量与4个气候因素分别求偏相关,如在求生长量与气候因素的相关时控制其他因素的影响。所以需进行偏相关分析; 第2步 数据组织:如上表定义4个变量,输入数据即可; 第3步 进行偏相关分析:选择菜单“分析相关双变量”,指定分析变量和控制变量,分析变量“hgrow”和“temp”的偏相关系数,并将“rain”、“hsun”、“humi”设为控制变量。如下图所示设置。,第4步 主要结果及分析。,7.3 偏相关分析,从中可以看出,月降雨量、月平均日照时数和月平均湿度为控制变量,生长量与月平均气温关系密切,偏相关系数为0.977,双尾检测的相伴概率为0.000(表示趋近于0的正数),明显小于显著性水平0.05。故应拒绝原假设,说明中山柏的生长量与气温间存在显著的相关性。,主要内容,7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析,(1) 基本概念 距离分析是对观测量之间相似或不相似程度的一种测度,是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。 (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论