第7章 方差分析_第1页
第7章 方差分析_第2页
第7章 方差分析_第3页
第7章 方差分析_第4页
第7章 方差分析_第5页
已阅读5页,还剩15页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7章 方差分析7.2单因素方差分析(单因变量单因素方差分析)基本描述:设影响某个指标的因素只有一个A,相应的水平为A1, A2, ,Ak,假设各个水平所对应的总体服从正态分布,方差相等.单因素方差分析的目的之一就是检验.若拒绝原假设,则认为至少有两个水平间存在着差异,到底是那些水平间存在差异呢?这时可以进行多重比较,一致性子集检验(把均值间不存在差异的水平划分为一类).若不知方差是否相等,还可以进行方差齐性检验.方差分析是对总平方和进行分解,分解为因素的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个因素的各个水平之间是否存在差异;进行多重比较,一致性子集

2、检验;进行方差齐性检验。方法:AnalyzeCompare MeansANOVA注1:在数据文件时,因变量(即指标)只有一个,各个水平下的观测量通过分类变量来区分.注2:因变量一般要求服从正态分布。对照:例:data07-01.sav例:data07-02.sav7.3单因变量多因素方差分析基本描述:设影响某个指标的因素有多个,假设各个水平组合所对应的总体服从正态分布,方差相等.单因变量多因素方差分析的目的之一就是检验或主效应: 反映一个因素对指标的影响性的一个度量.主效应的作用可通过相应的平方和来体现.交互效应: 两个以上因素间的相互作用对指标的影响性的一个度量.方差分析是对总平方和进行分解

3、,分解为各个因素的平方和,交互作用的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个变量是否受多个因素影响?检验因素之间是否存在交互作用;进行协方差分析。要求:(1)因变量和协变量(或伴随变量):数值型变量。二者之间存在线性关系。(2)因子变量:分类变量。注:数据文件的建立.方法:AnalyzeGeneral Linear ModelUnivariate例:data07-03.sav -随机区组设计data07-04.sav -2*2析因设计(针对两个或以上因素的效应进行研究的实验设计,所使用的分析方法为多因素方差分析.2k析因设计要求有k个因素,每个因素有

4、两个水平)data07-05.sav -拉丁方设计(针对两个或以上因素的效应进行研究的实验设计,每个因素的水平数相等, 所使用的分析方法为多因素方差分析.它是为了消除多个变异源的影响)data07-06.sav -协方差分析(是方差分析和回归分析的综合.是利用线性回归分析消除某些变量的影响后进行的方差分析.)data07-07.sav -多维交互效应方差分析多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用

5、,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。例子研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。表5-7 不同温度与不同湿度粘虫发育历期表相对湿度

6、(%) 温度 重 复 12341002591.295.093.893.02787.684.781.282.42979.267.075.770.63165.263.363.663.3802593.289.395.195.52785.881.681.084.42979.070.867.778.83170.786.566.964.94025100.2103.398.3103.82790.691.794.592.22977.285.881.779.73173.673.276.472.5数据保存在“DATA5-2.SAV”文件中,变量格式如上。1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“

7、历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。图5-6 数据输入格式2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。图5-7 多因素方差分析窗口3)设置分析变量设置因变量: 在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。设置因素变量: 在左边变量列表中选“a”和“b”变量,用向右拉

8、按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。设置随机因素变量: 在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。4)选择分析模型在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。图5-8 “Univariate

9、Model” 定义分析模型对话框在Specify Model栏中,指定分析模型类型。 Full Factorial选项此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。选择该项后无需进行进一步的操作,即可单击“Continue”按钮返回主对话框。此项是系统缺省项。 Custom选项建立自定义的分析模型。选择了“Custom”后,原被屏蔽的“Factors & Covariates”、“Model”和“Build Term(s)”栏被激活。在“Factors & C

10、ovariates”框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量名,其变量名后面的括号中标有字母“C”。这些变量都是由用户在主对话框中定义过的。根据表中列出的变量名建立模型,其方法如下:在“Build Term(s)”栏右面的有一向下箭头按钮(下拉按钮),单击该按钮可以展开一小菜单,在下拉菜单中用鼠标单击某一项,下拉菜单收回,选中的交互类型占据矩形框。有如下几项选择: Interaction 选中此项可以指定任意的交互效应; Main effects 选中此项可以指定主效应; All 2-way 指定所有2维交互效应; All 3-way 指

11、定所有3维交互效应; All 4-way 指定所有4维交互效应 All 5-way 指定所有5维交互效应。 建立分析模型中的主效应:在“Build Term(s)”栏用下拉按钮选中主效应“Main effects”。在变量列表栏用鼠标键单击某一个单个的因素变量名,该变量名背景将改变颜色(一般变为蓝色),单击“Build Term(s)”栏中的右拉箭头按钮,该变量出现在“Model”框中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。也可以在标有“F”变量名中标记多个变量同时送到“Model”框中。本例将“a”和“b”变量作为主效应,按上面的方法选送到“Mode

12、l”框中。 建立模型中的交互项要求在分析模型中包括哪些变量的交互效应,可以通过如下的操作建立交互项。例如,因素变量有“a(F)”和“b(F)”,建立它们之间的相互效应。 连续在“Factors &”框的变量表中单击“a(F)”和“b(F)”变量使其选中。 单击“Build Term(s)”栏内下拉按钮,选中交互效应“Interaction”项。 单击“Build Term(s)”栏内的右拉按钮,“a*b”交互效应就出现在“Model”框中,模型增加了一个交互效应项:a*b Sum of squares 栏分解平方和的选择项 Type I项,分层处理平方和。仅对模型主效应之前的每项进行调整。一般

13、适用于:平衡的AN0VA模型,在这个模型中一阶交互效应前指定主效应,二阶交互效应前指定一阶交互效应,依次类推;多项式回归模型。嵌套模型是指第一效应嵌套在第二效应里,第二效应嵌套在第三效应里,嵌套的形式可使用语句指定。 Type II项,对其他所有效应进行调整。一般适用于:平衡的AN0VA模型、主因子效应模型、回归模型、嵌套设计。 Type III项,是系统默认的处理方法。对其他任何效应均进行调整。它的优势是把所估计剩余常量也考虑到单元频数中。对没 有缺失单元格的不平衡模型也适用,一般适用于:Type I、Type II所列的模型:没有空单元格的平衡和不平衡模型。 Type IV顶,没有缺失单元

14、的设计使用此方法对任何效应F计算平方和。如果F不包含在其他效应里,Type IV = Type IIIl =TypeII。如果F包含在其他效应里,Type IV只对F的较高水平效应参数作对比。一般适用于:Type I、Type lI所列模型;没有空单元的平衡和不平衡模型。 Include intercept in model栏选项系统默认选项。通常截距包括在模型中。如果能假设数据通过原点,可以不包括截距,即不选择此项。5)选择比较方法在主对话框中单击“Contrasts”按钮,打开“Contrasts”比较设置对话框,如图5-9所示。如图5-9 Contrasts对比设置框在“Factors”

15、框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的比较方法。 选择因子 在“Factors”框中选择想要改变比较方法的因子,即鼠标单击选中的因子。这一操作使“Change Contrast”栏中的各项被激活。 选择比较方法单击“Contrast”参数框中的向下箭头,展开比较方法表。用鼠标单击选中的对照方法。可供选择的对照方法有: None,不进行均数比较。 Deviation,除被忽略的水平外,比较预测变量或因素变量的每个水平的效应。可以选择“Last”(最后一个水平)或“First”(第一个水平)作为忽略的水平。 Simple,除了作为参考的水平外,对预测变量或因素变量的

16、每一水平都与参考水平进行比较。选择“Last”或“First”作为参考水平。 Difference,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert对照方法相反。 Helmert,对预测变量或因素的效应,除最后一个以外,都与后续的各水平的平均效应相比较。 Repeated,对相邻的水平进行比较。对预测变量或因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较。 Polynomial,多项式比较。第一级自由度包括线性效应与预测变量或因素水平的交叉。第二级包括二次效应等。各水平彼此的间隔被假设是均匀的。 修改比较方法先按步骤选中因子变量

17、,再选比较方法,然后单击“Change”按钮,选中的(或改变的)比较方法显示在步骤选中的因子变量后面的括号中。设置比较的参考类在“Reference Category”栏比较的参考类有两个,只有选择了“Deviation”或“Simple”方法时才需要选择参考水平。共有两种可能的选择,最后一个水平“Last”选项和第一水平“First”项。系统默认的参考水平是“Last”。6) 选择均值图在主对话框中单击“Plot”按钮,打开“Profile Plots”对话框,如图5-10所示。在该对话框中设置均值轮廓图。如图5-10 “Profile Plots”对话框均值轮廓图(Profile Plot

18、s)用于比较边际均值。轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值。如果指定了协变量,该均值则是经过协变量调整的均值。因变量做轮廓图的纵轴;一个因素变量做横轴。做单因素方差分析时,轮廓图表明该因素各水平的因变量均值。双因素方差分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线。如果是三因素方差分析,可以指定第三个因素变量,该因素每个水平产生一个轮廓图。双因素或多因素轮廓图中的相互平行的线表明在因素间无交互效应;不平行的线表明有交互效应。 Factors 框中为因素变量列表。 Horlzontal Axis 横坐标框,选择选择“Factors”框中一

19、个因素变量做横坐标变量。被选的变量名反向显示,单击向右拉箭头按钮,将变量名送入相应的横坐标轴框中。如果只想看该因素变量各水平的,因变量均值分布,单击“Add”按钮,将所选因素变量移入下面的“Plots”框中。否则,不点击“Add”按钮,接着做下步。 Separate Lines 分线框。如果想看两个因素变量组合的各单元格中因变量均值分布,或想看两个因变量间是否存在交互效应,选择“Factors”框中另一个因素变量,单击右拉按钮将变量名送入“Separate Lines”框中。单击“Add”按钮,将自动生成的图形表达式送入到“Plots”栏中。分线框中的变量的每个水平将在图中是一条线。图形表达式

20、是用“*”连接的两个因素变量名。 Separate Plots 分图框。如果在“Factors”栏中还有因素变量,可以按上述方法,将其送入“Separate Plot”框中,单击“Add”按钮,将自动生成的图形表达式送入到“Plots”栏中。图形表达式是用“*连接的三个因素变量名。分图变量的每个水平生成一张线图。 将图形表达式送到“Plots”框后发现有错误,单击选错的变量,单击“Remove”按钮,将其取消,再重新输入正确内容。 在检查无误后,按“Continue”按钮确认,返回到主对话框。如果取消做的设置单击“Cancel”按钮7) 选择多重比较在主对话框中单击“Post Hoc”选项,打

21、开“Post Hoc Multiple Comparisons for Observed Means”对话框,从“Factor(s)”框选择变量,单击向右拉按钮,使被选变量进入“Post Hoc test for”框。本例子选择了“a”和“b”。然后选择多重比较方法。在对话框中选择多重比较方法。本例子选择了“Duncan”和“Tamhanes T2”。8)选择保存运算值图5-11 Save对话框在主对话框中,单击“Save”按钮,打开“Save”设置对话框,如图5-11所示。通过在对话框中的选择,可以将所计算的预测值、残差和检测值作为新的变量保存在编辑数据文件中。以便于在其他统计分析中使用这些

22、值。 Predicted Values 预测值1. Unstsndardized,非标准化预测值。 2. Weighted,如果在主对话框中选择了WLS变量,选中该复选项,将保存加权非标准化预测值。 3. Standard error,预测值标准误。 Diagnostics 诊断值1. Cooks distance,Cook 距离。 2. Leverage values,非中心化 Leverage 值。 Residuals 残差1. Unstsndardized,非标准化残差值,观测值与预测值之差。 2. Weighted,如果在主对话框中选择了WLS变量,选中该复选项,将保存加权非标准化残差

23、。 3. Standardized,标准化残差,又称Pearson残差。 4. Studentized,学生化残差。 5. Deleted,剔除残差,自变量值与校正预测值之差。 Save to New File 保存协方差矩阵选中”Coefficient statistics”项,将参数协方差矩阵保存到一个新文件中。单击“File”按钮,打开相应的对话框将文件保存。9)选择输出项在主对话框中单击“Options”按钮,打开“Options”输出设置对话框,见图5-12。图5-12 “Options”输出设置对话框 Estimated Marginal Means 估测边际均值设置 在“Fact

24、or(s) and Factor Interactions”框中列出“Model”对话框中指定的效应项,在该框中选定因素变量的各种效应项,单击右拉按钮就将其复制到“Display Means for”框中。选择主效应,则产生估计的边际均值表;选择二维交互效应产生的估计边际均值表实际上是典型的单元格均值表。选择三维交互效应也是单元格均值表。 在“Display Means for”框中有主效应时激活此框下面的“Compare main effects”复选项,对主效应的边际均值进行组间的配对比较。 Confidence interval adjustment参数框,进行多重组间比较。打开下拉菜单

25、,共有三个选项:LSD(none)、Bonferroni、Sidak.。 在“Display”栏中指定要求输出的统计量Descriptive statistics项,输出描述统计量:观测量的均值、标准差和每个单元格中的观测量数。Estimates of effect size项,效应量估计。选择此项,给出2(eta-Square)值。它反应了每个效应与每个参数估计值可以归于因素的总变异的大小。Observed power复选项,选中此项给出在假设是基于观测值时各种检验假设的功效。计算功效的显著性水平,系统默认的临界值是0.05。Parameter estimates项。选择此项给出了各因素变量

26、的模型参数估计、标准误、t检验的t值、显著性概率和95的置信区间。Contrast coefficient matrix项,显示协方差矩阵。Homogeneity test项,方差齐次性检验。本例子选中该项。Spread vs.level plot项,绘制观测量均值对标准差和观测量均值对方差的图形。Residual plot项,绘制残差图。给出观测值、预测值散点图和观测量数目,观测量数目对标准化残差的散点图,加上正态和标准化残差的正态概率图。Lack of fit项,检查独立变量和非独立变量间的关系是否被充分描述。General estimable function项,可以根据一般估计函数自定

27、义假设检验。对比系数矩阵的行与一般估计函数是线性组合的。 Significance level 框设置改变“Confidence intervals”框内多重比较的显著性水平。10) 提交执行设置完成后,在多因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。11) 结果与分析主要输出结果:结果分析:方差不齐次性检验显著 表5-8 方差齐次性检验表明:方差不齐次性显著,p0.05。方差分析: 表5-9 主效应方差分析表:在表的左上方标明研究的对象是粘虫历期。偏差来源和偏差平方和: Source 列是偏差的来源。其次列是“Type III

28、 Sum of Squares”偏差平方和。 Corrected Model 校正模型,其偏差平方和等于两个主效应a、b平方和加上交互a*b的平方和之和。 Intercept 截距。 a 温度主效应,其偏差平方和反应的是不同温度造成对粘虫历期的差异。与b偏差平方相同均属于组间偏差平方和。 b 湿度主效应,其偏差平方和反应的是不同湿度计量造成的粘虫历期之差异。 a*b 温度和湿度交互效应,其偏差平方和反应的是不同温度和湿度共同造成的粘虫历期的差异。 Error 误差。其偏差平方和反应的是组内差异。也称组内偏差平方和。 Total 是偏差平方和在数值上等于截距、主效应、次效应和误差偏差平方和之总和。 Corrected Total 校正总和。其偏差平方和等于校正模型与误差之偏差平方和之总和。 df 自由度 Mean Square 均方,数值上等于偏差平方和除以相应的自由度。 F 值,是各效应项与误差项的均方之比值 Sig 进行F检验的p值。p0.05,由此得出“温度”和“湿度”对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论