SPSS在方差分析上的应用_第1页
SPSS在方差分析上的应用_第2页
SPSS在方差分析上的应用_第3页
SPSS在方差分析上的应用_第4页
SPSS在方差分析上的应用_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程 . 本章内容 9.1 方差分析的概念与方差分析的过程 9.2 单因素方差分析 9.3 单因变量多因素方差分析过程 9.4 多因变量线性模型的方差分析 9.5 重复测量设计的方差分析 9.6 方差成分分析 9.7 正交实验设计 练习题(对银行数据进行方差分析) 9.1.1方差分析的概念 在科学实验中常常要探讨不同实验条件或 处理方法对实验结果的影响。通常是比较 不同实验条件下样本均值间的差异 方差分析是检验多组样本均值间的差异是 否具有统计意义的一种方法。例如 n医学界研究几种药物对某种疾病的疗效; n农业研究土壤、肥料、日照时间等因素对某 种农作物产量的影响 n不同饲料对牲畜体重增长的效果等 都可以使用方差分析方法去解决 方差分析基本原理 认为不同处理组的均值间的差别基本来源 有两个: n(1)随机误差,如测量误差造成的差异或个 体间的差异,称为组内差异,用变量在各组的 均值与该组内变量值之偏差平方和的总和表示 , 记作SSw,组内自由度dfw n(2)实验条件,即不同的处理造成的差异, 称为组间差异。用变量在各组的均值与总均值 之偏差平方和表示,记作SSb,组间自由度dfb n总偏差平方和SSt 、 SSb 、 SSw的公式P147 方差分析基本原理(续) 组内SSw 、组间SSb除以各自的自由度(组内 dfw =n-m,组间dfb=m-1,其中n为样本总 数,m为组数),得到其均方MSw和MSb,一 种情况是处理没有作用,即各组样本均来自 同一总体, MSb/MSw1。另一种情况是处 理确实有作用,那么, MSbMSw (远远大 于)。 MSb/MSw比值构成F分布,用F值与其临界值 比较,推断各样本是否来自相同的总体. 方差分析的假设检验 零假设H0:m组样本均值都相同,即1= 2= m 如果经过计算结果组间均方远远大于组内均方 ( MSbMSw ),FF0.05(dfb,dfw), p0.05不能拒绝零假设,说 明样本来自相同的正态总体,处理间无差异。 9.1.2 方差分析中的术语 1、因素与处理:因素是影响因变量变化的 客观条件;处理是影响因变量变化的人为条件 。也可通称为因素。用分类变量表示,取有限 的离散值 2、水平:因素的不同等级称作水平。水平值 取有限的离散值。如:性别中的0,1(男、女 )等 3、单元(cell):指各因素的水平之间的每个 组合。如性别(0,1)和年龄(10,11,12)的六种 组合。 9.1.2 方差分析中的术语(续) 4、因素的主效应和因素间的交互效应(如药物 A、B的主效应及AB的交互效应) 5、均值比较: n均值的相对比较是比较各因素对因变量的效应大小的 相对比较,如研究A、B的单独效应之和是否等于它们 的交互效应,或A、B的效应是否相等。 n均值的多重比较是研究因素单元对因变量的影响之间 是否存在显著性差异。如A、B的疗效是否存在显著性 差异。 6、单元均值、边际均值: n在多因素方差分析中,每种因素水平组合的因变量均 值称为单元均值。一个因素水平的因变量均值称为边 际均值(Marginal Means) 方差分析中的术语(续) 7、协方差分析:在一般进行方差分析时,要求除研究的 因素外应该保证其他条件的一致。作动物实验往往采用同一胎动 物分组给予不同的处理,研究不同处理对研究对象的影响就是这 个道理。如研究身高与体重的关系时要求按性别分别进行分析, 以消除性别因素的影响。要消除其他因素的影响,应采用协方差 分析。 8、重复测量:组内变异的主要的原因是实验对象之间的个 体差异。由于个体差异存在,即使实验对象受到相同的处理,他 们的因变量值也可能相当不同。重复测量设计的方差分析也是像 协方差分析一样,是在研究中减少个体差异带来的误差方差的一 种有效方法,而且由于对相同个体进行重复测量,在一定程度上 降低了人力、物力、财力的消耗。 如果重复测量是在一段时间内或一个温度间隔内进行的,还可以 研究因变量对时间、温度等自变量的变化趋势,这种重复测 量研究称为趋势研究。 9.1.3 方差分析过程 1、One-Way过程:单因素简单方差分析 过程。在Compare Means菜单项中,可 以进行单因素方差分析、均值多重比较和 相对比较。 2、General Linear Model(简称GLM) 过程:GLM过程由Analyze菜单直接调用 。这些过程可以完成简单的多因素方差分 析和协方差分析,不但可以分析各因素的 主效应,还可以分析各因素间的交互效应 。 General Linear Model(简称GLM)过程 n在General Linear Model菜单项下有 四项: nUnivariate:提供回归分析和一个因变量和一 个或几个因素变量的方差分析。 nMultivariate:可进行多因变量的多因素分析 nRepeated Measure:可进行重复测量方差分析 nVariance Component:可进行方差成分分析。 通过计算方差估计值,可以帮助我们分析如何 减小方差。 9. 单因素方差分析 也称有一维方差分析,对二组以上的均值加以比较。 检验由单一因素影响的一个(或几个相互独立的)分 析变量由因素各水平分组的均值之间的差异是否有统 计意义。 并可以进行两两组间均值的比较,称作组间均值的多 重比较,还可以对该因素的若干水平分组中哪些组均 值不具有显著性差异进行分析,即一致性子集检验。 One-Way ANOVA过程要求: n因(分析)变量属于正态分布总体,若因(分析)变量的分 布明显的是非正态,应该用非参数分析过程。 n对被观测对象的实验不是随机分组的,而是进行的重复测量 形成几个彼此不独立的变量,应该用Repeated Measure菜 单项,进行重复测量方差分析,条件满足时,还可以进行趋 势分析。 9.1 简单的一维方差分析 使用系统默认值进行一维方差分析: nP151 比较四种饲料对猪体重增加的作用有无不同( 注意:分组变量的定义)data09-01 nAnalyze-Compare Means-One-Way ANOVA nDependent List:weight nFactor:fodder n结果只有方差分析表 n结果中比较有用的值:Sig显著性概率值。 n结论:四种饲料对猪体重增加的作用有显著性差异。 n零假设H0:组间均值无显著性差异(即四种饲料对猪 体重增加的平均值无显著性差异); 9.2-9.3 单因素方差分析的选择项和例子 使用选择项的单因素方差分析: nP155 比较四种饲料对猪体重增加的作用data09-01 nAnalyze-Compare Means-One-Way ANOVA nDependent List:weight nFactor:fodder nContrasts选项: 多项式比较(AD与BC比较和AC与BD比较) nPost Hoc选项: 均值多重比较LSD和Tamhanes T2 ,一致性子集 检验Duncan(各种方法的使用条件方差齐或不齐) nOptions选项:Descriptive描述统计量,Homogeneity-of- variance方差齐次性检验,Means plot均值分布图 n结果除了方差分析表,还有很多选项相应的结果 n结论:四种饲料对猪体重增加的作用有显著性差异,还可得知 ABCD四种饲料对猪平均体重增加多少(越来越多)。 nP159 同种三叶草被接种上不同的菌种,其含氮量情况data09- 02(注意Post Hoc各种方法结果的使用条件方差齐或不齐). 9.3 单因变量多因素方差分析过程 (多因素, 2) 1、单因变量多因素方差分析概述 2、单因变量多因素方差分析的菜单和选择项 3、使用系统默认值进行随机区组设计资料的方 差分析 4、22析因实验方差分析实例 5、拉丁方区组设计的方差分析实例 6、协方差分析实例 7、多维交互效应方差分析实例 9.3.1单因变量多因素方差分析概述 1、概述 n是对一个独立变量是否受多个因素或变量影响而进行的方差分析。 nSPSS调用UNIANOVA过程,检验不同水平组合之间因(分析)变量 均值由于受不同因素影响是否有差异的问题。 nUNIANOVA过程可以分析每一个因素的作用(主效应),也可以分析 因素之间的交互作用(交互效应)。可以进行协方差分析,以及各因 素变量与协变量之间的交互作用。 nUNIANOVA过程要求因变量是从多元正态总体随机采样得来,且总体 中各单元的方差相同,也可以通过方差齐次性检验选择均值比较结果 。 n因变量和协变量必须是数值型变量,协变量与因变量彼此不独立。因 素变量是分类变量,可以是数值型和字符型。 n固定因素变量(Fixed Factor)是反应处理的因素。随机因素是随机 设置的因素,是在确定模型时需要考虑会对实验有影响的因素,对实 验结果影响的大小可以通过方差成分分析确定。 2、关于模型:GLM Univariate功能很强,可以建立包括各种主效应、交 互效应的模型。必须认真分析因素变量的具体情况,来确定自己的模型, 否则会产生不可解释的输出结果。 9.3.2 单因变量多因素方差分析的菜单和选择项 菜单:Analyze-General Linear Model- Univariate 选项: n选择分析模型Model: w默认全模型Full Factorial:包括所有因素变量的主效应、所有协 变量的主效应、所有因素与因素的交互效应,不包括协变量与其他 因素的交互效应。 w自定义模型Custom:主效应(Main effects及其因素变量)、交互 变量(有交互效应维数之分) w选择分解平方和的方法(默认为TYPE III) wInclude Intercept in model:系统默认截距包括在回归模型中。 n选择对照方法Contrasts n选择分布图形Plots n选择多重比较分析Post Hoc n保存运算结果的选择项Save n选择输出项Options 9.3.3 使用系统默认值进行随机区组设计资料的方差分析 P168 比较不同种系、剂量的雌性大白鼠子宫重量,看 不同种系、不同剂量对雌性大白鼠子宫重量是否有显著 性作用data09-03 nAnalyze-General Linear Model- Univariate nDependent:wuteri nFixed Factor(s):mouse、etrogen nModel选项: Custom(Main effect, mouse和etrogen) n主效应方差分析检验结果(截距,主效应,误差Error) n结果中比较有用的值:Sig显著性概率值(各自主效应,截 距-线性回归关系) n结论:不同种系、不同剂量对雌性大白鼠子宫重量均有有显 著性作用。 n注意:选择只有主效应,原因是每种组合只有一个观 测量。如果分析交互作用,无法计算差异的显著性 9.3.4 析因实验方差分析概念 多因素析因实验的方差分析:析因实验 是把各因素的各水平的全部组合排列出 来,然后按每个条件的组合作一次或多 次重复的实验,所得的全部数据个数 n=a*b*.*k,其中a,b,. 为各因 素的水平数,k为每种组合内的重复数 。析因分析的好处在于对各因素间的交 互影响项的方差都可以加以析离并检验 其显著性。 9.3.4 22析因实验方差分析实例 两因素、两水平的实验设计。 例子:P171使用两种药物A(0-不用,1-用)和B (0-不用,1- 用)治疗缺铁性贫血(2*2=4种组合,每种组合有3个病人),看 A、B、AB的作用data09-04 nAnalyze-General Linear Model- Univariate nDependent:redcell nFixed Factors:drugA、drugB n保留全模型选项(不对Model操作) n选择Plot选项: 作三个图drugA、drugB、 drugA*drugB n选择输出Option选项:选 drugA、drugB、 drugA*drugB、Overall进 入Display Means for框中 n结果除了方差分析表( (截距、主效应、交叉效应、误差Error),还有很 多选项相应的结果 n结论p173:两种药物A和B均对治疗缺铁性贫血有显著疗效 ,两种药物A和B的协同作用也很显著。 9.3.5 拉丁方区组设计的方差分析实例 拉丁方实验设计的特点:有两个以上因素变量,每个因素变量的水平 数相等。 例子:P174为了评价六种不同甜菜,选择地块土壤条件相同,将 六种甜菜(变量variety)种子播种在六行(变量rep)、六列(变 量Col)的地块上,记录两次收获(变量Harvest)的产量(变量 yield)data09-05(3因素6*6拉丁方,n=6*6*272 Cases ) 实验的假设是:不同地块(行、列)对产量均值无影响,不同种子 产量均值无影响 nAnalyze-General Linear Model- Univariate nDependent:yield nFixed Factors:rep、col、variety nModel:只分析三个主效应rep、col、variety(Main effects) n主效应方差分析检验结果(截距,主效应,误差Error) n结果中比较有用的值:Sig显著性概率值(各自主效应,不同品种 的甜菜variety 有显著性差异,即平均产量的差异主要是品种不同 造成的,而跟地块无关) 9.3.6 协方差分析实例 协方差分析是利用线性回归方法消除混杂因素的影响后进行的 方差分析。 例子:P176 镉作业工人按暴露于镉烟尘的年数大于等于10年和 不足10年两组。两组工人的年龄未经控制(人随着年龄的增长 ,肺活量也会有所下降),测量了每个工人的肺活量。课题研 究暴露于镉粉尘的年数和肺活量的关系(要消除年龄的影响), Data09-06,Time接触镉粉尘时间分组(1为=10年,2为General Linear Model- Univariate nDependent: Vitalcp nFixed Factors:time nCovariate:Age nOption:Display Means For:time(分Time显示肺活量均值) Display :Parameter Estimates(肺活量与年龄的线性回归 方程,分time) n结果中比较有用的值:Sig显著性概率值(各主效应,年龄Age有显著 性差异, TIME无显著性差异,即肺活量的差异是由于被试者的年龄差 异所致,与被试者接触镉粉尘时间的时间是否大于10年无关) 9.3.7 多维交互效应方差分析实例 p178实验数据为教育心理学实验,心理运动测验分数与被试者 必须瞄准的目标大小关系的资料Data09-07 n四个大小不同的目标:Target n三部测验设备:Device n两种不同明暗程度的照明环境:Light n432的析因实验设计(24个组合单元,每组5个Cases,共 245120Cases) Analyze-General Linear Model- Univariate nDependent:Score nFixed Factors: Target、 Device、 Light nModel:保留全模型选项(不对Model操作) n选择输出Option选项:选Target*Device* Light进入Display Means for框中:各种组合均值 n选择Plot选项: 作四个图Target、 Device、 Light 、 Target*Device* Light n结果中比较有用的值:Sig显著性概率值(各主效应,交互效应,均对 Score有显著性作用) 9.4 多因变量线性模型的方差分析P181 概述: GLM Multivariate过程提供回归分析和 多因变量的方差分析。多因变量方差分析模型 除包括多个因变量外,还可以包括一个或几个 因素变量或协变量。因素变量把总体分为几个 组。使用这个一般线性模型过程,可以检验因 素变量在因变量的联合分布的各组均值的效应 ,可以研究因素间的交互效应和单一因素的效 应,另外还包括协变量效应和协变量与因素间 的交互效应。对回归分析,协变量作为自变量 (预测变量) GLM Multivariate过程可以检验平衡和不平 衡模型。模型中每个单元包括相同数量的观测 量为平衡设计。 9.4.3多因变量线性模型方差分析实例 实例:数据是对男33人、女26人的头部四 个解剖部位的测量结果,研究男女头部有 无显著性差异。Data09-08 菜单:Analyze-General Linear Model - Multivariate nDependent:Basilar、length、postorb、 zygoma nFixed Factors: Sex nModel:保留全模型选项(不对Model操作) nOption:Descriptive Statistics n结果中比较有用的值:Sig显著性概率值(不同性别 的头部四个解剖部位没有显著性差异) 9.5 重复测量设计的方差分析 概述P187:重复测量设计方差分析的样本必须包括同质 的实验单位或进行多次重复测量的实验。 GLM重复测量属于高级分析过程,是对同一因变量进行 重复测量,可以是同一条件下进行的重复测度,目的 在于研究各种处理之间是否存在显著性差异的同时, 研究被试着之间的差异;也可以是不同条件下的重复 测度,目的在于研究各种处理间是否存在显著性差异 的同时,研究形成重复测量条件间的差异以及这些条 件与处理间的交互效应。 重复测量设计方差分析的数据文件结构:若干次重复 测量结果作为不同因变量出现在数据文件中。 9.5 重复测量方差分析实例1 P188实例1-Data09-09 :设置了三个级别的视觉刺激 作为处理因素变量vsno(视觉刺激等级1、2、3),4位 被试者均接受三个级别的视觉刺激,并在同样条件下测 试三次(time1,time2,time3) 。 H0:三个级别的视觉 刺激之间(被试者内)无显著性差异。 菜单:Analyze-General Linear Model- Repeated Measure nWithin-Subject Factor Name:time nNuber of Levels:3 nDefine: nWithin-Subjects Variables time:time1,time2,time3 nBetween-Subject Factor:vsno n结果中比较有用的值:Sig显著性概率值(三次测量之间没 有显著性差异, 4位被试者之间对每种相同视觉刺激的反映 也没有显著性差异,而对不同的视觉刺激等级有显著性差异 ) 9.5.4 重复测量方差分析实例2 P191实例-Data09-10a :研究四种药物对某生化指 标的作用(med1, med2, med3, med4) ,5位被 试者参与实验,零假设H0:四种药物对某生化指标作 用之间(被试者内)无显著性差异。 菜单:Analyze-General Linear Model- Repeated Measure nWithin-Subject Factor Name:med nNuber of Levels:4 nDefine: nWithin-Subjects Variables med:med1-med4 nOption: Display Means for: Med Display: Descriptive Statistics n结果中比较有用的值:Sig显著性概率值(四种药物对某 生化指标作用之间有显著性差异,而5位被试者之间对每 种相同药物的反映也有显著性差异) 9.5.5 关于趋势分析 P194概念:当重复测量的条件是某些顺序变量时,可以分析重复测量的因 变量随顺序变量变化的趋势。 实例-Data09-11 :选择16名实验对象(no),使用两种方法(group)锻炼 他们的记忆力。训练一段时间后,每隔一天测试一次记忆情况,共测试5次 。每次测试对每个参与实验的人员均按一定的法则打分(day1-day5)。这 是一个组内因素、一个组间因素的重复测量设计的例题。因为组内因素是与 时间有关的变量,因此不但可以分析比较两种训练记忆的方法哪个更有效, 还可以得到随时间的推移,记忆分数随时间下降的数学模型(线性关系 Linear、二次关系Quadratic、三次关系Cubic)。 菜单:Analyze-General Linear Model- Repeated Measure nWithin-Subject Factor Name:days (Nuber of Levels:5) nDefine: nWithin-Subjects Variables days:day1day5 nBetween-Subject Factor:group nModel:Main effects(days,Group) nPlots:Days*Group nOption: Display Means for: Days,group,overall Display: Descriptive Statistics和Estimate of effect size n结果中比较有用的值:Sig显著性概率值(多元、组内、趋势分析)和趋势 图(Days*group的Plot图) 9.6 方差成分分析 概述P198:是对混合效应模型中各随机效应对 因变量变异的贡献进行分析。 菜单:Analyze-General Linear Model- Variance Components n定义因变量和随机因素 n选分析模型Model:Full Model或Custom n选分析方法Option:四选一 wMINQUE正态最小二次无偏估计,默认方法 wANOVA(Analysis of Variance) wMaximum likelihood(ML)最大似然法 wRestric

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论