




已阅读5页,还剩76页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,第五章方差分析,.,2,一、方差分析的概念,在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间差异。方差分析是检验两个或多个样本均数间差异是否具有统计意义的一种统计学方法。,.,3,方差分析主要用于均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验;举例:几种药物对某疾病的疗效;不同饲料对牲畜体重增长的效果;,.,4,1方差分析原理,随机误差,例如测量误差造成的差异,称为组内差异。用变量在各组的均值与该组内变量值之偏(离均)差平方和的总和表示。记作SS组内。实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏(离均)差平方和的总和表示。记作SS组间。SS组间、SS组内除以各自的自由度得到其均方值即组间均方和组内均方。,.,5,一种情况是处理没有作用,即各样本均来自同一总体。MS组间/MS组内1。考虑抽样误差的存在,则有MS组间/MS组内1。另一种情况是处理因素确实有作用。组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,组间均方会远远大于组内均方。MS组间MS组内。MS组间/MS组内比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。,.,6,2方差分析的假设检验,假设有m个样本,如果原假设H0:样本均数都相同1=2=3=m=,m个样本有共同的方差2。则m个样本来自具有共同的方差2和相同的均数的总体。如果经过计算结果组间均方远远大于组内均方的FF0.05(f组间,f组内),(括号中的两个f是自由度)则p0.05,推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异,有统计意义。否则,FF0.05(f组间,f组内),P0.05承认原假设,样本来自相同总体,处理无作用。,.,7,二、方差分析中的术语,因素与处理(FactorandTreament)水平(Level)单元(Cell)因素的主效应和因素间的交互效应均值比较协方差分析,.,8,1因素与处理,因素(Factor)是影响因变量变化的客观条件;例如影响农作物产量的因素有气温、降雨量、日照时间等;处理(Treatments)是影响因变量变化的人为条件。也可以通称为因素。如研究不同肥料对不同种系农作物产量的影响时农作物的不同种系可称为因素,所施肥料可视为不同的处理。一般情况下Factors与Treatments在方差分析中可作相同理解。在要求进行方差分析的数据文件中均作为分类变量出现。即它们的值只有有限个取值。即使是气温、降雨量等平常看作是连续变量的,在方差分析中如果作为影响产量的因素进行研究,就应该将其数值用分组定义水平的方法事先变为具有有限个取值的离散变量,.,9,2水平,因素的不同等级称作水平。例如,性别因素在一般情况下只研究两个水平:男、女。化学实验或生物实验中的“剂量”必须离散化为几个有限的水平数。如:1ml、2ml、4ml三个水平。应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能是字符型变量,必须是数值型变量。例如性别变量SEX,定义为数值型,取值为0、1。换句话说,因素变量的值实际上是该变量实际值的代码,代码必须是数值型的。可以定义值标签F、M(或Fema1e、ma1e)来表明0、1两个值的实际含义,以便在打印方差分析结果时使用。使结果更加具有可读性。,.,10,3.单元(Ce11),在方差分析中Cell指各因素的水平之间的每个组合。例如研究问题中的因素有性别Sex,取值为1、2;有年龄,分三个水平1(10岁)、2(11岁)、3(12岁)。两个变量的组合共可形成六个单元:1,1、1,2、1,3、2,1、2,2、2,3,代表两种性别与三种年龄的六种组合。,.,11,4因素的主效应和因素间的交互效应,有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是:第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红细胞增加数。要求分析两种药物的疗效(数据下表)。,.,12,实验数据,这是个双因素方差分析的问题,因素A与因素B。每个因素均有用该药与不用该药两个水平,研究药物A和B是否对红细胞的增加有显著影响是对红细胞增加数的均值作以下比较:,.,13,比较第二组的均值与第一组的均值是否有显著性差异。比较第三组的均值与第一组的均值是否有显著性差异。前两项研究的是A、B两因素的主效应。,.,14,除了比较第四组的均值与第一组的均值是否有显著性差异外还要研究A药对B药的疗效是否有影响。若A药对B药疗效无影响,那么除抽样误差外,第四组与第二组均值之差应该等于第三组均值减去第一组均值。但是实际上(2.11.2)=0.9;(1.00.8)=0.2。竞相差0.7,该差值几乎与第一组均值相同。0.7的差值包括抽样误差和A、B药的相互作用。,.,15,因素之间的相互作用在统计学上称之为交互效应。如果交互效应存在,说明两个因素不是相互独立的。,.,16,5均值比较,均值的相对比较是比较各因素对因变量的效应的大小的相对比较。例如研究A、B效应之和是否等于它们的交互效应。或者研究A、B对红细胞增加数的效应是否相等,等。均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异,例如例题中研究A、B药物对红细胞增加数的疗效是否存在显著性差异。,.,17,6协方差分析,在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究各种处理对研究对象的影响就是这个道理。例如研究身高与体重的关系时要求按性别分别进行分析。这样消除性别因素的影响。不同年龄的身高对体重的关系也是有区别的,被测对象往往是不同年龄的。要消除年龄的影响,应该采用协方差分析。,.,18,三、方差分析过程,SPSS提供的方差分析过程有:One-way过程(One-wayANOVA)GeneralLinearModel(简称GLM,一般线性模型)过程,.,19,(一)One-way过程,One-way过程就是单因素简单方差分析过程,它在Analyze菜单中的CompareMeans过程组中,用One-wayANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。,.,20,1、单因素方差分析,单因素方差分析也称作一维(元)方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量按因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析即进行均值的多重比较。,.,21,One-wayANOVA过程适用情况,One-wayANOVA过程要求因变量属于正态分布总体;如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程;如果几个因变量之间彼此不独立,应该用GLM过程。,.,22,例题,用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下。比较四种饲料对猪体重增加的作用有无不同。,.,23,步骤,1、建立数据库Fodder变量:数值型,取值1、2、3、4分别代表A、B、C、D四种饲料。Weight变量:数值型,其值为猪体重的增加数。应该特别注意,不能把A、B、C、D定义为四个变量。,.,24,2、调用One-way过程进行单因素方差分析,.,25,第一栏:方差来源第二栏:离均差平方和第三栏:自由度第四栏:均方差(第二栏与第三栏之比)第五栏:F值(组间均方与组内均方之比)第六栏:F值对应的概率即P值,3、结果说明,.,26,4、结果分析,根据输出的p值为0.000可以看出,无论临界值取0.05,还是取0.01,P值均小于临界值。因此否定H0假设,四种饲料对猪体重均数有显著性意义,结论是四种饲料对猪体重的增加明显作用不同。根据该结论选择饲料,犯错误的概率几乎为0。,.,27,存在问题与解决方法,本例只考虑了猪体重的增加量,对其均值进行了比较但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用ANOVA过程的协方差分析功能去解决。,.,28,使用系统默认值进行单因素方差分析只能得出是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。实际工作中往往需要两两的组间均值比较。这就需要使用One-wayANOVA进行单因素方差分析时使用选择项从而获得更丰富的信息,使分析更深入。,.,29,单因素方差分析的选择项,Contrasts:可以指定一种要用t检验来检验的Priori对比,即进行均值的多项式比较选项;PostHoc:可以指定一种多重比较检验;Option:可以指定要输出的统计量,指定处理缺失值的方法。,.,30,Contrasts(均值的多项式选项),Polynomial(多项式比较):均值的多项式比较是包括两个或更多个均值的比较。单因素方差分析的One-wayANOVA过程允许进行高达5次的均值多项式比较。Linear线性、Quadratic二次、Cubic三次、4th四次、5th五次多项式,.,31,Coefficients:为多项式指定各组均值的系数。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。多项式的系数需要由读者自己根据研究的需要输入。,.,32,可以同时建立多个多项式。一个多项式的一级系数输入结束,激活Next按钮,单击该按钮后Coefficients框中清空,准备接受下一组系数数据。如果认为输入的几组系数中有错误,可以分别单击Previous或Next按钮前后翻找出错误的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后年击Change按钮,在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激活Remove按钮;单击该按钮将选中的系数清除。,.,33,左图是要求计算:1.7mean11mean4的值。检验的假设H0:第一组值的的1.7倍与第四组的均值相等。,.,34,PostHoc(均数的多重比较选项),进行多重比较是对每两个组的均值进行如下比较:MEAN(i)-MEAN(j)4.6625RANGESQRT(1/N(i)+1/N(j);其中i、j分别为组序号,MEAN(i)、MEAN(j)分别为第i、j组均值,N(i)、N(j)分别为第i、j组中的观测数。各组均值的多重比较方法的算法不同RANGE值也不同。,.,35,LSD(最小显著差异法):用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整;Bonferroni(修正最小显著差异法):用t检验完成各组均值间的配对比较,但通过设置每个检验的误差率来控制整个误差;Sidak(斯达克法):计算t统计量进行多重配对比较,可以调整显著性水平,比Bonferroni法的界限要小,.,36,Scheffe(谢弗检验法):对所有可能的组合进行同步进入的配对比较,这些选择可以同时选择若干个,以便比较各种均数比较方法的结果;R-E-G-WF(赖安艾耶盖F法):用F检验进行多重比较检验;R-E-G-WQ(赖安艾耶盖F法):正态分布范围进行多重配对比较;,.,37,S-N-K(SNK法):用studentrange分布进行所有各组均值间的比较;该过程各组均值从Tukey(图基法):用student-range统计量进行所有组间均值的配对比较,将所有配对比较误差率作为实验误差率;Tukeys-b(图基s-b法):用studentrange分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值;,.,38,Duncan(邓肯法):指定一系列的的Range值,逐步进行计算比较得出结论;HochbergsGT2(霍耶比GT2法):用正态最大系数进行多重比较;Gabriet(盖比理法):用正态标准系数进行配对比较,在单元数较大时,这种方法较自由;,.,39,Waller-Duncan(瓦尔-邓肯法):用t统计量进行多重比较检验。使用贝耶斯接近;Dunnett(邓尼特法):方法是选择最后一组为对照,其他各组和它比较;选定此方法后,激活下面的ControlCatetory参数框,展开小菜单,选择对照组,.,40,TamhanesT2(塔海尼T2法):t检验进行配对比较;DunnettsT3(邓尼特T3法):正态分布下的配对比较;Games-Howell(盖门-霍威尔法):方差不齐时的配对比较,该方法较灵活;DunnettC(邓尼特C法):正态分布下的配对比较。,.,41,Options(输出统计量的选择),Descriptive复选项,要求输出描述统计量。选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95置信区间;Fixandrandomeffects:输出固定与随机效应;,.,42,Options(输出统计量的选择),Homogeneityofvariance复选项,要求进行方差齐次性检验,并输出检验结果。用Levenetest检验,即计算每个观测量与其组均值之差,然后对这些差值进行一维方差分析;Brown-Forsythe:布朗福塞斯统计量Welch:韦尔奇统计量,.,43,Options(输出统计量的选择),Meanplot复选项,即均数分布图,根据各组均数描绘出因变量的分布情况;MissingValues栏中,选择缺失值处理方法。Excludecasesanalysisbyanalysis选项,对含有缺失值的观测量根据缺失值是因变量还是自变量从有关的分析中剔除。Excludecaseslistwise选项对含有缺失值的观测量从所有分析中剔除,.,44,例题一,用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下。比较四种饲料对猪体重增加的作用有无不同;并比较、D饲料效应和与B、C饲料效应和之间是否有显著性差异,A、C饲料效应和与B、D效应和之间是否有显著性差异。Data12-01,.,45,指定多项式系数,1.0mean11.0mean21.0mean31.0mean4检验饲料对使猪体重增加的效应,A、D饲料效应和与B、C饲料效应和之间是否有显著性差异;1.0mean11.0mean21.0mean31.0mean4检验A、C饲料效应和与B、D效应和之间是否有显著性差异。,.,46,结果分析(1)描述统计量结果,给出了四种饲料分组的样本含量N、平均数Mean、标准差StdDeviation、标准误StdError、95的置信区间、最小值和最大值;,.,47,结果分析(2)方差齐次性检验结果,从显著性概率看,P0.9950.05,说明各组的方差在=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。,.,48,结果分析(3)方差分析结果,与未使用选择项的输出结果一样给出了组间、组内的偏差平方和、均方、F值和概率P值。P0.05;Contrast2,p0.05;说明各组方差具有齐次性。,.,54,结果分析(8)均数图形,以因素变量fodder为横轴,以独立变量Weight为纵轴而绘制的均数散点图。可看出各组均数的水平分布。,.,55,特别说明,应该特别说明的是,选取哪些选择项是根据研究需要进行的。本例中希望比较各种饲料对猪体重增加的效应,因此选择多重比较的选择项。相对比较在此例中无实际意义,只是为了说明选择项的使用方法才选择了Contrast选择项。,.,56,例题二,同种三叶草被接种上不同的菌种测量三叶草植物中含氮量。每组数据中前面一个是菌种代码,变量名是strain,SPSS分析过程要求因素变量必须为数值型变量。后面一个是含氮量,变量名是nitrogen。Data12-02,.,57,练习一,用二氧化硒50mg对大鼠染尘后不同时期全肺湿重的变化见下表,试比较染尘后1个月,3个月,6个月,三个时期的全肺湿重有无差别。,.,58,练习二,为试验三种镇咳药,先以NH.OH0.2ml对小白鼠喷雾,测定其方式咳嗽的时间,然后分别用药灌胃,在同样条件下再测定发生咳嗽的时间,并以“用药前的时间用药后的时间”之差为指标,计算延迟咳嗽时间(秒)。试比较三种药物的镇咳作用。,.,59,SPSS10.0简明教程网址,.,60,(二)GeneralLinearModel(简称GLM,一般线性模型)过程,GLM过程可以完成实验设计的多自变量、多水平、多因变量、重复测量方差分析以及协方差分析等。它包括:单变量方差分析(Univariate),多变量方差分析(Multivariate),重复测量方差分析(RepeatedMeasures),方差分量估计法(Variance)与协方差分析(ANCOVA)。GLM过程由Analyze菜单直接调用,该过程可以完成简单的多因素方差分析和协方差分析,并且不但可以分析各因素的主效应,还可以分析各因素间的交互效应。,.,61,1、单变量多因素方差分析过程,单因变量多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的回归分析和方差分析。利用该方差分析过程,可以检验不同组之间均数由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差和协方差交互作用。,.,62,单变量多因素方差分析调用步骤,.,63,(1)主对话框,DependentVariable:定义因变量;FixedFacter:定义固定变量;RandomFacter:定义随机变量;如果需要去除协变量的影响,将协变量移到Covariates框中;如果需要分析权重变量的影响,将权重变量移到WLSWeight框中。,.,64,(2)功能按钮,Model:选择分析模型;Contrast:选择对照方法;Plots:选择分布图形;PostHoc:选择多重比较分析;Save:选择保存运算值;Option:选择输出项。,.,65,Model按钮、在SpecifyModel栏中指定模型类型,FullFactorial选项,此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个同素变量的主效应、两两的交互效应和三个因素的交互效应。Custom选项,建立自定义的模型。此项的选择激活下面各操作框,.,66,、建立自定义模型类型,选择了Custom后,在FactorsCovariates框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量名,其变量名后面的括号中标有字每“C”。,.,67,A、选择模型中的主效应(Model),鼠标键单击某一个单个的因素变量名该变量名背景将改变颜色(一般变为蓝色),单击BuildTerm(s)栏中下面的箭头,该变量出现在Mode1中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。注意,选择主效应必须选择一个,用箭头按钮送入模型一个。也可以同时送两个或多个到Model框中。,.,68,B、选择交互效应类型,Interactin选项,选中此项可以指定任意的交互效应;Maineffects选项,选中此项可以指定主效应;All2-way选项,指定所有2维交互效应;All3-way选项,指定所有3维交互效应;All4-Way选项,指定所有4维交互效应;All4-Way选项,指定所有5维交互效应。,.,69,C、建立模型中的交互项,利用选中的交互效应类型可以建立模型中的交互项了。例如,因素变量有Light(F)、Device(F)、Target(F)。要求模型中包括变量Light与Device交互效应,相应的操作是在FactorsCovariates框内的变量表中,用鼠标单击device变量使其背景改变颜色,此为选择了交互项之一,再用鼠标单击变量light变量使其背景改变颜色;此为选择了交互项之二。单击BuildTerm(s)栏内参数框的箭头按钮,一个交互效应出现在Model框中。模型增加了一个交互效应项:device*light。,.,70,要求模型中包括三个变量的所有2维交互效应项时应该分别用鼠标单击light、Device、Target三个变量名。在BuildTerm(s)栏内参数框中选择All2way项,单击箭头按钮。在Model中出现三个2维交互效应项:light*device、light*target、device*target。若要求模型中包括所有3维效应,由于可以作为因素变量的只有三个变量,因此可以有两种操作方法。鼠标分三次单击变量light、device、target。选择BuildTerm(s)栏内参数框中的Interaction或All3way项,再申击箭头按钮,均可以在Model框中出现3维交互效应项:ligh*device*target。,.,71,、选择分解平方和的方法,在对话框的下部有Sumofsquares后跟一个矩形框,可以进行四项选择来确定平方和的分解方法,包括TYPE、TYPE、TYPE和TYPEIV四种。其中TYPE是系统默认的,也是常用的一种。,.,72,Contrasts按钮,在Factors框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版深基坑支护与盾构掘进综合服务合同
- 二零二五年度户外休闲区搭棚设计与施工合同
- 2025版企业股权转让与合同终止补充协议
- 二零二五年度建设项目采购谈判服务标准合同
- 二零二五年度跨境供用水合作协议模板
- 二零二五年度代理记账服务与税务筹划及申报合同
- 二零二五年度法律培训与咨询一体化服务合同
- 2025版绿色建筑合作精简范本协议建议书
- 二零二五年度杭州商铺租赁合同-含租赁双方信用评估及管理
- 二零二五年度中草药养生产品原料采购合同
- 2025年小学语文新课标测试题库及答案
- 十八项医疗核心制度考核试题及答案
- 2025年放射工作人员辐射安全与防护考核试题(附答案)
- 2025云南红河投资有限公司招聘12人笔试参考题库附带答案详解(10套)
- 测绘生产安全生产管理制度
- 2024-2025学年湖南省新高考教学教研联盟暨长郡二十校联盟高二(下)期末数学试卷(含解析)
- 偏瘫患者穿衣健康宣教
- 2025年邵东市招聘社区工作者模拟试卷附答案详解ab卷
- 气候变化与健康宣教课件
- 儿科血小板减少的护理查房
- 新教师教学常规培训
评论
0/150
提交评论