第章方差分析(页)PPT课件_第1页
第章方差分析(页)PPT课件_第2页
第章方差分析(页)PPT课件_第3页
第章方差分析(页)PPT课件_第4页
第章方差分析(页)PPT课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第1页,Theteachingplanformedicalstudents,ProfessorChengCong,Dept.ofPreventiveMedicineTaishanMedicalCollege,MEDICALSTATISTICS,.,第2页,医学统计学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事医学统计学、预防医学,医学人口统计学等课程的教学及科研工作,每年听课学生600-1000人。自2000年起连续10年,为硕士研究生开设医学统计学、SPSS统计分析教程、卫生经济学等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文50多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,“行列相关的测度”等。主编、副主编各类教材及专著10部,代表作有医学统计学、SPSS统计分析教程。获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。医学统计学为校级和省级精品课程。,程琮教授简介,.,第3页,医学统计学目录,第1章绪论第2章定量资料的统计描述第3章总体均数的区间估计和假设检验第4章方差分析第5章定性资料的统计描述第6章总体率的区间估计和假设检验第7章二项分布与Poisson分布第8章秩和检验第9章直线相关与回归第10章实验设计第11章调查设计第12章统计表与统计图,.,第4页,第4章方差分析目录,第五节多个方差齐性检验,第二节单因素方差分析,第三节双因素方差分析,第四节多个样本均数间两两比较,第一节方差分析的基本思路,第六节变量变换,.,第5页,第4章方差分析学习要求,掌握方差分析的基本思想;掌握单因素、双因素方差分析的应用条件、意义及计算方法;熟悉多个均数间两两比较的意义及方法;了解方差齐性检验和t检验的意义及方法;熟悉变量变换的意义和方法。,.,第6页,第一节方差分析的基本思想,方差分析(analysisofvariance,缩写为ANOVA)也称为变异数分析。是常用的统计分析方法之一。其应用广泛,分析效率高,节省样本含量。由英国统计学家Fisher在1920年代提出。故也称为F检验。主要原理:将各组数据的总变异按设计及研究目的分为若干部分,再计算各部分的均方,两均方之比为F值。F值与F临界值比较,决定P值大小,并根据P值大小推断结论。,一、方差分析的用途及应用条件,(一)基本概念,.,第7页,进行两个或两个以上样本均数的比较;可以同时分析一个、两个或多个因素对试验结果的作用和影响;分析多个因素的独立作用及多个因素之间的交互作用;进行两个或多个样本的方差齐性检验等。应用条件:方差分析对分析数据的要求及条件比较严格,即要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。,(二)主要用途及应用条件有:,.,第8页,处理因素可分为若干个等级或不同类型,通常称为水平。在不同的水平下进行若干次试验并取得多个数据,可以将在每个水平下取得的这些数据看作一个样本。若某个因素有四个水平,每个水平的数据代表一个样本,则获得四个样本的数据。设有k个相互独立的样本,分别来自k个正态总体X1,X2,Xk,且方差相等。,二、方差分析的基本思想,.,第9页,假设的意义为:在某处理因素的不同水平下,各样本的总体均数相等。这就意味着处理因素不起作用。设某因素有多个水平,即试验数据产生多个样本。由多个样本的全部数据可以计算出总变异,称为总的离均差平方和。即SS总。数理统计证明,SS总可以由几个部分构成。单因素方差分析中,SS总由组间变异和组内变异构成。SS总SS组间SS组内。,.,第10页,组间变异主要受到处理因素和个体误差两方面影响,组内变异主要受个体误差的影响。当H0为真时,由于处理因素不起作用,组间变异只受个体误差的影响。此时,组间变异与组内变异相差不能太大。两部分的均方(方差)也相差不大。其比值F值接近1。如果比值远远大于1,如大于3-5倍时,则处理因素就产生作用,影响了数据的结果。,.,第11页,单因素方差分析模式表,.,第12页,各种变异除以相应的自由度,称为均方,用MS表示,也就是方差。当H0为真时,组间均方与组内均方相差不大,两者比值F值约接近于1。即F组间均方组内均方1。当H0不成立时,处理因素产生了作用,使得组间均方增大,此时,F1,当大于等于F临界值时,则P0.05。可认为H0不成立,各样本均数不全相等。,.,第13页,单因素方差分析(one-wayANOVA)也称为完全随机设计(completelyrandomdesign)的方差分析。还可称为单向或单方式方差分析。该设计只能分析一个因素下多个水平对试验结果的影响。双因素方差分析(two-wayANOVA)称为随机区组设计(randomizedblockdesign)的方差分析。还可称为双向或双方式方差分析。该设计可以分析两个因素。一个为处理因素,也称为列因素;一个为区组因素,也称为行因素。,三、方差分析的类型,.,第14页,三因素方差分析也称为拉丁方设计(Latinsquaredesign)的方差分析。该设计特点是,可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。析因设计(factorialdesign)的方差分析当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法。它是一种全面组合试验方法,当试验因素及水平较多时,试验次数会急剧增多。,.,第15页,正交试验设计的方差分析如果要分析的因素有三个或三个以上,可进行正交试验设计(orthogonalexperimentaldesign)的方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试验次数,得到最佳的分析组合结果。它是一种部分试验的方差分析方法。,.,第16页,四、方差分析的基本步骤,总变异:为各组数据总的离均差平方和。其中:把展开式的后面一项单独列出,C称为校正系数。在计算过程中作为一个共有项。,计算总变异:指所有试验数据的离均差平方和。公式如下:,.,第17页,计算各部分变异:(1)单因素方差分析中,可以分出组间变异(SS组间)和组内变异(SS组内)两大部分;(2)双因素方差分析中,可以分出处理组变异(SS处理),区组变异(SS区组)或称为配伍组变异(SS配伍)及误差变异(SS误差)三大部分。,.,第18页,计算各部分变异的均方MS在方差分析中,方差也称为均方,是各部分的离均差平方和除以其相应的自由度,用MS表示。基本公式为:MSSS。计算统计量F值F值是指两个均方之比。一般是用较大的均方除以较小的均方。故F=MS大/MS小:F值一般不会小于1。,.,第19页,确定P值,推断结论根据分子1,分母22,查F界值表(方差分析用表),得到F值的临界值(criticalvalue),即:如果FF界值,则P0.05,在=0.05水准上拒绝H0,接受H1。结论:可以认为各样本所代表的总体均数不全相等。如果想要了解哪两个样本均数之间有差异,可以继续进行各样本均数的两两比较。,.,第20页,第二节单因素方差分析,意义单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。特点:其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。该设计中的总变异可以分出两个部分,SS总SS组间SS组内,.,第21页,(1)意义为第i组的第j个数据。其中下标i表示列,j表示行。,3常用符号及其意义,(2)意义为将第i组的全部j个数据合计。,.,第22页,变异来源(单因素)SS总:表示变异由处理因素及随机误差共同所致;SS组间:表示变异来自处理因素的作用或影响;SS组内:表示变异由个体差异和测量误差等随机因素所致。,(3)将第i组的j个数据合计后平方,再将所有各i组的平方值合计。,.,第23页,计算公式,.,第24页,【例4.1】科研人员研究细胞增殖核抗原(PCNA,%)在胃癌组织(A组),胃癌旁组织(B组)及正常胃粘膜组织(C组)中的表达状况。检测结果用表达指数来表示。设数据为正态分布。数据见表42。试分析PCNA在三种胃组织中的表达有无差异。,三、计算实例,.,第25页,.,第26页,建立检验假设H0:PCNA在三种组织中的表达指数相同,123;H1:PCNA在三种组织中的表达指数不全相同。取双侧:0.05,计算检验统计量F值由表4-2的数据计算有:校正系数C(X)2N(874)22728291.70SS总X2C39236-28291.70=10944.3总N1=27-1=26,检验步骤及方法,.,第27页,组间k-1=3-1=2SS组内SS总SS组间10944.3-8965.98=1978.32,.,第28页,(3)列方差分析表见表4-3。(4)确定P值根据0.05,1组间2,2组内24,查附表4,F界值表,得F界值:F0.01(2,24)=5.61。本例F54.39,大于界值F0.01(2,24)=5.61,则P0.01。,.,第29页,表43方差分析表,.,第30页,(5)推断结论由于P0.01,在0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为PCNA在三种不同胃组织中的表达指数不全相同。该结论的意义为,至少有两种组织的PCNA表达指数不同。如果想确切了解哪两个组织的PCNA表达指数有差异,可进一步作多个样本均数的两两比较。,.,第31页,第三节双因素方差分析,1.特点按照随机区组设计的原则来分析两个因素对试验结果的影响及作用。其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个因素相互独立,且无交互影响。双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法。,一、特点及意义,.,第32页,注意:双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。该设计方法中,总变异可以分出三个部分:SS总SS处理SS区组SS误差,.,第33页,将第i个处理组的j个数据合计后平方,再将所有i个处理组的平方值合计。,3.常用符号及其意义,将第j个区组的i个数据合计后平方,再将所有j个区组的平方值合计。,.,第34页,二、双因素方差分析计算公式,.,第35页,例4.2某医院研究五种消毒液对四种细菌的抑制效果。抑制效果用抑菌圈直径(mm)表示。数据见表4-5。试分析五种消毒液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。,三、计算实例,.,第36页,表45消毒液对不同细菌的抑制效果,.,第37页,(1)建立检验假设1)对处理因素作用的检验假设H0:五种消毒液的消毒效果相同,12345;H1:五种消毒液的消毒效果不全相同。取双侧:0.052)对区组因素作用的检验假设H0:四种细菌的抑菌圈直径相同,1234;H1:四种细菌的抑菌圈直径不全相同。取双侧:0.05,检验步骤及方法,.,第38页,(2)计算统计量F值由表45数据计算,有:校正系数C=(X)2/N=(348)2/20=6055.2SS总X2C67166055.2660.8总N120119处理k1514,.,第39页,区组b1413SS误差SS总SS处理SS区组660.831.3566=63.5误差(k-1)(b-1)(51)(41)12,.,第40页,误差总处理区组(41)(51)12MS处理SS处理处理(31.3)47.825MS区组SS区组区组(566)3188.667MS误差SS误差误差(63.5)125.292F处理MS处理MS误差7.8255.292=1.4796F区组MS区组MS误差188.6675.292=35.65,.,第41页,表4-6双因素方差分析表,.,第42页,(3)确定P值根据0.05,1处理4,2误差12,查附表4,F界值表,得F0.05(4,12)3.26,F0.01(4,12)5.41;再由1区组3,2误差12,查F界值表,得F0.05(3,12)3.49,F0.01(3,12)5.95。本例F处理35.65,P0.01;F区组1.48,P0.05。,.,第43页,(4)确定P值根据0.05,1处理4,2误差12,查附表4,F界值表,得F0.05(4,12)3.26,F0.01(4,12)5.41。再由1区组3,2=误差12,查F界值表,得F0.05(3,12)3.49,F0.01(3,12)5.95。本例F处理35.65,P0.05,在0.05水准上不拒绝H0,差异无统计学意义。结论:可以认为五种消毒液之间的消毒效果相同。区组间P0.05,在0.05水准上拒绝H0,接受H1,差异无统计学意义。结论:可认为不同细菌的抑菌圈直径不全相同,即消毒液对不同细菌类型的抑菌效果不全相同。,.,第45页,第四节多个样本均数间的两两比较,当方差分析的P值小于0.05时,可以进行均数间的两两比较,也称为多重比较(multiplecomparison)。有多种两两比较的方法。国内教科书或参考书一般只讲3-5种。国外统计软件SAS和SPSS则有较多种方法。如SPSS有14种,再加上方差不齐时的比较4种,共有18种。多数两两比较的方法,对值进行了调整。,一、均数两两比较的特点和意义,.,第46页,当分析结果为P,拒绝H0时,得出的结论只是指各总体均数不全相等。如果想要确切了解哪两个样本均数之间的差异有统计学意义(总体均数不等),哪两个样本均数之间的差异无统计学意义(总体均数相等),可以进行多个样本均数的两两比较。,调整显著性水平值,.,第47页,当有三个及三个以上样本均数比较时,如果仍使用一般的t检验对样本均数两两组合后进行比较,会使检验水平值增大,即增大第一类错误的概率,这样,就可能把本来无差别的两个总体均数判为有差别。例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较6次。见下列组合公式:,.,第48页,若比较6次,即可有6个对比组。若每次比较的检验水准0.05,则每次比较不犯第一类错误的概率为(10.05)=0.95。那么根据概率的乘法法则,比较6次均不犯第一类错误的概率为(1-0.05)60.7351。此时,总的显著性水平变为:10.73510.2649。此值已远远大于规定的检验性水平0.05。,.,第49页,(一)概念及意义SNK-q检验法,全称为Student-Newman-Keulsq检验法,也简称为SNK法。这是国内外常用而较为经典的检验方法。可以对所有对照组及处理组的样本均数进行两两比较。式中:q为检验统计量,均数A及均数B为任意比较的两样本均数,,二、SNK-q检验法,(二)计算公式,.,第50页,当两样本n不相等时上式中MS误差在单因素方差分析中即为MS组内。,当两样本n相等时自由度误差,.,第51页,首先将多个样本均数由大到小顺序排列。按照两均数组合原则,计算出每两个样本均数比较的统计量q值。,(三)计算步骤及方法,.,第52页,根据误差的自由度和两样本间隔组数a查q界值表得q界值。注意:组数a的计算方法:由于各样本均数已由大到小顺序排列,因此,相邻两样本均数比较时,组数a=2,中间间隔1个样本均数时,组数a=3,间隔两个样本均数时,组数a=4,余类推。,.,第53页,【例4.3】仍以例4.1为计算实例说明计算方法。例4.1的数据经单因素方差分析,P0.01,拒绝H0,接受H1。可以认为三种胃组织的PCNA表达指数不全相等。进一步作样本均数的两两比较。(1)建立检验假设H0:任意两样本的总体均数相等,ABH1:任意两样本的总体均数不相等,AB0.05,(四)计算实例,.,第54页,表4-7三个样本均数顺序排列结果,(2)计算统计量q值将三个样本均数由大到小顺序排列,见表4-7。,.,第55页,表4-8样本均数两两比较q检验表,.,第56页,推断结论在=0.05水准上拒绝H0,接受H1,各样本均数的两两比较的差异均有统计学意义。结论:可以认为,胃癌组织,胃癌旁组织及正常胃粘膜组织的PCNA表达指数各不相同。,计算统计量q值。应用第(2)栏数据除以第(4)栏数据即得q值。例如,1与2组比较有:,.,第57页,1.概念:LSD英文全称为least-significant-difference,译为最小显著差异法或最小有意义差异法,也可简称为LSD法。LSD法实际上是一种t检验法,但它与以前描述的一般t检验法有所不同。两种t检验法的主要区别在于计算标准误中的合并方差及自由度的不同。,三、LSDt检验法,(一)概念及意义,.,第58页,LSD法在计算标准误时,用MS组内或MS误差取代一般t检验标准误,自由度则用MS误差的自由度误差NK或误差(k-1)(b-1)。一般t检验法中的自由度n-1或n1+n2-2。LSD法根据及,查一般的t值表得t界值,与LSD计算的统计量t值的大小进行比较,并确定P值。据此作出判断和结论。,2.LSD-t检验与一般t检验的区别,.,第59页,(二)计算公式自由度误差,.,第60页,LSDt检验法在查t值表确定t界值时,不需要组数a,故各样本均数也不需要按大小顺序排列。各样本均数两两比较时,仍需要进行组合。组合计算公式及方法与q检验法相同。其它计算步骤与一般t检验法相同。,(三)计算步骤及方法,.,第61页,【例4.4】仍用例4.1为计算实例,说明LSD法的计算过程。(1)建立检验假设H0:任意两样本的总体均数相等,ABH1:任意两样本的总体均数不相等,AB双侧0.05(2)计算统计量t值列出样本均数两两比较t检验表,见表4-9。,(四)计算实例,.,第62页,(2)计算统计量t值列出样本均数两两比较t检验表,见表4-9。,.,第63页,LSD法的计算过程。,.,第64页,(3)推断结论在=0.05水准上拒绝H0,接受H1。结论:各样本均数的两两比较的差异均有统计学意义。此结论与q检验法的结论完全相同。,.,第65页,Dunnettt检验法在进行科研时,经常需要设立一个对照组和若干个实验组或处理组。按照研究目的和设计要求,有时只需要将各个处理组的试验结果与一个对照组进行比较,而各处理组之间并不需要比较。,四、多个处理组与一个对照组均数间的两两比较,(一)概念及意义,.,第66页,此时,仍可应用前述SNKq检验法或LSDt检验法处理资料。因为前两种检验方法均包括所有各组之间的比较。但处理此类资料也有非常常用而经典的方法,称为Dunnettt检验法。该法在大型统计软件中的应用非常广泛。如SAS和SPSS。【注意】查Dunnett-t值表时,要用到组数a和误差自由度。,.,第67页,Dunnett-t检验计算公式为:,当比较组两样本含量ni相等时,当比较组两样本含量ni不相等时,(二)计算公式,.,第68页,【例4.5】以例4.2为计算实例,说明该方法的计算过程。,表4-10各组均数排列顺序,(四)计算实例,.,第69页,表4-11Dunnettt检验表,.,第70页,计算均数差值的标准误:计算1与3比较组的标准误。,(3)推断结论本例只有1与3比较组P0.01,故在0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为消毒液对大肠杆菌和葡萄球菌的抑制效果不相同;其它各对比组的P0.05,不拒绝H0,差异无统计学意义。则可认为消毒液对大肠杆菌,绿脓杆菌和痢疾杆菌的抑制效果相同。,.,第71页,第五节多个方差的齐性检验,概念:进行t检验、u检验和方差分析时,要求数据服从正态分布并且方差齐性。2.方法:两样本方差齐性检验:使用F检验。多两样本方差齐性检验常用两种方法:即为Bartlett检验和Levene方差齐性检验,一、概念及意义,.,第72页,二、Bartlett检验的应用条件,Bartlett方差齐性检验法:1、主要用于正态总体分布的数据。2、此法计算卡方值,当计算的X2值大于等于X2界值时,则P。结论:可以认为各样本所代表的总体方差不全相等。3、注意:由于数据要服从正态分布,应用受到限制。,.,第73页,三、Levene检验的应用条件,1、数据可以为正态分布或非从正态分布;2、常用著名统计软件中如SAS和SPSS中,默认的方差齐性检验方法为该检验。3、应用非常广泛。注意:也可用于两样本的方差齐性检验。具体方法:可以参考有关书箱或文献。,.,第74页,第六节变量变换,(一)概念变量变换(datatransformation)也称为变量代换,是指将原始数据X经过某种数学方法转换为其它的数据形式,使其达到统计学上的某种要求,以利于对资料进行统计处理。如对变量X取对数lgX或取平方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论