第五章方差分析_第1页
第五章方差分析_第2页
第五章方差分析_第3页
第五章方差分析_第4页
第五章方差分析_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学及其软件包医学统计学及其软件包第第 五五 章章 方差分析方差分析上海第二医科大学生物统计教研室第一节 概论 方差分析(analysis of variance,简记为:anova) 的应用范围很广,本章的方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。 以一个实例说明方差分析的基本思想和原理。第二节 单因素方差分析(one-way anova, completely random design anova) 例5.1 小白鼠给药前后发生咳嗽的推迟时间(秒) 复方 复方 可待因 40 50 60 15 -10 30 -5 105 77 。 例数 15 15 10 均

2、值 31.67 44 60.7 常见的错误是进行三组之间的两两t检验。这将增加第一类误差的概率。 如两组比较作一次t检验取=0.05; 三组之间的两两t检验作三次t检验,至少有一次拒绝h0的概率为0.14。 五组之间的两两t检验作十次t检验,至少有一次拒绝h0的概率为0.40。 两组以上均数的比较不能用两两t检验,而必须用方差分析。 要比较三种药物的平均推迟咳嗽时间有否差异? 总体1n(1 ,12) 样本1( n1 , ,s1 ) 总体2n(2 ,22) 样本2( n2 , ,s2 ) 总体3n(3 ,32) 样本3( n3 , ,s3 ) 已知:12=22=32 , , 不相等 问:1=2=

3、3 ? ? 1,2,3不相等 1x2x3x1x2x3x方差分析法的模型方差分析法的基本思想 组间变异(不同药物引起,包含误差)总变异 组内变异(误差引起)如不同药物的作用相同,并且无抽样误差,则: f=组间变异/组内变异=1 由于抽样误差,f不等于1,但和1相差不大,f越大概率越小,如概率p0.05,则可认为不同药物的作用是不相同的。即样本均数之间的差异有统计学意义。 方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分为相应的各个部分, 各部分的离均差平方和除以相应自由度得出各个均方,然后列出方差分析表算出f值, 作出统计推

4、断。方差分析法的基本思想方差分析法的基本思想h0:1= 2 = 3h1:至少有一个等式不成立或:h0:三种药物对小白鼠镇咳作用相同h1:三种药物镇咳作用不完全相同方差分析法的基本思想离均差平方和用ss表示,自由度用df表示,均方(mean square)用ms表示 ms=ss/df 即方差。 ss总=ss组间+ss组内 df总=df组间+df组内 f=ms组间/ms组内 = (ss组间/ df组间)/( ss组内/ df组内) 根据f和df组间,df组内查方差分析用f界值表,得p值。如p0.05,拒绝h0 。方差分析法的基本思想 以上分解和检验可列成方差分析表的形式: 方差分析表 变异来源 平

5、方和 自由度 均方 f值 p值 source ss df ms f p 总变异 组间 误差 方差分析法的基本思想 如果影响数据变异的因素不止一个,则可作二因素或三因素等的方差分析,总变异可分解成和各因素相对应的各个变异;这样,分解越细,误差越小,检验的效率就越高。方差分析的基本要求 1.各组样本来自正态分布的总体。 2. 各总体的方差相等。 3. 各效应的可加性。 如不符合基本要求时,可进行变量变换,变换成正态分布后再进行检验或用非参数检验的方法。变 量 变 换1.服从对数正态分布的资料可用对数变换 y=log(x)2.服从泊松分布的资料可用平方根变换 y= 3.表达成百分数的资料可用平方根反

6、正弦变换 y=arcsinxxnxc2)(校正数总平方和cx2组间平方和cnxnxnx323222121)()()(方差分析基本步骤组内平方和=总平方和组间平方和df总=n-1df组间=组数-1df组内=df总-df组间 方差分析表变异来源 ss df ms f p 总变异 31939.9 39药物间变异 5062.4667 2 2531.2333 3.4845 f0.05故知p3.46,故p0.05,而其余二个q皆小于q0. 05 ;因此复方与可待因两药对小白鼠平均推迟咳嗽时间,在=0.05水平上有显著差异,其余任两药间差异皆不显著。均数间两两比较进行均数间两两比较的方法很多: snk(st

7、udent-newman- keuls)检验, duncan检验, tukey检验, lsd(最小显著差)检验, scheffe检验,等。 如只须几个实验组和一个对照组比较,实验组之间不比较: dunnett检验, duncan新法,等第四节 方差齐性检验h0:各个正态总体方差相等,即12= 22 = k2h1:至少存在一对i,j,有i2 j 2 本书中介绍一种稳健的(robust)方差齐性检验方法-levene检验,它可以用于两个或两个以上方差的齐性检验。(1) 对于k组的样本资料, 求得各组的均数后计算观察值距各自组均数的绝对离差。(2) 以绝对离差作为主要变量,使用前述的方差分析法。当拒

8、绝h0时,认为各组方差不齐;当不拒绝h0时,认为方差齐性。算得三个药物组: =31.6667, =44, =60.7,得绝对离差如下: 复方 复方 可待因 8.3333 6 0.7 21.6667 24 30.7 . 18.3333 14 再用上表中绝对离差值进行方差分析。1x2x3x第四节 方差齐性检验第四节 方差齐性检验变异来源 ss df ms f p 总变异 9108.39 39 药物间 679.56 2 339.78 1.49 0.2382 误差 8428.83 37 227.80 由于p=0.2382,因此不拒绝h0,而认为三组方差齐性, 因此符合均数间比较的方差分析法的基本要求。

9、第五节第五节 随机单位组设计方差分析随机单位组设计方差分析 (randomized block design anova)randomized block design anova) 随机单位组设计又称随机区组设计,随机配伍组设计,它是两样本配对试验的扩大。 单位组 处理1 处理2 . 处理k 1 x11 x12 x1k 2 x21 x22 x2k 。 b xb1 xb2 xbk 随机单位组设计方差分析随机单位组设计方差分析 大白鼠注射不同剂量雌激素后的子宫重量(g) 雌激素剂量(g/100g) 大白鼠种系 0.2 0.4 0.8 a 106 116 145 b 42 68 115 c 70

10、111 133 d 42 63 87 随机单位组设计方差分析随机单位组设计方差分析 欲比较因素的k个水平的各变量均值,同时控制另一个因素的作用。试验设计时,先将受试对象按其它控制因素性质相同或相近者组成单位组,每个单位组有k个受试对象,分别随机分配至因素的k个水平上。这时每个水平的受试对象不仅数量相同, 而且性质亦相同或相近,就能缩小误差,提高实验效率。这样的设计可将单位组亦看作一个因素,就成为二个因素的设计随机单位组设计方差分析 处理间变异 组间 总变异 单位组间变异 组内 误差 (误差) 和单因素方差分析相比,误差减少了,检验效率提高了。 随机单位组设计方差分析 可作二个假设检验:(1)h

11、0:因素各水平x的均值相同 h1:因素中至少有二个水平的x均值不相同 f1=ms因素/ms误差 df因素=k-1,df误差=(bk-1)-(k-1)-(b-1) =bk-k-b+1 (2)h0:各个单位组的x均值相同 h1:至少有二个单位组的x均值不相同 f2=ms单位组/ms误差 df单位组=b-1,df误差=bk-k-b+1当欲进一步比较因素中任二个的水平x均值是否相同。可用本章第三节中均数间两两比较的检验。 大白鼠注射不同剂量雌激素后子宫重量处理组:雌激素剂量,三水平(0.2, 0.4, 0.8)单位组:大白鼠种系,四水平(a, b, c, d)变异来源 ss df ms f p 总 1

12、3075 11剂量间 6074 2 3037 33.54 0.01种系间 6457.67 3 2152.56 23.77 0.05受试者间 2853.67 4 713.41 16.27 0.05 误差 526.14 12 43.84 f0.05(4,12)=3.26, f0.01(4,12)=5.41处理因素为药物复方1复方2可待因处理因素为药物不同浓度控制因素为动物种系单因素方差分析单位组设计方差分析拉丁方设计方差分析拉丁方设计方差分析防护服a、b、c、d、e受试者甲、乙、丙、丁、戊试验日期1、2、3、4、5第七节第七节 析因设计的方差分析析因设计的方差分析 (factorial desig

13、n anova)(factorial design anova) 析因设计是一种多因素的交叉分组试验设计。例如:提取某蛋白质成分的研究中,蛋白质的提取量和温度,试剂浓度及ph值有关。温度分高,中,低三个水平;试剂浓度分0.1,0.2,0.3,0.4 四个水平;ph值分6和8二个水平。这三个因素的各水平相结合,共形成342=24种处理组;各种处理组各有数例,这样的试验叫析因设计。由于进行了交叉设计,同时每组又有重复,因此可检验各因素间的交互作用(interaction)。上述试验也可称为342析因试验设计。重复数可以相等也可以不相等,一般地说,重复数相等时,效率最高。第七节第七节 析因设计的方差

14、分析析因设计的方差分析最简单的析因设计是22析因设计。有二个因素,每个因素分二个水平。因素a:分a1和a2二个水平; 因素b:分b1和b2二个水平;分四个处理组:a1b1,a1b2,a2b1和a2b2。每个处理组做若干次试验。第七节第七节 析因设计的方差分析析因设计的方差分析例例5.45.4 某研究所对甲、乙两药的降胆固醇作用进行研究,将甲药视作为因素,下有二个水平,水平1为不加甲药,水平2为加甲药。乙药为因素,水平1为不加乙药,水平2为加乙药。构成了22=4个水平组合,试验中将12个高胆固醇病人随机分为四组,每组3例,进行治疗,观察胆固醇的下降值。本试验为22析因试验设计,重复数为3。 22

15、析因设计试验结果 因素(乙药) 因素 (甲药) 水平1(不加) 水平2(加) 水平1 0.416 0.728(不加) 0.650 0.806 0.468 0.598 水平2 1.456 1.664 (加) 1.144 2.028 1.092 2.080 第七节第七节 析因设计的方差分析析因设计的方差分析交互作用 当二个因素的作用相互独立时,称这二个因素无交互影响;当二个因素的作用不独立,而相互有影响时,称这二个因素有交互影响。当存在交互影响时表示一个因素各水平间的差异随着另一个因素的水平改变而不同;当不存在交互影响时,则各个因素独立, 即一个因素水平改变时不影响另一个因素的各水平之效应。因素a

16、和因素b的交互作用记为ab。 交互作用:几个因素联合作用不等于这几个因素单独作用的累加(有的情况是相乘),称这几个因素间存在交互作用,否则称为不存在交互作用或称为这几个因素相互独立。第七节第七节 析因设计的方差分析析因设计的方差分析 因素1引起的变异(甲药) 因素2引起的变异(乙药) 总变异 因素1和因素2的交互作用引起的变异 误差 可作三个假设检验。第七节第七节 析因设计的方差分析析因设计的方差分析(1)h0:因素的各水平的胆固醇的平均降低值相同; h1:因素的各水平的胆固醇的平均降低值不相同;(2)h0:因素的各水平的胆固醇平均降低值相同; h1:因素的各水平的胆固醇平均降低值不相同;(3

17、)h0:因素的各水平的胆固醇平均下降值的差异,独立于因素,或者因素的各水平的胆固醇平均下降值的差异独立于因素; h1:两者不独立。 第(3)个假设就是检验两个因素的交互影响。第七节第七节 析因设计的方差分析析因设计的方差分析 例5.4的方差分析表变异来源 ss df ms f p 总变异 3.8146 11 因素 2.8014 1 2.8014 96.2680 0.01 因素 0.5976 1 0.5976 20.5361 0.01 0.1813 1 0.1831 6.2921 累加:有协同作用联合作用累加:有桔抗作用联合作用=累加:无交互作用 本例有协同作用。第八节 方差分析的sas程序 可

18、用于各种方差分析的sas过程较多,常用的有二个过程:anova过程:只用于单因素方差分析及各种平衡设计资料(即各组例数相等)的方差分析。glm(general linear model)过程:用于各种试验设计的方差分析和协方差分析。 glm过程可完全替代anova过程的作用,并且语句相同。第九节第九节 平衡不完全单位组设计方差分析平衡不完全单位组设计方差分析 (balanced incomplete block design anova) 在随机单位组设计中有时处理组的水平数太多,大于单位组中的个体数, 这时就可以有计划地安排每个单位组中的处理,使全部试验中每种处理的重复数相同,每两种处理同时

19、出现在同一单位组中的次数相同,这就是平衡不完全单位组设计的方法。对于一个具体设计,欲用本方法时需查有关的书籍,作出实验安排。第九节第九节 平衡不完全单位组设计方差分析平衡不完全单位组设计方差分析 要比较9种饲料的作用,用同一窝的白鼠作为单位组。如用随机单位组设计,则每一窝都要有9个白鼠。但实际上做不到每一窝9个白鼠,只能做到每一窝4个白鼠。这时可选用平衡不完全单位组设计。本例处理组的水平数为9,每各单位组中实验单位数为4,可从有关专著中查到设计格式,以达到使全部试验中每种处理的重复数相同,每两种处理同时出现在同一单位组中的次数相同。根据设计格式安排试验,得到结果,再进行统计分析。单位组(窝)

20、处理 1 6(2.6) 4(9.7) 3(5.4) 5(6.9) 2 6(5.9) 7(2.6) 9(5.9) 2(6.3) 3 1(7.0) 6(5.6) 9(5.9) 3(3.3) 4 9(2.4) 4(5.0) 7(3.0) 6(2.4) 5 9(5.0) 8(7.4) 5(10.3) 3(9.4) 6 4(10.1) 1(9.7) 6(5.7) 8(7.5) 7 2(3.9) 4(5.1) 5(6.4) 9(6.3) 8 8(5.0) 6(6.1) 7(5.4) 3(3.3) 9 2(2.8) 6(2.6) 5(2.8) 8(3.3) 10 2(5.7) 8(9.3) 3(5.4) 9

21、(6.1) 11 2(5.7) 7(6.6) 1(5.5) 8(5.3) 12 1(3.0) 8(1.4) 9(5.2) 4(2.8) 13 3(7.5) 7(2.2) 5(2.6) 1(5.4) 14 3(3.7) 1(5.2) 4(2.4) 2(2.4) 15 9(3.0) 7(2.6) 1(5.7) 5(2.4) 16 4(5.5) 2(6.0) 7(5.6) 3(3.3) 17 7(2.6) 5(5.9) 4(6.0) 8(5.6) 18 2(7.3) 5(5.4) 6(5.7) 1(5.4) 第十节第十节 正交试验设计方差分析正交试验设计方差分析(orthogonal experim

22、ent design anova) 正交试验是一种高效,快速的多因素试验方法, 能同时对多个因素,多个水平进行比较。正交试验利用一套规格化的正交表,使每次试验的因素,水平得到最合理的安排, 所以能以较少的试验次数提供因素,交互影响等有关信息,作出统计推断。通过试验常能找出最佳实验条件,最好的生产条件,最合适的配料方案等。 第十节第十节 正交试验设计方差分析正交试验设计方差分析正交试验设计方差分析的一般步骤为: (1)确定所研究的因素和水平; (2)选择合适的正交表,安排试验; (3)通过试验获得数据; (4)对试验结果用方差分析方法作出统 计推断。第十节第十节 正交试验设计方差分析正交试验设计

23、方差分析例例5.65.6 过氧乙酸是广泛应用的一种杀灭病毒性肝炎病毒的主要消毒剂,但其有效成分极不稳定,以致影响其消毒效果,现对下列四个因素,每个因素2个水平进行研究,由放置24个小时后过氧乙酸残存量(mg/3ml),分析哪些为主要影响因素。 a:稳定剂, 水平1:加磷酸0.3%; 水平2:不加磷酸; b:水浴温度,水平1:25-30; 水平2:35-40; c:浸泡口表,水平1:浸泡口表10支;水平2:不浸口表; d:加盖与否,水平1:加盖; 水平2:不加盖。第十节第十节 正交试验设计方差分析正交试验设计方差分析选用l8(27)正交表:试验号 1 2 3 4 5 6 7 1 1 1 1 1

24、1 1 1 2 1 1 1 2 2 2 2 3 1 2 2 1 1 2 2 4 1 2 2 2 2 1 1 5 2 1 2 1 2 1 2 6 2 1 2 2 1 2 1 7 2 2 1 1 2 2 1 8 2 2 1 2 1 1 2第十节第十节 正交试验设计方差分析正交试验设计方差分析二列间交互影响: 列 1 2 3 4 5 6 7 1 3 2 5 4 7 6 2 1 6 7 4 5 3 7 6 5 4 4 1 2 3 5 3 2 6 1第十节第十节 正交试验设计方差分析正交试验设计方差分析 选择适当的正交表后,需先作表头设计;即哪一列安排哪个因素,哪一列为交互影响?必须剩下至少一列为误差项

25、。本例可安排如下:列号 1 2 3 4 5 6 7因素 a b ab c ac bc d cd bd ad 如需考虑6个一级交互影响,则l8(27)正交表太小,要选更大的正交表。这里只考虑2个交互影响: ab 和ad。选用l8(27)作如下表头设计 列号 1 2 3 4 5 6 7 因素 a b ab c ad d第十节第十节 正交试验设计方差分析正交试验设计方差分析据l8(27)中的1,2,4,7列所示的因素水平进行试验得:试验号 a(1) b(2) c(5) d(7) 残存量 1 1 1 1 1 7.00 4.11 2 1 1 2 2 6.05 3.50 3 1 2 1 2 1.10 0.

26、80 4 1 2 2 1 1.90 0.96 5 2 1 1 2 2.40 1.65 6 2 1 2 1 4.00 1.50 7 2 2 1 1 0.35 0.30 8 2 2 2 2 0.30 0.90第十一节 协方差分析(analysis of covariance) 在各种试验设计中,对主要变量(dependent variable)y 研究时,常希望其他可能影响y的变量保持基本一致,以达到均衡可比。例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无显著差异。第十一节 协方差分析 有时这些变量不能控制,须在统计分析时,通过一定方法来消除这些变量的影响后,再对主要变量y作出统计推断。 如果所控制的变量是分类变量时,可用多因素的方差分析; 当要控制的变量是连续型变量时,可用协方差分析。 称这些影响变量为协变量(covariate),消除协变量的影响后,或将协变量化成相等后,对y的修正均数所作的方差分析称为协方差分析。例如:比较几种不同饲料对动物体重增加的作用,可把动物的进食量作为协变量。 比较大学生和运动员的肺活量时,可把身高作为协变量。 比较治疗后二组舒张压的大小,可把治疗前的舒张压作为协

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论