多组均数间比较的方差分析.ppt_第1页
多组均数间比较的方差分析.ppt_第2页
多组均数间比较的方差分析.ppt_第3页
多组均数间比较的方差分析.ppt_第4页
多组均数间比较的方差分析.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 多组均数间比较的方差分析,第一节 方差分析(一):单向方差分析,一、 方差分析(analysis of variance,ANOVA)的基本思想,把全部数据关于总均数的离均差平方和分解成几个部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应,将各部分均方与误差均方相比较,依据F分布作出统计推断,从而确认或否认某些因素或交互作用的重要性。,二、 完全随机设计的单因素方差分析,完全随机化设计(completely random design): 在实验研究中,将全部观察对象随机分入k个组,每个组给予不同的处理,然后观察实验效应。 在调查研究中,按某个因素的不同水平分组,比

2、较该因素的效应。,第1组 第2组 第k组,X11 X12,X21 X22,Xk1 Xk2,X1 n1 X2 n2 Xk nk,n1,n2,nk,X,N,X ij为第i个处理组的第j个观察值,i=1,2, ,g,j= 1,2, , nk ; 为第i个处理组的均数 为总均数,,1.总变异 , 总=N-1 2.组间变异 , 组间=k-1 均方 MS组间= SS组间/ 组间 3.组内变异 , 组内=N-k MS组内= SS组内/ 组内 4.三种变异的关系:,=0,总=N-1=(k-1)+(N-k)= 组间+组内 H0:1= 2 = = k F=MS组间/ MS组内 F服从自由度组间=k-1, 组内=N

3、-k 的F分布, 表示为FF( 组间, 组内) 若F F ( 组间, 组内) ,P ,不拒绝H0; 若F F ( 组间, 组内) ,P ,拒绝H0,接受H1。,注1: H0:1= 2 = = k H1: 1,2, , k不全相等, 不能用12 k表示。 注2:优点 (1)不受比较的组数限制; (2)可以同时比较多个因素的作用,以及因素间的 交互作用。 注3:条件 (1)各组样本是互相独立的; (2)各样本来自于正态总体; (3)方差齐性。,例8.1 有3种解毒药:A,B,C, 同时设一个空白对照D.受试大白鼠共24只,用完全随机化方法将它们等分成4组,每组接受一种药物.试比较不同解毒药的解毒效

4、果. 应用不同解毒药的大白鼠血中胆碱酯酶含量,组号 胆碱酯酶含量(X ij ) ni,1 23 12 18 16 28 14 6 111 18.5 2233.0 2 28 31 23 24 28 34 6 168 28.0 4790.0 3 14 24 17 19 16 22 6 112 18.7 2162.0 4 8 12 21 19 14 15 6 89 14.8 1431.0,合计 24 480 20.0 10616.0,(1)建立检验假设,确定检验水准 。 H0:各组大白鼠血中胆碱酯酶含量的总体均数相等 H1:各组大白鼠血中胆碱酯酶含量的总体均数不全相等 =0.05 (2)选定检验方法

5、,计算检验统计量。,=,=,=,SS组间( SS处理),SS组内( SS误差),=,=,=,=,10616- 4802/24,=,1016.0,=,SS总 - SS组间,=,1016.0-568.33,=,447.67,=,1112 /6+1682 /6+1122 /6+892 /6- 4802/24,=,568.33,总=N-1=24-1=23 组间=k-1=4-1=3 组内=N-k=24-4=20 MS组间= SS组间/ 组间=568.33/3=189.44 MS组内= SS组内/ 组内=447.67/20=22.38 F=MS组间/ MS组内=189.44/22.38=8.46 方差分析

6、结果,变异来源 SS MS F P,组间 组内 总,568.33 447.67 1016.00,3 20 23,189.44 22.38,8.46,0.05,(3)确定P值和作出推断结论: F0.05(3,20)=3.10, F=8.46 F0.05(3,20),P0.05。 在=0.05水准上拒绝H0,接受H1,可以认为各组大白鼠血中胆碱酯酶含量的总体均数不全相等.,三、 多个样本均数间的多重比较,(一)LSD-t检验,最小显著差异t检验(least significant difference t test),适合于某几个特定的总体均数间的比较。,按算得的t值,以及误差和检验水准查t界值表

7、,作出推断结论。如tt /2,则在水准上拒绝H0。 与一般t检验的不同:1)MS误差代替Sc2;2)自由度为N-k,比成组比较中的n1+n2-2大得多,易于检出均数之差的显著性。 当各处理组例数相等时, ,,最小显著差数,当|XA-XB | LSD时,则P ,则可认为被比较的两组总体均数之间有显著性差别。,(二) Dunnett-t检验,适用于k-1个试验组与一个对照组均数差别的多重比较。 查Dunnett-t界值表。,当各组例数相等时,(三) SNK-q检验,用于多个样本均数间每两个均数的比较。,当各组例数相等时,,在比较时,将均数从大到小或从小到大依次排列,根据计算所得q值,组间跨度a,误

8、差自由度误差和检验水准查q界值表,如qq (a, ) ,则在水准上拒绝无效假设。,四、 方差分析的假定条件,1.观察值X ij独立来自正态分布的总体; 2.方差齐性。,方差齐性检验,1.提出检验假设; 2.计算每一组的中位观察值mdi; 3.计算各组内个体观察值与中位观察值之差的绝对值dij; dij =| Xij - mdi | 4.用dij作单向方差分析。,五、 SPSS演示,完全随机设计资料的方差分析, 例8.1 View Variable:,View Data:,Analyze Compare Means One-Way ANOVA Dependent list: x Factor:

9、g Post Hoc Equal Variances Assumed: S-N-K Continue Options Statistics: Homogeneity of variances test Continue OK,第二节 方差分析(二):双向方差分析,一、 随机区组设计的两因素方差分析,随机化区组设计(randomized block design): 将全部受试对象按某一个重要的属性(即区组因素)分组,把条件最接近的a个受试对象分在同一个区组内,然后用完全随机的方法,将每个区组中的全部受试对象分配到a个组中去。,例9.1 采用随机区组设计方案,以窝作为区组标志,给断奶后的小鼠喂以

10、三种不同的营养素A、B和C。四周后检查各种营养素组的小鼠所增体重(g)。资料见下表,试比较不同营养素对小鼠体重增加的差别。,三种营养素喂养四周后各小鼠所增体重(g),营养素分组(i ) 按区组求和 1(A) 2(B) 3(C) nj 1 57.0 64.8 76.0 3 197.8 2 55.0 66.6 74.5 3 196.1 3 62.1 69.5 76.5 3 208.1 4 74.5 61.1 86.6 3 222.2 5 86.7 91.8 94.7 3 273.2 6 42.0 51.8 43.2 3 137.0 7 71.9 69.2 61.1 3 202.2 8 51.5 4

11、8.6 54.4 3 154.5 ni 8 8 8 24 500.7 523.4 567.0 1591.1 62.6 65.3 70.9 66.3 32783.4 35459.1 42205.0 110447.5,区组(j),1.变异的分解,=,=,=,SS处理 SS区组 SS误差,其中: ,N = n a , i=1,2, ,a , j=1,2, ,n 总=N-1=(a-1)+(n-1)+(a-1)(n-1),=,=,=,处理 区组 误差,2.分析计算步骤 (1)建立检验假设和确定检验水准 H0:三种营养素喂养的小鼠体重增量相等 H1:三种营养素喂养的小鼠体重增量不全相等 =0.05 (2)

12、计算F值,=(197.82+196.1+ +154.52 )/3- 1591.12/24=3990.31,SS误差= SS总- SS处理 - SS区组 =4964.21-283.83-3990.31=690.07,总=N-1=24-1=23 处理=a-1=3-1=2 区组=n-1=8-1=7 误差=(a-1)(n-1)=2 7=14 MS处理= SS处理/ 处理=283.83/2=141.92 MS误差= SS误差/ 误差=690.07/14=49.29 F=MS处理/ MS误差=141.92/49.29=2.88 (3)确定P值和作出推断结论: F0.05(2,14)=3.74,F=2.88

13、 0.05。 在=0.05水准上不拒绝H0,尚不能认为三种营养素喂养的小鼠体重增量有差别。,区组间差别的检验: H0:8个区组的小白鼠体重增量相等 H1:8个区组的小白鼠体重增量不全相等 =0.05 MS区组= SS区组/ 区组=3990.31/7=570.04 F=MS区组/ MS误差=570.04/49.29=11.56 F0.05(7,14)=2.77,F0.01(7,14)=4.28, F=11.56 F0.01(7,14),P0.01。 在=0.05水准上拒绝H0,接受H1,可以认为8个区组的小白鼠体重增量不全相等。,SPSS演示,随机区组设计资料的方差分析:例9.1 View Va

14、riable:,View Data:,Analyze General Linear Model Univariate Dependent Variable: x Fixed Factors: a b Model Specify Model: Custom Build Terms: Main effects Model: a b Continue Post Hoc Post Hoc Tests for: a Equal Variances Assumed: S-N-K Continue OK,Univariate Analysis of Variance,二、 数据变换,(一)对数变换(loga

15、rithm transformation),Y=lgX 常用于: 1)使服从对数正态分布的数据正态化。如生长率、变化速度、 抗体滴度等。 2)使数据达到方差齐性,特别是各样本的标准差与均数成比例时。,例:为了诊断某种疾病需要测量一项指标,现用4种不同的方式来测量这一指标,以增加诊断的可靠性。表1是对4名健康人测得的数据。试检验4种测量方式有无差异?,表1 用4种方式对4人测得的某指标值,测 量 方 式,A1 A2 A3 A4,对象,1 2 3 4,4 000 000 1 500 000 10 000 000 100 000,22 000 13 000 30 000 8 500,6 000 3

16、400 16 000 5 200,780 720 1 900 550,均数 标准差,3 900 000 4 374 928.6,18 375 9 568.8,7 650 5 671.9,987.5 616.1,表2 表1资料的方差分析,变异来源 SS MS F 临界值,测量方式间 测量对象间 误差,总,4.54 1013 1.451013 4.291013 10.281013,3 3 9 15,1.51 1013 4.831012 4.771012,3.17 1.01,F0.05=3.50,表3 经对数变换后的数据,测 量 方 式,A1 A2 A3 A4,对象,1 2 3 4,6.60 6.1

17、8 7.00 5.00 6.20 0.86,4.34 4.11 4.48 3.93 4.22 0.24,3.78 3.53 4.20 3.72 3.81 0.28,2.89 2.86 3.28 2.74 2.94 0.23,均数 标准差,表4 表2资料的方差分析,变异来源 SS MS F 临界值,测量方式间 测量对象间 误差,总 25.56,22.73 1.70 1.13,3 3 9 15,7.58 0.57 0.13,58.31 4.38,F0.01=6.99 F0.05=3.86,(二)平方根变换(square root transformation),Y=,常用于: 1)使服从Poiss

18、on分布的计数资料正态化,如水中细菌数的分布、放射性物质在单位时间内放射的次数等。 2)当各样本的方差与均数呈正相关时,可使数据达到方差齐性。,例:下面的表1资料是3组小白鼠在注射某种同位素24h后脾脏蛋白质中放射性强度的测定,试问芥子气和电离辐射对同位素进入脾蛋白质是否起抑制作用?,表1 小白鼠注射某种同位素后脾脏蛋白质中放射性的测定,窝别,X Y=,对照组 芥子气中毒组 电离辐射组,对照组 芥子气中毒组 电离辐射组,1 2 3 4 5 6 7 8 9 10 X s2,3 8 1 7 6 7 11 8 10 7 6.8 8.8,1 6 0 5 3 4 7 6 6 3 4.1 5.4,1 3

19、0 3 1 2 5 4 5 2 2.6 2.9,1.73 2.83 1.00 2.65 2.45 2.65 3.32 2.83 3.16 2.65 2.53 0.470,1.00 2.45 0.00 2.24 1.73 2.00 2.65 2.45 2.45 1.73 1.87 0.674,1.00 1.73 0.00 1.73 1.00 1.41 2.24 2.00 2.24 1.41 1.48 0.468,表2 方差分析结果,变异来源 自由度 SS MS F F0.01 P,处理间 窝别间 误差 总的,2 9 18 29,5.638 14.020 0.487 20.146,2.819 1.

20、558 0.027,104.41 57.70,6.01 3.60,0.01 0.01,用LSD法进行多重比较:,表3 处理组均数与对照组均数比较,处理 均数 与对照组的差异 P 反变换为平方,对照组 芥子气中毒组 电离辐射组,2.53 1.87 1.48,0.66 1.05,0.01 0.01,6.40 3.50 2.19,(三)倒数变换,Y=,X,常用于数据两端波动较大的资料。,1,(四)平方根反正弦变换(arcsine square root transformation),常用于服从二项分布的率或百分比的资料,如发病率、治愈率、病死率、有效率等。,表1 不同温度对玫瑰花瓣形成率(%)的影

21、响,病员 编号,低温(4-6C) 室温(20-25C) 高温(30-37C),P,P,P,1 2 3 4 5 总和 均数,40.0 34.0 34.0 34.5 34.5,39.23 35.67 35.67 35.97 35.97 182.51 36.50,48.0 58.0 49.0 65.5 55.5,43.85 49.60 44.43 54.03 48.16 240.07 48.01,49.0 36.0 40.0 16.0 15.0,44.43 36.87 39.23 23.58 22.79 166.90 33.38,例: 某医学院病理生理教研组研究不同温度对淋巴细胞玫瑰花瓣形成率的影响

22、,结果见表1,试作方差分析和多重比较。,表2 方差分析结果,变异来源 自由度 SS MS F F0.05 P,温度间 病人间 误差 总的,2 4 8 14,594.045 83.866 371.133 1049.044,297.02 20.97 46.39,6.40 0.45,4.46 3.84,0.05,用q检验法对各温度的形成率进行两两比较:,将3个样本均数从大到小依次排列, 组次 1 2 3 均数 48.01 36.50 33.38 组别 室温 低温 高温 表3 两两比较计算表,对比组 两均数之差 标准误 q值 组数 q界值 P A与B =0.05 =0.01,1与3 1与2 2与3,1

23、4.63 11.51 3.12,3.046 3.046 3.046,4.803 3.779 1.024,3 2 2,4.04 3.26 3.26,5.64 4.75 4.75,0.05,三、 析因设计的方差分析,如果试验所涉及的处理因素的个数2,当各因素在试验中所处的地位基本平等,而且因素之间存在交互作用时,需选用析因设计(factorial design)。,(一)22析因设计,例 用A、B两药治疗12名贫血病人,性别、年龄一致,随机分成4组,治疗后1个月测得血中红细胞增加数(1012/L),结果如表,问A、B两药的治疗效果如何?两药是否存在交互效应?,A、B两药治疗后病人红细胞增加数 (1

24、012/L),A 药,B药 用 不用,用 不用,2.1 2.2 2.0 0.9 1.1 1.0 1.3 1.2 1.1 0.8 0.9 0.7,(1)建立检验假设和确定检验水准 对于有重复的两因素设计资料方差分析,可以作3个原假设。 H0:A药无效; 或 H0:B药无效; 或 H0:A、B两药无交互作用。 =0.05 (2)计算F值 1)列表计算各种 X、 X2。,A 药,B 药 用(i=1) 不用(i=2) 合计,用(j=1) 不用(j=2) 合计,X=6.3 X2=13.25 X=3.6 X2=4.34 X=9.9 X2=17.59,X=3.0 X2=3.02 X=2.4 X2=1.94

25、X=5.4 X2=4.96,X=9.3 X2=16.27 X=6.0 X2=6.28 X=15.3 X2=22.55,2)校正数C= ( X)2/n = 15.32/12=19.51 3)总的离均差平方和 SS总= X2 - C = 22.55-19.51=3.04 4)总的处理离均差平方和 SS总处 = =6.32/3+ 3.02/3+ 3.62/3+ 2.42/3-19.51=2.96 5)A药的离均差平方和 SSA =,( X) i j2,nij,- C,( X) i2,ni,i j,i,- C,=9.92/6+ 5.42/6-19.51= 1.69 6)B药的离均差平方和 SSB =,

26、( X) j2,nj,j,- C,=9.32/6+ 6.02/6-19.51= 0.91 7)A药和B药的交互作用 SSAB = SS总处 - SSA - SSB =2.96-1.69-0.91=0.36,8)误差离均差平方和 SS误差 = SS总 - SS总处 =3.04-2.96=0.08 9) 计算与上述各种离均差平方和相对应的自由度 总= n-1=12-1=11 总处=(A的水平数B的水平数)-1=2 2-1=3 A=A的水平数-1=2-1=1 B=B的水平数-1=2-1=1 AB= 总处 - A- B =3-1-1=1 误差= 总 - 总处 =11-3=8,10)列方差分析表,变异来

27、源 SS MS F 临界值,总处理 A B AB 误差 总,2.96 1.69 0.91 0.36 0.08 3.04,3 1 1 1 8 11,1.69 0.91 0.36 0.01,36,11.3,(3)确定P值并作出推断结论 本例分析交互作用时,P 0.01,认为交互作用有统计学意义。表明A因素处于不同水平时,B因素的作用是不同的,反之亦然。因此,不能笼统地分析A因素和B因素的作用。,四种处理的样本均数,A 药,B药 用 不用,用 不用,2.1 1.2,1.0 0.8,由此算出,在不用B药时,A1-A2=1.2-0.8=0.4;用B药时, A1-A2=2.1- 1.0=1.1。即B药能加强A药的作用。同理,A药能加强B药的作用。本例中A、B两药的交互作用有统计学意义,实际上就是说A、B两药同时用的效果更好,有协同作用。,SPSS演示,两因素析因设计的方差分析: View Variable:,View Data:,Analyze General Linear Model Univariate Dependent Variable: x Fixed Factors: a b Model Specify Model: Full fact

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论