医学统计学课件 (2)_第1页
医学统计学课件 (2)_第2页
医学统计学课件 (2)_第3页
医学统计学课件 (2)_第4页
医学统计学课件 (2)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析多个样本均数比较的假设检验,1.基本概念t检验解决了推断两个总体均数是否相等的问题,但实际工作中还会遇到需要推断多个总体均数是否相等的问题。如:Ex1为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙三个组,每组6只,分别在地面办公楼、煤碳仓库和矿井下染尘,12周后测量大鼠的全肺湿重,数据见下表,问不同环境下大鼠全肺湿重有无差别?,返回,本例的问题是,要比较不同环境下大鼠的全肺湿重有无差别,即需要对下列假设作出推断:H0:1=2=3三种不同环境对大鼠的全肺湿重无影响,ex2为研究克拉霉素的抑菌效果,对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TL)。给予不同的处理后,观察抑菌圈的直径,结果见下表,问(1)4种处理效果是否不同?(2)不同菌源之间抑菌圈的直径大小是否不同?,本例有两问,需要对如下两个假设作出推断:H0:SL=SH=TL=TH4种处理效果相同H0:1=2=7菌源对抑菌圈的直径大小没有影响,这两个例子都涉及到多个均数的比较问题。为了解决这类问题,我们先复习一下几个相关的概念:试验指标:要考察的指标称为试验指标-例1为全肺湿重,例2为抑菌圈的直径;因素:影响试验指标的条件称为因素-例1为组别,例2为药物(及剂量)、菌株来源;水平:因素所处的状态称为该因素的水平-例1组别这个因素有3个不同的水平;例2药物(及剂量)因素有4个水平,菌株来源有7个水平。,在一项试验中,如果影响试验指标的因素只有一个,则称该试验为单因素试验(例1);如果影响试验指标的因素有多个,则称该试验为多因素试验(例2)。,2.完全随机设计的方差分析(单因素试验)完全随机设计又称为成组设计,即将受试对象随机分配到处理因素的不同水平组中,比较处理因素各个水平组间均数有无显著差别。这种设计只有一个处理因素,故称为单因素试验。现在回到例1的问题:我们在因素(组别)所处的每一水平下进行了独立试验,其结果是一随机变量。如果将因素的每一水平分别视为一个总体,各总体的均值分别为1、2、3,则表中数据可视为来自三个不同总体的样本值。于是,例1的问题即为检验如下的假设:H0:1=2=3H1:1、2、3不全相等,完全随机设计(单因素)多个均数比较的资料,一般地,对于单因素试验,假设因素A有s个水平:A1,A2,As。在水平Aj(j=1,2,s)进行nj次独立试验,得到如下的试验结果:,为了对这个假设进行检验,需要对平方和进行分解。考虑总平方和,是所有样本观测值的总平均;SS总又称为总变差,它反映了全部试验数据之间的差异。记水平Aj下的样本均值为,假定各水平Aj均为正态总体N(j,2),方差分析的任务是对假设H0:1=2=s进行检验。,其中,完全随机设计(单因素)多个均数比较的资料,可将总平方和SS总分解为:,反映了各水平组内每个样本观察值与其样本均数之间的差异,故SS组内称为组内平方和(又称为误差平方和),其自由度为n-s;,反映了各水平下的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同水平及随机误差所引起的,故称SS组间为组间平方和(又称为因素A的效应平方和)其自由度为s-1。,完全随机设计(单因素)多个均数比较的资料,完全随机设计(单因素)多个均数比较的资料,为了检验假设H0:1=2=s进行检验。根据平方和分解式:,我们来分析一下如下的统计量:,MS组间称为组间均方MS组内称为组内均方,如果F值远大于1,则说明SS组间很大,SS组内很小,即SS总主要是由各水平组之间的差异引起的,即认为假设H0不成立;,可以证明,如上定义的统计量FF(n-s,s-1),故可利用这个统计量来对H0进行检验。,如果F值接近于1,则说明SS组间与SS组内较为接近,而SS组内反映的是随机误差,SS组间是由各水平之间的差异与随机误差两部分构成的,现在SS组间与SS组内很接近,即说明SS组间主要由随机误差构成,即水平之间的差异很小,因此没有理由认为H0不成立。,下面将例完整地做一遍。1)作假设H0:1=2=3作业环境不影响大鼠全肺湿重。确定检验水准0.052)为计算F值,先计算出相关的统计量的值,3)将算得的数据及相应统计量的自由度填入下面的方差分析表:,方差分析表,4)查F界值表,得F0.05(2,15)3.684.70=F从而知P0.05于是拒绝H0,即认为不同粉尘环境影响大鼠的全肺湿重。,3.随机区组设计资料的方差分析随机区组设计又称为配伍组设计,是配对设计的扩展。其设计方法是按两个因素分组,一个是区组因素,一个是处理因素。具体做法是:按实验对象的自然属性或对实验结果有影响的非研究因素设置区组,先将具有某种共同属性的实验对象分配到同一个区组内,再将各区组内的实验对象随机分配到各个不同的处理组中,每个实验对象接受一种处理,各处理组的实验对象数量相等。如ex2,ex2为研究克拉霉素的抑菌效果,对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TL)。给予不同的处理后,观察抑菌圈的直径,结果见下表,问(1)4种处理效果是否不同?(2)不同菌源之间抑菌圈的直径大小是否不同?,一般地,随机区组设计的试验结果见下表:,随机区组的试验结果,假定处理组各水平Aj均为正态总体N(j,2),区组各水平Bk均为正态总体N(k,2),方差分析的任务是:,对假设:H0:1=2=gH0:1=2=n进行检验。与完全随机设计的情形类似,我们将总平方和分解为:,SS处理组表示各处理组的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同处理组及随机误差所引起的,故称SS处理组为处理组间平方和(又称为处理因素的效应平方和)其自由度为g-1。,其中,SS区组表示各区组的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同区组及随机误差所引起的,故称SS区组为区组间平方和(又称为区组因素的效应平方和)其自由度为n-1。,SS误差表示处理和区组两个因素各水平组内每个样本观察值与其样本均数之间的差异,故SS误差称为误差平方和,其自由度为(g-1)(n-1)。于是,得检验统计量,例2即是一个随机区组的方差分析问题。1)作假设本例有两问,需要对如下两个假设作出推断:H0:SL=SH=TL=TH4种处理效果相同H0:1=2=7菌源对抑菌圈的直径大小没有影响=0.052)计算相应的统计量,填入方差分析表中,3)确定P值,作出推断结论查F界值表,得F0.01(3,18)=5.09116.859=F处理F0.05(6,18)=2.663.97=F区组从而对于处理组,按0.01的检验水准拒绝H0,可认为4种处理效果不全相同。对于区组,按0.05的检验水准拒绝H0,可认为菌源对抑菌圈的直径大小有影响。,方差分析的应用条件:1).各观察值相互独立,且服从正态分布;2).各组资料总体方差相等。,注1:对于两种不同设计的平方和分解,有:完全随机设计:SS总SS处理SS组内随机区组设计:SS总SS处理SS区组SS误差由此可见,随机区组设计的优点是:从组内变异中分离出区组变异,使误差变异减小,因而更容易发现处理组间的差别,提高统计效率。每个区组内的若干个受试对象间具有良好的同质性,组间的均衡性较强。注2:当g=2时,完全随机设计方差分析的结果与两样本均数比较的t检验等价,理论上有t2=F。当g=2时,随机区组设计方差分析与配对设计资料的t检验等价,理论上有t2=F。,4.拉丁方设计资料的方差分析由g个拉丁字母排成的g*g方阵,方阵的每行每列中每个字母都只出现一次,这样的方阵称为g阶拉丁方。如:,基本拉丁方,拉丁方,随机调换某两列(行),利用g阶拉丁方可按行、列、拉丁字母分别安排3个因素,每个因素有g个水平。如4阶拉丁方可安排3个因素:,Ex3研究A、B、C、D四种食品以及甲、乙、丙、丁四种加工方法对小白鼠体重增加的影响。拟用4窝小白鼠,每窝4只,每只小白鼠随机喂养一种食品、随机采用一种加工方法,8周后观察小白鼠的体重增加情况。实验结果如下表。问食品种类是否影响小白鼠体重的增加?食品加工方法是否影响小白鼠体重的增加?不同窝别的小白鼠体重增加是否不同?,本例有三问,需要对如下三个假设作出推断:H0:A=B=C=D四种食品对体重增加作用相同H0:1=2=3=4窝别对体重增加无影响H0:甲=乙=丙=丁食品加工方法对体重增加无影响,与完全随机设计的情形类似,我们将总平方和(总变异)分解为:,其中SS处理组表示各处理组的样本均值与全部观测数据的总平均值之间的差异,这种差异是由不同处理组及随机误差所引起的,故称SS处理组为处理组间平方和(又称为处理因素的效应平方和)其自由度为g-1。,SS行表示行因素各水平组的样本均值与全部观测数据的总平均值之间的差异,其自由度为g-1。,SS列表示列因素各水平组的样本均值与全部观测数据的总平均值之间的差异,其自由度为g-1。,SS误差表示各因素各水平组内每个样本观察值与其样本均数之间的差异,其自由度为(g-1)(g-2)。于是,得检验统计量,计算相应的统计量,填入方差分析表中,根据P值,作出推断:1.拒绝H0,认为食品种类会影响大鼠体重增加;2.不拒绝H0,不能认为窝别可影响大鼠体重增加;3.拒绝H0,认为食品加工方法会影响大鼠体重增加。,5.多个均数间的多重比较在方差分析中,若拒绝原假设,则说明多个总体均数不全相等,但究竟是哪些不等?却并没有解决。这需要对多个总体均数进一步作两两比较,即需要对如下假设进行检验。,H0:1=21=31=g2=32=gg-1=g,这里,每一个检验都是两个总体均数的比较,似乎都可以采用t检验来做,但由于这里需要进行多重比较,重复使用t检验会增大犯I类错误的概率。如需进行6次比较,每次犯I类错误的概率最大为0.05,则,1.SNK-q检验适用于多个总体均数的两两比较;2.Dunnett-t检验适用于多个实验组与一个共用对照组的比较;3.LSD-t检验适用于多组中某一对或某几对在专业上有特殊意义的均数的比较。,第1次比较时不犯一类错误的概率为:1-0.05前2次比较均不犯一类错误的概率为:(1-0.05)26次比较均不犯一类错误的概率为:(1-0.05)6,于是,6次比较中至少有一次犯一类错误的概率为:1-(1-0.05)6=0.26这个概率远大于0.05。故需采用特定的方法来作这种多重比较的假设检验。作这种多重比较,常用的方法有:,6.多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论