第九章 方差分析1卫生统计学考研课件_第1页
第九章 方差分析1卫生统计学考研课件_第2页
第九章 方差分析1卫生统计学考研课件_第3页
第九章 方差分析1卫生统计学考研课件_第4页
第九章 方差分析1卫生统计学考研课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第九章方差分析(analysisofvariance简写为ANOVA)无论是在试验研究还是在调查研究中,如研究因素为k个,当k2时,两组总体均数比较是否相等的假设可采用前面介绍的t检验或Z检验(当然也可采用今天所介绍的方差分析);当k2时,即检验两组以上的总体均数是否相等时,t检验已不能满足要求,需采用本章介绍的方差分析(analysisofvariance简写为ANOVA),例91某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人,低剂量组19人,对照20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表91所示。问治疗4周后,餐后2小时血糖下降值的总体平均水平是否不同?,表912型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L),上述资料如采用前面所学两样本t检验进行两两比较,而得出结论,会使犯一类错误的概率增大。如从已知正态总体N(10,52)进行随机抽样,共抽取k10组样本,每组样本含量均20,每组样本均数和标准差结果见表92。,表92从已知正态总体N(10,52)进行随机抽取10个样本的(ni=20)的结果,如要进行两两比较的t检验,即10个样本每两个进行,其比较的次数为:实验结果表示:若0.05,则在45次比较中,发现有5次有统计学意义,结果见表93。从理论上讲10个样本均来自同一正态总体,应当无差别,但我们用两样本比较的t检验时,规定0.05,其实际犯第一类错误的概率为5/450.11.j显然比所要控制的0.05要大。,表93.45次比较中5次有统计学意义的结果,第一节完全随机设计资料的方差分析一、方差分析的基本思想,用Xij表示第i个处理组的第j个观察值,或简记为X,总例数N=ni。第i个处理组的均数用表示,全部实验结果的总均数用表示。,方差分析的目的就是通过分析各个处理组均数之间的差别,推断它所代表的k个总体均数间是否存在差别,或k个处理组间均数的差别是否具有统计学意义。,表94方差分析试验数据示意图,例某克山病区测定10例克山病患者与10名健康人的血磷值(mmol/L)如下,问该地克山病患者与健康人的血磷值是否不同?患者:0.841.640.750.760.811.161.201.341.351.48健康人:0.540.051.201.201.391.531.671.801.872.07变异的分解:1.总变异:全部实验数据大小不等,总=N1,2.组间变异:各处理组的样本均数也大小不等,组间=k1,MS组间=SS组间/组间(反映了处理因素的作用,同时也包括了随机误差),3.组内变异各处理组内部的观察值也大小不等。它反映了观察值的随机误差(包括个体差异以及测定误差),MS组内=SS组内/组内,组内=Nk,SS总=SS组内+SS组间,且总=组间+组内。,F=MS组间/MS组内,方差分析的基本思想:根据资料的设计类型及研究目的,即按变异的不同来源将全部观察值间的总变异分为两部分或多个部分,其自由度也分解为相应的部分,除随机误差外,其余每个部分的变异可由某个因素的作用加以解释,(如各组均数间的变异SS组间可由处理因素的作用加以解释),通过比较可能由某因素所致变异的均方与随机误差的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。,方差分析的应用条件是:1)各样本是相互独立的随机样本;即任何两个观察值之间均不相关;2)各样本来自正态总体;3)各处理组总体方差相等,即方差齐(homogeneityofvariance)。简单地概括为任何观察值Xij都是独立地来自具有等方差的正态总体。,二、完全随机设计资料方差分析的基本步骤,完全随机设计资料的方差分析用于成组设计的多个样本均数的比较可用单因素方差分析。该分析中仅涉及一个研究因素,此因素有K(K2)个水平或状态。,无论是实验还是观察,研究目的都是比较不同水平下,各组平均值之间的差别是否具有统计学意义,这种多个样本均数的比较都可用单因素方差分析。,1.成组设计方差分析中变异的分解,总变异(三个组共60人的餐后2小时血糖测定值大小不等;该变异既包含随机误差,又包含了三组用药即处理的不同),组内变异:个体差异及血糖的随机测定误差。,组间变异:不同用药的影响及随机测量误差。,表95成组设计方差分析的计算公式,SS总-SS组间,2、分析计算步骤,(1)建立假设并确定检验水准H0:三个总体均数相等,即1=2=3H1:三个总体均数不等或不全相等=0.05(2)计算检验统计量F值,表912型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L),3).确定P值并作出推断结论以分子的自由度组间=2为1,分母的自由度组内=57为2,查附表3.1,方差分析用F界值表,F0.05(2,60)=3.15F0.01(2,60)=4.98,F=5.537F0.01(2,60)=4.98,P0.01。,在=0.05水准上拒绝H0,接受H1可以认为三种人的血糖水平不同。,表96例91的方差分析表,注意:以上结论表明,总的说三种人的血糖水平有差别,但并不能说明任何两种人的血糖值均有差别。只能说可能至少有两组人的血糖值有差别,可能有的组间没有差别。要了解那些组均数间有差别,那些组均数间没有差别,需要进一步做两两比较。当k=2时,对同一资料,单因素方差分析等价于成组设计的t检验,且F=t2。,第二节随机区组设计资料的方差分析,随机区组设计的多个样本均数的比较可用多个样本均数比较的两因素方差分析。两因素是指主要的研究因素和配伍组(区组)因素,研究因素有k个水平,共有n个区组。,例9.2为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组间3只大白兔随机采用A、B、C三种处理方案即在松止血带前分别给予丹参2ml/kg、1ml/kg、生理盐水2ml/kg在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表97,问A、B两方案分别与C方案的处理效果是否不同?,表97A.B.C三种方案处理后大白兔血中白蛋白减少量(g/L),一、离均差平方和与自由度的分解,从表97中可以看出,测定结果的变异除了总变异、不同处理方案(处理组)的变异和随机误差变异外,还存在区组间变异,这是由于大白兔遗传特征所致。其大小可用各区组的均数的离均差平方和表示,即:,总变异和处理组变异的计算同于完全随机设计资料的方差分析。即:数理统计证明:在随机区组设计的方差分析中,总变异分为三部分,即:进一步计算出处理和区组的F值。,。,总变异,误差变异:个体差异及血白蛋白的随机测定误差。,处理组间变异:A、B、C不同方案的影响及机测量误差。,区组间变异:既反映了十个区组不同的影响同时又包括了随机测量误差。,表99例92的方差分析表,二.分析计算步骤,(1)建立假设并建立检验水准对于处理组:H0:三个总体均数全相等,即1=2=3H1:三个总体均数不等或不全相等对于区组:H0:十个总体均数全相等H1:十个总体均数不等或不全相等=0.05(2)计算检验统计量F值,表910随机区组设计方差分析的计算公式,SS总-SS处理-SS配伍,误差,3).确定P值并作出推断结论以分子的自由度处理=2为1,分母的自由度误差=18为2,查附表3,方差分析用F界值表,F0.05(2,18)=2.62,F处理=32.639F0.05(2,18)=2.62,P0.05。在=0.05水准上不拒绝H0,还不能认为十个区组间有差别.,注意:单因素与双因素方差分析的区别,根据设计类型来选择方差分析方法在结果解释时应该注意哪些问题?,第三节析因设计资料的方差分析方差分析中,影响观察指标的因素称为因子(factor);因子所处的状态称为因子的一个水平(leveloffactor);各因子水平的组合称为处理(treatment).例9-3某研究人员为了解升白细胞药物(A)和纯苯(B)对大鼠吞噬指数的影响,以及两者同时使用作用。将20只性别相同、体重相近的大鼠,按A、B两因素有无分为四个处理组,A因素有两个水平即用升白细胞药物和不用升白细胞药物,B因素也分为两个水平即用0.3ml/kg纯苯给大鼠皮下注射染毒和未用纯苯染毒。测得其吞噬指数结果见表9-11。,表9-1120只大鼠的吞噬指数,本例研究目的之一为A药(升白细胞药物)的使用是否会引起大鼠的吞噬指数变化。研究目的之二为B药(用纯苯)的使用是否会引起大鼠的吞噬指数变化。研究目的之三为A药与B药是否有交互作用。所谓有协同作用,是指同时用A、B两药起的作用大于单独用A药和B药的作用之和。所谓有拮抗作用,是指同时用A、B两药起的作用小于单独用A药各B药的作用之和。不论协同或拮抗作用均意味着A、B药同时使用的作用不等于单独作用之和。,一、单独效应、主效应和交互效应表9-12例9-3大鼠的吞噬指数均数的差别,二、离均差平方和与自由度的分解:析因设计是将两个或多个实验因素的各水平进行排列组合、交叉分组进行实验,因此其方差分析的总变异可以分为处理和误差两部分。22析因设计处理变异包含了A因素、B因素的主效应及A、B两因素间的交互效应。,三、析因设计资料方差分析的基本步骤,(1)建立假设并建立检验水准对于因素A:H0:给药组与不给药组大鼠吞噬指数的总体相等均数,即1=2H1:给药组与不给药组大鼠吞噬指数的总体均数不等或不全相等对于因素B:H0:染毒与不染毒组大鼠吞噬指数的总体相等均数H1:染毒与不染毒组大鼠吞噬指数的总体相等均数不等或不全相等,对于交互作用AB:H0:给升白细胞药与否不影响染毒与不染毒大鼠的吞噬指数,即A因素与B因素无交互作用H1:给升白细胞药与否影响染毒与不染毒大鼠的吞噬指数,即A因素与B因素无交互有作用=0.05(2)计算检验统计量F值:上述两因素两水平的析因设计可更一般地推广至两因素多水平。若处理因素A有a个水平、处理因素B有b个水平,则有a*bk个处理组。若每个处理组有n个受试对象,则全部受试对象的总数为Na*bn。常用Xijm表示每个受试对象的观察值。(3)确定P值,做出推断结论,表914两因素a*b析因设计方差分析的计算公式,注意单独效应、主效应、和交互效应,1.单独效应是指其他因素水平固定时,同一因素不同水平之间的差异。2.主效应是指某一因素各水平之间的平均差别。3.交互效应:某因素的单独效应随着另一因素变化而变化时候,则称这两个因素存在交互作用。,第四节重复测量资料的方差分析,重复测量资料(repeatedmeasurementdata)是同一对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该指标在不同时间点上的变化特点。这类资料在临床试验和流行病学研究中常见。,例9-4为研究减肥新药盐酸西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同,以及肥胖患者服药后不同时间的体重随时间的变化情况。采用双盲双模拟随机对照试验,将体重指数BMIf27的肥胖患者40名随机等分成两组,一组给予盐酸西布曲明片+模拟盐酸西布曲明胶囊,另一组给予盐酸西布曲明胶囊+模拟盐酸西布曲明片。所有患者每天坚持服药,共服药6个月,受试期间禁用任何影响体重的药物,而且受试对象行为、饮食及运动与服药前的平衡期均保持一致。分别平衡于(0周)、服药后的8周、16周、24周测定肥胖患者的体重(kg)见表9-13,随机区组与重复测量资料的区别主要有二:,重复测量资料中同一受试对象的数据高度相关表9-14表9-13数据的简单相关系数r(n=20)2)重复测量资料中的处理因素在受试对象间为随机分配,但受试对象内的各时间点往往是固定的,不能随机分配;随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受处理各不相同,一、离均差平方和与自由度的分解:全部受试对象的结果用Xijk表示,其中i表示时间点,j表示受试对象,k表示受试对象的处理因素。,二、重复测量资料方差分析的基本步骤,(1)建立假设并建立检验水准对于因素K:H0:不同剂型的减肥总体均数相等,即1=2H1:不同剂型的减肥的总体均数不等或不全相等对于时间因素I:H0:服用减肥药前后不同时间体重的总体均数相等H1:服用减肥药前后不同时间体重的总体均数不等或不全相等,对于交互作用KI:H0:服药剂型K和时间I间无交互效应,即K因素与I因素无交互作用H1:服药剂型K和时间I间有交互效应,即K因素与I因素有交互作用=0.05(2)计算检验统计量F值:,(3)确定P值,做出推断结论本例,按=0.05的水准,减肥药剂型K、剂型K与时间I的交互应KI均不拒绝H0,无统计学意义,还不能认为盐酸西布曲明不同剂型的减肥效果不同,也不能认为盐酸西布曲明不同剂型和不同时间的交互作用的减肥效果不同。而时间因素I拒绝H0接受H1有统计学意义,可认为服用减肥药盐酸西布曲明前后不同时间的平均体重不全相等。,三、重复测量资料方差分析的前提条件进行重复测量资料的方差分析,除需满足一般方差分析的条件外,还需要特别满足协方差阵(covariancematrix)的球形性(sphericity/circularity)或复合对称性(compoundsymmetry)。若球形不对称性质不能满足,则方差分析的F值是有偏的,因它增大了第一类错误的概率。球形对称性通常采Mauchly检验(Mauchlystest)来判断。表9-16例9-4资料的Mauchly检验和球对称系数,若按规定的检验水准=0.10,拒绝H0,接受H1,则理论上讲应对受试对象内所有变异的自由度进行校正,包括时间效应、处理和时间的交互效应以及个体误差三者的自由度均进行校正。表9-17例9-4资料经球对称系数计算机结果,第四节多个样本均数间的两两比较,2.检验全部k个总体均数是否相等,其无效假设称为完全无效假设即所有各组所对应的总体均数都相等,H0:1=2=3=k。例如在研究设计阶段对实验结果知之不多的探索性研究,或经数据结果的提示后,才决定的多个均数间的两两比较,这类情况往往涉及到每两个均数的两两比较。,在检验多组均数差别的无效假设H0时,常见的有以下两种情况:,1.检验某几个特定的总体均数是否相等,其无效假设称为部分无效假设即某几个组所对应的总体均数相等,H0:i=j(ij),如研究者对实验结果有一个大致的设想,在设计阶段就根据研目的或专业知识决定了某些均数间的两两比较,常见于事先有明确假设的证实性实验研究。,一、多个样本均数间每两个均数的比较:即SNK-q检验。,为两个对比组的样本均数,为比较两组差值的标准误,当各处理组例数相等时,,也相等,,MS误差为方差分析中算得的误差均方(组内均方),nA和nB分别为两对比组的样本例数。,计算的检验统计量为q值,q的分布与两比较组之间的组间跨度a及自由度有关。组间跨度a是指,之间涵盖的均数个数(包括,自身在内),每个对比组所包含的组数(组间跨度)a=2,3,K。,根据检验统计量q值,组间跨度a,误差自由度误差及检验水准,查q界值表,确定P值。,例9-5对例9-1资料做两两比较,H0:任两对比组的总体均数相等,即A=BH1:任两对比组的总体均数不等,即AB=0.05,将三个样本均数从小到大排列,并编上组次:组次123均数9.19525.80005.4300组别高剂量组低剂量组对照组列出两两计算表(见表9-18)表9-18例9-1的SNK检验计算表,二、Dunnett-t检验:它适用于多个实验组与一个对照组的比较,根据算得的t值、误差的自由度、试验组数(K-1)及检验水准查Dunnett-t界值表,作出统计推断结论。,例9-6分析例9-2比较A、B两方案(均为实验组)与方案(对照组的总体均数是否不同?,A方案与C方案相比H0:任一实验组与C方案的总体均数相等H1:任一实验组与C方案的总体均数不等=0.052)计算检验统计量表9-19例9-2的Dunnett-t检验计算表3)确定P值,作出统计推断结论,查Dunnett-t界值表,得双侧t0.05=2.04,t0.01=2.84,P0.01,在=0.05水准上,拒绝H0,接受H1。故认为A方案与C方案及B方案与C方案的总体均数均有统计学意义。,三、Bonfferoni法该法又称Bonfferonit检验(Bonfferonittest).Bonfferoni提出,若每次检验水准为,共进行m次比较,当H0为真时,犯第一类错误的累计概率不超过m,即有Bonfferoni不等式(Bonfferoniinequality)m成立。例,四个样本均数经ANOVA有统计学意义,需对任意两个均数进行比较,其比较的次数m=k(k-1)/2=6,若=0.05,则6次比较均不犯第一类错误的概率为(1-0.05)6=0.746,犯第一类错误的累计概率=1-0.746=0.25420,故不能使用该法。为此,提出以来调整,从而保证由检验统计量算得的概率不会超过1。,第六节方差分析的前提条件和变量变换,方差分析的前提条件为各样本是相互独立的随机样本,均服从正态分布且各样本的总体方差相等。在进行方差分析时,实际资料有时不能完全满足任何观察值都独立地来自具有等方差正态总体的假定,此时进行方差分析时,可能导致F值偏大,从而有增大第一类错误的危险。在样本例数较多的情况下,数据可看成近似正态分布,此时,方差分析对总体的非正态性并不苛求;当每组样本例数相等时,方差分析对于方差的非齐性并不苛求,故在方差分析时,最好采用每组例数相等的平衡设计方案。,变量变换的目的:1)使各组达到方差齐性;2)使资料转换为正态分布,以满足方差分析和t检验的应用条件。通常情况下,一种适当的函数转换可使上述两个目的同时达到。3)直线化。常用于曲线拟合。,1.对数变换即将原始数据X的对数值作为新的分析数据。常用于:1)使服从对数正态分布的数据正态化。可用对数变换改善其正态性。2)使资料达到方差齐性的要求,特别是各样本的标准差与均数成比例或变异系数CV接近一个常数时。,2.平方根变换即将原始数据X的平方根作为新的分析。数据常

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论