07方差分析(ANOVA).ppt_第1页
07方差分析(ANOVA).ppt_第2页
07方差分析(ANOVA).ppt_第3页
07方差分析(ANOVA).ppt_第4页
07方差分析(ANOVA).ppt_第5页
免费预览已结束,剩余78页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析(ANOVA),AnalysisofVariance:,RAFisher(18901962),方差分析(AnalysisofVariance,ANOVA),又称“变异数分析”由英国统计学家R.A.Fisher首先提出,为纪念Fisher,以F命名,故方差分析又称为F检验。,方差分析简介,方差分析简介,1918年,Fisher首创“方差”和“方差分析”两个词汇。apaperonpopulationgenetics,TheCorrelationBetweenRelativesontheSuppositionofMendelianInheritanceTransactionsoftheRoyalSocietyofEdinburgh,52,399-433:Itis.desirableinanalyzingthecausesofvariabilitytodealwiththesquareofthestandarddeviationasthemeasureofvariability.WeshalltermthisquantitytheVariance.(p.399),方差分析简介,Ina1921paper(StudiesinCropVariation.I.AnexaminationoftheyieldofdressedgrainfromBroadbalkJournalofAgriculturalScience,11,107-135)Fisherdiscussedtheanalysisofthetotalvarianceforeachplot.(p.111),方差分析简介,1923年,他与W.A.Mackenzie(麦肯齐)合写的关于收获量变异的研究一文中,首先对方差分析进行了系统的研究。Studiesincropvariation.II.Themanurialresponseofdifferentpotatovarieties.JournalofAgriculturalScience13311-320.Gani,JM,ed.(1986).,方差分析简介,1925年他对方差分析及协方差分析进行了完整的论述FishersbookStatisticalMethodsforResearchWorkers(1925)madetheanalysisofvariancewidelyknown。,看一个实例,例6.6某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者,治疗一月后,记录下每名受试者血红蛋白的上升克数,资料见表6.3,问三种治疗方案对婴幼儿贫血的疗效是否相同?,分析,总变异SS总,SumofsquaresaboutthemeanofallNvalues.,total=N-1,组间变异SS组间,Sumofsquaresbetweengroups,n1n2n3,组间变异SS组间,Sumofsquaresbetweengroups,Between=k-1,MSBetween=SSBetween/(k-1),组内变异SS组内,within=N-k,MSwithin=SSwithin/(N-k),Sumofsquareswithingroups,变异分解,组间变异总变异组内变异SS总=SS组间+SS组内总=组间组内,证明,组间及组内变异的比较,B,A,组内变异性,组间变异性,B相对于A是较大,组间及组内变异的比较,B,A,组内变异性,组间变异性,B相对于A是较小,方差分析的基本思想,组内变异:抽样误差组间变异:组间本质差别抽样误差若组间无本质差别:组间变异组内变异或:,方差分析的原理,单因素多个样本均数的比较(onewayanalysisofvariance),单因素:处理因素属于完全随机设计(Completelyrandomdesign)随机的含义:机会均等不可预测随机抽样随机分组随机试验,几个术语,因素(factor)所要检验的对象:治疗方案水平(level)因素的具体表现:方案A、方案B、方案C试验(Trial)单因素三水平的试验,基本步骤,建立检验假设,确定检验水准计算检验统计量(列方差分析表)计算P值结论,建立假设,确定检验水准,H0:A=B=C,即三种治疗方案治疗婴幼儿贫血的疗效相同,H1:A,B,C不全相等或全不相等,即三种治疗方案治疗婴幼儿贫血的疗效不全相同或全不相同。=0.05,计算基本数据,计算SS总,SS组间,和SS组内,计算SS总,SS组间,和SS组内,C=(83.70)2/60=116.7615SS总=184.43116.76=67.6685SS组内=0.91332191.29712190.7800219=59.3747,单因素方差分析表(基本结构),列方差分析表,F分布,方差比的分布,F分布,1=1,2=10,1=5,2=10,F分布,1=10,2=,1=10,2=1,界定P值,作结论,总自由度为N1=601=59组间自由度=组数(k)1=31=2组内自由度=总自由度组间自由度=592=57。,F(2,57)的F分布及界值,0,1,2,3,4,5,0,.2,.4,.6,.8,1,3.15,0.05,F0.05(2,57)3.15,查方差分析表得F0.05(2,57)=3.15,FF0.05(2,57),则P0.05。故按=0.05的水准,拒绝H0,接受H1,故可认为三种治疗方案的治疗效果不一样。,多个样本均数的两两比较,在方差分析认为多组均数间差异有统计学意义的基础上,若需了解究竟哪些组均数之间有差别,还是各组间均有差别,可用多个样本均数的两两比较(又称多重比较multiplecomparison)。,多重比较(multiplecomparison),多组间的两两比较为什么不能用t检验?进行一次假设检验,犯I类错误的概率:进行多次(k)假设检验,犯I类错误的概率:1(1)k组数为3,k=3,1(10.05)k=0.1426组数为4,k=6,1(10.05)k=0.2649组数为5,k=10,1(10.05)k=0.4013,Theriskthatweactuallytakeishigherthanwhatweassumed!,Bonferroni1892-1960,Scheffe1907-1977,Tukey1915-2000,Dunnett1921-,Westerfall1957-,Benjamini1949-,多个样本均数间的两两比较,用q检验(又称Student-Newman-Keuls法,即SNK法),统计量为q:,q与误差自由度有关,还与比较的两组之a值有关!,H0:A=B,每次对比时两个总体均数相等;H1:AB,每次对比时两个总体均数不等。=0.05。将三个样本均数按从大到小顺序排列并编上组次:组次123均数1.8401.4150.930组别(治疗方案)ABC,q0.05,(57,3)=3.40q0.05,(57,2)=2.83,结论,总的说来,三种治疗方案的治疗婴幼儿贫血疗效有差别。而这种差别主要来自A方案和C方案。这一结论可用下列形式表示:ABC1.8401.4150.930,多重比较结果表示,划线法标记字母法(SAS)梯形表法(Stata),SAS结果,Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNgA1.8400201ABA1.4150202BB0.9300203,Stata结果,Comparisonofxbyg(Scheffe)RowMean-|ColMean|12-+-2|-0.42|0.426|3|-0.91-0.49|0.0240.330,多个实验组与一个对照组均数间的两两比较,常用q检验,又称Duncan法,其计算公式为:公式与q检验公式类似,但需查附表9q界值表。,两因素多个样本均数的比较(twowayanalysisofvariance),两因素:配伍因素和处理因素属于随机区组设计(randomizedblockdesign)又称“配伍组设计”,配伍的概念,是“配对”概念的扩展,不是按每两个配对,而是按每三个、每四个或更多个配起来,这就超出了“对子”的涵义,而是配伍组设计了。,配伍设计的目的,对研究因素以外的已知的干扰因素加以控制,从而将研究因素的作用与干扰因素的作用区分开,以达到提高检验的功效之目的。,单向区组控制示意,实例,例6.10在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见表6.7,问三种药物有无抑瘤作用?,两因素方差分析的原理类似于单因素方差分析,前者仅在后者的基础上,从误差中再分离出区组效应,使误差减少,达到提高检验功效之目的。,区组设计的SS的分解,SS总SS处理+SS区组+SS误差,v总v处理v区组v误差,kb-1(k-1)(b-1)(k-1)(b-1),实验因素:H0:三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组相同,即对照=A=B=C;H1:三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不全同或全不同。=0.05。,建立检验假设,干扰因素:H0:5个窝别小白鼠对肉瘤生长的反应相同;H1:5个窝别小白鼠对肉瘤生长的反应不全相同或全不相同。=0.05。,计算SS总,SS处理,SS区组和SS误差,SS误差=SS总SS处理SS区组=0.741280.410840.11233=0.21811,计算自由度,总=总例数1=201=19处理=处理组数1=41=3区组=区组数1=51=4误差=总处理区组=1934=12,两因素方差分析表(基本结构),列方差分析表,界定P值,作结论,F0.05,(3,12)=3.49F0.05,(4,12)=3.26F0.01,(3,12)=5.95F0.01,(4,12)=5.41,显然处理组间均数的检验结果是FF0.01,P0.01,拒绝H0,接受H1,差别有统计学意义,可认为三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同;但区组间差别无统计学意义,即各窝小白鼠对肉瘤生长的反应相同。,方差齐性检验,两个方差的齐性检验多个方差的齐性检验,方差分析的优点,不受比较组数的限制,可比较多组均数可同时分析多个因素的作用可分析因素间的交互作用,交互作用,某个因素的效应会因另一因素水平的改变而发生变化时,我们就说这两个因素具有交互作用。否则,我们就说这两个因素没有交互作用。Aninteractionisthevariationamongthedifferencesbetweenmeansfordifferentlevelsofonefactoroverdifferentlevelsoftheotherfactor.,方差分析的应用条件,独立性:各样本是相互独立的随机样本正态性:各样本都来自正态总体方差齐性:各样本的总体方差相等,方差分析的正确应用,要求资料满足独立性、正态性和方差齐性变量变换对数转换平方根转换平方根反正弦转换,方差分析的正确应用,两两比较解决问题的逻辑顺序不能用t检验“模糊结论”的解释与方差分析结果矛盾,方差分析的正确应用,F值、t值、q值、q值之间的关系在两样本均数比较时,t检验、F检验、q检验及q检验是等价的当k2时,q检验的检验功效高于q检验,例:某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别?,上面结果表明,总的来说三组矿工用力肺活量有差别。再做进一步的两两比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论