医学统计学方差分析于_第1页
医学统计学方差分析于_第2页
医学统计学方差分析于_第3页
医学统计学方差分析于_第4页
医学统计学方差分析于_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学,方差分析Analysis of Variance,Department of Epidemiology and Biostatistics, NJMU流行病与生物统计系 南京医科大学,主要内容,问题的提出方差分析的原理完全随机设计的方差分析 completely random design配伍组设计的方差分析 random block design两两比较方差分析的正确应用,复习假设检验,提出一个假设如果假设成立,得到现有样本的可能性可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设(没理由),因素和水平,因素(factors):将试验对象随机分为若干个组,加以不同的干预,称为处理因素。在相同的因素下的不同干预,称为不同的水平(level)。 昆明癫痫病医院/ 昆明癫痫病/ 昆明癫痫病医院/ 昆明脑科医院/,问题的提出,t检验实例南京医科大学的学工部门想知道2005年南京市进入南医大就读的学生中,市区的学生和郊区的学生成绩是否有差异。因素:学生所来自的区域水平:市区,郊区,问题的提出,t检验实例阿卡波糖的降血糖效果。分别给对照组和试验组服用拜唐平胶囊和阿卡波糖胶囊,观察8周后血糖下降值的差异。因素:不同的药物水平:阿卡波糖,拜唐平,问题的提出,t检验的局限性单因素两水平,问题的提出,江苏、安徽、浙江三省的平均入学成绩,?,问题的提出,一种新的降血脂药,120人分为安慰剂组,用药组1(2.4g),用药组2(4.8g),用药组3(7.2g)。实验结束后观察血脂水平。,?,问题的提出,假如每次t检验犯第一类错误的概率是0.05,那么要完全地进行比较,犯第一类错误的概率是1(1)k。,多组间的两两比较为什么不能用 t 检验? 进行一次假设检验,犯第一类错误的概率: 进行多次(k)假设检验,犯第一类错误的概率:1(1)k组数为3, k=3,1(10.05)k=0.1426组数为4, k=6,1(10.05)k=0.2649组数为5, k=10, 1(10.05)k=0.4013 组数为6, k=15, 1(10.05)k=0.5400,问题的提出,方差分析,方差分析,又称变异数分析。Analysis of Variance,简写为ANOVA。由英国统计学家R.A.Fisher提出。方差分析的起源。F检验。,Sir Ronald Aylmer Fisher,18901962,Rothamste Agricultural Station,Fisher于Rothamste研究作物产量时,完善了方差分析的思想,方差分析的原理,单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;,方差分析的原理,单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;,方差分析的原理,t检验的检验统计量,方差分析的原理,例1 某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者,A方案为每公斤体重每天口服2.5硫酸亚铁1ml,B方案为每公斤体重每天口服2.5硫酸亚铁0.5ml,C方案为每公斤体重每天口服3g鸡肝粉, 治疗一月后,记录下每名受试者血红蛋白的上升克数,资料见表1,问三种治疗方案对婴幼儿贫血的疗效是否相同?,因素:治疗方案水平:A,B,C,例1 三组血红蛋白增加量(g),方差分析的原理,所有个体的血红蛋白上升值几乎都不同总变异不同组间的血红蛋白上升值不同,原因:处理因素的效应(如果存在的话);随机误差组间变异同组内的血红蛋白上升值不一致,原因是不同个体的个体差异、随机误差组内变异总变异=组间变异+组内变异,X,总变异示意图,所有个体的血红蛋白上升值几乎都不同,X,组间变异示意图,不同组间的血红蛋白上升值不同,X,组内变异示意图,同组内的血红蛋白上升值不一致,例1 三组血红蛋白增加量(g),总变异 SS总,Sum of squares about the mean of all N values.,组内变异 SS组内,Sum of squares within groups,组间变异 SS组间,Sum of squares between groups,n1 n2 n3,总变异的分解,SS总SS组间SS组内,67.66858.2930+59.3755,方差分析的基本思想,组内变异(SS组内):抽样误差组间变异(SS组间) :组间本质差别抽样误差如果组间无本质差别,则组间变异组内变异或:,方差分析的基本思想,方差分析的原理,方差分析的原理,方差分析表,方差分析表,方差分析的原理,方差比的分布!,方差分析的最终统计推断和假设检验均依靠F分布,所以适当了解一下F分布的特点十分有益。,F分布,F分布是英国统计学家Fisher和Snedecor(斯内德克 )提出的。 为了表示对Fisher的尊重, Snedecor将其命名为F分布。 方差分析也主要是由Fisher推导出来的,也叫F检验。,F 分布,1=1, 2=10,1=5, 2=10,F 分布,1=10, 2=,1=10, 2=1,构造检验的统计量(F 分布),如果均值相等,F=MSt/MSe1,方差分析表,方差分析表,F(2,57)的F分布及界值,0,1,2,3,4,5,0,.2,.4,.6,.8,1,3.1588,0.05,完全随机设计资料的方差分析,H0: 1=2=3 ,即三总体均数相等;H1: 1, 2, 3 不等或不全相等。0.05。计算检验统计量: F=3.98 3.1588(界值)对应的概率: P=0.0241(p0.05)结论:在0.05水准,拒绝H0,接受H1,差别有统计学意义。认为三种治疗方案治疗婴儿贫血的效果不等或不全相等。,完全随机设计资料的方差分析,例题2 已知动物烧伤后内脏ATP含量迅速下降, 严重影响生物体各器官能量的正常代谢,为了解烫伤后不同时期切痂对肝脏ATP含量影响,将30只雄性大鼠随机分3组, 每组10只:A组为烫伤对照组,B组为烫伤后24小时(休克期)切痂组,C组为烫伤后96小时(非休克期)切痂组, 并在烫伤后168小时活杀,测量其肝脏的ATP含量, 探讨烫伤后不同时间ATP含量是否有变化?,因素:烫伤后不同时期水平:A,B ,C,完全随机设计资料的方差分析,完全随机设计资料的方差分析,完全随机设计资料的方差分析,建立假设 H0:三组大鼠肝脏的ATP含量值无差别, 1=2=3H1 :三组大鼠肝脏的ATP含量值有差别 ;选择检验水准=0.05;,完全随机设计资料的方差分析,列方差分析表,计算F值;查自由度为2,27的F界值表,得P0.05;按=0.05的水准拒绝H0,接受H1,差别有统计学意义。认为烫伤后168 h时, 三组大鼠肝脏的ATP含量有差别。,主要内容,问题的提出方差分析的原理完全随机设计的方差分析配伍组设计的方差分析两两比较方差分析的正确应用,配伍组设计的方差分析,为什么要配伍?配对的目的:排除干扰因素的影响;配伍的目的:使同一区组内除了研究因素外的其他特征尽可能相似,排除干扰因素的影响;按窝配伍;田间试验按区块配伍;当研究因素只有两水平时, 配伍设计方差分析=配对t检验,Rothamste Agricultural Station,Fisher 用方差分析的思想耕种的一块田,配伍组设计的方差分析,种子A,种子B,种子C,配伍组设计的方差分析,肥,中,瘦,A,B,C,肥,中,瘦,BLOCK1,配伍组设计的方差分析,BLOCK2,BLOCK3,配伍组设计的方差分析,实质:两因素方差分析变异分解,N为总样本含量,k为水平数,n为区组数;,总变异总的离均差平方和,配伍组方差分析的原理,配伍组设计的SS的分解,SS总 SS区组间 SS处理间 SS误差,v总 v区组间 v处理间 v误差,kb-1 (b-1) (k-1) (k-1) (b-1),实质:两因素方差分析变异分解,N为总样本含量,k为水平数,b为区组数;,配伍组设计的方差分析,例3 在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见表6.7,问三种药物有无抑瘤作用?,配伍组设计的方差分析,配伍组设计的方差分析,配伍组设计的方差分析,建立假设实验因素:H0:三种药物的抑瘤效果与对照组相同; H1:三种药物的效果与对照组不同或者不全相同;干扰因素:H0:5个窝别小白鼠对肉瘤生长的反应相同 ;H1:5个窝别小白鼠对肉瘤生长的反应不全相同或全不相同 ;确立检验水准; =0.05;列方差分析表;,配伍组设计的方差分析,按=0.05的水准拒绝H0,接受H1,差别有统计学意义,认为三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同 ;按=0.05的水准不拒绝H0,差别无统计学意义,尚不能认为各窝小白鼠对肉瘤生长的反映不同 ;,主要内容,问题的提出方差分析的原理完全随机设计的方差分析配伍组设计的方差分析两两比较方差分析的正确应用,两两比较,又叫多重比较,Multiple Comparison;分类事先计划好的多个试验组与一个对照组之间的比较,多个组与一个特定组间的比较或者特定组间的比较;(Planned Multiple Comparison) 方差分析得到有差别的结论后多个组之间的相互比较的探索性研究(Post Hoc);,多个组之间的相互比较,Student-Newman-Keuls法(SNK法),SNK法步骤,H0: 相比较的两总体均数相等;H1: 相比较的两总体均数不等。0.05。计算检验统计量: q组次123均数1.8401.4150.930组别 A B C a=2 a=2 a=3,SNK法步骤,均数1.8401.4150.930组别 A B C,结论:A方案与C方案的治疗效果间差异有统计学意义,而其余两组间尚看不出差异。,Duncan- t 检验,又称q法。用于k-1试验组与1个对照组比较,或 k-1对照组与1个试验组比较。,q 与误差自由度有关,还与比较的两组之a值有关!,Duncan-t 法步骤,H0: 相比较的两总体均数相等;H1: 相比较的两总体均数不等。0.05。计算检验统计量: Duncan q,Duncan-t 法步骤,结论:A疗法优于C疗法,而A与B差异无统计学意义。,两两比较的注意事项,对于方差分析后的两两比较均应以方差分析拒绝相应的H0为前提,且结论均不应与方差分析的结论相悖;出现模糊结论,下结论应该谨慎;方差分析拒绝H0,但两两比较得不出有差异的结论,因为方差分析效率高。Post Hoc分析发现的各组间差别只是一种提示,一种进一步增加含量改进试验的提示。,不能用t检验代替方差分析,也不能用t检验代替两两比较。无论是SNK法还是Dunnett-t法,用于两组比较时,结果与t检验等价。,两两比较的注意事项,方差分析的要求,独立随机抽样(Independence);正态性(Normality);方差齐性(Homoscedascity);,方差齐性检验,两个方差的齐性检验Levene法多个方差的齐性检验Bartlett法,变量变换(Variable Transformation),方差齐性是一个很strong的假设,如果不齐,就不能直接进行方差分析;变量变换目的:方差齐性化,正态化,线性化常用方法:对数变换 对数正态分布, 等比,正偏平方根变换 poisson分布,轻度偏态等百分数平方根反正弦变换 原始数据为率,方差分析 小结,均数、方差的比较样本均数与总体均数的比较( t 检验)配对设计样本均数的比较(配对t 检验)两样本均数的比较 ( t 检验, u 检验, F 检验, SNK, Duncan),多样本均数的比较( F 检验,ANOVA)各组间的比较(SNK法);各试验组与某一对照组间的比较用(Duncan法)两个方差的比较( F 检验)多个方差的比较( Bartlett 检验),方差分析 小结,方差分析 小结,分析单因素多水平间的比较或多个因素对结果的影响;要求数据满足正态性、独立性、方差齐性单因素方差分析 两因素方差分析两两比较变量变换正确应用,Thank You!,两种错误的说法,X1 X2 X3X2所来自的总体位于X1所来自的总体和X3所来自的总体之间;X1和X2来自同一总体,X2和X3来自同一总体。,只能说明无法判断样本2来自于何总体!,第一阶段从19世纪初直至20世纪末尾,代表人物有高斯及拉普拉斯、勒让德等人,形式是误差论并逐渐渗入到统计数据分析问题; 第二阶段从19世纪末到20世纪20年代初期,代表人物主要是卡尔皮尔逊,形式是把多元正态与这模型联系起来,重点转到相关回归;第三阶段可以说是自1922年,代表人物是费歇尔,重点问题是方差分析(协方差分析)并联系到试验设计的发展。,线性统计模型,溯源到1917年斯卢茨基(E. Slutsky)的一篇文章,其中提出了运用皮尔逊的拟合优度(goodness of fit)思想去检验回归是否为线性的问题。斯卢茨基认为,在原假设(回归为线性)成立时,统计量,费歇尔和F分布方差分析,斯卢茨基这个论断在数学上是不正确的,但其中包含了一种有价值的统计思想 : 反映与模型取法无关的随机误差,残差ri ,则不仅与随机误差有关,还与模型取得是否正确有关,模型与实际偏离愈大, ri一般也会愈大,,费歇尔和F分布方差分析,所以 这个量反映了以随机误差水平为标杆去衡量模型与实际的偏离程度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论