




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学方差分析Analysis of VarianceDepartment of Epidemiology and Biostatistics, NJMU流行病与生物统计系 南京医科大学主要内容o 问题的提出o 方差分析的原理o 完全随机设计的方差分析 o completely random designo 配伍组设计的方差分析o random block designo 两两比较o 方差分析的正确应用复习假设检验o 提出一个假设o 如果假设成立,得到现有样本的可能性n 可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。n 有可能得到手头的结果,故
2、根据现有的样本无法拒绝事先的假设(没理由)因素和水平o 因素(factors):将试验对象随机分为若干个组,加以不同的干预,称为处理因素。o 在相同的因素下的不同干预,称为不同的水平(level)。o 昆明癫痫病医院http:/ 昆明癫痫病http:/ 昆明癫痫病医院http:/ 昆明脑科医院http:/ t检验实例n 南京医科大学的学工部门想知道2005年南京市进入南医大就读的学生中,市区的学生和郊区的学生成绩是否有差异。因素:学生所来自的区域水平:市区,郊区单因素两水平问题的提出o t检验实例n 阿卡波糖的降血糖效果。分别给对照组和试验组服用拜唐平胶囊和阿卡波糖胶囊,观察8周后血糖下降值的
3、差异。因素:不同的药物水平:阿卡波糖,拜唐平单因素两水平问题的提出o t检验的局限性单因素两水平问题的提出江苏、安徽、浙江三省的平均入学成绩X?单因素三水平江苏=592.79X安徽=571.23X浙江=569.83X问题的提出o一种新的降血脂药,120人分为安慰剂组,用药组1(2.4g),用药组2(4.8g),用药组3(7.2g)。实验结束后观察血脂水平。X?单因素四水平用药组1 =2.72mmol/lX用药组2 =2.70mmol/lX安慰剂组 =3.43mmol/lX用药组3 =1.97mmol/lX问题的提出o 假如每次t检验犯第一类错误的概率是0.05,那么要完全地进行比较,犯第一类错
4、误的概率是1(1)k。61 0.950.2649o 多组间的两两比较为什么不能用多组间的两两比较为什么不能用 t 检验?检验? 进行一次假设检验,犯第一类错误的概率: 进行多次(k)假设检验,犯第一类错误的概率:1(1)k组数为组数为3, k=3,1(10.05)k=0.1426组数为组数为4, k=6,1(10.05)k=0.2649组数为组数为5, k=10, 1(10.05)k=0.4013 组数为组数为6, k=15, 1(10.05)k=0.5400问题的提出方差分析o 方差分析,又称变异数分析。o Analysis of Variance,简写为ANOVA。o 由英国统计学家R.A
5、.Fisher提出。o 方差分析的起源。o F检验。Sir Ronald Aylmer Fisher18901962Rothamste Agricultural StationFisher于Rothamste研究作物产量时,完善了方差分析的思想方差分析的原理o 单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;处理因素水平1水平2方差分析的原理o 单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;处理因素水平1水平2水平k方差分析的原理1212XXXXts以抽样误差作为尺度t检验的检验统计量差别方差分析的原理例例1 某地用某地用A、B和和C三种方案治疗血红蛋白含量不满三种方
6、案治疗血红蛋白含量不满10g的婴的婴幼儿贫血患者,幼儿贫血患者,A方案为每公斤体重每天口服方案为每公斤体重每天口服2.5硫酸亚铁硫酸亚铁1ml,B方案为每公斤体重每天口服方案为每公斤体重每天口服2.5硫酸亚铁硫酸亚铁0.5ml,C方案为每公斤体重每天口服方案为每公斤体重每天口服3g鸡肝粉,鸡肝粉, 治疗一月后,记录下每名受试者治疗一月后,记录下每名受试者血红蛋白的上升克数血红蛋白的上升克数,资料,资料见表见表1,问三种治疗方案对婴幼儿贫血的疗效是否相同?,问三种治疗方案对婴幼儿贫血的疗效是否相同?因素:治疗方案因素:治疗方案水平:水平:A,B,C例1 三组血红蛋白增加量(g)A(i=1)B(i
7、=2)C(i=3)2.02.1-0.7Xij0.02.00.72.01.41.00.03.0--2.01.2-1.31.4方差分析的原理o 所有个体的血红蛋白上升值几乎都不同总变异o 不同组间的血红蛋白上升值不同,原因:处理因素的效应(如果存在的话);随机误差组间变异o 同组内的血红蛋白上升值不一致,原因是不同个体的个体差异、随
8、机误差组内变异o 总变异=组间变异+组内变异1X3XX2XX总变异总变异示意图示意图i jXX 所有个体的血红蛋白上升值几乎都不同所有个体的血红蛋白上升值几乎都不同1X3XX2XX组间变异组间变异示意图示意图iXX 不同组间的血红蛋白上升值不同不同组间的血红蛋白上升值不同1X3XX2XX组内变异组内变异示意图示意图ijiXX 同组内的血红蛋白上升值不一致同组内的血红蛋白上升值不一致例1 三组血红蛋白增加量(g)A(i=1)B(i=2)C(i=3)2.02.1-0.7Xij0.00.20.
9、1.62.00.72.01.41.00.03.0--2.01.2-1.31.4ni20202060Meansd1.8400.9131.4151.2970.9300.7801.3951.07121(1.840)201jX 22(1.415)201jX 23(0.930)201jX 2(1.39605)1ijX 总变异 SS总o Sum of squares about the mean of all N values. 2Ti jSSXX 60211.
10、39567.6685TijjSSX 组内变异 SS组内o Sum of squares within groups 2020202221231111.8401.4150.930 59.3755withinjjjjjjSSXXX 211inkwithinijiijSSXX 组间变异 SS组间22()XX 21()XX 23()XX 1X2X3XX2()BetweeniiSSn XX o Sum of squares between groupsn1 n2 n3 22220(1.8401.395)20(1.4151.395)20(0.9301.395) 8.2930BetweenSS 总变异的分解
11、SS总SS组间SS组内22211111()()()iinnkkkijiiijiijiijXXn XXXX222()()()iiijiXXn XXXX 67.66858.2930+59.3755方差分析的基本思想o 组内变异(SS组内):抽样误差o 组间变异(SS组间) :组间本质差别抽样误差o 如果组间无本质差别,则组间变异组内变异o 或:11SSkMSMSSSnk组间组间组内组内1X3XX2X方差分析的基本思想方差分析的基本思想总变异总的离均差平方和包括处理因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度总变异总的离均差平方和包括处理
12、因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度方差分析表变异来源SSvMSF组间 SS组间k-1SS组间/v组间MS组间MS组内组内 SS组内N-kSS组内/v组内总SS总N-1方差分析表变异来源SSvMSF 总 67.668559 组间8.293024.14653.98 组内(误差) 59.3755571.0417方差分析的原理12(,)BetweenWithinMSFFMS 1SSkMSFMSSSnk组间组间组内组内o方差比的分布! 方差分析的最终统计推断和假设检验均依靠F分布,所以适当了解一下F分布的特点十分有益。F F分布分布
13、 F分布是英国统计学家Fisher和Snedecor(斯内德克 )提出的。 为了表示对Fisher的尊重, Snedecor将其命名为F分布。 方差分析也主要是由Fisher推导出来的,也叫F检验。F 分布0123450.00.81.01=1, 2=101=5, 2=10F 分布0123450.00.81.01=10, 2=1=10, 2=1构造检验的统计量(F 分布)方差分析表变异来源SSvMSF组间 SS组间k-1SS组间/v组间MS组间MS组内组内 SS组内N-kSS组内/v组内总SS总N-1方差分析表变异来源SSvMSF 总 67.668559 组间
14、8.293024.14653.98 组内(误差) 59.3755571.0417F(2,57)的的F分布及界值分布及界值01234.813.15880.05完全随机设计资料的方差分析1. H0: 1=2=3 ,即三总体均数相等;H1: 1, 2, 3 不等或不全相等。0.05。2. 计算检验统计量: F=3.98 3.1588(界值)3. 对应的概率: P=0.0241(p0.05)4. 结论:在0.05水准,拒绝H0,接受H1,差别有统计学意义。认为三种治疗方案治疗婴儿贫血的效果不等或不全相等。完全随机设计资料的方差分析 例题2 已知动物烧伤后内脏ATP含量迅速下降, 严重影
15、响生物体各器官能量的正常代谢,为了解烫伤后不同时期切痂对肝脏ATP含量影响,将30只雄性大鼠随机分3组, 每组10只:o A组为烫伤对照组,o B组为烫伤后24小时(休克期)切痂组,o C组为烫伤后96小时(非休克期)切痂组, 并在烫伤后168小时活杀,测量其肝脏的ATP含量, 探讨烫伤后不同时间ATP含量是否有变化?因素:烫伤后不同时期因素:烫伤后不同时期水平:水平:A,B ,C完全随机设计资料的方差分析烫伤对照组24小时切痂组96小时切痂组 7.76 11.14 10.85 7.71 11.60 8.58 8.43 11.42 7.19 8.47 13.85 9.36 10.30 13.5
16、3 9.59 6.67 14.16 8.81 11.73 6.94 8.22 5.78 13.01 9.95 6.61 14.18 11.26 6.97 17.72 8.68完全随机设计资料的方差分析变异来源离均差平方和MSF组间 119.8314组内112.9712总变异完全随机设计资料的方差分析o 建立假设 nH0:三组大鼠肝脏的ATP含量值无差别, 1=2=3nH1 :三组大鼠肝脏的ATP含量值有差别 ;o 选择检验水准=0.05;完全随机设计资料的方差分析o 列方差分析表,计算F值;o 查自由度为2,27的F界值表,得P0.05;o 按=0.05的水准拒绝H0,接受H1,差别有统计学意
17、义。认为烫伤后168 h时, 三组大鼠肝脏的ATP含量有差别。 变异来源离均差平方和MSF组间 119.8314259.916 14.32 组内112.9712274.184总变异232.8026 29主要内容o 问题的提出o 方差分析的原理o 完全随机设计的方差分析o 配伍组设计的方差分析o 两两比较o 方差分析的正确应用配伍组设计的方差分析o 为什么要配伍?n 配对的目的:排除干扰因素的影响;n 配伍的目的:使同一区组内除了研究因素外的其他特征尽可能相似,排除干扰因素的影响;o 按窝配伍;o 田间试验按区块配伍;n 当研究因素只有两水平时, 配伍设计方差分析=配对t检验 Rothamste
18、 Agricultural Station Fisher 用方差分析的思想耕种的一块田配伍组设计的方差分析配伍组设计的方差分析种子种子A种子种子B种子种子C配伍组设计的方差分析肥肥中中瘦瘦ABC肥肥中中瘦瘦BLOCK1配伍组设计的方差分析处理因素处理因素配伍因素配伍因素BLOCK2BLOCK3配伍组设计的方差分析o 实质:两因素方差分析o 变异分解,N为总样本含量,k为水平数,n为区组数;212121,knijijkniijknjijSSXXNSSXXkSSXXnSSSSSSSS总总=1处理处理=1配伍配伍=1处理总配伍误差处理总配伍误差 -1 -1 -1总变异总的离均差平方和处理因素不同水平
19、的效应所致的变异,及随机误差无法用处理、配伍所解释的部分变异(随机误差)配伍组方差分析的原理尺度配伍因素不同水平的效应所致变异,及随机误差尺度配伍组设计的SS的分解SS总 SS区组间 SS处理间 SS误差 v总 v区组间 v处理间 v误差 kb-1 (b-1) (k-1) (k-1) (b-1)o 实质:两因素方差分析o 变异分解,N为总样本含量,k为水平数,b为区组数;配伍组设计的方差分析MSSSFMSSSMSSSFMSSS处理处理处理处理误差误差误差配伍配伍配伍配伍误差误差误差o 例3 在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效
20、果,资料见表6.7,问三种药物有无抑瘤作用?配伍组设计的方差分析配伍组设计的方差分析配伍组设计的方差分析o 建立假设n实验因素:实验因素: H0:三种药物的抑瘤效果与对照组相同:三种药物的抑瘤效果与对照组相同; H1:三种药物的效果与对照组不同或者不全相同;:三种药物的效果与对照组不同或者不全相同;n干扰因素:干扰因素: H0:5个窝别小白鼠对肉瘤生长的反应相同个窝别小白鼠对肉瘤生长的反应相同 ; H1:5个窝别小白鼠对肉瘤生长的反应不全相同或全不相同个窝别小白鼠对肉瘤生长的反应不全相同或全不相同 ;o 确立检验水准; =0.05;o 列方差分析表;配伍组设计的方差分析o 按=0.05的水准拒
21、绝H0,接受H1,差别有统计学意义,认为三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同 ;o 按=0.05的水准不拒绝H0,差别无统计学意义,尚不能认为各窝小白鼠对肉瘤生长的反映不同 ;变异来源离均差平方和MSFP处理0.4108430.136957.53P0.05误差0.21811120.01818总变异0.7412819主要内容o 问题的提出o 方差分析的原理o 完全随机设计的方差分析o 配伍组设计的方差分析o 两两比较o 方差分析的正确应用两两比较o 又叫多重比较,Multiple Comparison;o 分类n 事先计划好的多个试验组与一个对照组之间的比较,多个组与一个特定组
22、间的比较或者特定组间的比较;(Planned Multiple Comparison) n 方差分析得到有差别的结论后多个组之间的相互比较的探索性研究(Post Hoc);多个组之间的相互比较o Student-Newman-KeulsStudent-Newman-Keuls法法( (SNK法)112ABABXXqM Snn误 差SNK法步骤法步骤1. H0: 相比较的两总体均数相等;H1: 相比较的两总体均数不等。 0.05。2.计算检验统计量: q组次123均数1.8401.4150.930组别 A B C a=2 a=2 a=3SNK法步骤法步骤o均数1.8401.4150.930o组别
23、 A B C对比组均数之差标准误qaq界值P1与30.9100.22823.987733.400.052与30.4850.22822.125322.830.05结论结论:A方案与方案与C方案的治疗效果间差异有统计学意义,而其余两方案的治疗效果间差异有统计学意义,而其余两组间尚看不出差异。组间尚看不出差异。211AcBABXXtnns Duncan- t 检验o 又称q法。o 用于k-1试验组与1个对照组比较,或 k-1对照组与1个试验组比较。112ABErrorABXXqMSnn q 与误差自由度有关,还与比较的两组之a值有关!Duncan-t 法步骤1. H0: 相比较的两总体均数相等;H1
24、: 相比较的两总体均数不等。 0.05。2. 计算检验统计量: Duncan q1.8401.4151.86220.2282ABq 11()21.041711 ()22020ABErrorXXABMSsnn 1.8400.9303.98740.2282ACq 11()21.041711 ()22020ACErrorXXACMSsnn Duncan-t 法步骤结论:A疗法优于C疗法,而A与B差异无统计学意义。对比组均数之差标准误qaq界值P1与20.4250.28221.862222.830.051与30.9100.28223.987432.980.05两两比较的注意事项o 对于方差分析后的两两
25、比较均应以方差分析拒绝相应的H0为前提,且结论均不应与方差分析的结论相悖;o 出现模糊结论,下结论应该谨慎;o 方差分析拒绝H0,但两两比较得不出有差异的结论,因为方差分析效率高。o Post Hoc分析发现的各组间差别只是一种提示,一种进一步增加含量改进试验的提示。o 不能用t检验代替方差分析,也不能用t检验代替两两比较。o 无论是SNKSNK法还是Dunnett-t法,用于两组比较时,结果与t检验等价。两两比较的注意事项方差分析的要求o 独立随机抽样(Independence);o 正态性(Normality);o 方差齐性(Homoscedascity);方差齐性检验o 两个方差的齐性检
26、验n Levene法o 多个方差的齐性检验n Bartlett法222121111122,1,1,sFnnsss变量变换(Variable Transformation)o 方差齐性是一个很strong的假设,如果不齐,就不能直接进行方差分析;o 变量变换n目的:方差齐性化,正态化,线性化o 常用方法:n对数变换 对数正态分布, 等比,正偏n平方根变换 poisson分布,轻度偏态等n百分数平方根反正弦变换 原始数据为率logxXxXarcsinxX方差分析 小结均数、方差的比较均数、方差的比较o 样本均数与总体均数的比较样本均数与总体均数的比较( t 检验检验)o 配对设计样本均数的比较配对
27、设计样本均数的比较(配对配对t 检验检验)o 两样本均数的比较两样本均数的比较 ( t 检验检验, u 检验检验, F 检验检验, SNK, Duncan)o 多样本均数的比较多样本均数的比较( F 检验,检验,ANOVA)n各组间的比较各组间的比较( (SNKSNK法法) );n各试验组与某一对照组间的比较用各试验组与某一对照组间的比较用(Duncan法法) )o 两个方差的比较两个方差的比较( F 检验检验)o 多个方差的比较多个方差的比较( Bartlett 检验检验)方差分析 小结方差分析 小结o 分析单因素多水平间的比较或多个因素对结果的影响;o 要求数据满足正态性、独立性、方差齐性o 单因素方差分析 两因素方差分析o 两两比较o 变量变换o 正确应用两种错误的说法X1 X2 X3o X2所来自的总体位于X1所来自的总体和X3所来自的总体之间;o X1和X2来自同一总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公文最易错别字的
- 饿了外卖市场经理月工作总结
- 如何说课培训课件
- 2026届山东省海阳市美宝学校化学九年级第一学期期中质量跟踪监视试题含解析
- 教学查房的价值与意义
- 2026届贵州省施秉县化学九年级第一学期期末联考试题含解析
- SMT生产现场培训
- 南昌市南大附中2026届英语九上期末调研模拟试题含解析
- 2026届安徽省蚌埠市怀远县化学九年级第一学期期末教学质量检测模拟试题含解析
- 江苏省苏州市虎丘区立达中学2026届化学九年级第一学期期中质量跟踪监视模拟试题含解析
- 2025年工会经审财务知识竞赛培训试题考试题库(含答案)
- Starter Unit2 Keep TidySectionB(1a-1d)公开课一等奖创新教学设计人教版(2024)七年级英语上册
- 2025湖南衡阳工会招聘11名工会社会工作者备考考试题库附答案解析
- 焊接质量检测记录规范模板
- 2025年辽宁省交通建设投资集团招聘(104人)备考练习试题及答案解析
- 七年级上册数学《相交线与平行线》100题练习(含答案)
- 西藏文化考试题目及答案
- 重庆市南开中学高2026届高三第一次质量检测+英语答案
- 2025秋外研新版三起点小学英语四年级上册教学计划
- 2025北师大版(2024)三年级上册数学教学计划
- 新版《医疗器械生产监督管理办法》培训试题及答案
评论
0/150
提交评论