




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第 五 章 方差分析,上海第二医科大学 生物统计教研室,本讲义参考:何清波教授 贾俊平教授,第一节 概论,方差分析:Analysis of Variance, 简记为:ANOVA。应用范围很广 本章的方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法 以一个实例说明方差分析的基本思想和原理,第二节 单因素方差分析 (one-way ANOVA, completely random design ANOVA),P63 例5.1 小白鼠给药前后发生咳嗽的推迟时间(秒) 复方 复方 可待因 40 50 60 15 -10 30 -5 105 77 . . . 例数 15 15 10 均值 31.67 44 60.7 ,因素 所要检验的对象称为因素 要研究不同药物对小白鼠的镇咳作用,药物是要检验的因素 水平 因素的具体表现称为水平 复方,复方,可待因三种药物就是(药物)因素的水平 观察值 在每个因素水平下得到的样本测量值 每种药给药前后发生咳嗽的推迟时间就是观察值,几个基本概念(一),几个基本概念(二),试验 这里只涉及一个因素,因此称为单因素三水平的试验 总体 因素的每一个水平可以看作是一个总体 比如复方,复方,可待因三种药物的效应值可以看作是三个总体 样本数据 表5-4的数据可以看作是从这三个总体中抽取的样本数据,方差分析法的模型,常见的错误是进行三组之间的两两t检验。 这将增加第一类误差(假阳性错误)的概率。 如两组比较作一次t检验,显著性水平取=0.05 三组之间的两两t检验作完三次(C32)t检验,总的显 著性水平变为0.14(1-(1-0.05)3) (即至少有一次拒 绝H0的概率) 五组之间的两两t检验作完十次(C52) t检验,总的 显著性水平变为0.40 (1-(1-0.05)10) 0.05 两组以上均数的比较不能用两两t检验,而必须 用方差分析。,要比较三种药物的平均推迟咳嗽时间有无差异?,变异的分解,在因素的同一水平(同一个总体)内,样本的各观察值之间的差异,在因素的不同水平(不同总体)下,各水平的均值之间的差异,在因素的所有水平(H0总体)下,所有观察值之间的差异,总变异,组间变异,组内变异,P63 表5-4,总变异(Total variation):全部原始测量值X与总均数 间的差别 组间变异(between treatment variation )各组的均数 与总均数 间的差异 组内变异(within-sample variation)每组的原始数据与该组均数 的差异,三个不同的变异,度量变异: 离均差平方和(Sum of Squares of deviations from mean,SS) 自由度,方差分析法的基本思想,组间变异(不同药物效应引起 + 随机误差引起) 总变异 组内变异(随机误差引起) 如不同药物的作用相同(H0:均值相等),则: F=组间变异/ 组内变异 =1 在H0条件下,F虽不会正好等于1 (抽样误差) ,但应当和1相差不大。 F越大,其概率越小,当F以致其对应的概率P0.05,则可认为不同药物的作用是不相同的。即样本均数之间的差异有统计学意义。,方差分析法的基本思想 (F分布与拒绝域),如果均值相等, F=组间变异/ 组内变异 1,(k:组别即水平数;n:总例数),1,根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应 总自由度也被分为相应的各个部分 各部分的离均差平方和除以相应自由度得出各个均方(等于方差即变异的测度指标) 然后列出方差分析表算出F值, 作出统计推断,方差分析法的基本思想 (分析步骤 ),H0:1= 2 = 3 H1:至少有一个等式不成立 或: H0:三种药物对小白鼠镇咳作用相同 H1:三种药物镇咳作用不完全相同,方差分析法的基本思想 (1.提出假设 ),离均差平方和用SS表示,自由度用DF表示 均方(MEAN SQUARE)即方差,用MS表示 MS=SS/DF SS总=SS组间+SS组内 DF总=DF组间+DF组内 F=MS组间/MS组内 = (SS组间/ DF组间)/( SS组内/ DF组内) 根据F和DF组间,DF组内查方差分析用F界值表, 得P值。如果P0.05,则拒绝H0 。,方差分析法的基本思想 (2.计算内容 ),以上变异分解和检验的构建可列成方差分析表的形式:(P64 表5-5) 方差分析表 变异来源 平方和 自由度 均方 F值 P值 Source SS DF MS F P 总变异 组间 误差 ,方差分析法的基本思想 (3.方差分析表 ),如果影响数据变异的因素不止一个,则可作二因素或三因素等的方差分析,总变异可分解成和各因素相对应的各个变异 总变异分解越细,误差越小,检验的效率就越高。,方差分析法的基本思想 (方差分析扩展 ),方差分析的应用条件,1. 各组样本来自正态分布的总体 2. 各总体的方差相等 3. 观察值是独立的,各效应的可加性,与两均数比较时“t检验”的应用条件相同 当组数为2时,两均数比较的t检验与方差分析 是等价的(同一资料,有 ),如果不符合基本条件(1, 2)时: 可进行变量变换后再进行检验 或用非参数检验的方法,变 量 变 换,1.服从对数正态分布的资料可用对数变换 y =log(x) 2.服从泊松分布的资料可用平方根变换 y = 3.表达成百分数的资料可用平方根反正弦变换 y =arcsin,校正数:,总离均差平方和:,组间平方和:,方差分析基本计算步骤P62-P64,组内平方和: SS组内= SS总 SS组间,DF总=N-1,DF组间=组数-1,DF组内=DF总-DF组间,方差分析表 变异来源 SS df MS F P 总变异 31939.9 39 药物间变异 5062.4667 2 2531.2333 3.4845 0.05 误差 26877.4333 37 726.4171 ,由df1=2,df2=37 查F临界值表(附表五)得F0.05= 3.25, 现FF0.05,故知P0.05 结论为在= 0.05水平上,拒绝H0,从而认为三种药物平均推迟咳嗽时间不相同。,例5.1 方差分析结果,第三节 均数间两两比较,K组均数比较时,经方差分析,拒绝了H0时(总体中各组均数相同,即1=2=K),如果需进一步确定哪二个均数间有显著差异,可用均数间的两两比较。 例如有三个组A,B,C时,每两个均数进行比较时可有A与B,A与C,B与C共3种两两比较;而如有四个组时将有6种比较 进行均数间两两比较的方法很多。教材主要介绍了Student-Newman-Keuls(SNK)检验法,H0:A= B H1: A B,求得q值后,据误差项自由度及组数a,查附表六(P397)的q界值表,得q0.05,q0.01 。,均数间两两比较,均数一 均数二 均数三,a=2,a=2,a=3,均数间两两比较,a为均数从小到大排队后,所比较的二组相隔的组数,例5.1资料中误差项df=37,MS=726.4171, 复方:n1=15, =31.6667; 复方:n2=15, =44; 可待因:n3=10, =60.7 均数由小到大排列后,组别依次为复方,复方,可待因。 比较复方与复方,其a=2 q=|31.666-44|/ =1.772 比较复方与可待因,其a=3 q=|31.666-60.7|/ =3.732 比较复方与可待因,其a=2 q=|44-60.7|/ =2.146,均数间两两比较,查附表六(P397),由误差项df=37, 组数a=2查得q0.05=2.87, q0.01=3.84; a=3查得q0.05=3.46,q0.01=4.40。 复方与可待因比较,q=3.7323.46,故P0.05,而其余二个Q皆小于q0.05 ; 因此复方与可待因两药对小白鼠平均推迟咳嗽时间,在=0.05水平上差异有统计学意义,其余任两药间差异没有统计学意义。,均数间两两比较,进行均数间两两比较的方法很多: SNK(Student-Newman- Keuls)检验 DUNCAN检验 Tukey检验 LSD(最小显著差)检验 Scheffe检验,等 如只须几个实验组和一个对照组比较,实验组之间不比较: DUNNETT检验 DUNCAN新法,等,均数间两两比较,第四节 方差齐性检验,H0:各个正态总体方差相等,即12= 22 = K2 H1:至少存在一对i,j,有i2 j 2 本书中介绍一种稳健的(Robust)方差齐性检验方法-Levene检验,它可以用于两个或两个以上方差的齐性检验。 (1) 对于K组的样本资料, 求得各组的均数后计算观察值距各自组均数的绝对离差。 (2) 以绝对离差作为主要变量,使用前述的方差分析法。当拒绝H0时,认为各组方差不齐;当不拒绝H0时,认为方差齐性。,算得三个药物组: =31.6667, =44, =60.7,得绝对离差如下:(P66) 复方 复方 可待因 8.3333 6 0.7 21.6667 24 30.7 . 18.3333 14 再用上表中绝对离差值进行方差分析。,第四节 方差齐性检验, 变异来源 SS DF MS F P 总变异 9108.39 39 药物间 679.56 2 339.78 1.49 0.2382 误差 8428.83 37 227.80 由于P=0.2382,因此不拒绝H0,而认为三组方差齐性, 因此符合均数间比较的方差分析法的基本要求。,第四节 方差齐性检验,第五节 随机单位组设计方差分析 (randomized block design ANOVA),随机单位组设计又称随机区组设计、随机配伍组设计,它是两样本配对试验的扩大。 (每个单位组内随机分到各处理组), 单位组 处理1 处理2 . 处理k 1 X11 X12 X1k 2 X21 X22 X2k b Xb1 Xb2 Xbk ,随机单位组设计方差分析,大白鼠注射不同剂量雌激素后的子宫重量(g) 雌激素剂量(g/100g) 大白鼠种系 0.2 0.4 0.8 A 106 116 145 B 42 68 115 C 70 111 133 D 42 63 87 ,目的:欲比较因素的K个水平的各变量均值, 同时控制另一个因素的作用。 试验设计时,先将受试对象按控制因素性质相同或相近者组成单位组,每个单位组有K个受试对象,分别随机分配至因素的K个水平上。 这时每个水平的受试对象不仅数量相同, 而且性质亦相同或相近,可缩小误差,提高实验效率。 这样的设计可将单位组亦看作一个因素,就成为二个因素的设计,随机单位组设计方差分析,组间处理组间的变异 总变异 组内 和单因素方差分析相比,误差项减少了, 检验效率提高了。,随机单位组设计方差分析,单位组间变异,误差,可作二个假设检验: (1)H0:因素各水平x的均值相同 H1:因素中至少有二个水平的x均值不相同 F1= MS因素 / MS误差 DF因素=K-1,DF误差=(bk-1)-(k-1)-(b-1) =bk-k-b+1 (2)H0:各个单位组的x均值相同 H1:至少有二个单位组的x均值不相同 F2= MS单位组 / MS误差 DF单位组=b-1,DF误差=bk-k-b+1 当欲进一步比较因素中任二个的水平x均值是否相同。可用本章第三节中均数间两两比较的检验。,随机单位组设计方差分析,大白鼠注射不同剂量雌激素后子宫重量,处理组:雌激素剂量,三水平 (0.2, 0.4, 0.8) 单位组:大白鼠种系,四水平 (A, B, C, D), 变异来源 SS DF MS F P 总 13075 11 剂量间 6074 2 3037 33.54 0.01 种系间 6457.67 3 2152.56 23.77 0.01 误差 543.33 6 90.56 F0.01(2,6)=10.92, F0.01(3,6)=9.78,P68 例5.2 表5-10,方差分析得各个不同剂量的平均子宫重量不相同。可进一步比较任二个剂量的平均子宫重量的差异是否有统计意义。可用SNK方法。 比较结果为三种剂量两两之间的差异都有统计学意义。,大白鼠注射不同剂量雌激素后子宫重量,小结:不同设计不同的方差分析表,第六节 方差分析的SAS程序,可用于各种方差分析的SAS过程较多,常用的有二个过程: ANOVA过程:只用于单因素方差分析及各种平衡设计资料(即各组例数相等)的方差分析。 GLM(general linear model)过程:用于各种试验设计的方差分析和协方差分析。 GLM过程可完全替代ANOVA过程的作用,并且语句相同。,例5.1 Page63Page 74,例5.2 Page638Page 78,单因素方差分析SAS程序 Data步,data dat1; do group=1 to 3; input n; do i=1 to n; input x ; output; end; end; cards; 15 40 10 35 25 20 15 35 15 -5 30 25 70 65 45 50 15 50 20 45 55 20 15 80 -10 105 75 10 60 45 60 30 10 60 30 100 85 20 55 45 30 77 105 ;,循环语句: DO; END;,例5.1 Page63Page 74,proc glm data=dat1; class group; model x=group; means group/snk; * means group/snk alpha=0.01; means group/dunnett(1); means group; run;,单因素方差分析SAS程序 Proc步,结果见 P75-P77,data dat2; do block=1 to 4; do treat=1 to 3; input x ; output; end; end; cards; 106 116 145 42 68 115 70 111 133 42 63 87 ;,随机单位组设计方差分析 SAS程序 Data步,例5.2 Page638Page 78,随机单位组设计方差分析 SAS程序 Proc步,proc glm data=dat2; class treat block; model x=treat block; means treat block/duncan; means treat block; run;,结果见 P78-P80,交互作用(了解),当二个因素的作用相互独立时(即一个因素水平改变时不影响另一个因素的各水平之效应),称这二个因素无交互影响; 当二个因素的作用不独立,而相互有影响时,称这二个因素有交互影响。(当存在交互影响时表示一个因素各水平间的差异随着另一个因素的水平改变而不同)。因素A和因素B的交互作用记为AB。 交互作用:几个因素联合作用不等于这几个因素单独作用的累加(有的情况是相乘),称这几个因素间存在交互作用,否则称为不存在交互作用或称为这几个因素相互独立。,协方差分析(了解) (ANalysis of COVAriance),在各种试验设计中,对主要变量(dependent variable)Y 研究时,常希望其他可能影响Y的变量保持基本一致,以达到均衡可比。 例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无显著差异。,有时这些有影响的变量在课题设计和课题实施过程中不能控制 须在统计分析时,通过一定方法来消除这些变量的影响后,再对主要变量y作出统计推断。 如果所控制的变量是分类变量时,可用多因素的方差分析; 如果所控制的变量是连续型变量时,可用协方差分析。,协方差分析,这些影响变量称为协变量(Covariate),消除协变量的影响后,或将协变量化成相等后,对y的修正均数所作的方差分析称为协方差分析。例如: 比较几种不同饲料对动物体重增加的作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 马的解剖生理课件
- 2025届新疆维吾尔巴音郭楞蒙古自治州和静县三年级数学第一学期期末学业水平测试试题含解析
- 股权管理学课件
- 工程项目的多维度评估试题及答案
- 水利水电工程前沿动态试题及答案
- 2025年市政工程绩效评价试题及答案
- 2025年经济师行业前景展望试题及答案
- 工程项目管理法规试题及答案
- 通信行业客户服务手册
- 2025年市政工程公共事务试题及答案
- (二模)保定市2025年高三第二次模拟考试地理试卷(含答案解析)
- 足浴店员工涉黄合同协议
- 2023年1月浙江高考英语试题(含答案解析)
- 应用文写作-介绍智能校园图书馆的英文发言稿+讲义-2025届吉林省长春市高三下学期质量监测(三)英语试题
- 2025-2030中国叶黄素行业市场发展现状及竞争格局与投资发展研究报告
- 非全日制劳动合同协议
- 创新工程实践智慧树知到期末考试答案章节答案2024年北京大学等跨校共建
- 小小科学家《生物》模拟试卷A(附答案)
- 切尔诺贝利核事故永远不能忘却的事故(课堂PPT)
- 安装调试培训及验收方案
- 劳动合同法培训ppt课件
评论
0/150
提交评论