第六章 方差分析.ppt_第1页
第六章 方差分析.ppt_第2页
第六章 方差分析.ppt_第3页
第六章 方差分析.ppt_第4页
第六章 方差分析.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 方差分析 2005.5.25,方差分析的意义:,前述的t检验和u检验适用于两个样本均数的比较,对于k个样本均数的比较,如果仍用t检验或u检验,需比较次,如四个样本均数需比较次。假设每次比较所确定的检验水准=0.05,则每次检验拒绝H0不犯第一类错误的概率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6=0.7351,而犯第一类错误的概率为0.2649,因而t检验和u检验不适用于多个样本均数的比较。用方差分析比较多个样本均数,可有效地控制第一类错误。,方差分析(analysis of variance ), 简称ANOVA, 由英国统计学家R.A.Fish

2、er首先提出,后人为纪念Fisher ,以F命名方差分析的统计量,故方差分析又称F检验。 样本均数的差异,可能有两种原因所致: 1、可能由随机误差所致随机误差包括两种成分个体间的变异和测量误差两部分; 2、可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。,个体之间各不相同,是繁杂的生物界的特点;测量误差也是不可避免的,因此随机变异肯定存在,而处理因素导致的变异是否存在,这正是假设检验要回答的问题,只要能证明它不等于0,就等同于证明了处理因素的确存在影响。 总变异=随机变异+处理因素导致的变异,方差分析的基本思想: 将所有观察值之间的变异(称总变异)根据

3、离均差平方和划分的原理,按设计和需要分解成两个或多个部分。每一部分变异都反映了研究工作中某种特定的内容(如某种处理因素的作用、随机误差的影响等),通过对平均变异的比较,做出相应的统计判断。,方差分析的应用条件: 各样本须是相互独立的随机样本(独立性) 各样本来自正态分布总体(正态性) 各总体方差相等(方差齐性),方差分析的用途: 两个或多个样本均数间的比较; 分析两个或多个因素间的交互作用; 回归方程的线性假设检验; 多元线性回归分析中偏回归系数的假设检验; 两样本的方差齐性检验等。,方差分析的检验假设: H0:为各样本来自均数相等的总体 H1:为各总体均数不等或不全相等 若不拒绝H0时,可认

4、为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量F为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。,若拒绝H0,接受H1时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量F明显大于1。在实际应用中,当统计量F值远大于1且大于某界值时,拒绝H0,接受H1,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。,如完全随机设计资料的方差分析,将总变异分解为处理间变异和组内变异两部分,常将后者称为误差。将

5、各部分变异除以误差部分,得到统计量F值,并根据F值确定P值作推断。 由于方差分析是根据实验设计将总变异分成若干部分,因此设计时考虑的因素越多,变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易,同时由于变异划分的精细,误差部分减小,提高了检验的灵敏度和结论的准确性。,一、完全随机设计资料的方差分析 医学实验中,根据某一实验因素,用随机的方法,将受试对象分配到各组,各组分别接受不同的处理后,观察各种处理的效果,比较各组均数之间有无差别。 临床研究中,还可能遇到:比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效;或比较某种疾病不同类型之间某一指标有无差别等。这些都是一个因

6、素不同水平(或状态)间几个样本均数的比较,可用单因素的方差分析(one-way ANOVA)来处理此类资料。,完全随机设计(completely random design)属单因素研究设计,它是将随机抽取的受试对象,随机地分配到两个或多个水平(处理)组中,观察和比较不同处理所产生的效应。本设计易于理解,实施简便。分组时可采用简单随机化来实现,即将随机抽取的足够量的受试对象,按某种标识进行编号,如就诊日期、出生时间或体重大小等,采用随机数字表或随机函数法等,将受试对象分配到各组中。,例1、 将建模成功的某恶性肿瘤小白鼠40只,随机分为4个处理组,对照组注射蒸馏水1.0ml,另3组分别注射不同剂

7、量的三菱莪术注射液,半月后处死小白鼠称瘤重(g),结果如表。表中组为对照组,组、组和组分别给予0.5ml,1.0ml和1.5ml三菱莪术注射液。试比较不同处理组间瘤重有无差别?,将24只大鼠分4组进行实验,并要求n相等。 (1)首先给动物按体重编号; (2)任意指定随机数字表中第3行,从第7、8列开始由上向下抄录24个两位的随机数; (3)将抄录的随机数排序,用R表示; (4)因各组例数相等,规定R为1-6者分入甲组,7-12者分入乙,13-18者分入丙组,19-24者分入丁组。分组过程如下:,分组结果: 甲组6例,编号为:1,13, 14,16,17,18,22; 乙组6例,编号为:3,7,

8、8,9,11,24; 丙组6例,编号为:4,5,10,15,18,20; 丁组6例,编号为:2,6,12,19,20,21,23。,某药对小白鼠Ehrlich腹水癌的作用实验资料,总均数,样本的组内误差 (随机误差),两个样本均数间比较,k: 组别 n: 例数,二、随机区组设计资料的方差分析 随机区组设计(randomized block design)也称配伍组设计,它是将受试对象按一定条件划分为若干个区组(配伍组),并将各区组内的受试对象随机地分配到各个处理组中的一种设计类型。 随机区组设计在医学科研中较为常见,例如在实验研究中,将动物按窝别配伍,再随机分配到各个处理组;在观察性研究中,按

9、年龄、性别或地区配伍来抽取和组成研究因素的各个水平组等等。,随机区组设计的多个样本均数的比较可用无重复数据的两因素的方差分析(two-way ANOVA)。 两个因素是指主要的研究因素(处理因素)和区组因素。按这两个因素纵横排列时,每个格子中仅有一个数据,故称无重复数据。,值得注意的是,同一受试对象不同时间(或部位)重复多次测量所得到的资料称为重复测量数据(repeated measurement data),对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。,三、析因设计资料的方差分析,析因设计(factorial design)是一种两因素或多因素各水平完

10、全交叉分组组合的实验设计,它不仅可以进行每个因素各个水平间的比较,还可进行因素间交互作用的分析。 最简单的析因设计方案是分析两个因素(分别记为A和B),每个因素各有两个水平(分别记为a1 ,a2和b1 ,b2 ),共有224种不同的组合,也称为22析因设计。,四、 多个样本均数间两两均数间的比较,方差分析结果若拒绝H0,接受H1,其含义是指各个样本所来自的正态总体其总体均数不全相等,但不能推断哪些总体均数之间有差别,若用两样本均数比较t检验(或u检验)对多个样本均数进行两两检验,则会增大第一类错误,特别是两两比较的次数较多时。,例如:六个样本均数做两两比较时,若用t 检验两两比较按排列组合原理

11、: ,则需比较 =15次,若检验水准每次均取0.05,则每次比较不犯第一类错误的概率为(1-0.05),15次比较都不犯第一类错误的概率为(1-0.05)15=0.4633,而此时犯第一类错误的概率不再是0.05, 而是1-(1-0.05)15=0.5367 了。因此多个样本均数的比较不宜用 t 检验。,1、Bonferroni法: 2、Tukey法(henestly signifacant difference,HSD),3、多个样本均数间每两个均数之间的比较常用q检验,也 称SNK (Student-New-man-Keuls)法。,4、多个实验组与一个对照组均数间的比较: LSD法(最小显著差法) q检验对k个均数的两两比较需k(k-1)/2次。若k=8,则需比较28最小显著差(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论