卫生统计学专题九:方差分析_第1页
卫生统计学专题九:方差分析_第2页
卫生统计学专题九:方差分析_第3页
卫生统计学专题九:方差分析_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 专题九 方差分析 方差分析( ANOVA),又称 F 检验,是一种以 分析数据的变异 为基础 ,以 F 值为统计量的计量资料的假设检验方法。用于 多个均数的比较 。 方差分析的基本思想 和应用条件 根据资料的设计类型(即变异的不同来源),将全部观察值之间的总变异按设计类型分解为两个或多个组成部分,通过比较不同变异来源的 均 方 ,借助 F 分布做出统计推断。 方差分析的应用条件: 各观察值相互独立,且每一水平下的观察值均服从 正态分布 。 各总体方差相等,即具有 方差齐性 。 对于不满足方差分析应用条件的资料,可采用以下两种方式进行处理: 变量变换,是指满足方差分析的基本假定。 应用非参数统计分析方法。 完全随 机 设计的 ANOVA 各组样本均数各不相等,这种差异可能由两种 原因引起: 随机误差; 处理因素。 完全随机设计的变异分解: 完全随机设计(成组设计)资料的总变异可以分解为 组间变异 和 组内变异 。 总 变异: SS总,用所有观察值与均数的离均差平方和表示。 SS总 = i j 2ij xx )(, 总 =N-1( N 为总例数) 组间变异: SS组间,用各组均数与总均数的离均差平方和表示。 SS组间 = i 2ii xxn )(, 组间 =k-1( k为处理组数) 组内变异: SS组内,用各组内每个测量值 xij与该组均数得离均差平方和表示,仅反映随机 误差,又称误差变异。 SS组内 = i j 2iij xx )(, 组内 =N-k 三种变异及相关自由度的关系为: SS总 =SS组间 +SS组内,总 =组间 +组内 均方 MS组间 =SS组间 组间; MS组内 = SS组内 组内 方差分析的统计量 F: F=MS组间 MS组内 F界值表: 纵标目为组间自由度 1,横标目为组内自由度 2,表中给出了 =0.05 和 =0.01 时供方差分析用的单侧 F 界值,用 F ,( 1, 2)表示。 若 F F ,( 1, 2),则 P ,按 水准拒绝 H0, 接受 H1,差别有统计学意义,可以认为总体均数不等或不全等(处理因素有效应);反之,则差别无统计学意义,尚不能认为总体均数不等或不全等(尚不能认为处理因素有效应)。 完全随机设计方差分析计算公式 变异来源 SS MS F 组间变异(处理) i 2ii xxn )( k-1 1kSS组间组内组间MSMS 组内变异(误差) i j 2iij xx )( N-k k-NSS组内 总变异 2x - Nx 2 N-1 【小结】 完全随即设计资料的总变异可分解为组间变异和组内变异两部分。 方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与 t 检验 等价 ,即 F=t2 方差分析的结果若拒绝 H0,而接受 H1,只说明多个总体均数中至少有两个均数不同,不能说明任意两个总体均数都有差别;若要比较那两组均数有差别,需进一步进行 多个均数间的两两比较 。 随机区组设计的 ANOVA 随机区组设计的变异分解: SS总 =SS处理 +SS区组 +SS误差,总 =处理 +区组 +误差 用 k 表示处理组数, b 表示区组数,实验观察值 xij下标 i( i=1, 2, , k)表示组别,下标 j( j=1, 2, , b)表示区组序号。 完全随机设计方差分析计算公式 变异来源 SS MS F 处理组 i 2ii xxn k-1 1kSS处理误差处理MSMS 2 区组 j 2jj xxn b-1 1bSS区组误差区组MSMS误差 SS总 -SS处理 -SS区组 N-k-b-1或( k-1)( b-1) 1bkNSS 误差总变异 2x - Nx 2 N-1 1NSS总随机区组设计资料的 ANOVA的基本步骤: 建 立假设检验,确定检验水准: 对于处理组: H0: 1= 2= k,即 相同; H1: 1、 2、 k不等或不全等,即 不同或不全同。 对于区组: H0: k个区组的总体均数相等; H1: k个区组的总体均数不等或不全等。 计算检验统计量: F= MS处理 MS误差; F= MS区组 MS误差 确定 P 值,做出统计推断。 对处理组:以 1=k-1, 2=N-k-b-1或( k-1)( b-1),查 F 界值表,确定 P 值,做出统计推断。 对区组:以 1=b-1, 2= N-k-b-1或( k-1)( b-1),查 F 界值表,确定 P 值,做出统计推断。 【注意】 随机区组设计资料的总变异可以分解为处理组间变异、区组间变异和误差变异三个部分。 随机区组设计与完全随机设计相比,由于利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组内变异中分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理间的 F 值更容易出现显著性,从而提高了实验效率。 随机区组设计是配对设计的扩展,当 k=2时,随机区组设计的方差分析 与配对资料的 t 检验 完全等价,即 F=t2。(平方关系) 多个样本均数的两两比较 多个样本均数经方差分析后,若有统计学意义,需用两两比较的方法进一步确定哪些均数相等,哪些均数不等。 多组均数假的两两比较不能用 t 检验,会增大 型错误 。 两两比较的方法较多,常用的是多重比较,多重比较法有两种情况: 探索性研究 , 即事先没有计划的任意两个均数的事后比较: SNK-q检验、 Bonfferoni t 检验。 证实性研究 ,即事先有明确假设,用于多组中某一对或某几对在专业上有特殊意义的均数间的比较: Dunnett-t 检验、 LSD-t检验、 Bonfferoni t 检验等。 SNK-q检验与 LSD-t检验的比较 SNK-q检验 LSD-t 检验 应用 探索性研究 证实性研究 H0 A= B,即任两对比组的总体均数相等。 A= B,即 所研究的 两对比组的总体均数相等 。 检验统计量 q=BA x-xBASx-x = BABAn1n12MSx-x误差t=BA x-xBASx-x = BABAn1n12MSx-x误差 = 误差 = 误差 【注意】统计软件可以同时进行十多种多重比较检验,因此在应用时,应根据统计设计和专业知识来确定采用哪一种方法,不能多种方法一起使用,然后选取“有利”的结果。 交叉设计的 ANOVA 两阶段交叉设计的变异分解: 二阶段交叉设计方差分析的总变异可以分解为 处理间变异 、 阶段间变异 、 个体变异 和 误差变异 四个部分。 SS总 =SS处理 +SS阶段 +SS个体 +SS误差,总 =处理 +阶段 +个体 +误差 两阶段交叉设计的方差分析基本步骤: 建立建设检验,确定检验水准。 计算检验统计量 F 值: MS阶段 MS误差、 MS个体 MS误差、 MS处理 MS误差; 确定 P 值,做出统计推断。 【说明】 交叉设计可以采用完全随机设计或配对设计方法来安 排其受试对象。 交叉实验的处理是单因素的,但影响实验结果的因素还有非人为控制的受试者之间的个体差异和试验阶段这两个因素。因此交叉设计试验实际上是一个试验因素和两个重要的非实验因素的多因素实验。 析因设计的 ANOVA 析因设计资料的方差分析包括 主效应分析 、 交互效应分析 和 单独效应分析 三个层次。 单独效应:是指其他 因素的水平固定时,同一因素不同水平间的差别。 主效应:是指某一因素各水平间的平均差别。 交互效应:是指当某一因素的各单独效应随某一因素水平的变化而变化时则称这两个因素间存在交互效应。 两因素析因设计即 I J 析因设计,表示有两种处理因素,第一种处理因素有 I个水平,第二种因素有 J 个水平,共有 IJ 种处理组合。 3 析因设计的变异分解: SS总 =SS处理 + SS误差 =( SSA+SSB+SSAB) +SSE,总 =处理 +误差 =( A+ B+ AB) + E 若处理因素 A 有 a个水平,处理因素 B有 b个水平,每个处理因 素组含有 n个受试对象,则全部收拾对象的总数 N=a b n。用 xijk表示每个受试对象的观察值,其中 i( i=1, 2, , a)表示 A 因素的水平。 j( j=1, 2, , b)表示 B 因素有 b个水平; k( k=1, 2, , n)表示 A、 B两因素不同水平组合下受试对象的序号。 析因设计方差分析计算表 变异来源 SS MS F 处理 i j 2ijij xxn ab-1 A i 2ii xxn a-1 1aSSA误差MSMSA B j 2jj xxn b-1 1-bSSB误差MSMSB AB SS处理 -SSA-SSB ( a-1)( b-1) 1b1-a SS AB误差MSMSAB 误差 SS误差 =SS总 -SS处理 N-ab 或 ab( n-1) 1nabSS 误差总变异 Nxx 22 N-1或( abn-1) 1NSS总两因素析因设计资料方差分析的基本步骤: 对于因素 A、 B、交互作用 AB分别建立假设检验,确定检验水准。 检验假设: 对于因素 A: H0: A 因素各水平总体均数相等; H1: A 因素各水平总体均数不相等; 对于因素 B: H0: B因素各水平总体均数相等; H1: B因素各水平总体均数不相等; 对于交互作用 AB: H0: A、 B无交互作用 ; H1: A、 B有 交互作用 ; 计算检验统计量:列表计算各组均数及方差分析表 。 确定 P 值,做出统计推断。 【说明】 析因设计是将两个或多个实验因素的各水平进行交叉分组、全面实验的方法。因此析因设计的方差分析被广泛用于需要分析交互效应和选择最佳组合的实验研究中。 析因设计不但可以分析主效应和交互效应,也可以分析单独效应,故效率较高,但当因素太多时,所需的样本含量会很大。 对析因设计资料,应先分析交互效应,若交互效应有统计学意义,方进一步分析个因素的单独效应。反之,若交互效应无统计学意义,则因素之间的作用相互独立,分析某一因素的作用只需考虑因素的主效应。 重复测量设计的 ANOVA 重复测量设计是指给予一种或多种处理后,在多个时间点上从同一受试对象重复获得指标的观察值。 重复测量数据的两因素多水平设计,两因素是指处理因素和处理时间;多水平是指处理有 k( 1)个水平;测量时间有i( i 2)个水平(时间点),即每个观察对象有 i个重复测量数据。 重复测量设计的变异分解: 两因素重复测量设计的总变异包括两部分 : 受试对象间变异 、 受试对象内变异 。 SS总 =SS受试对象间 +SS受试对象内 =( SS处理 +SS个体间误差) +SS时间 +SS处理与时间交互作用 +SS个体内误差 总 =受试对象间 +受试对象内 =(处理 +个体间误差) +时间 +处理与时间交互作用 +个体内误差 重复测量设计方差分析的基本步骤: 对于处理因素、时间因素、交互作用分别建立检验假设,确定检验水准; 计算检验统计量: SPSS软件 确定 P 值,做出统计推断; 重复测量设计方差分析的前提条件: 正态性和方差齐性; 协方差阵地球形性或复合对称性 。球对称性: Mauchly 检验 。 【注意】 若资料不满足球对称性,则方差分析的 F 值有偏,通常会增大 型错误的概率。 资料满足球对称性时,可采用重复测量设计资料的单变量方差分析方法;若资料不满足球对称性,可用 Greenhouse-Geisser、Huynh-Feldt 或 Lower-bound三种“球对称”系数对自由度进行校正或采用多变量方差分析的方法。 【小结】 完全随机设计资料的方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论