5 第六章 方差分析.ppt_第1页
5 第六章 方差分析.ppt_第2页
5 第六章 方差分析.ppt_第3页
5 第六章 方差分析.ppt_第4页
5 第六章 方差分析.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 方差分析,廖奇 宁波大学医学院,当试验的处理数目k3时,不能直接应用两两检验的方法进行均值假设检验,原因有三: 1. 当有k个均值进行比较时,需比较k(k-1)/2次,诸多次检验,程序实为繁琐。 2. 试验误差估计的精确度要受到损失。 3. 两两检验的方法会随着k的增加而大大增加犯错误的概率。,第一节 方差分析的基本思想、应用条件及常见的类型,一、方差分析的基本思想 方差分析(analysis of variance)又称变异数分析,可简记为ANOVA,主要用于检验计量资料中的两个或两个以上均值间差别显著性的方法。 当欲比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个

2、相同的方差,仅仅均值可以不相同。,方差分析也是一种确定因变量与单个和多个自变量之间统计显著性的方法。 它可以根据其来源将一组数据的变差分解到不同的变差来源中,从而发现变差的重要程度,即变差是由偶然因素引起还是因为特殊原因引起的。,所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方MS(mean square)。 根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以相应部分的自由度得出各部分的均方,然后列出方差分析表算出值,作出统计推断。,二、方差分析的类型 1)单因素方差分析 单因素方差分析适用于单因

3、素x由两个以上水平时,确定因素各水平对因变量y的变差的影响 一个因素多个水平(固定效应和随机效应)。 完全随机设计, 随机化区组设计, 拉丁方设计,2)双因素方差分析 适用于两个因素x和两个以上水平时确定每个因素对因变量y的影响 两个或两个以上因素,每个因素有多个水平(固定效应、随机效应和混合效应)。 析因设计, 裂区设计, 交叉设计, 正交设计, 回归方程的假设检验,单因素方差分析,假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如下表所示。,(一)总平方和的分解 在上表中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为S

4、ST。即,因为,其中 所以 为各处理平均数与总平均数的离均差平方和与重复数n的乘积 ,反映了重复 n 次的处理间变异 ,称为处理间平方和,记为SSt,即,组间变差示意图,比如A、B、C 分别是A、B、C三种水平下对应的y的均值,1与2为不同均值的间距,又称为组间变差,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,总变差 SST =SSt+SSe,(总的偏差平方和) =(由水平引起的偏差平方和) +(试验误差平方和) 总差异=组间差(又称为信号)+组内差(又称为噪声),(二)总自由度的剖分 在计算总平方和时,资料中的各个观测值要受 这一条件的约

5、束,故总自由度等于资料中观测值的总个数减1,即kn-1。,各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方, 分别记为 MST(或 )、MSt(或 )和MSe(或 )。 即,MSTMSt+MSe。,定义F值为组间均方和组内均方(随机误差造成)的比值 此F值服从自由度为v1=k-1,v2=N-k的F分布。 在方差分析中,F测验是用于测验某项变异因素的效应或方差是否真实存在,所以在计算F值时,总是将要测验的那一项变异因素的均方作为分子,而以另一项变异因素(例如试验误差项)的均方作为分母。,F统计量,通用单因素方差分析表 方差分析的目的是为了发现差异,通过通用的方差分析表我们可以很直

6、观的完成方差分析。 SSB=可被分解至因素水平的平方和,又称为独立变差 SSW =可被分解至非受控变量来源的平方和,又称为背景变差 SST =总平方和,可悲分解至因素水平和背景变差 g=组数 n=组内样本容量 g-1=组间自由度 g(n-1)=组内自由度 ng-1=总自由度,等于组间自由度和组内自由度 SSB/dfB=因素水平的均方和 SSW/dfw=误差的均方和 MSB/MSW=F=均方和的比值,又叫F值 Fcrif=查表自由度为g-1,g(n-1)置信度为对应的F分布表的值,称为临界值,三、方差分析的适用条件,各样本是相互独立的 各样本数据服从正态分布 各处理组总体方差相等即方差齐性,不满

7、足条件的处理,(1)轻微:允许应用t检验、方差分析来作分析。 (2)严重 数据转换 非参数统计,四、方差齐性检验,F检验:适用于正态分布资料 两个总体方差的齐性检验 Bartlett 2检验 :适用于正态分布资料 Levene检验:适用于任何分布资料,五、常用两两比较方法,SNK法 LSD法 Bonfferoni法 Dunnett法,六、SAS 方差分析,ANOVA过程(Analysis Of Variance) GLM过程(General Linear Model),第二节 多样本的正态性检验和方差齐性检验,一、多样本的正态性检验 例6-1 某单位在大白鼠营养试验中,随机将大白鼠分为三组,测

8、得每组12只大鼠尿中氨氮的排出量X(mg/6 d)。试对该资料作正态性检验和方差齐性检验。,univariate过程,data d6_1; do group=1 to 3; do i=1 to 12; input x ; output; end;end; cards; 30 27 35 35 29 33 32 36 26 41 33 31 43 45 53 44 51 53 54 37 47 57 48 42 82 66 66 86 56 52 76 83 72 73 59 53 ; proc univariate normal; var x; class group; run;,第二组,第一

9、组,第三组,二、多样本的方差齐性检验,例6-2 对例6-1数据作方差齐性检验 proc anova data=d6_1; class group; model x=group; means group/hovtest; 默认采用levene检验 means group/hovtest=bartlett; run;,方差齐性检验,means的hovtest选项: 用于多个样本的方差齐性检验 默认采用levenes方法:即统计量F服从自由度v1=k-1,v2=n-k的F分布。 hovtest选项后指明bartlett,则SAS采用bartlett方法进行检验,其统计量服从自由度为k-1的卡方分布

10、bartlett方法要求资料服从正态分布,levenes方法不需要,三、变量变换,常用的变换: 对数变换 用于偏态(非对称)分布的计量资料 开根号 用于服从possion分布的计数资料 平方根反正弦变换 用于服从二项分布的百分比资料( ),变量变换对数变换,例6-3 对例6-1数据进行对数变换并作正态性检验和方差齐性检验。,第三节 完全随机设计资料的方差分析,例6-4 用二氧化硅 50mg对大鼠染尘后,不同时期全肺湿重的变化见表6-3,试比较染尘后1月,3月和6月三个时期的全肺湿重有无差别?,ANOVA过程,过程格式: PROC ANOVA DATA=数据集名 选项; CLASS 处理因素;指

11、明分类变量, 是ANOVA过程的必需语句,并且必须出现在 MODEL语句之前. MODEL 因变量=效应表/选择项; MEANS 效应表 /选择项;计算该语句 所列的每个效应所对应的因变量均值,其选项 用于设定多重比较的方法,可用于多个样本的 方差齐性的检验,MODEL语句,定义分析所用的效应模型,即方差分析的因变量和效应变量. 在方差分析过程中,关键在于定义线性数学模型,常用的模型定义语句有: MODEL y=a 单因素一元方差分析 MODEL y=a b 双因素无交互作用一元方差分析 MODEL y=a b a*b 双因素有交互作用一元方差分析 MODEL y=a b c(a b) 嵌套设

12、计模型,c因素为a,b两因素各种组合下的二级因素。,MEANS语句,计算并输出所列的效应对应的因变量均值。可以使用任意多个Means语句。 常用的选择项如下: BON、DUNCAN、LSD、REGWF、REGWO、SNK、SCHEFFE、SIDAK、SMM(GT2)、TUKEY、WALLER。以上选择项在实际应用中,一般选择一种或两种方法即可。 HOVTEST方差齐性检验,其他语句,test语句:用于进行其他类型的F检验,其中选项H=用于指定作为分子的效应变量表达式,E=用于指定作为分母的变量 freq: 频数变量,本例,处理水平数目以及总的观测数目,各部分变异(model及error)的自由

13、度,离均差平方和, 均方以及F值,p value 复相关系数(确定系数),变异系数,均方根,总均数 对自变量的检验,R-Square:等于模型的平方和除以总平方和,用于度量在因变量的变差里能够由模型决定的比例有多少,越接近1,效果越好。,检验的显著水平、自由度、 误差均方,具有相同字母的组间 均值差异没有统计学意义。,第2组具有A和B两个字母,所以 第二组和第三组,第一组均没有差异。,练习,以小鼠研究正常肝核糖核酸(RNA)对癌细胞的生物学作用,试验分为对照组(生理盐水)、水层 RNA组和酚层RNA组,分别用此三种不同处理诱导肝细胞的FDP酶活力,得数据如下。该三组资料均服从正态分布,试比较三

14、组均数有无差别?,ex_36.sas,第四节 随机区组设计的方差分析,随机区组设计: 先将条件相同或相近的实验对象归为一个区组,再将每个区组内的实验对象随机分配到各个处理组,每个区组的例数与处理组数相等 一个处理因素、一个区组因素(配伍因素),并要求处理因素和区组因素无交互作用,SAS 分析,class a block; model y=a block; 其中a为处理变量,block为区组变量,例6-5 某研究人员采用随机区组设计试验,比较三种抗癌药物对小白鼠肉瘤的抑瘤效果,先将15只染有肉瘤的小白鼠按体重的大小配成5个区组,每个区组的3只小白鼠随机分配至三个药物(处理)组,以肉瘤的瘤重为效应指标,结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论