《方差分析II》PPT课件.ppt_第1页
《方差分析II》PPT课件.ppt_第2页
《方差分析II》PPT课件.ppt_第3页
《方差分析II》PPT课件.ppt_第4页
《方差分析II》PPT课件.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析(II),1 数据的变换 2 随机效应的方差分析 3 双因素方差分析,1 数据的变换 如果在方差分析前发现有某些异常的观测值、处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下应加以删除。 有些资料就其性质来说就不符合方差分析的基本假定。其中最常见的一种情况是处理平均数和均方有一定关系(如二项分布资料,平均数 ,方差 ;泊松分布资料的平均数与方差相等 )。,对不能直接进行方差分析的资料应考虑采用非参数方法分析或进行适当数据转换后再作方差分析。 常用的数据转换方法 : 平方根转换(square root transformation) 此法适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。转换的方法是求出原数据的平方根 。若原观测值中有为0的数或多数观测值小于10,则把原数据变换成 ,对于稳定均方,使方差符合同质性的作用更加明显。变换也有利于满足效应可加性和正态性的要求。, 对数转换(logarithmic transformation) 如果各组数据的标准差、全距与其平均数大体成比例或变异系数CV接近常数时,或者效应为相乘性或非相加性,则将原数据变换为对数 lgx或 lnx(lg(x+1)或ln(x+1))后,可以使方差变成比较一致而且使效应由相乘性变成相加性。 对数变换能使服从对数正态分布的变量正态化。如环境中某些污染物的分布、人体中某些微量元素的分布,可用对数转换改善其正态性。, 反 正 弦 转 换 (arcsine transformation ) 平方根反正弦转换适用于服从二项分布的资料。转换的方法是求出每个原数据(用百分数或小数表示)的平方根反正弦 。 一 般,若资料中的百分数介于30%70%之间时,因资料的分布接近于正态分布,数据变换与否对分析的影响不大。产品合格率、食品污染率、腐烂率等等二项分布资料。附表7是百分数反正弦转换表,可以直接查得x的平方根反正弦值。, 倒数转换(reciprocal transformation) 当各处理标准差与其平均数的平方成比例 时,可进行倒数转换。这种转换常用于以出现质反应时间为指标的数据资料,也可用于数据两端波动较大的资料,可使极端值的影响减小。对于一些分布明显偏 态的二项分布资料,有人通过以下转换,可使x呈良好的正态分布。,对于一般非连续性的数据,最好在方差分析前先检查各处理平均数与相应处理内均方差是否存在相关性和各处理均方差间的变异是否较大。如果存在相关性,或者变异较大,则应考虑对数据作出变换。有时要确定适当的转换方法并不容易,可事先在试验中选取几个其平均数为大、中、小的处理试验作转换。哪种方法能使处理平均数与其均方差的相关性最小,哪种方法就是最合适的转换方法。,方差分析的线性模型可分为固定模型(fixed model)和随机模型(random model): (1)固定模型(fixed model) 在单因素试验的方差分析中,把k个处理看作k个明晰的总体。如果研究的对象只限于这k个总体的结果,而不需推广到其它总体;研究目的在于推断这k个总体平均数是否相同,即在于检验k个总体平均数相等的假设H0:1=2=k;H0被否定,下步工作是进行多重比较;重复试验时的处理仍为原k个处理。这样,k个处理的效应(如i= i )固定于所试验的处理的范围内,处理效应是固定的。这种模型称为固定模型。一般的比较性试验均属固定模型。,(2)随机模型(random model) 在单因素试验中 ,k个处理并非特别指定,而是从更大的处理总体中随机抽取的k个处理而已,即研究的对象不局限于这k个处理所对应的结果,而是着眼于这k个处理所在的更大的总体;研究的目的不在于推断当前k个处理所属总体平均数是否相同,而是从这k个处理所得结论推断所在大总体的变异情况,检验的假设一般为处理效应方差等于零,即 ;如果H0被否定,进一步的工作是估计 ;重复试验时 ,可在大处理总体中随机抽取新的处理。这样,处理效应并不固定,而是随机的,这种模型称为随机模型。,固定模型仅在供试处理范围内了解处理间的不同效应。 例如:有5个品种,各取样3次,组成简单的方差分析资料。 随机模型是通过不同处理对这些处理所属总体进行推断。 例如:研究水稻杂交 F5 代系间单株干草重量的遗传变异,随机抽取7个系进行测验,每系取 3 个样品测定干草重(g/株)。,(3)混合模型(mixed model) 在多因素试验中,若既包括固定效应的试验因素,又包括随机效应的试验因素,则该试验对应于混合模型。混合模型在试验研究中是经常采用的。,固定模型与随机模型的区别,随机模型参数的估计:,单因素方差分析表,当检验拒绝假设时,随机模型估计参数如下:,多因素方差分析 单因素方差分析研究的是总体的均值受一个因素不同水平的影响。但在一些实际问题中,影响总体均值的因素不止一个,这些因素间还可能存在交互作用,这就要考虑两个或多个因素的问题。 为简单起见,仅考虑两个因素的情况,双因素方差分析 对于两因素问题,通常考虑等重复观测的情形,若第一个因素A有r个水平,第二个因素B 有s个水平。在因素A的第i个水平和因素B的第j个水平下均进行了k次观测,记为xijk,1ir,1js,1lk其数据结构如表所示,无交互作用的双因素方差分析 在无交互作用的方差分析中,因素A的确r个水平与因素B的s个水平的组合共计 n=rs 个处理,每个处理做一次试验,试验数据如下表:,无交互作用的双因素方差分析的数学模型可以表示为:,其中 表示平均的效应,i和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应,无交互作用双因素方差分析的假设,与单因素方差分析类似,引进以下统计量: 总平均值:,组内平均值:,无交互作用的双因素方差分析平方和分解,10.3.1 无交互作用的双因素方差分析,对于给定的显著性水平,H0A的拒绝域为:,H0B的拒绝域为,无交互作用的双因素方差分析表,例 用3种电烤箱烧烤3种菜肴, 考察用电量(千瓦小时),2 有交互作用的多因素方差分析 要分析交互作用,每个处理都要有重复,数据如下:,有交互作用的双因素方差分析的数学模型 可以表示为:,有交互作用的双因素方差分析的平方和分解:,混合模型。混合模型的假定是一因素的效应随机,另一因素的效应固定。例如,若A的效应固定,B的效应随机,则满足条件:,各种模型的期望均方见表,有交互作用双因素方差分析的假设,检验统计量分别为 固定模型:,随机模型,混合模型(A固定B随机),随机模型参数估计,混合模型参数估计(A固定B随机),例 施用A1、A2、A3 3种肥料于B1、B2、B3 3种土壤,以小麦为指示作物,每处理组合种3盆,得产量结果(g)于表。试作方差分析。,总和,平均,资料的方差分析结果,作业:对5个杂交水稻品种的干物质累积过程进行系统测定,每次测定随机取2个样点,每样点取5株。其中有一次测定的结果如下。试作方差分析,并以LSR法对各品种间差异进行多重比较,算出样点间方差和样点内植株间方差估计值。,(一) 完全随机设计(completely random design),完全随机设计将各处理随机分配到各个试验单元(或小区)中,每一处理的重复数可以相等或不相等,这种设计对试验单元的安排灵活机动,单因素或多因素试验皆可应用。,完全随机设计方差分析(平衡数据) 例1 有A、B、C、D四种药片在兔胃内分解时间如下表,试问各种药片的分解时间是否有差异? 表1 四种药片在兔胃内分解时间,data li_1; do i=1 to 4; do j=1 to 6; input x; output; end; end; cards; 3 7 6 4 8 6,6 2 5 4 6 7 10 8 11 7 7 9 10 4 6 6 7 8 ; proc anova; class i; model x=i; means i; run;,完全随机设计方差分析(非平衡数据),例2 用A、B、C三种方案治疗婴幼儿贫血患者,治疗一月后,记录血液中血红蛋白的增加克数,如下表,试问,三种方案对婴幼儿贫血的疗效是否相同?,表2 三种方案治疗婴幼儿贫血的疗效比较,data li_2; do i=1 to 3; input n; do j=1 to n; input x; output; end; end;,cards; 7 24 36 25 14 26 34 23 6 20 18 17 10 19 24 8 20 11 6 6 0 -1 4 5 8 ; proc anova; class i; model x=i; run;,(二)(完全)随机区组设计(randomized (complete ) blocks design),特点:又称为配伍组设计,是配对设计的扩展。具体做法是:根据“局部控制”的原则,先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程、动物窝别等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。 优点:(1)设计简单,容易掌握; (2)富于伸缩性,单因素、多因素试验都可应用; (3)能提供无偏的误差估计,有效地减少单向环境差异,降低误差; (4)对试验环境要求不严,不同区组亦可分散设置在不同环境。,随机区组设计的方差分析,例3 用某新药治疗血吸虫患者,采用三天疗法,在治疗前及治疗后分别定期测定患者的血清谷丙转氨酶的变化,以观察该药对肝功能的影响,测定结果如下表。试分析不同阶段血清谷丙转氨酶是否有差异?,data li_3; do i=1 to 7; do j=1 to 6; input x; output; end; end; cards; 63 36 188 138 63 54 90 200 238 220 188 144 54 36 300 83 100 92,45 72 140 213 144 100 54 54 175 150 100 36 72 63 300 163 144 90 64 77 207 185 122 87 ; proc anova; class i j; model x=i j; run;,(三) 拉丁方设计(latin square design),拉丁方设计将处理从纵横二个方向排列为区组(或重复),使每个处理在每一列和每一行中出现的次数相等(通常一次),所以它是比随机区组多一个方向局部控制的随机排列的设计。如图所示为55拉丁方。 优点:精确度高 缺点:缺乏伸缩性,拉丁方设计的通常应用范围只限于48个处理。当在采用4个处理的拉丁方设计时,为保证鉴别差异的灵敏度,可采用复拉丁方设计,即用2个(44)拉丁方。 第一直行和第一横行均为顺序排列的拉丁方称标准方。拉丁方甚多,但标准方较少。如33只有一个标准方。 将每个标准方的横行和直行进行调换,可以化出许多不同的拉丁方。一般而论,每个kk标准方,可化出个不同的拉丁方。,A B C B C A C A B,拉丁方设计的方差分析,例4 5种防护服, 由5个人在不同的5天中穿着测定其脉搏数(试验是以脉搏数作为人对高温反应的指标), 试验结果见下表,试比较5种防护服在不同天气, 对人脉搏的影响是否不同? 表 不同日期5个受试者穿着5种不同防护服时脉搏次数(次数/分),data li_4; do i=1 to 5; do j=1 to 5; input fz $ x; output; end; end; cards; A 129.8 B 116.2 C 114.8 D 104.0 E 100.6 B 144.4 C 119.2 D 113.2 E 132.8 A 115.2 C 143.0 D 118.0 E 115.8 A 123.0 B 103.8 D 133.4 E 110.8 A 114.0 B 98.0 C 110.6 E 142.8 A 110.6 B 105.8 C 120.0 D 109.8 ; proc anova; class i j fz; model x=i j fz; run;,(四) 裂区设计(split-plot design) 裂区设计是多因素试验的一种设计形式。 在多因素试验中,处理组合数较多而又有一些特殊要求时,往往采用裂区设计。 主区( main plot ) 按主处理所划分的小区称为主区,亦称整区. 副区 (split-plot) 主区内按各副处理所划分的小区称为副区,亦称裂区. 在裂区设计时先按第一个因素设置各个处理(主处理)的小区;然后在这主处理的小区内引进第二个因素的各个处理(副处理)的小区.,通常在下列几种情况下,应用裂区设计: (1)在一个因素的各种处理比另一因素的处理可能需要更大的面积时,为了实施和管理上的方便而应用裂区设计。 (2) 试验中某一因素的主效比另一因素的主效更为重要,而要求更精确的比较,或二个因素间的交互作用比其主效是更为重要的研究对象时,亦宜采用裂区设计,将要求更高精确度的因素作为副处理,另一因素作为主处理。 (3) 根据以往研究,得知某些因素的效应比另一些因素的效应更大时,亦适于采用裂区设计,将可能表现较大差异的因素作为主处理。,下面以品种与施肥量两个因素的试验说明裂区设计。如有6个品种,以1、2、3、4、5、6表示,有3种施肥量,以高、中、低表示,重复3次,则裂区设计的排列可如图。图中先对主处理(施肥量)随机,后对副处理(品种)随机,每一重复的主、副处理随机皆独立进行。 裂区设计在小区排列方式上可有变化,主处理与副处理亦均可排成拉丁方,这样可以提高试验的精确度。尤其是主区,由于其误差较大,能用拉丁方排列更为有利。主、副区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论