版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析(二):双向方差分析上一章介绍的单向方差分析只考虑处理因素的效应和随机效应两项,是方差分析中最简单的一种。双向方差分析是从纵横两个方向分析,不仅分析处理因素的效应,还可根据不同设计分析区组效应、交互作用等,从而得到更多的信息。本章将介绍关于随机区组设计、析因设计和裂区设计的方差分析。
第一节随机区组设计的方差分析
一、随机区组设计方差分析的基本思想
随机区组设计(randomizedblockdesign)是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象。设共有n个区组,处理因素有a个水平(a个实验组),受试对象总数为N=n×a。(配对试验设计的扩大)例9-l采用随机区组设计方案,以窝作为区组标志,给断奶后的小鼠喂以三种不同的营养素A、B、和C。四周后检查各种营养素组的小鼠所增体重(g)。资料列于表9-1第一部分。
表9-1三种营养素喂养四周后区组(j)营养素分组(i)按区组求和1(A)2(B)3(C)nj157.064.876.03197.8255.066.674.53196.1362.169.576.53208.1474.561.186.63222.2586.791.894.73273.2642.051.843.23137.0771.969.261.13202.2851.548.654.43154.5ni88824500.7523.4567.01591.162.665.370.966.332783.435459.142205.0110447.5block令Yij表示第i(i=1,2,…,a)处理组第j(j=1,2,…,n)区组受试对象的应变量观察值,随机区组设计的方差分析模型:模型中的为总体平均值,为处理因素第i水平效应,为第j区组效应,为随机误差项。给定限制条件为:
与上述模型相对应,每一观察值与总平均值之差可写为:
对上式的等号两边取平方后按i与j两个方向求和就得到总离均差平方和的分解公式为:即:SS总=SS处理+SS区组+SS误差式(9-1)中和分别表示对i从1到a求和与j从1到n求和。式中各符号的意义及简化计算公式为:总离均差平方和处理组间离均差平方和区组间离均差平方和随机误差离均差平方和v总=N-1,v处理=a-1,v区组=n-1,v误差=(a-1)(n-1)二、方差分析步骤
1.整理和描述资料参见表9-1的资料整理格式。
2.提出检验假设及给定Ⅰ
类错误概率水准α
对随机区组设计的方差分析模型中的两个参数与分别提出检验假设。给定Ⅰ类错误概率水准α=0.05。
3.计算各种离均差平方和与自由度将例9-1的有关数据(见表9-1)代入式(9-2),计算各种离均差平方和及自由度为:
SS总=4964.21;v总=24-1=23
SS处理=283.83;v处理=3-1=2
SS区组=3990.31;v区组=8-1=7
SS误差=690.07;v误差=(3-1)(8-1)=14
4.计算相应的均方
5.计算F值(1)关于处理间变异的F值计算公式为:
F处理服从v1=v处理,v2=v误差的F分布。(2)关于区组间变异的F值计算公式为:
F区组服从v1=v区组,v2=v误差的F分布。将以上计算结果列于方差分析表中见表9-2。查附表5:F界值表得F0.05(2,14)=3.74,F0.01(2,14)=6.51。故处理因素在α
=0.05水准上不拒绝无效假设,不同营养素对小鼠所增体重的差别无统计学意义。区组因素在α
=0.05水准上拒绝无效假设,故窝别对小鼠所增体重的差别具有统计学意义。有时研究者只注重处理因素的效应而不大关心区组因素的效应。这时只要把区组效应从随机误差项中分离开来就达到了设计者的目的。表9-2例9-1资料的方差分析表变异来源离均差平方和自由度均方FP处理283.832141.922.88>0.05区组3990.317570.0411.56<0.01误差690.071449.29总4964.2123
第二节两因素析因设计资料的方差分析
凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorialdesign)实验。析因设计实验的方差分析可以同时分析这些处理因素的效应,以及因素间的交互效应(interaction)。它可节省受试对象、能够提供较多的信息以及缩小随机误差。22析因设计模型设:因素A有二个水平因素B有二个水平a1a2b1b2因素B因素Aa1a2b1a1b1a2b1b2a1b2a2b2
一、两因素析因实验的方差分析模型处理因素A及B分别有a及b个水平,总共有a×b种组合。在每一种组合下即每一个格子中配有n个受试对象。全部实验受试对象总数N=n×a×b。用i(i=l,2…,a)表示因素A的水平号,j(j=l,2,…b)表示因素B的水平号,k(k=l,2,…,n)表示在ab每一水平组合的受试对象号与表示应变量的观察值例9-2一项公共卫生调查要了解护士对患不同疾病的病人实行家庭访视时所花费的时间(分钟)。共有60名护士,按年龄分为3组,病人所患疾病种类分为4种。资料见表9-3。研究者希望对下列问题取得答案:(1)不同年龄组护士进行家庭访视所花的时间是否不同?(2)病人所患疾病的病种是否对护士的家庭访视时间有显著影响?
(3)护士的年龄与病人所患疾病的病种之间是否存在交互作用?
表9-3护士进行家庭访视所花费的时间(分钟)因素A病种(i)因素B:护士年龄组(j)按A水平合计1(20岁以上)2(30岁以上)3(40岁以上)1.心脏病202524253028222924272825213030115142131388101902.肿瘤30303945294230313635304236304017615019952518793(续上表)3.脑血管意外313241303545403040354040303035166167201534193664.结核病2023242125252028302030261931231001371283659107按B水平合计ni20202060557596659181216613180002284357456处理因素A与B每种组合的合计数列于每个格子下部。从表9-3的边际值看出,处理因素A中肿瘤与脑血管意外的访视时间较长。处理因素B有随年龄增长而访视时间增加的趋势。两因素析因实验的方差分析模型为:式中i=1,2,…,a;j=1,2,…,b;k=1,2,…,n。模型中的为常数项,相当于总平均值。及分别代表处理因素A取i水平、处理因B取j水平的主效应。代表处理因素A与B处于(ij)组合水平时的交互作用。代表实验误差,是随机效应。与上述模型相对应,每一观察值与总平均值之差可写为:
对等式两边取平方并求和可以得到总离均差平方和的分解公式,其表达式为:
SS总=SSA+SSB+SSAB+SS误差表达式中各项的意义及计算公式为:总离均差平方和
v总=N-1处理因素A的组间离均差平方和
vA=a-1处理因素B的组间离均差平方和
vB=b-1A与B交互作用的离均差平方和为:
vAB=(a-1)(b-1)误差项的离均差平方和可用减法得到为:SS误差=SS总-SSA-SSB-SSAB;v误差=N-(a-1)-(b-1)-(a-1)(b-1)-1(9-3)二、方差分析的步骤1.整理及描述资料将实验所得资料按表9-3的格式整理后,分别求出处理因素A及必理因素B各水平观察值之和Ti及Tj,各组观察值平方和Si及Sj,总和T,总平方和S等。2.提出检验假设对模型中三种效应分别提出检验假设。(1)处理因素A的假设:(2)处理因素B的假设:(3)处理因素间交互作用的假设:给定假设检验水准α
=0.05。
3.计算离均差平方和及自由度利用式(9-3)及表9-3有关数据计算如下:
SS总=2733.6,v总=60-1=59
SSA=1580.93,vA=4-1=3SSB=264.90,v总=3-1=2SSAB=356.97,vAB=(4-1)(3-1)=6SS误差=530.80,v误差=4×3×(5-1)=48
4.计算各种均方及F值并列出方差分析表见表9-4。有三种假设,故需计算三个F值。各F值均以MS误差为分母进行计算。
表9-4护士家庭访视时间的方差分析表变异来源离均差平方和自由度均方FP因素A:病种1580.933526.9847.65<0.01因素B:年龄264.902132.4511.98<0.01A*B:病种*年龄356.97659.495.38<0.01误差530.804811.04总计2733.6059
5.确定P值并作出统计推断查附表5:界值表,根据每种F检验的分子、分母自由度从附表5中查出α水准下的临界值Fα(v1,v2)。v1分别是vA、vB及vAB,v2=v误差。从表中查得F0.01(2,48)
=5.08,F0.01(3,48)=4.22及F0.01(6,48)=3.20。对比统计量F值与临界F值得出如下统计学结论:(1)拒绝H0:的无效假设,接受H1,即至少有一个病种的访视时间长度与其他病种的访视时间长度不同。(2)拒绝H0:=0的无效假设,接受H1,即至少有一个年龄组的访视时间长度与其他年龄组不同。(3)拒绝H0:的无效假设,接受H1,即至少有一种组合水平的访视时间长度与其他组合不同。
专业结论认为:年龄较大的护士每次访视所用时间较长。访视时间似乎与年龄组有某种线性关系。从病种分析,对肿瘤病人和脑血管意外病人的访视时间较长。
jb三、交互作用上述例子经方差分析表明,护士年龄与病人所患疾病的病种之间存在有显著的交互作用,必须进一步探明这种交互作用的形式及其存在于哪些组合水平上。分析过程如下:
1.首先计算出每种组合水平的平均访视时间根据表9-4所列的各种组合水平的观察值之和Tij及边际合计值Ti与Tj除以相应的观察例数,即可得到各格子内平均值及边际水平的平均值,见表9-5。直观分析可见,在A8不同组合下的平均值是不相同的。
2.交互作用图
将表9-5中各格子平均值绘制在交互作用图上。见图9-l。
表9-5因素A与B各组合水平上的平均访视时间(分)因素A的水平i(病种)因素B的水平j(护士年龄组)(岁)123(20~)(30~)(40~)1心脏病23.028.426.225.902肿瘤35.230.039.835.003脑血管意外33.233.440.235.604结核病20.027.425.624.3327.929.833.030.20
从图
9-1可见,在因素
A的
4个水平上人的第
l、3两组平均值的趋势比较一致,呈山峰型,对病种2和3所花的访视时间增加。但B的第2水平比较平坦,表明因素B的l、3、水平与因素A的2、3水平间存在较强的交互作用,这种交互作用使访视时间增加。青年护士及高年护士对肿瘤病人及脑血管意外病人访视的时间较长。
第三节两因素析因设计方差分析中的多重比较
当双向方差分析拒绝无效假设时,需要进一步确定哪些水平间的效应存在显著差异。当交互作用不显著时,可直接对处理因素各水平的平均值进行比较。当交互作用显著时,必须用两因素各水平组合下的平均值进行比较。下面仍以例9-2资料为例介绍采用Tukey法进行多重比较的方法。
一、两因素存在显著交互作用时两两比较的方法
l.计算两因素各水平相互组合的格子(ij)中的平均值的方差:当各格子中的观察例数相等时用n代替上式中的nij。
2.计算两个对比格子(ij)与(kl)平均值之差的方差
如当(ij)为(23)、(kl)为(22)的两平均值之差的方差为:
3.计算t值:4.确定概率P并作出统计推断查附表6:q界值表,取得在Ⅰ类错误概率水准为α时的临界值qα(v1,v2)
,下标v1=a×b为两因素各水平所有可能的组合数,v2=N-ab。本例有,故拒绝无效假设。例9-2资料经方差分析表明,30~岁年龄组护士与40~岁年龄组护士对肿瘤病人的访视时间长度不同。
二、两因素间交互作用不显著时的对比方法
1.计算每一因素各水平的平均值的方差如当比较处理因素A各水平的平均值之差时,先计算平均值的方差,所用公式为:当比较处理因素B各水平值之差时,用下式计算平均值
的方差:
上式中的
ni1,ni2,…,nib及n1j,n2j,…,naj为因素A的i水平与因素B的j水平上各格子d的观察例数。
2.计算同一因素在i,k人两个不同水平的平均值之差的方差计算公式为:
3.计算t值
4.查q值表得到在Ⅰ类错误概率水准为α时的临界q值qα(v1,v2)
,然后与t值比较,作出是否拒绝无效假设的统计学推论。分子自由度v1为水平数。当对因素A的不同水平的平均值进行比较时,v1=a;当对因素
B的不同水平的平均值进行比较时v1=b。分母自由度v2=v误差。
第四节裂区设计资料的方差分析一、裂区设计的结构裂区设计(split-plotdesign)又称嵌套设计(nesteddesign),也是一种两因素设计。这种设计最早应用于农业。在某些田间试验中,首先将选择好的田块分为几个大区。然后再将每一大区分为若干个小区。在大区水平上施加处理因素A,在小区水平上施加处理因素B。假如A有2个水平:a1、a2,B有3个水平:bl、b2、b3,就可将试验田块分为2个大区,分别配置a1、a2。将每个大区划分为三个小区,配置bl、b2、b3。这种设计框架如下表所示:
从变异的角度分析,在这种设计中,因素B的变异性要小于因素A的变异性,因为因素A只是在大区上实施的,没有重复。故在配置因素时,应将主要因素作为B,配置在小区水平上,而重要性相对小一点的因素作为A,配置在大区水平上。
大区A的水平a1a2小区B的水平b1b2b3b1b2b3
二、裂区设计的方差分析模型
设有2个处理因素:因素A施加于大区,有a个水平,用i(i=l,2,…,a)表示水平号;因素B施加于小区,有b个水平,用j(j=1,2,…b)表示水平号。用k(k=1,2,…,n)表示观察对象号,n为每个大区内重复观察例数。裂区设计的方差分析模型为:
模型中Yijk是应变量的观察值。为常数项,相当于总体平均值,为因素A在i水平上的效应;为因素B在j水平上的效应;是A取i水平、B取j水平的交互作用;为小区内第k个观察对象的效应,相当于区组效应;
为因素A取i水平时第k个受试对象的效应,是一个随机分量;
是每一个测定值的随机分量。
例9-3一项关于上呼吸道感染的流行病学调查。应变量Y是咽拭培养的肺炎双球菌阳性数目。因素A是家庭居住情况,分为过度拥挤、拥挤和不拥挤3类。在每一类中抽查了6户家庭,共18户。因素B是家庭成员,包含父亲、母亲和3个子女共5个水平。资料见表9-6。表中‘子女’项下的l、2、3是子女的出生序号,最小的子女必须是学前儿童。调查目的是想了解家庭居住情况和不同家庭成员肺炎双球菌阳性数目的差异。
在本例中因素A是拥挤程度,分为3个水平,相当于3个大区。每个家庭的5名成员相当于5个小区。在每个大区内包含6个家庭,就是重复的次数,相当于6个区组。在这个调查中有两类变异。一类是家庭间的变异,另一类是家庭内各成员间的变异。拥挤度之间的比较是在家庭间的变异范围内进行。而家庭成员间的比较是在家庭内变异范围内进行。计算所需数据列于该表的边际部分。在每一种拥挤程度中按家庭成员的合计项列于每一大区的下部。
表9-6某地咽拭培养肺炎双球菌阳性数抽样调查结果家庭拥挤程度(i)家庭号(k)家庭成员(j)按家庭拥挤程度(i)计算父亲母亲子女123过度拥挤(i:1)157625196221181133359833121962161431912171768510915111762690695294155691011143806838(续上表)拥挤(i:2)11177151353210581317533543181040419416838555101620566731317185839334595862983798不拥挤(i:3)1635732429661410453226158334021016214953203142266247203926173162762122434按家庭成员(j)计算10610514525827689083296515434544518613070
三、方差分析的步骤1.总离均差平方和的分解总离均差平方和可分解为两部分:①大区间离均差平方和SS大区间与②大区内离均差平方和SS大区内。每一部分又再分解为三小部分。各部分的符号及其计算公式以及相应自由度的计算公式见表9-7第l、2列。将各离均差平方和除以自由度得到相应的均方,见表9-7第3列。
2.计算F值
裂区设计的方差分析模型中包含两个随机误差项。一个是,它与大区间有关,其样本方差的估计值是
MSA*区组。另一个是,它与大区内有关,其样本方差的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动脉瘤手术前的准备与护理
- 北师大版九年级英语上册Unit5单元测试卷(含真题答案解析)
- 2026年医学影像学专升本影像诊断学模拟单套试卷
- 雨课堂学堂在线学堂云《现代光学(北京理工)》单元测试考核答案
- 湖北新八校2026年高三下4月联考高考二模化学试卷
- 人教版八年级数学上册二次函数单元测试卷(含答案解析)
- 统编版七年级数学上册《一元一次方程》单元测试卷(含答案解析)
- 2026年阁楼家具 斜顶空间的定制解决方案
- 2021年留置看护队员考试全套试题及超详细答案解析
- 2020广西学考命题组同款仿真模拟题及标准答案
- 2026年农药经营许可培训经典例题含完整答案详解【各地真题】
- 2026智慧酒店智能化系统解决方案
- 毕业设计(论文)-树冠振动式板栗采摘机设计
- 电子产品维修故障排除方案
- 2025四川宜宾三江投资建设集团有限公司下属子公司第二批员工招聘21人笔试历年难易错考点试卷带答案解析
- 2025年山东青岛局属公办高中自主招生物理试卷真题(含答案详解)
- 《第3课 斑斓的色彩》课件2025-2026学年人教版美术二年级下册
- 2026年托育机构保育人员培训大纲与技能等级评定指南
- 中国历史研究院中国考古博物馆中文讲解员招聘1人考试参考试题及答案解析
- 学习先进师德典型事迹
- 预防办公室腰椎间盘突出的
评论
0/150
提交评论