




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉纺织大学备课纸第八章 方差分析教学目的使学员掌握单因子及二因子(包括无交互作用有交互作用的情形)方差分析的推断法,并能将其应用于教育与心理学等领域。一、方差分析的基本原理在工农业生产及科学研究中,影响产品质量与产量(或研究结果)的因素一般较多,例如影响农作物产量的因素就有种子品种,肥料、雨水等。影响儿童识记效果的因素有教学材料、教学法等。为了找出影响结果(效果)最显著的因素,并指出它们在什么状态下对结果最有利,就要先做些试验,然后对测试的数据进行统计推断,方差分析就是对实测数据进行统计推断的一种方法。方差分析中,常称上述的因素为因子,用A、B、C等表示因素在试验中所处的不同情况或状态称为水平,例如因子A的r个不同水平表为A1,A2,Ar。下面以一简例说明方差分析的原理。例8.1 从小学入学新生中随机抽取20名学生作数学试验,将儿童均分为四组,分别用四种汉字识字教学法进行教学,一段时间后对他们进行统一测验,成绩如下:教 法A1A2A3A4学生成绩yij7482707680888085838480737076827674807382希望通过试验数据推断:不同教学法的教学效果是否有显著差异?在上例中,只考虑了教学法这一个因子(记为A)对教学效果的影响,四种不同的教学法就是该因子的四个不同水平(分别记为A1,A2,A3,A4)。从表中数据看出,即使同一教学法下,由于随机因素(学生个体差异,随机误差等)的影响,学生成绩也不同因而有:(1)学生测试成绩是随机变量;(2)应把同一教学法(同一水平)得到的测验成绩看作同一母体抽得的子样,不同教学法下的测试成绩视为不同母体下抽得的子样,故表中数据应看成从四个母体y1,y2,y3,y4中分别抽了容量为5的子样的观测值判断教学法对测试成绩是否有显著影响的的问题,就是要辨别测试成绩之间的差异主要是由随机误差造成的,还是由不同教学法造成的,这一问题可归结为四个母体是否有相同分布的讨论。由于在实际中有充分的理由认为测试成绩服从正态分布,且在安排试验时,除所关心的因子(这儿是教学法)外,其它试验条件总是尽可能做到一致,这就使我们可以认为每个母体的方差相同,即例8.1中 yiN(i,2) i=1,2,3,4,因此,推断几个母体是否具有相同分布的问题就简化为:检验几个具有相同方差的正态母体是否均值相等的问题,即只需检验H0:1=2=3=4 (8.1)象这类检验若干同方差的正态母体均值是否相等的一种统计分析方法称为方差分析。在实际问题中,影响母体均值的因素可能不止一个,按试验中因子的个数,称为单因子方差分析、二因子方差分析、多因子方差分析等。我们先介绍单因子方差分析,再讨论二因子方差分析,至于多因子方差分析与二因子的类似。二、单因子方差分析:单因子方差分析模型如下: yij=i+ij i=1,2,r; j=1,2,t (8.2) ijN(0,2)这里yi看成第i个水平下的试验结果,yiN(i, 2),在Ai水平下做了t次试验,获得t个数据yij (i=1,t)需检验假设:H0:1=2=r (8.3)现把参数形式改变一下:记 我们称为一般平均,i为因子A的第i个水平的效应,r个效应满足关系式: 于是单因子方差分析模型(8.2)可改写成 (8.4)所要检验的假设(8.3)可改写为H0:1=2=r=0 (8.5)需指出的是在模型(8.4)或(8.2)中,观察到的是yij,而ij是观察不到的,通常称ij为随机误差或随机干扰。下面就来讨论(8.5)的检验我们首先分析引起yij波动的原因,有如下两个 H0为真,波动由随机误差引起引起yij的波动H0不真导致今后我们的yij视情况不同可以表示随机变量,也可以表示观测数据,下面就从分解平方和入手,找出反映上述两个原因的量来,为此先引入 (8.6) (8.7)称是从第i个母体抽得的子样的平均,常称为组平均值,而 称为样本总平均值,我们称 (8.8)为总偏差平方和。由于有 ,i=1,r所以故总偏差平方和有如下分解式 (8.9)其中 (8.10)称为误差的偏差平方和,它反映了观察yij时,抽样误差的大小程度 (8.11)称为因子A的偏差平方和,在(8.5)所示H0为真时,它反映误差的波动,在H0不真时,它反映因子A的不同水平效应间的偏差。下面我们分别计算它们的数学期望 (8.12)所以 (8.13)由(8.12)知,为2 的无偏估计,而当(8.5)为真时,也是2的无偏估计故统计量 (8.14)在假设(8.5)为真时接近1,而(8.5)不真时有偏大的趋势,我们取F作(8.5)的检验统计量,下面就来推导其分布,先看一个重要的定理。定理8.1(柯赫伦定理)设x1,x2,xn为n个独立同服从N(0.1)分布的随机变量,又设Q=Q1+Q2+QK=为变量,其中Qi(i=1,k)是秩为fi的关于x1,xn的非负二次型,则Qi(i=1k)相互独立,且分别服从自由度为fi的分布的充要条件是证:(见教材P378P379)有了上面的定理,我们便可推出(8.14)所示的F-统计量的分布。事实上,当(8.5)所示 H。为真时有1=2=r=0由(8.4)式知一切yijN(,2)且相互独立,即所有yij (i=1r j=1t)可以看作取自正态N(,2)母体的容量为n=rt的子样,而yij -N(0,2)由 上式左边是n个N(0.1)变量的平方和,右边显然是yij的三个非负二次型,Q3的秩显然为1。因 含有r个线性关系故Se从而Q1的秩为n-r因 包含一个线性关系所以SA从而Q2的秩为(r-1)。由于Q1,Q2,Q3三个非负二次型的秩满足(n-r)+(r-1)+1=n由柯赫伦定理知:且它们相互独立,从而有(8.14)所示的F统计量H0 (8.15)以(8.15)作为(8.5) H0:1=2=r=0的检验统计量,对任给的水平(0,1)由P(FF1-)= 查F(r-1),(n-)分布表,定出临界值,然后视F统计量的观察值是否大于F1-作出拒绝或接受H。的判断。在具体计算时,Se,SA的计算可简化如下: (8.16)并将上述结果列成一张如教材P380所示的方差分析表例8.1(续)由前述表中数据,r=4,t=5 n=20将计算列表如下:教 法A1 A2 A3 A4Yij 74 88 80 7682 80 73 74 70 85 70 80 76 83 76 78 80 84 82 82Yi382 420 381 390 Yi2145924 176400 145161 152100 , ST=124179-123716.45=462.55SA=619585-123716.45=200.55Se=ST-SA=262从而取检验水平=0.05 查F(3.16)分布表得=3.24 故拒绝H0:1=2=3=4认为在=0.05下,不同教学法对识字效果影响显著。若在因子的每一水平下所进行的试验次数不等,设在第i个水平下重复了ti次,i=1r,上面的结论仍然成立,只是在具体计算时,公式(8.15)可修改为: (8.17)三、二因子方差分析上面我们讨论了单因子试验中的方差分析,但在实际问题中,更多出现的却是多因素试验,往往需要同时研究几种因素对试验结果的影响,比如农业生产中需要同时研究肥料和种子品种对农作物产量的影响。这样的问题就存在两个因子:一个因子是肥料的种类,一个因子是种子的品种。它们两者同时影响着农作物的产量。我们希望通过试验选取使产量达到最高的肥料种类和种子品种。由于有两个因子的影响,就产生一个新问题:不同种类的肥料和不同品种的种子对产量的联合影响不一定是它们分别对产量影响的迭加,也就是说肥料类型和种子品种要搭配得当才能得到最高产量,这类各因子的不同水平的搭配所产生的影响在统计学中称为交互作用。各因子间是否存在交互作用是多因子方差分析中产生的新问题。由于多因子问题复杂,而解决的基本方法又类似,为简单起见,我们仅介绍二因子的方差分析,分两种情况讨论。1、无交互作用的二因子方差分析设在某试验中同时考虑A与B两因子的作用,因子A取r个不同的水平A1,A2,Ar,因子B取S个不同的水平B1,B2,Bs,由于我们在这里只考虑A、B两因子无交互作用的情形,因此对每种不同水平的组合(Ai,Bj)均进行一次独立试验,共得rs个试验结果yij可列成下表形式。B因子B1 B2 BSyi.A因子A1A2.Ary11 y12 y1sy21 y22 y2syr1 yr2 yrsy1.y2.yr.y.jy.1 y.2 y.s这里仍假定yij是独立地取自分布为N(ij,2)的正态母体的子样。为研究问题方便,仍如单因子方差分析一样把参数改变一下,令 显然有在A、B无交互作用的假设下,应有ij=+i+j综上,得如下(无交互作用)的方差分析模型 (8.18)要判断因子A(或B)不同水平的影响是否有显著差异,只须检验下面的假设H01(或H02)H01:1=2=r=0H02:1=2=s=0 (8.19)为检验H01和H02,我们仍如单因子时一样,采用分解平方和的方法,为此先引进如下记号:由(8.18)可知有 (8.20)分解总偏差平方和其中称为误差偏差平方和,它反映了误差的波动 称为因子A的偏差平方和 称为因子B的偏差平方和可计算得 因此在H01和H02为真时,分别是2的无偏估计,为此构造统计量H01真 H02真时 (与单因子时一样,利用柯赫伦定理可以证明FA、FB具有上述F分布),分别作H01和H02的检验统计量,在H01、H02不真时,FA、FB分别有偏大的趋势。对给定的水平,可查分布表分别得()分位点,当值时拒绝H01,当值时拒绝H02。具体计算时,可将分析过程列成如书P387所示的方差分析表例8.2 题略(见书P387)解:用方差分析解决这里的问题检验:H01:因子A对化验结果无显著影响 H02:因子B对化验结果无显著影响这里r=4,s=3,记n=rs=12, 具体计算见下表ABA1 A2 A3 A4y.jy2.jB1B2B33.5 2.6 2.0 1.42.3 2.0 1.5 0.82.0 1.9 1.2 0.39.56.65.490.2543.5629.16yi. 7.8 6.5 4.7 2.5 60.84 30.25 22.09 6.25又 由上述计算可得从而 对=0.05,因 查表得 查表得因故拒绝H01,H02认为因子A、B对化验结果都有显著影响2、具有交互效应的二因子方差分析在这种情形下,用前面的记号,因为两因子A与B存在交互效应会有ij+i+j记ij=ij-i-j称它为因子A的第i个水平和因子B的第j个水平的交互效应,其满足关系式:关系式:为了研究交互效应,需对两因子各个水平的组合进行若干次重复的观察,其结果如下表所示因子B因子AB1B2BSA1A2.Ary111,y11ty211,y21t.yr11,yr1ty121,y12ty221,y22t.yr21,yr2ty1s1,y1sty2s1,y2styrs1,yrst这里视(yij1,yijt) i=1r, j=1s, 为取自N(ij,2)母体的简单随机子样,又由各母体间相互独立的假设,故所有yijk相互独立。综上,得有交互作用的二因子方差分析模型为: (8.21)对此模型,除需检验因子A、B对试验结果有无显著影响,即检验H01:1=r=0H02:1=s=0 (8.22)还需检验A、B的交互作用是否对试验结果有显著影响,即H03:ij=0 对一切i=1r, j=1s (8.23)为此,需找出以上这些显著性检验的检验统计量,与前一段的讨论类似,我们需分解平方和,先引入一些记号(见书P387)由(8.21)可知 (8.24)将总偏差平方和作如下分解其中 称为误差偏差平方和(反映了随机误差对试验结果的影响)为因子A引起的偏差平方和(除含有误差波动外,反映因子A对试验结果的影响)称为因子B的偏差平方和 为因子A与B的交互作用的偏差平方和,反映了因子A与B的交互作用对试验结果的影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学美术教学中的审美教育对学生综合素质的提升研究论文
- 校园周边广告对学生消费观念的影响与学校心理健康教育实践论文
- 基于创新教育的高中数学建模竞赛辅导策略研究论文
- 艺考生班级管理制度
- 苏美达集团管理制度
- 茶水间员工管理制度
- 蓝天教育集团高二年级下册期中考试语文试题(含答案)
- 财务规范计划
- 财务管理案例 教学组织方式 案例1-20
- 国际经济法专业本科生
- 2022-2023学年福建省厦门市数学五年级第二学期期末学业质量监测试题含答案
- 父亲节:感恩父亲的日子
- 有趣的行为金融学知到章节答案智慧树2023年上海海洋大学
- 现代物流管理(第三版-钱廷仙)课件1.物流成本构成
- 2023年芜湖一中高一自主招生考试试题数学
- 天津理工大学-PPT 答辩3
- 中心静脉导管护理
- 江苏省南京市联合体2022-2023八年级初二下学期期中英语试卷+答案
- 事业单位岗位职数情况表
- 糖尿病的外周血管病变和处置培训课件
- Ф9.52铜管表冷器计算书
评论
0/150
提交评论