品质统计原理变异数分析_第1页
品质统计原理变异数分析_第2页
品质统计原理变异数分析_第3页
品质统计原理变异数分析_第4页
品质统计原理变异数分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、授课目录第1章导论第2章统计资料的整理与描述第3章机率导论第4章常用的机率分配与统计分布第5章描样方法与描样分布第6章统计估计第7章统计检定第8章变异数分析第9章相关分析与回归模式第10章无母数统计检定第11章类别资料分析一列联表与卡方检定第八章变异数分析一般统计检定系讨论两个常态母体下检定平均值的方法。倘对k个常态母体,欲检定其平均值是否一致时,采逐一比对程序检定则效率差且会增型I误差的机率。变异数分析ANOVA(AnalysisofVariance)的主要观念即利用各组资料平均值的差异与各组资料整体之间差异做比较,来检定平均值是否相同的方法。ANOVA7k个母体检定其平均值是否一致。ANO

2、VA!R将一组资料的总变异,依其变异来源分割成数区,然彳矍针对其各区内变异与各区间变异加以探讨分析。ANOVA依据因子的数目一One-wayANOVA,Two-wayANOVA实验设计与ANOVA十九世纪初,英国为了改良农作物的品质与产量,由RonaldA.Fisher爵士首先提由应用ANOV凝实验设计(DOE,DesignofExperiment)中。实验的目的是将不同的处理(Treatment),指定给不同的实验单位(Unit),以便观察其结果好坏。实验的目的是将不同的处理,指予不同的实验单位,以便观察其结果好坏。具包括下列几点:1、决定何者变数X对反应y最具影响力。2、决定这些最具影响力

3、变数x的值,使反应y几乎永远都是在所想要的目标值(NominalValue)的附近。3、决定这些最具影响力变数x的值使反应y变异较小。4、决定这些最具影响力变数x的值使得不可控变数z的影响极小以一般实验设计方法分为二大类:完全随机设计(CompletelyRandomizedDesign)与集区随机设计(RandomizedBlockDesign),以增处理效果的可信度。1、完全随机设计系在考虑一个因子的情况下,有m,n2,nk个实验单位分别指定到k个处理上。这些实验单位的实验顺序是随机决定的。完全随机设计因为只考虑一个因子,故亦称一因变异数分析(One-wayANOVA)可中和其他因子对实验

4、的影响。2、集区随机设计系事先将实验对象划分成若干同质性的集区,即在每个集区内涵具同质性环境下,进行不同实验处理。实验设计亦可以一函数表示之:y=f(x1,x2,xk)式中:输入x-可控因子(变数)(ControlFactors(Variables),输由y-依变量(DependentVariable),输出y一因子变异数分析(TheOne-wayANOVA)倘工管系欲采三种工厂实习课程:(1)电视教学(2)讲师讲习(3)实地观摩,研究其对学生学习效果是否有不同的影响。止匕3种实习课程称之处理(Treatment)。於是将实习生随机分成3组,分别施以不同实习课程。兹随机抽样21位实习生进行分组

5、,第1组有7位,第2组有8位,第3组有6位。此n1=7,n2=8,n3=6称之实验单位(Unit)。本研究仅以工厂实习课程此一因子(Factor)来对母体作分类探讨,故此称之一因子变异数分析。典型资料如下:处理(水准)Treatment(Level)观测值(Observations)总和(Totals)平均值(Average)1y11y12-y1ny1y1?2丫21y22,y2ny2y2?aya1ya2.y1nya-ya?yy?N=anyu:第i个处理、第j个观测值一因子变异数分析是根据变异来源:组内、组间、与总变异等统计量,建立变异数分析表(ANOVATable),以进行检定工作。变异来源平

6、方和SS自由度df均方和MSF因子(组问)SSTa-1MST=SST/(a-1)MST/MSE随机(组内)SSEN-aMSE=SSE/(N-a)总和SSN-1MS=SS/(N-1)其中:总变异(TotalSumofSquaredDeviation)SS =(yij y?)2i 1 j 1an(yi?y?)2i 1a n(yjyi?)2i 1 j 1=SST+SSE组间变异(TreatmentSumofSquares)(BetweenTreatment)SST=na(yi?y?)2i1组内变异(ErrorSumofSquares)(WithinTreatment)SSE =an(yjyi?)2i

7、1j1简化之:SS =a n 2y,ji 1 j 1y:?/N; SST = 12 y? NSSE=SS-SST一因子变异数分析的统计假设为H0:m1=m2=.=mk;即因子对依变数无影响。Hi:mi不全等;即因子对依变数有影响。上述的假设中,m1,m2,.,mk分别为k个因子水准所造成的效果。若H0为真,即表示k个效果不存在,因子对依变数无影响。检定统计式:F=MST/MSE若各组样本均来自常态分布,则检定统计量为一F分布在显着水准a下,倘F£Fa,a-1,N-aTTAcceptHoF>Fa,a-1,N-aTTRejectH0各组样本数相等范例、随机抽取IDF、F16、与幻象

8、2000等三种战机各10架,测其速度,这三种战机的平均速度有差异SOL(1)建立统计假设H0:m1=m2=m3;Hi:mi不全等(2)显着水准a=IDFF162000单因子变异数分析摘要组个数总和平均变异数IDF10F1610200010ANOVA变源SSdfMSFP-值组间2组内27临界值总和29F(=值远大於临界值(=,且P-值为远小於显着水准RejectH0TT即至少有二种战机(母体)的平均速度是有差异的。各组样本数不等范例、工管系欲采三种工厂实习课程:(1)电视教学(2)讲师讲习(3)实地观摩,其对学习效果是否有不同的影响SOL(1)建立统计假设Ho:m1=m2=m3;Hi:mi不全等

9、(2)显着水准a=电视教学讲师讲习实地观摩单因子变异数分析707682838580摘要888075组个数总和平均变异数929089电视教学75888455858570讲师讲习86888634808872实地观摩64687850909094ANOVA变源SS自由度MSFP-值组间2组内81818临界值总和20F(=值小於临界值(=,且P-值为大於显着水准AcceptH0TT三种工厂实习课程对学生学习效果无差异的。集区随机设计(TheRandomizedBlockDesign)在任何实验中,扰动因子(NuisanceFactor)引起的变异对其结果会有影响。扰动因子之定义:一设计因子,其对反应有效

10、果而实验者却对此效果无兴趣。未知且无法控制(UnknownandUncontrolled)的扰动因子:不知其存在及实验进行时可能改变水准。随机化是一种设计技巧用来防范此潜伏的扰动因子。然而,已知但不可控制(KnownbutUncontrollable)的扰动因子,倘於每次实验时会观测到此的扰动因子之值,则於ANOVA寸其会被补偿。如扰动变异来源是已知且可控制(KnownandControllable)时,集区划分(Blocking)之设计将可系统化地消除其对处理间统计比较的影响。上节叙述一因子变异数分析,且完全随机设计,藉此中和或消弭一些非特定因子(不是我们想知道的重点)对依变量(输由y)所造

11、成的影响。但某些情况下,非特定因子对依变量的干扰过大,甚至完全随机设计亦无法消弭这些干扰。此时依变量不只受到特定因子的影响,亦受到非特定因子的影响。倘致远管理学院欲对6个学系有开统计学课程,采4种不同教学方式,以研究统计学对各系学生学习效果是否有不同的影响。此时,学生学习效果为依变量(输由y),教学方式为特定因子,但学生学习效果却不只受到教学方式的影响,而受到各学系的影响,因为各学系各具不同的特性。若用上节的检定方式,会将各系所导致的影响计入SSE中,而使得SSE膨胀起来,因而影响结论的正确性。如欲评监各系学生学习统计学的效果,则各系学生学习成绩形成一个集区(Block)o因此总变异的分解为:

12、SS(总变异)=SST(组间变异)+SSB(集区变异)+SSE(随机误差)Block1Block2Blockbyiiy12yiby2iy22y2by3iy32y3b.ya1ya2yab变异来源平方和SS自由度df均方和MSF因子(组问)SSTa-1MST=SST/(a-1)MST/MSE集区SSBb-1MSB=SSB/(b-1)MSB/MSE随机(组内)SSE(a-1)(b-1)MSE=SSE/(a-1)(b-1)总和SSN-1MS=SS/(N-1)其中:SS=SST+SSB+SSESST =ab (yi?i 12y ?)SSB =ba (y?jj 12 y ?)SSE =a b(yiji 1

13、 j 1yi?2 y?j y ?)简化之:SS =y2 y2?/N ;y2?/NSST- SSBSSB=1bv2v2;SSE=SSy?jy?aj1集区随机设计的统计假设为H0:m1=m2=.=mk;即因子对依变数无影响H1:mi不全等;即因子对依变数有影响。上述的假设中,m,m2,.,mk分别为k个因子水准所造成的效果。若H为真,即表示k个效果不存在,因子对依变数无影响。检定统计式:F=MST/MSE若各组样本均来自常态分布,则检定统计量为一F分布。在显着水准a下,倘F£Fa,a-1,(a-i)(b-i)TTAcceptH0F>Fa,a-1,(a-1)(b-1)TTReject

14、H0范例、欲研究硬度实验。共有4种尖锐物和4块可供测试的金属物品。每i种尖锐物在每块金属物品上测试一次,成为一个集区随机设计。尖锐物种类金属物品(集区)12341234SOL:变异来源平方和SS自由度df均方和MSF处理(尖锐物种类)3集区(金属物品)3P-Value误差9总和15F(=值大於临界值(=,且P-值为小於显着水准RejectH0TT尖锐物种类的确会影响平均硬度读值(即尖锐物对平均硬度有效)SOL:(考虑集区)变异来源平方和SS自由度df均方和MSF处理(尖锐物种类)3集区(金属物品)3P-Value误差9总和15SOL:(倘无考虑集区)变异来源平方和SS自由度df均方和MSF处理

15、(尖锐物种类)3误差12总和15F(=值小於临界值(=。AcceptHoTT尖锐物种类的平均硬度读值相等,即尖锐物种类不会影响平均硬度读值(即尖锐物对平均硬度无效)。二因子变异数分析(Two-wayANOVA)在上述一因子变异数分析和集区随机设计中,均研究一个因子对依变量所造成的影响,将此观念扩展至二因子时,此研究架构即为二因子变异数分析。在进行二因子变异数分析时,须考因子问是否对依变数有交互作用(Interaction),此作用不存在,则变异数分析的结构较简单,则二个因子对依变量的影响可分开研究;倘此作用存在,则变异数分析的结构较复杂,则二个因子对依变量的影响须置於一起讨论。考虑一般情况,令

16、yjk为A因子在第i个水准(i=1,2,a)、B因子在第j个水准(j=1,2,b)、在第k次重复(k=1,2,n)时所观测到的B因子12bA1yiii,yii2,yiinyi21,yi22,yi2n.yibi,yib2,yibn因2y211,y2i2,y21ny221,y222,y22n.y2b1,y2b2,,y2bn子:.ayaii,ya12,yainya21,ya22,,ya2n.yabi,yab2,*,yabny2b1,y2b2,y2bn反应值。如下:总变异=A因子变异+B因子变异+AB因子交互变异+随机误差变异来源平方和SS自由度df均方和MSF因子ASSAa-1MSA=SSA/(a-

17、1)MSA/MSE因子BSSBb-1MSB=SSB/(b-1)MSB/MSE交互作用SSAB(a-1)(b-1)MSAB=SSAB/(a-1)MSAB/MSE(b-1)随机误差SSEab(n-1)MSE=SSE/ab(n-1)总和SSabn-1MS=SS/(abn-1)其中:SS=abn (yi?i 1(yijkyij?)2 y ?)_2b_y?)an(y?j?j1a bn (yij?i 1 j 12yi? y ?j? y ? )abn(yjki 1 j 1 k 12 y ij?)=SST+SSB+SSAB+SSE简化之:SS = a b n v2y ijki 1 j 1 k 12 _ y?

18、/ abn,bn i 12y i?y?/abnSSB =y;?an j 1y:"abn; Subtotal =-b2y ij?j 1y? /abnSSAB = SubtotalSSA - SSBSSE=SSSubtotal在进行二因子变异分析时,般是先检定交互作用存在与否,倘接受交互作用不存在,则二因子变异分析的架构可简化之,此时再继续进行A、B因子效果检定假设才有意义。若拒绝则无论A、B因子效果检定的结果为何,交互作用都会保留在模式中,此已认定A、B因子会对依变量造成影响。二因子变异分析三阶段检定过程:(1) 检定交互作用是否存在:统计假设为交互作用不存在。H1:交互作用存在。若H

19、为真,即表示AB因子未对依变数产生交叉影响。检定统计式:F=MSAB/MSE倘F£Fa,(a-I)(b-1),ab(n-i)TTAcceptH0F>Fa,(a-1)(b-1),ab(n-1)TTRejectH0(2)检定A因子是否影响依变量:假设已作由交互作用不存在,则分别检定二因子对依变量的影响。统计假设为H0:mij=m2j=maj,j=1,2,b;Hi:mij,m2j,m司不全相等。若H0为真,即表示A因子未对依变数产生影响。检定统计式:F=MSA/MSE倘F£Fa,(a-1),ab(n-1)TTAcceptH0F>Fa,(a-1),ab(n-1)TTRe

20、jectH0(3)检定B因子是否影响依变量:检定B因子对依变量的影响。统计假设为H0:mii=mi2=mib,i=1,2,a;Hi:mii,mi2,mib不全相等。若H为真,即表示B因子未对依变数产生影响。检定统计式:F=MSB/MSE倘F£Fa,(b-i),ab(n-i)TTAcceptHoF>Fa,(b-i),ab(n-i)TTRejectHo电池设计实验温度(°F)材料种类157012511301553440207074180807582582150188361222570159126106115584531381107412096104168160150139

21、8260ANOVAforBatteryLifeData变源SSDOFMSFP-值临界值样本23.栏228.3.交互作用42.组内27总和35由ANOVAt示,,4,27=,则材料种类与温度之间有显着性,再者,2, 27=,则材料种类与温度之主效果亦有显着性。为解释实验的结果,构建各处理组合下平均反应图,由图5-9所示,结论如下1570125e 200 e 150 a ioOev 50A -Material TypeMaterial Type MaterialType123Temp.(DegreeF)材料种类-温度之反应图 由直线缺乏平行性质视由显着的交互作用, 不论材料种类,低温会得到较长的寿

22、命, 如要求温度变化时,其电池有效寿命折损较小,则材料种类3的表现似最佳。高中低货品陈架(二因子-位置与高度)与销售量前四359560双因子变异数分析:重复试验4510055258070摘要高中低总和409050前四3011070个数55515彳麦面659030总和1754753059556510525平均3595615510035变异数12580609040759540彳麦面个数55515总和320480170970平均649634变异数55总和个数101010总和495955475平均变异数ANOVA变源SSdfMSFP-值临界值样本(前彳麦)1栏(高度)21099E-13交互作用3920

23、21960294E-07组内163024总和29高中低前四359561彳麦面64963412010080604020习题1.以下有数个一因子变异数分析的例子,针对各个例子找出其因子,因子水准以及因变量:(a)某家汽车零件公司主要是制造三种汽车零件:轮胎、煞车、排气管;每一种零件各设置一个销售来负责销售。公司高层人员想要研究这三种零件的销售网每月的营业额是否相同。(因子:汽车零件;因子水准:轮胎、煞车、排气管;因变量:每月的营业额)(b)税捐稽徵处想要研究在台北市三种职业(大学教授、电脑工程师、房地产仲介业者)年收入的状况。研究人员从台北市抽出一千人,以这些样本来推断这三种职业的年收入是否相同。

24、(因子:职业种类;因子水准:大学教授、电脑工程师、房地产仲介业者;因变量:年收入)某研究是研究不同温度下木材的抗压能力,研究人员设定了三种温度:0C、25C、50C,他们想要知道在这三种温度之下,木材的抗压能力是否会不同。(因子:温度;因子水准:0C、25C、50C;因变量:木材的抗压能力)2.致远管理学院工管系想要研究不同的教学方式对学习成果所造成的影响。研究人员随机选出15位大一新生同学,并将之分为三组。第一组用教学录影带来教授学生,第二组采用传统的课堂教学方式,第三组仅授予讲义,由学生自行研读。一学期彼,对这三组学生进行测验,以下是测验的成绩:、样本教"T式'、.123

25、45录影教学8682947786课堂教学9079888796讲义教学7870657463(a)写出 ANOVA!。(b)在显着水准a二下,不同的教学方式是否对学习成果会造成影响请写出你的检定程序。变异来源平方和SS自由度df均方和MSF因子水准9302465误差46012;临界值总和139014RejectH0TT不同的教学方式是对学习成果会造成影响。3. 某电器公司将研发的新产品(收音机)委托四家工厂制造,为了测试这四家工厂制造收音机品质,研究人员分别由四家工厂的生产线上各抽出台收音机,将收音机的音量开到最大,并记录它们的使用期限,以下便是测试的结果:(单位为月)工厂123456一厂二厂三厂

26、四厂(a)写出ANOVA!。(b)在显着水准a=下,这四家工厂所制造的收音机品质是否一样请写出你的检定程序。变异来源平方和SS自由度df均方和MSF因子水准3误差20“界值总和23RejectH0TT这四家工厂所制造的收音机品质不一样。4. 一位食品研究人员想要研究蛋糕中乳酪的含量是否会影响蛋糕的体积;他调配了10公克、20公克、30公克三种乳酪含量,将它们置入原料中再烘烤成蛋糕,并测量蛋糕的体积。研究人员烘烤了21个蛋糕,每种乳酪含量各烘烤7个蛋糕,以下是所得的资料:、样本重量、123456710公克38739640140539839139320公克390394381390402403391

27、30公克398401405380391394395(a)写出ANOVAS。(b)在显着水准a=下,乳酪含量是否会影响到蛋糕体积请写出你的检定程序。变异来源平方和SS自由度df士勺方和MSF因子水准2误差18:临界值总和20AcceptH0TT乳酪含量不会影响到蛋糕体积。5. 一家厨具公司代理了三家厂牌的电子锅,这三种电子锅的品质、价格其实相差并不大,不过为了解顾客对厂牌的喜好状况,该公司想要比较这三种电子锅的销售状况。研究人员选了六家厨具贩卖店,并调查在这六家商店中三种电子锅的销售量,以下变是调查的结果:(单位为百元)。商店厂牌商店一商店二商店三商店四司店五商店六厂牌一216117692748

28、178228303183厂牌二237919131119120819621689厂牌三14791024159896319132251这是一个随机集区化的变异数分析,请回答以下问题:(a)在这个分析中,何者为因子(电子锅的厂牌)何者集区(贩卖电子锅的商家)请加以解释。(b)写出ANOVAS。在显着水准a二下,这三种电子锅的销售量是否一样请写出你的检定程序。变异来源平方和SS自由度df士勺方和MSF因子水准257005621285028集区24077485误差175254210175254临界值总和673034517RejectH0TT这三种厂牌电子锅的销售量是不一样06.以下是水果茶销售的实际观测资料:回j颜色i'、12345粉红1橙色2淡紫3墨绿4这是一项集区随机化的实验设计,依颜色的不同,所有卖场(集区)的水果茶销售量被分类为四组,由於每一种颜色的水果茶皆设置了五个卖场在贩售。因此,在每种颜色之下皆有五个实际销售量。销售量是以万元作为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论