品质统计原理——变异数分析_第1页
品质统计原理——变异数分析_第2页
品质统计原理——变异数分析_第3页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、授课目录第1章导论第2章统计资料的整理与描述第3章机率导论第4章常用的机率分配与统计分布第5章描样方法与描样分布第6章统计估计第7章统计检定第8章变异数分析第9章相关分析与回归模式第 10章 无母数统计检定第 11章 类别资料分析 - 列联表与卡方检定第八章 变异数分析般统计检定系讨论两个常态母体下检定 平均值 的方法。倘对 k 个常态母体,欲检定其 平均值 是否一致时, 采逐一比对程序检定则效率差且会增型 I 误差的机率。变异数分析 ANOVA(Analysis of Variance) 的主要观念即 利用各组资料平均值的差异与各组资料整体之间差异做比 较,来检定平均值是否相同的方法。 AN

2、OVA可对 k 个母体检 定其 平均值 是否一致。 ANOVA即将一组资料的总变异, 依其变异来源分割成数区 ,然後针对其 各区内变异与各 区间变异 加以探讨分析。 ANOVA 依 据 因 子 的 数 目-One-way ANOVA , Two-way ANOVA。实验设计与 ANOVA十九世纪初,英国为了改良农作物的品质与产量,由Ronald A. Fisher 爵士 首先提出应用 ANOVA於实验设 计 (DOE, Design of Experiment)中。实验的目的是将不 同 的 处 理 (Treatment) ,指定给不同的 实验 单位 (Unit) ,以便观察其结果好坏。实验的目

3、的是将不同的处理,指予不同的实验单位, 以便观察其结果好坏。其包括下列几点:1、决定何者变数 x 对反应 y 最具影响力。2、决定这些最具影响力变数 x 的值,使反应 y 几乎永远 都是在所想要的目标值 (Nominal Value) 的附近。3、决定这些最具影响力变数 x 的值使反应 y 变异较小。4、决定这些最具影响力变数 x 的值使得不可控变数 z 的影响极小以 一 般实 验 设计 方 法分 为 二大 类 :完 全 随机 设计 (Completely Randomized Design) 与 集 区 随 机 设 计 (Randomized Block Design) ,以增处理效果的可信

4、度。1、 完全随机设计 系在考虑 一个因子 的情况下,有 n1 , n2 , ,n k 个实验单位分别指定到 k 个处理上。这些 实验单位的 实验顺序是随机决定 的。完全随机设计因为只考虑一个因子, 故 亦称一因变异数分析 (One-way ANOVA。) 可中和其他因子对实验的影响 。2、 集区随机设计 系事先将实验对象划分成若干 同质性 的集区 ,即在 每个集区内涵具同质性环境下 ,进行不 同实验处理。实验设计亦可以一函数表示之:y = f(x 1 , x 2 , ,x k)式 中 : 输入 x- 可控 因 子 ( 变 数 )(Control Factors(Variables) ,输出

5、y- 依变量 (Dependent Variable) ,输出 y一因子变异数分析 (The One-way ANOVA)倘工管系欲采三种 工厂实习课程 : (1) 电视教学 (2) 讲师 讲习 (3) 实地观摩, 研究其对 学生学习效果 是否有不同的影 响。此 3 种实习课程称之 处理 (Treatment) 。於是将实习 生随机分成 3 组,分别施以不同实习课程。兹随机抽样 21 位实习生进行分组,第 1组有 7 位,第 2 组有 8 位,第 3组 有 6 位。此 n1 = 7 , n2 = 8 , n3 = 6 称之 实验单位 (Unit) 。 本研究仅以 工厂实习课程 此 一因子 (F

6、actor) 来对母体作 分类探讨,故此称之 一因子变异数分析 。典型资料如下:处理 (水准 )观测值总和平均值Treatment(Level(Observations(Totals(Average)1y11 y 12 y1ny1·y1?2y21 y 22 y2ny2·y2?aya1 y a2 y1nya·ya?y··y?N = anyij : 第 i 个处理、第 j 个观测值一因子变异数分析是根据变异来源:组内、组间、与总 变异等统计量 ,建立变异数分析表 (ANOVA Table) ,以进行 检定工作。变异来源平方和 SS自由度 df均方和

7、 MSF因子 (组间)SSTa-1MST=SST/(a-1)MST/MSE随机 ( 组内)SSEN-aMSE=SSE/(N-a)总和SSN-1MS=SS/(N-1)其中:总变异 (Total Sum of Squared Deviation)anSS =(yij y?) 2i 1 j1aa nn (yi?y?) 2(yijy i?)2i 1i1 j1= SST+SSE组间变异 (Treatment Sumo f Squares) (Between Treatment)SST = n a (yi?i12 y? )组内变异 (Error Sum of Squares) (Within Treatm

8、ent)SSE =ani1 j1(yijyi?)21 a2y2?yi?n i 1 i?N简化之:SS = a n yi2j y?2?/N; SST = i1j1SSE = SS SST一因子变异数分析的统计假设为H0: m 1= m2 =. = m k ;即因子对依变数无影响。H1: m i 不全等;即因子对依变数有影响。上述的假设中, m1 , m 2 , . , m k 分别为 k 个因子水准 所造成的效果。 若 H0为真,即表示 k 个效果不存在,因子对 依变数无影响 。检定统计式:F = MST/MSE若各组样本均来自常态分布 ,则检定统计量为一 F 分布 在显着水准 a 下,倘F F

9、 a, a-1, N-a TT Accept H 0F > F a, a-1, N-a TT Reject H 0各组样本数相等范例、随机抽取 IDF 、F16、与幻象 2000 等三种战机各 10 架,测其速度,这三种战机的平均速度有差异SOL:(1) 建立统计假设H0: m 1= m2 = m 3 ; H1: m i 不全等(2) 显着水准 a =IDFF162000单因子变异数分析摘要组个数总和平均变异数IDF10F1610200010ANOVA变源SSdfMSFP-值组间2组内27临界值总和29F(=值远大於临界值 (= ,且 P-值为远小於显着水准Reject H 0TT即至少

10、有二种战机 (母体 )的平均速度是有差异的。各组样本数不等范例、工管系欲采三种工厂实习课程: (1) 电视教学 (2) 讲师讲习 (3) 实地观摩,其对学习效果是否有不同的影响 SOL:(1) 建立统计假设H0: m 1= m2 = m 3 ; H1: m i 不全等(2) 显着水准 a =电视 教学讲师 讲习实地 观摩单因子变异数分析707682838580摘要888075组个数总和平均变异数929089电视教学75888455858570讲师讲习86888634808872实地观摩64687850909094ANOVA变源SS自由度MSFP-值组间2组内81818临界值总和20F(=值小於

11、临界值 (= ,且 P-值为大於显着水准Accept H 0TT三种工厂实习课程对学生学习效果无差异的。集区随机设计 (The Randomized Block Design)在任何实验中,扰动因子 (Nuisance Factor) 引起的变异 对其结果会有影响。 扰动因子之定义: 一设计因子,其对 反应有效果而实验者却对此效果无兴趣 。未知且无法控制 (Unknown and Uncontrolled) 的扰动因子:不知其存在及实 验进行时可能改变水准。 随机化是一种设计技巧用来防范此 潜伏的扰动因子。 然而,已知但不可控制 (Known but Uncontrollable) 的扰动因子

12、, 倘於每次实验时会观测到此 的扰动因子之值,则於 ANOVA时其会被补偿 。如扰动变异来 源是已知且可控制 (Known and Controllable) 时, 集区划分(Blocking) 之设计将可系统化地消除其对处理间统计比较 的影响 。上节叙述一因子变异数分析,且 完全随机设计,藉此中 和或消弭一些非特定因子 ( 不是我们想知道的重点 ) 对依变 量 ( 输出 y) 所造成的影响。 但某些情况下,非特定因子对依 变量的干扰过大,甚至完全随机设计亦无法消弭这些干扰。 此时依变量不只受到特定因子的影响,亦受到非特定因子的 影响。倘致远管理学院欲对 6 个学系有开统计学课程,采 4 种

13、不同教学方式,以研究统计学对各系学生学习效果是否有不 同的影响。此时, 学生学习效果为依变量 ( 输出 y) , 教学方 式为特定因子 ,但学生学习效果却不只受到教学方式的影 响,而受到各学系的影响,因为各学系各具不同的特性。若 用上节的检定方式, 会将各系所导致的影响计入 SSE中,而 使得 SSE膨胀起来,因而影响结论的正确性。如欲评监各系学生学习统计学的效果,则各系学生学习 成绩形成一个集区 (Block) 。因此总变异的分解为:SS(总变异 ) =SST(组间变异 ) + SSB( 集区变异 )+ SSE( 随机误差 )Block 1Block 2Block by11y12y1by21

14、y22y2by31y32y3b.ya1ya2yab变异来源平方和 SS自由度 df均方和 MSF因子 (组间)SSTa-1MST=SST/(a-1)MST/MSE集区SSBb-1MSB=SSB/(b-1)MSB/MSE随机 ( 组内)SSE(a-1)(b-1)MSE=SSE/(a-1)(b-1)总和SSN-1MS=SS/(N-1)其中:SS = SST + SSB+ SSESST =ab (y i?i12 y? )SSB =ba (y?jj12 y ? )SSE =abi1 j1(yiji 1 j 12yi?y?jy ?)简化之:abi1 j1yi2j y?2?/N;i 1 j1SS =SST

15、 =1 a 2 bi1yi?y?2?/NSSB = 1 b y2 y2 /N;SSE = SS SST- SSB a j 1 ?j ?集区随机设计的统计假设为H0: m 1= m2 =. = m k ;即因子对依变数无影响H1: m i 不全等;即因子对依变数有影响上述的假设中, m1 , m 2 , . , m k 分别为 k 个因子水准所 造成的效果。若 H0 为真,即表示 k 个效果不存在,因子对依 变数无影响。检定统计式:F = MST/MSE若各组样本均来自常态分布 ,则检定统计量为一 F 分布 在显着水准 a 下,倘F F a, a-1, (a-1)(b-1) TT Accept

16、H 0F > F a, a-1, (a-1)(b-1) TT Reject H 0范例、欲研究硬度实验。共有4 种尖锐物和 4 块可供测试的金属物品。每 1 种尖锐物在每块金属物品上测试一次,成为一个集区随机设计。尖锐物种类金属物品 (集区 )12341234SOL:变异来源平方和 SS自由度 df均方和 MSF处理( 尖锐 物种类 )3集区( 金属 物品 )3P-Value误差9总和15F(=值大於临界值 (= ,且 P-值为小於显着水准Reject H 0 TT尖锐物种类的确会影响平均硬度读值 ( 即尖锐物对平均硬度有效 )SOL:( 考虑集区 )变异来源平方和 SS自由度 df均方

17、和 MSF处理( 尖锐 物种类 )3集区( 金属 物品 )3P-Value误差9总和15SOL:( 倘无考虑集区 )变异来源平方和 SS自由度 df均方和 MSF处理( 尖锐 物种类 )3误差12总和15F(=值小於临界值 (= 。Accept H 0TT 尖锐物种类的平均硬度读值相等,即尖锐物种类不会影 响平均硬度读值 (即尖锐物对平均硬度无效 ) 。二因子变异数分析 (Two-way ANOVA)在上述一因子变异数分析和集区随机设计中,均研究一 个因子对依变量所造成的影响,将此观念扩展至二因子时, 此研究架构即为 二因子变异数分析。在进行二因子变异数分析时 ,须考因子间是否对依变数有 交互

18、作用 (Interaction) , 此作用不存在,则变异数分析的 结构较简单,则二个因子对依变量的影响可分开研究 ;倘此 作用存在,则变异数分析的结构较复杂,则二个因子对依变 量的影响须置於一起讨论 。考虑一般情况,令 yijk 为 A 因子 在第 i 个水准( i = 1, 2, ,a) 、 B因子在第 j 个水准 ( j = 1, 2, ,b) 、在第 k 次重复( k = 1, 2, ,n) 时所观测到的B 因 子12bA1y111 , y 112 , , y 11ny121 , y122 , , y12ny1b1 , y1b2 , , y1bn因2y211 , y 212 , , y

19、 21ny221 , y222 , , y22ny2b1 , y2b2 , , y2bn子:aya11 , y a12 , , y a1nya21 , ya22 , , ya2nyab1 , yab2 , , yabn总变异 =A 因子变异 + B 因子变异 + AB 因子交互变异 + 随机误差变异来源平方和 SS自由度 df均方和 MSF因子 ASSAa-1MSA=MSA/MSESSA/(a-1)因子 BSSBb-1MSB=MSB/MSESSB/(b-1)交互作用SSAB(a-1)(b-1MSAB=MSAB/)SSAB/(a-1)MSE(b-1)随机误差SSEab(n-1)MSE=SSE/a

20、b(n-1)总和SSabn-1MS=SS/(abn-1)其中:SS=(yijk yij? )a bn (y i?i12y?)2ban (y?j?j12y?)2abn(yij ?i1 j 12yi ? y ?j? y ? )abni 1 j1 k 1(yijk2yij?)2= SST + SSB+ SSAB+ SSE简化之:SS =abn2 yijk i1 j1 k 1y?2? /abn; SSA = 1SSB = a1n jb1y?2j?an j 1a2yi?bn i 1y?2? / abn;Subtotal = 1y?2? /abnni1b2yi2j? j1y?2? /abnSSAB = S

21、ubtotal SSA - SSBSSE = SS Subtotal在进行二因子变异分析时, 一般是先检定交互作用存在与否, 倘接受 H0:交互作用不存在 ,则二因子变异分析的架构可简化之,此时再继续进行A、 B 因子效果检定假设才有意义。 若拒绝 H0,则无论 A、 B 因子效果检定的结果为何,交 互作用都会保留在模式中,此已认定A、 B 因子会对依变量造成影响。 二因子变异分析三阶段检定过程:(1) 检定交互作用是否存在: 统计假设为 H0:交互作用不存在。H1 : 交互作用存在。若 H0为真,即表示 A、B 因子未对依变数产生交叉影响。 检定统计式:F = MSAB/MSE倘F F a,

22、 (a-1)(b-1), ab(n-1) TT Accept H 0F > F a, (a-1)(b-1), ab(n-1)TT Reject H 0(2) 检定 A 因子是否影响依变量: 假设已作出交互作用不存在,则分别检定二因子对依变量的影响。统计假设为H1: m 1j , m 2j , , m aj 不全相等。若 H0 为真,即表示 A 因子未对依变数产生影响。检定统计式:F = MSA/MSE倘 F F a, (a-1), ab(n-1)TT Accept H 0F > F a, (a-1), ab(n-1) TT Reject H 0(3) 检定 B因子是否影响依变量:

23、检定 B 因子对依变量的影 响。统计假设为H0: m i1= mi2 = mib ,i = 1, 2, ,a;H1: m i1 , m i2 , , m ib 不全相等。若 H0 为真,即表示 B 因子未对依变数产生影响。检定统 计式:F = MSB/MSE倘 F F a, (b-1), ab(n-1) TT Accept H 0F > F a, (b-1), ab(n-1) TT Reject H 0 电池设计实验温度( °F)材料种类15701251130155344020707418080758258215018836122257015912610611558453138

24、11074120961041681601501398260ANOVA for Battery Life Data变源SSDOFMSFP-值临界值样本23.栏228.3.交互作用42.组内27总和35由 ANOVA表示, , 4, 27 = ,则材料种类与温度之间有显着 性,再者, , 2, 27 = ,则材料种类与温度之主效果亦有显着性。 为解释实验的结果 ,构建各处理组合下平均反应图 ,由图 5-9 所示,结论如下Material TypeMaterial TypeMaterial Type15 70 125Temp. (Degree F)材料种类 - 温度之反应图由直线缺乏平行性质视出显着

25、的交互作用,不论材料种类,低温会得到较长的寿命, 如要求温度变化时,其电池有效寿命折损较小,则材料种 类 3 的表现似最佳。高中低货品陈架 (二因子 - 位置与高度 )与销售量前面359560双因子变异数分析:重复试验4510055258070摘要高中低总和409050前面3011070个数55515後面659030总和1754753059556510525平均3595615510035变异数12580609040759540後面个数55515总和320480170970平均649634变异数55总和个数101010总和495955475平均变异数ANOVA变源SSdfMSFP-值临界值样本

26、( 前後 )1栏(高度 )21099E-13交互作用392021960294E-07组内163024总和29高中低前面359561後面649634习题1. 以下有数个一因子变异数分析的例子,针对各个例子找出其因子,因 子水准以及因变量:(a) 某家汽车零件公司主要是制造三种汽车零件:轮胎、煞车、排气 管;每一种零件各设置一个销售来负责销售。公司高层人员想要研 究这三种零件的销售网每月的营业额是否相同。( 因子 : 汽车零件;因子水准 : 轮胎、煞车、排气管;因变量:每月的 营业额 )(b) 税捐稽徵处想要研究在台北市三种职业 ( 大学教授、电脑工程师、 房地产仲介业者 ) 年收入的状况。 研究

27、人员从台北市抽出一千人, 以 这些样本来推断这三种职业的年收入是否相同。( 因子 : 职业种类;因子水准 : 大学教授、电脑工程师、房地产仲介业 者;因变量:年收入 )(c) 某研究是研究不同温度下木材的抗压能力, 研究人员设定了三种 温度: 0、 25、 50,他们想要知道在这三种温度之下,木材的 抗压能力是否会不同。( 因子 : 温度;因子水准 : 0 、 25、 50 ;因变量:木材的抗压能 力)2. 致远管理学院工管系想要研究不同的教学方式对学习成果所造成的影 响。研究人员随机选出 15 位大一新生同学,并将之分为三组。第一组 用教学录影带来教授学生,第二组采用传统的课堂教学方式,第三

28、组 仅授予讲义,由学生自行研读。一学期後,对这三组学生进行测验, 以下是测验的成绩:样本教学方式12345录影教学8682947786课堂教学9079888796讲义教学7870657463(a) 写出 ANOVA表。(b) 在显着水准 a=下,不同的教学方式是否对学习成果会造成影响请写出你的检定程序。变异来源平方和 SS自由度 df均方和 MSF因子水准9302465误差46012临界值总和139014Reject H 0 TT不同的教学方式是对学习成果会造成影响。3. 某电器公司将研发的新产品 (收音机 )委托四家工厂制造,为了测试这 四家工厂制造收音机品质,研究人员分别由四家工厂的生产线

29、上各抽 出台收音机,将收音机的音量开到最大,并记录它们的使用期限,以 下便是测试的结果: (单位为月 )样本工厂123456一厂二厂三厂四厂(a)写出 ANOVA表。(b) 在显着水准 a=下,这四家工厂所制造的收音机品质是否一样请写出你的检定程序。变异来源平方和 SS自由度 df均方和 MSF因子水准3误差20临界值总和23Reject H 0 TT 这四家工厂所制造的收音机品质不一样。4. 一位食品研究人员想要研究蛋糕中乳酪的含量是否会影响蛋糕的体 积;他调配了 10 公克、 20 公克、 30 公克三种乳酪含量,将它们置入 原料中再烘烤成蛋糕, 并测量蛋糕的体积。 研究人员烘烤了 21

30、个蛋糕, 每种乳酪含量各烘烤 7 个蛋糕,以下是所得的资料:样本重量123456710 公克38739640140539839139320 公克39039438139040240339130 公克398401405380391394395(a) 写出 ANOVA表。(b) 在显着水准 a=下,乳酪含量是否会影响到蛋糕体积请写出你的检变异来源平方和 SS自由度 df均方和 MSF因子水准2误差18临界值总和20Accept H 0 TT 乳酪含量不会影响到蛋糕体积。5. 一家厨具公司代理了三家厂牌的电子锅,这三种电子锅的品质、价格 其实相差并不大,不过为了解顾客对厂牌的喜好状况,该公司想要比 较

31、这三种电子锅的销售状况。研究人员选了六家厨具贩卖店,并调查 在这六家商店中三种电子锅的销售量,以下变是调查的结果:( 单位为百元 ) 。商店厂牌商店一商店二商店三商店四商店五商店六厂牌一216117692748178228303183厂牌二237919131119120819621689厂牌三14791024159896319132251这是一个随机集区化的变异数分析,请回答以下问题:(a) 在这个分析中,何者为因子 (电子锅的厂牌 )何者集区 (贩卖电子锅 的商家 ) 请加以解释。(b) 写出 ANOVA表。(c) 在显着水准 a=下,这三种电子锅的销售量是否一样请写出你的检定程序。变异来源平方和 SS自由度 df均方和 MSF因子水准257005621285028集区24077485误差175254210175254临界值总和673034517Reject H 0 TT 这三种厂牌电子锅的销售量是不一样。6. 以下是水果茶销售的实际观测资料:卖场 j 颜色 i12345粉红 1橙色 2淡紫 3墨绿 4这是一项集区随机化的实验设计,依颜色的不同,所有卖场(集区 )的水果茶销售量被分类为四组, 由於每一种颜色的水果茶皆设置了五个卖场 在贩售。因此,在每种颜色之下皆有五个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论