两个统计总体的比较.docx_第1页
两个统计总体的比较.docx_第2页
两个统计总体的比较.docx_第3页
两个统计总体的比较.docx_第4页
两个统计总体的比较.docx_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章总体的比较到目前为止我们已经讨论了来自一个单一样本的数据分析。在许多环境下,我们需要比较2个或者多个总体。我们可以比较两个生产过程的平均值以及方差,去看看其中一个过程是否比另一个更加一致或精确。我们可以比较一个新的过程和标准过程,或者许多过程,去了解是否存在差异。在这一章中,我们将首先检查两个总体的比较问题,然后通过方差分析(ANOVA)表提出一个通用程序来比较任意数量的总体。6.1 两个一直均值和方差的比较假定我们有兴趣比较两个过程的平均值,其中我们认为观察值来自同一个总体。是来自第j总体的第i观察值,是这个总体的平均值,表示第j个总体中第i个观察值发生随机误差的概率。因此,这个问题的模型:其中,我们通常假定这些错误是独立的,同时服从平均值为0以及方差为的正态分布。正在研究的过程 可能有不同的平均值,因为他们代表不同的处理方法,如两种化学添加剂、两个分析测量设备,或两个操作计划。由于方差已知,通过标准正态变量我们可以用中心极限定理比较不同的处理方法;让, (6.1.1)其中是来自第j个处理方法的个观察值得平均值,是已知的方差。为了保证这些观察值得独立性,它们是随机抽取而获得的。因此,统计量的方差是。为了测验0假设:=0(或者是其它的值),或者是为了计算的置信区间。我们只需要参考标准正态偏差表。例 6.1 假设认为通过改变高速钻所在的冷却液流动速度可以使工具得寿命增加。为了检验这个假设,应用标准流动速率(过程1)能够得到7个观察值,同时从新的流动速率(过程2)中得到6个观察值,所有的13种试验随机排列。结果如下:由于-1.74比-1.645小很多(Pr(z-1.645) = 0.05),流动度率对工件寿命无影响的假设不成立。这个推理是基于一个显著性水平为5%单边的假设检验(I型错误概率)。6.2 两个方差的比较我们还可以检验两个方差是否相同。假设两个来源的观察值服从正态分布。其中一个处理过程比另一个更容易变化吗?更精确或者可以重复使用吗?要回答这些问题,我们首先应该估计每一个过程的方差,如下:每一个都服从分布,.为了检验0假设:,我们需要建立一个检验统计。我们用分布去检验一个独立方差的假设。要检验两个方差的相等性,我们使用检验统计,这个检验统计服从F分布。定义: 其中是含有2个变量的F分布。是所涉及比例的2个分布的自由度,雨分子相关和与分母相关由此可见:即,如果,服从的自由分布。因此,当:(即=1),检验统计服从自由度为的F分布。图 6.1 F分布从分布中期望获得什么样合理的值?一个处理左边尾部的F分布的有用的关系式如下:例 6.2返回到例6.1中工具寿命的问题,为比例方差建立一个90%的置信区间。假设估计的方差是:然后转换不等式的符号:从F分布图中可以看出,.0.067 1.45因此,我们能够相信置信度为90时坐落于0.067和1.45之间。于是,可以接受的假设。比较两个方差的标准近似法是把较大的值放在分子上,然后只测试:(其中).通过这种近似法,我们通过比较与相反的=4.39来检验与:=1相反的。然后我们就可以接受。(这是一个单边5%的测试,或者等价于一个双边10%的测试)。观察值得正常假设可以用来构建这种测试。通过比较不同的方差,偏离正态分布的方差可能引起重大的错误,这种错误会导致接受不相等的方差作为相等的方差,反之亦然。因此,在比较方差的时候,因该多加注意,特别是在认识与方差分布有关的问题上。6.3 两个未知的平均值和方差的比较当两个方差已知,在比较两个过程方式的不同时,这两个方差是否相等没有区别。我们简单地计算出相应的标准正态值,并把其与临界值进行比较。当方差未知时,我们继续像我们单一总体一样处理;即,我们用估计值代替,用t代替z. 然而,正如我们将要看到的,不相等的方差导致某些额外的困难。我们应该假设方差是相等的。这通常是一个合理的假设,因为数据的方差即是所涉及的错误的方差,Var(xij) = Var ( + ) = Var ().尽管过程可能已经被改变,我们通常还是用同样的设备和程序来获得数据,这些错误有时会大于过程可变性中的偏差。6 .3. 1 t分布检验,方差相等在比较2个总体的方法 上,其中,我们用下式:其中,是自由度为的t分布,因为这些自由度在因为这些自由度在联合估计方差中;如果的假设成立,然后我们期望的观察值尽可能的与不同。因此,同意参数的两个独立的估计是可用的,同时可以合并。由于在个体估计中有两个自由度(即通过和所得的均值),所以联合估计中有个自由度。如果,则在双边检验的级数为5%时,假设不成立。然而,这一统计数据,对于测试任何假设是是完全通用的。注意,如果:,有Var是最小的当这也可以认为我们用来估计。因此,如果我们假定(已知或者未知),为了最小化Var(),选择相等的样本,因此可以缩短相应的置信区间。如果,然后检验统计量减小为: (6.1.3)其中=n, 同时例6.3 再次考虑工具的寿命问题 给出下面的结果,检验。一个置信度为95%的置信区间是:然后这个95%的置信区间有:12.4 - 13.6 2.20 (0.66)-1.2 1.45(-2.65 0,b是分布的自由度。通过等价等式两边的前两阶矩,同时解出b,我们可以得到平均值检验的近似临界值。解出的值如下:因此,由于,所以服从一个分布。其中,分别用,则b的值就可以被估计出来, (6.1.6)注意:min () b .自由度的这种计算方法被称作Satterthwaites Aperoximation,该方法一般可以应用于将几个方差独立的估计结合成一个单一的总方差的估计。然而,在一些复杂的例子中,必须注意要保证估计方差之间相加而不是相减。在这样复杂的例子中,建议你咨询当地的统计学家!例6.4 来自例6.2中工具寿命的数据或者是Satterthwaites Approximation 6.3.3确定样本大小来比较两个样本的平均值在3.6节我们已经讨论过怎样决定检验一个类型I错误和类型II错误发生的概率的假设所需要的样本大小。具体来说,我们演示了如何找到所需的样本量n,以确保,当一个平均值的错误率不超过100%时,我们会拒绝一个真正的零假设,同时,当错误率不超过100 %,我们可以接受一个错误的选择性假设。如果分布的方差未知,可以从下式中直接确定所需样本的大小:如果方差未知,一个迭代过程可以应用于t分布,或所需的样本容量可以从表IX中查找。在处理比较两个平均值的问题上,我们同样可以这么做。让: 其中是我们用高的概率去检测的平均数的差值(即当是正确的概率比较小时,就接受)。检验统计假设是:其中,对于,当每个均匀的样本大小都相等时时,的方差最小。现在进行与3.6.3节相同的程序,可以发现:例 6.5 假如我们希望检测大小为的两个平均值的差值,如果它存在的话,其中是两个总体的标准偏差。如果我们允许拒绝零假设的错误率是,同时想要检测的准确率是95%,即,然后有:也就是说,如果我们想检验单边置信度为95%的以及当概率为0.95时检验,对于每一个均匀样本,我们需要6个观察值。如果方差未知,并通过获得数据进行估计,我们用t代替z,同时必须经过迭代法获得n.表X提供了这个例子中所需的样本尺寸。当,时,我们可以从表中找出n=7(对于每一个均匀样本).所提供的相等的方差的条件不是最重要的考虑,其条件是来自于每个总体的样本容量相同或者近似相同。然后,一个置信度为100y%的置信区间包含实际值的概率接近。对于相等的样本容量,t分布对假设的相等方差的偏离程度是不敏感的。做出这个假设的理由是很充分的。6.4 配对t实验为区分平均值而进行的一个非常大的方差估计不是一个不寻常的试验,因此,即使他们存在差异,我们也很难发现。这种情况与找一个未加工的高尔夫球不同!如果草方差很高,我们必须努力长期的寻找(大的样本容量)去寻找小球。如果我们能把草剪掉,我们有一个更好的机会找到我们所寻找的。经常发生的是,不是即将要检验的实验单元中存在较大的方差,而是在处理的方法中。假设我们要比较一个特定类型的合金样本的耐腐蚀性,未经处理的样本应该进行特定的化学方式处理。其中一组样本进行处理,另一组样本不进行处理,这能够使我们演示一个比较腐蚀性的t分布的试验。然而如果样本的耐蚀性观察值各不相同,我们将无法知道是否存在差异,也就是说试验不是非常的有效。如果合金样本的容量很大足够对经过处理的和未经过处理每组样本进行测试,将会怎么样呢?处理过的未处理的 然后我们可以对每个实验单元的腐蚀性结果进行比较(合金样本)。通过成对的抽取不同的观察值,比较两个平均值的试验就会转变成一个单独整体的问题。因,这个实验被称作配对t实验。分析过程如下经过处理的未经过处理或者标准的差值. 我们要注意以下内容:1、 自由度是n-1,而不是单个实验中的2(n-1)。其它的相等,自由度为2(n-1)的实验比自由度为n-1的实验更加有效。但是,所有的事情在这里是不平等的。通过比较每个实验单元的结果,我们减小样本观察值的方差,即已经排除了单元或者块之间的变化问题。2、 对于每一种处理方法的样本大小必须相等。3、 随机变量之间的方差可能相等,也可能不相等,实际上有可能是相关的,。在这个事实的发展过程中,配对t实验有时候也叫做相关t实验。用配对t实验比较平均值的优点是由于实验单元之间的差异,你可以忽略数据中的大量变量,因此也形成了一个更加有效的实验,假设一个大的变量存在。然而,一个重要的考虑是实验单元内的处理方法的比较有一个自然基础。自然配对的例子是测量值,而不是被指定为前后和有无这样的条件,或者像把同一钢锭用不同的设备分成两等分这样在同一实验单元中不同条件下所做的重复试验。如果你忽略了单元变量之间不存在的差异,由此产生的方差估计不会明显减小,但你的t统计量的自由度将会减半为(n - 1),而更准确的未配对的实验会有2(n - 1)个自由度。另一方面,如果因单元变量之间的差异过大不能忽略,则所导致的联合估计方差也很高。两个情况都会导致检验无效,即试验将会接受更多的零假设。然而有一个经验规则是,如果你怀疑一个单元块对单元变量有影响,使用自由度尽可能多的配对t试验。结果导致的错误要比没有配对的要少,并做一个不恰当的假设。例6.6 为了检验经过特殊化学处理的样本合金的耐腐蚀性,我们从合金试样中随机选取10个样本。每个试样的一半经过处理,另一半不经过处理。耐腐蚀性样本:实验单元或者块未处理的处理的差值样本平均值112. 1 14. 72.613.40210.9 14.03. 112.45313. 1 12.9-0.213.00414.5 16.21.715.3559.6 10.20.69.90611.2 12.41.211.8079.8 12.02.210.90813.7 14.81.114.25912.0 11.8-0.211 .90109. 1 9.70.69.40 ,即,假设不成立。经过处理的合金和未经过处理的合金在耐腐蚀性方面是有差异的。经过处理的合金的稳定性显著提高。6.5 t检验的假设比较t检验的时候涉及到三种基本假设,它们是:1) 正态假设2) 方差相等3) 相互独立由于我们是处理平均值,中心极限定理允许我们假设服从正态分布。尽管样本容量很小(n4),我们仍然需对个体观察值进行正态假设;尽管其没有真正的实际作用。在它产生任何有实质性的结果之前,必须让偏离常态的程度极端化。我们已经声明将t检验应用于不相等方差的理由是充分的。相等方差 的假设的一个解决方法是使用一个配对t检验。另一个方法是使用大小相等的样本去最小化出现错误结论的几率。然而,第三个假设,观察值的独立性,也是很重要的。(在一个配对t检验中,差值也是独立的)。为了保证独立性,应该进行随机化抽样。也就是说,像掷硬币或者使用一个随机数发生器一样,要随机的抽取观察值。我们需要选择一个适用于特定的随机响应的处理方法。在一个配对t检测中,我们要随机的选取要检验的单元,同时要随机选取一种首先被实用的处理方式(或者对于单元的一边)。6.6 k个方差的比较现在我们讨论比较两个以上的总体的问题。为了比较两个以上的方差之间可能存在的差异,有以下几种可行的方法,每一种方法都有难度:1. 哈特利的测试max-f试验对于k个总体以及,其中每个都有自由度,计算:临界值已经被列入到各种各样的表格中,同时k处于5%和1%的水平。然而,这些表格不是现成的。有一个来源是欧文的统计手册表,24。这种方法的一个额外的缺点是,对于每一个方差估值,最大的F分布会对相等的自由度产生限制。2. 科克伦测试这个测试是为了确定k个方差估计值中的某一个和其它的值是否在一直线上。所有的估计值必须有相等的自由度,同时一个估计值可以控制其它的值。同时,这个试验需要一个特殊的表而这个表不是现成的。见Dixon 和 Massey 8表A-17.3. 巴特利特的同性方差试验这个测试很普通,因为他不要求所有方差的自由度都相等。然而,它存在一个对正态假设的敏感度的问题,同时他的计算也是很繁琐的。它可以被编程,而且只需要使用一个标准的X表。对于k个自由分布的总体,有,其中,。例 6.7 4个方差的比较 K=4 正态总体 没有证据证明方差不相等。6.7 k个平均值的比较来自正态总体的任何数量的数据分析都可以通过方差分析表进行总结,或者通过ANOVA表进行简短的总结,或者用一个模型去代替这些情况。模型总是出现在数据分析中,但不幸的是常常没有被写出来。然而他也没有被隐藏在那里。在开始进行k个平均值得比较之前,这对于我们检验类似于检验单个平均值以及比较两个平均值这种简单问题的ANOVA表示有利的。6.7.1 方差分析的检验 对于来自单个样本的观察数据,模型如下:, (6.7.1)其中-是x的平均值,同时,i=1,2,n.平方和可以被看成是对数据中总信息量的测量。这可以分割成两部分:其中是估计均值中的信息占有量。信息仍然需要去衡量,-是错误所导致的,此式除以n-1,可以得到,也就是方差。这种形式叫做残差平方和,因为总体平均值估计之后剩下的残余值。残差值可以用于估计在获取样本观察值生发生的错误。平方和,一般用于数据中总变量的测量,同时也包含了观察值中所有变量的来源。定义根据被检查 的模型,方差分析是零部件中总变异性的分区。然后可以确定出这些零部件对数据中总变异性的重要作用。从模型(6.7. 1)可以看出,ANOVA表对分析做出了总结,如下:表6.1 的ANOVA表来源平方和自由度平均方差总和n平均值(CF)1残余值或者误差值n-1其中平方均值是平方和除以自由度得到的,同时被用于估计方差函数。为了检验假设,我们要首先算出的期望值,已知Var因此,如果成立,我们会发现 的估计值是。剩余平方和除以自由度叫做剩余或误差均方,并且实际上估计值,是最好的最公正的估计。除了随机误差,残差变量没有其它来源。因此,如果,和残差均方应该和估计值同时存在。我们可以通过F检验值检验这种假设,其中:也就是说,在假设的情况下,对的检验已经在两个独立估计的相等性试验中给予了解答。【注意:通过Cov,可以看出在统计上是独立的,其中Cov表示两个随机变量的方差。】如果计算所得的F值比临界值大,则假设不成立。【注意:】。例 6.8 冶金实验室有来自于经过电弧熔炼过程产生的一个锆合金的五个观察值,锆合金样本的重量分别是:90, 91, 93, 90, 和 94。ANOVA来源平方和自由度平均方差总和5平均值(CF)141952.8残余值或者误差值13.24(估计均值)平均值是91.6,方差是3.3。均值显著性的F检验是41952.8/3.3,同时也是很重要的。这和T检验是等价的。当一个F或者T检验拒绝零假设时,我们说所估计的参数是明显不同于假设值的。在这个例子中,平均值显然不同于0.6.7.2 通过方差方差分析来比较k个均值一个更有趣的问题是两个或者两个以上的均值是否相等。和这个问题有联系的模型是: (6.7.2)即,来自于第j个总体有个观察值,并且假定所有的总体方差相等。我们可以重新把这个模型写作:其中是总体的平均值,是 对已经来自于第j个总体的响应所产生的额外影响。通常被叫做处理效果。定义,一个线性约束,存在于处理方法中。由于对于所有的总体是通用的,所以检验和检验是等价的。我们可以按照以前的方法进行,同时根据总均值,我们也可以找出平方和,即。这就是通常所说的校正因子。剩余或者改正过的平方和是。这仍然包含一个来自于不同处理效果的变量源。总平方和可以划分如下:定义:,然后, 其中第一步是剩余平方和,第二步是对平方和的处理,最后一步是矫正因子(由于平均值)。则ANOVA将变成:表6.2 用于比较k个平均值的ANOVA表来源平方和自由度平均方差EMS总和N平均值(CF)1修正总值N-1处理值SSTk-1残余值或者误差值SSEN-k由于总体均值的差异或者仅仅由于处理结果,所处理的平方和代表数据的可变性,总体均值的估计就是样本均值;超过大均值的总体效应估计是。从附录D中可以看出处理方式中均方值得期望值,其中是实际处理效果。由于通过定义,这里的自由度是k-1而不是k。这种线性对比限制了估计的一个自由度。当然,参与方差均值,或者联合估计是不偏不倚的。处理方差均值可以看作是处理变量和残余方差均值之间的估计,其中估计在假设条件下的方差处理内估计,假设条件为:,对于所有的j都是相同的。方差比如下:这是对假设的一种检验,其中这些方差估计是兼容的,反过来说是对零假设的检验,对于所有的j。如果,我们可以预算所计算的F 值小于临界值。如果值更大,我们说假设不成立,此时所有的处理值相等。一般来讲,处理方法的均值可以和其他存在的变量源作比较,而这些变量源被忽略了,不在分析报告之中。例如配对t检验。考虑到模型: (6.7.4) j=1.2k i=1.2.n其中代表分区效应,并且一般情况下可以代表一个或者更多的效应,其中每一个都可以被独自分开。ANOVA表可以总结如下:来源平方和自由度平均方差EMS总和N平均值(CF)1修正总值N-1处理值SSTk-1MS(处理)限制值SSBn-1MS(限制)残余值或者误差值SSE通过减法运算得到(n-1)(k-1)和上面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论