六西格玛:0203单样本置信区和假设检验_第1页
六西格玛:0203单样本置信区和假设检验_第2页
六西格玛:0203单样本置信区和假设检验_第3页
六西格玛:0203单样本置信区和假设检验_第4页
六西格玛:0203单样本置信区和假设检验_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3部分:,单样本置信区间和假设检验,第3部分:单样本置信区间和假设检验,目的:这一部分的目的是介绍连续数据的置信区间和假设检验。目标:了解假设检验和置信区间的基本原理- 确定所观测的差异是真实的,还是偶然因素引起的。计算样本平均值的置信区间,并将这一平均值与期望(或目标)平均值相比较。使用单样本置信区间和假设检验,将平均值与目标值相比较。,举例洗衣机传动装置的总高度将影响制动性能。项目Y是总高度,目标值=5.394,加工这种部件时所使用的固定架共有8个。您想了解什么?,使用第三个固定架生产出的部件的平均高度与目标值是否一致?,分析步骤:1. 将数据绘制成图2. 使用假设检验和置信区间来确定所观测到的差异是否真实。3. 得出结论。,设备3 的10 个部件的高度,用图形来表示数据,设备3中10个部件的高度5.3945.3945.3935.3945.3945.3955.3965.3975.3955.395,总体平均值的最可能的范围是多少?x(5.3947)与目标值(5.394)之间的差异是由于偶然因素造成的吗?,置信区间,设备3所制造的所有部件的平均值最可能的取值范围是什么?让我们来计算一下置信区间,以便找出该值!单个平均值的置信区间,(1-)100%置信度,真正的总体均值包含在置信区间内。,什么是t分布?类似于正态分布(z),正态分布(z):已知总体标准差,,t分布(t):估计的标准差, s,用于提供有关平均值的结论(置信区间和假设检验),我们将需要使用t分布,t = (x - )/(s / n),-,置信区间,其中:x = 样本平均值t = t表格中的t统计结果a = a风险df = 自由度 = n -1s = 样本标准差n = 样本中的数据点数量,置信区间上限值 = x + t(a/2, df),置信区间下限值 = x - t(a/2, df),用所给出的有关部件的数据代入以上公式,置信区间,计算利用设备3所生产的传输设备平均高度的置信区间使用=0.05(95%的置信区间)x = 5.3947s = 0.00116n = 10df = n - 1 = 9t(a/2,df)取自t表格。t (0.025,9) = 2.262,区间上限 = x + t (a/2, df),t表格,自由度为9, = .05/2 = .025,范例-续设备3所制造部件的平均值是否在目标范围之内?,设备3生产出的部件总体的平均值最有可能是5.3947,但实际值可能比该值大一点或小一点。,5.393,5.394,5.395,5.396,5.397,设备3,高度 (英寸),目标值 = 5.394英寸,平均值的95%置信区间,置信区间上限值 = 5.3955英寸,置信区间下限值 = 5.3939 英寸,设备3所生产的部件的总体平均值最可能的取值范围为5.3939到5.3955。,举例-续,置信区间说明以这种方式构成的区间的95%是正确的(包含真正的总体平均值),以此构成的区间的5%是不正确的。目标值5.394包含在此区间内。统计评价:没有证据证明设备3所制造部件的平均高度不在目标范围之内。实际评价:目标值刚好在置信区间内。计算时只用到10 个数据点,并且=0.05。您可以使用置信区间来进一步调查设备3获得更多样本(如果是实际的)并计算置信区间使用不同的值来计算置信区间,置信区间量化了数据的不定性。,样本大小对置信区间的影响,让我们取20个以上的样本(总数 n = 30),看一看对95%的置信区间有何影响。假设平均值和标准差保持不变:x = 5.3947 和 s = 0.00116 。,置信区间上限值 = x + t (a/2, df),置信区间下限值 = x - t (a/2, df),样本大小对置信区间的影响-续,通过增加样本,可以证明设备3所制造部件的平均高度不在目标范围内。,目标值 = 5.394英寸,n = 10 的95%置信区间为5.3939 - 5.3955.n = 30的95%置信区间为 5.3943 - 5.3951.唯一改变的是 n。,置信区间随样本容量的增加而减小。,对置信区间的影响,计算设备3所制造传送装置的平均高度的90%置信区间。取 n = 10 ( x = 5.3947,s = 0.00116),计算设备3所制造传送装置的平均高度的99%置信区间。取 n = 10 ( x = 5.3947,s = 0.00116),对置信区间有何影响?,对置信区间的影响,唯一改变的是 a。 我们能够以90% 置信度来说明设备3所制造的部件不在目标范围内我们不能以99%的置信度说来说明设备3所制造的部件不在目标范围内。,置信区间随着值的增大而增大。,另一种确定是否存在差异的方法:假设检验,置信区间给出了总体值(参数)的最可能的取值范围。假设检验用于确定所观测的差异是确实存在,还是偶然产生的。我们可以量化确实存在差异的置信程度。,所有 潜在“ X”,关键少数“ X”,定义假设:Ho 和 Ha,Ho假设检验的起点是零假设- H0。H0是相同或没有差异假设。举例:总体均值等于检验均值。Ha第二条假设是Ha- 备择假设,即差异假设。举例:总体均值不等于检验均值。,您通常想表明差异是确实存在的(Ha)。通过假定相等 (Ho)开始。如果数据表明它们不相等,则它们一定存在差异(Ha)。,和风险,风险:当H0为真时,拒绝Ho-有时称为厂商风险风险:当H0为假时,接受Ho-有时称为消费者风险,t 检验,t检验可用来检验:目标值(或检验均值)与计算的样本均值的对比 - 单样本t检验,或者两个计算的样本均值之间的对比 - 双样本t检验(将在第4部分进行讨论)让我们使用Minitab来执行单样本t检验。将设备3的平均值与目标值5.394进行比较。假设检验Ho: = 5.394Ha: 不等于5.394在Minitab中打开文件“ lth”L:6sigmaMinitabTrainingMinitabSession 2lth.mtw,点击“图形”,双击“确定”按钮运行,单样本检验 t-检验-利用Minitab,选择: Stat Basic Statistics 1-Sample t,点击两次“ OK”,运行,键入目标平均值,选择 Ha,单击 “ Graphs”,单击 “ Boxplot of data”,置信区间指出了总体平均值的近似值范围。,Hmmmm 5.394刚好在置信区间内。我们可能会进一步调查。,按目标均值进行设备3的单样本t检验,Ho 和 Ha的假设,置信区间指出总体均值的最可能的取值范围。,P值 0.05; 不能拒绝 Ho,5.394刚刚落在置信区间内。也许我们需要进一步调查。,请注意 不得将假设检验用作“行/不行”检验。所存在的差异是否真的很重要?,平均值的T-检验Test of mu = 5.39400 vs mu not = 5.39400Variable N Mean StDev SE Mean T Pfix 3 10 5.39470 0.00116 0.00037 1.91 0.089,有关差异的统计决策的三种方法,方法1如果计算值大于()表格(关键)值,则拒绝Ho,接受存在差异。方法2如果计算的p值小于(),则拒绝Ho,接受存在差异。方法3如果检验值(目标值)不在置信区间内,则拒绝Ho,接受存在差异。,这3种方法将得出相同的结论。,何谓p值?,p值的统计定义观察到的显著水平。当不存在差异时, 接受Ha,即接受存在差异的概率导致拒绝零假设的最小值。,这些都是很好的统计定义,但,我如何利用它?,如果 p ,则差异具有统计显著性。拒绝零假设,接受存在差异。将(1-p)看作存在差异的置信度。举例1:p = 0.001,则(1 - p) = 0.999或99.9%。您可以将99.9%看成是存在差异的置信度。举例2:p = 0.25,则(1- p) = 0.75或75%您可以将75%看成是存在差异的置信度。,单样本 t - 课堂练习,3. 写出有关设备3的平均值的结论。,设备1的10个部件的高度5.3905.3895.3905.3895.3885.3915.3915.3915.3915.389,1.计算设备1的95%置信区间的平均值。 n = _ x = _ s = _df = _置信下限 = _置信上限 = _2.进行假设检验,以确定平均值是否显著地不同于目标值5.394Ho: _Ha: _,正态分布对有关平均值的命题有多重要?,根据中心极限定理,平均值趋于正态分布,即使单个变量并不具备正态分布特征。只要样本不是太小,而且没有极端值,正态分布这个前提对于平均值的置信区间和假设检验正态分布通常不成问题。,关键概念:-第3部分置信区间与假设检验,1. 假设Ho:事物相同Ha:事物不同2. 置信区间:总体参数最可能的取值范围(与数据一致的值)。3.平均值 t检验是一种假设检验,用于将样本的平均值与目标值或与其它样本的平均值相比较。单样本t检验用于将样本平均值与目标平均值相比较。,关键概念:-第3部分置信区间与假设检验,统计风险错误:将实际上相同的事物说成不同(在装配线上拒绝合格的部件)风险:出现错误的风险 - 习惯上, 风险为5%(或 = 0.05)p值:所观察到的显著水平。在总体参数相同的情况下,观察到显著差异的概率。,如果观察到的显著水平(“ p”)小于可接受的风险(“ ”),则接受 Ha(否定Ho)。,如果观察到的显著水平(“ p”)大于可接受的风险(“ ”),则拒绝 Ha (不拒绝Ho)。,附录,定义假设,零假设假定总体/样本相同。公式选择实际应用Ho: 1 = 假定设备相同Ho: 1 - 2 = 0Ho: 1 = 2 = 3 =.nHo: 1 = 2Ho: 1 = 2 = 3 =. n,Ha是可以得到证明的唯一假设!,假设检验的九个步骤,1.定义问题/陈述检验的目的2.建立假设 - Ho和 Ha 陈述零假设(Ho):总体的参数相同 陈述备择假设(Ha ):总体的参数不同3.确定适当的统计检验(假设的概率分布:t、F、或x2)。4.陈述可接受的风险和风险水平:风险: 通常为 5%风险: 通常为 10-20%,假设检验中的九个步骤(续),5.使用检验灵敏度(/)确定样本大小6.制定抽样计划和收集样本7.根据数据计算检验统计值(t、F或x2)8.确定所计算的检验统计值由于偶然因素引发的概率(p值): 如果概率(p) ,则拒绝Ho并接受 Ha 如果概率(p) ,则不能拒绝Ho(无法得出结论)9.复制结果,并将统计结论转换为实际解决方案。,在每个假设检验中,我们都在努力证明Ha,有关假设的注解,假设代表了实际问题向统计问题的转换。在这种方法中,以各种术语来表述实际问题,以使其适于科学检验和检测。实质上,假设就是与给定概率分布的参数相关的命题;如平均值和/或方差。换句话说,假设是这样一些命题:使我们能够在进行调查之前提出所有可能的结果。在统计调查之后,我们只需接受或拒绝每个假设,反过来,这些假设又为我们制定现实生活中的实际决策奠定了坚实的基础。当以零假设表述时,假设通常的含义与偶发事件的分布相关。这种特殊的假设经常被称为“ 零假设”,并以“ Ho”表示。通常,它被称为“名义上的假设。”其意思非常简单-调查的全体参数相等;也就是说,我们所关心的所有参数(平均值和/或偏差)之间没有差异。直接与零假设相对的是备择假设(Ha)。这类假设一般与非偶发事件的分布相关,因而,被称之为“统计显著地不同”于偶发事件的分布,也就是说,观察到的存在于所调查的样本参数之间的差异不是源于样本的随机偏差。如果观测到的样本的差异不是偶发原因所致,我们可以得出结论,从一个或多个方面来说,样本不同于我们所调查的总体。因此,我们接受不相同的备择假设,并认为样本是从其它总体、而不是从我们所调查的总体中 抽取的。当接受或拒绝零假设和备择假设时,我们冒已知程度的风险、具有一定的置信度。为此,我们规定(在调查之前)了可接受的决策风险的大小(、)和检验灵敏度(/)。一旦选择完毕,我们就拥有了所需的信息来确定“合理”的样本大小。用于计算的数学等式确实存在;然而,我们必须将这些计算值与成本、时间和可用资源的实际限制范围相平衡,以便得出“合理的”抽样计划。,t分布的性质,如果总体分布为未知,我们可以通过随机取样来进行估计。当样本为无穷大时,则不存在估算误差;因此,我们可以应用正态(z)分布来发现偶发事件的概率。然而,随着样本大小的降低,我们的不确定性也不断提高;因此,对于同一概率,我们必须扩大预测的范围。换句话说,我们必须纠正z来弥补自由度的损

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论