版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
假设试验假设试验因研究蜜蜂的语言而荣获诺贝尔奖
以蜂王为中心组成的井然有序的蜜蜂社会的生活,究竟是以什么样的方式维持的呢?在很长一段时间,这是一大谜。特别是工蜂们的交流方式,人们几乎一概不知。
澳大利亚出生的动物学家卡尔·冯·弗里奇(KarlvonFrisch)(1886-1982),通过孜孜不倦的实验和观察,揭示了蜜蜂是通过舞蹈的方式向同伴通报花和蜜源的地点。
在野外采集到蜜和花粉的蜜蜂返回蜂巢后,在蜂巢上起舞,因此被称为“收获舞”。同时,弗里奇还发现,收获舞有“圆形舞”和“摆尾舞”2种。他花了近40年的时间研究揭示出:蜜蜂用舞蹈的形式代替语言,向同伴通报花所在的距离和方位,对维护和繁荣自己所属的蜂巢作出了贡献。
弗里奇于1965年完成了《蜜蜂的舞蹈研究》这一大作。并且,在1973年,与尼可拉斯·丁伯根(NikolaasTinbergen)和康拉德·罗伦兹(KonradLorenz)同时荣获了诺贝尔医学生理学奖。以前不受人关注的动物行为学(Ethology)随着这3名动物行动学家获得了诺贝尔奖,取得了全球性进展。因研究蜜蜂的语言而荣获诺贝尔奖
你在这里DOEDataAnalysisIMPROVEINSTRUCTORNOTES:HypothesistestingwasusedfordiscreteXsandcontinuousYs.RegressionisusedforcontinuousXsandYs.过程分析数椐分析组织原因假设试验回归分析控制定义测量改进分析你在这里DOEDataAnalysisIMPROVEINS目录
检测正态分布假设试验概述比较两组平均值:
t试验
假设试验的解释比较两组或更多组的平均值:ANOVA试验
比较两组或更多组的比例:χ²试验复习目录 检测正态分布检测正态分布复习:正态曲线定义:正态曲线是一种概率分布,最经常发生的值位于中间,其他概率向两侧对称下降。
此图形有时称为钟形曲线。复习:正态曲线定义:正态曲线概率标准正态分布将数据标准化为平均值=0标准偏差=1
正态分布使用实际数据平均值=17标准偏差=3
值Z值–30+3+2+1–2–1817262320111495.46%99.73%68.26%正态曲线概率标准正态分布正态分布值Z值–30+3+2+Z值:与标准正态值相同SX(兴趣值)Z-=-3-2-10123平均值 = 0标准偏差= 1此标尺上任何一处的Z值标准正态分布Z值兴趣值远离平均值有多少个标准偏差Z值:与标准正态值相同SX(兴趣值)Z-=-3-2-101Z值的概率标准正态曲线下的面积=概率Z值0的概率是多少?Z值2.84的概率是多少?-3-2-10123面积=1-3-2-10123概率=.5或50%面积=.5-3-2-10123兴趣值面积=?Z值的概率标准正态曲线-3-2-10123面积=1-3P值=尾部面积兴趣值以外的曲线下的面积处于或超过兴趣值的概率小的P值(0到.05)意味着:从该分布产生兴趣值的概率较小。可能从其他分布产生。P值是兴趣值的概率兴趣值兴趣值兴趣值兴趣值P值=面积P值=面积A+BAB拒绝域拒绝域拒绝域拒绝域接受域接受域接受域P值=P值是兴趣值的概率兴趣值兴趣值兴趣值兴趣值P值0123On-holdtime(min)并非所有数据都呈正态0123456#DefectsonInvoice
515253545CycleTime(days)仅在一个方向上有长尾巴的分布被称为不对称0123On-holdtime(min)并非所有数据都呈示例:使用正态曲线计算过程均方差要确定过程均方差,找到超出规格界限外的缺陷面积如果数据不是正态,使用方法2(在测量阶段已讨论)估计的缺陷面积就不正确,且不能如实表示过程均方差将正态方法用于非正态数据的后果USLUSL平均值阴影面积占多大百分比?对于正态曲线,此百分比值是不同的。示例:使用正态曲线计算过程将正态方法用于非正态数据的后果U受非正态数据影响的方法方法非正态的结果
过程均方差计算过程均方差值不正确单值控制图错误地发现某些特殊原因,丢失其它信号假设试验关于各组之间差别的错误结论回归错误地识别重要因素;较差的预测能力实验设计关于重要因素的错误结论;较差的预测
能力必须转换非正态数据
(在高级课程中讲授)受非正态数据影响的方法方法非正态的结果过程均方差计算过程均使用正态概率图检查正态以下是在Minitab(n=25)中生成的样本正态概率图。Graph>ProbabilityPlot如果数据是正态,那些点可连成一条直线。直线表示在95%的置信范围之内。如果大约95%的数据点落在置信范围内,可以说数据是正
态的。 95%置信范围使用正态概率图检查正态以下是在Minitab(n=25什么是正态概率图?数据值在
X轴上正态分布的百分点在Y轴上(线条的不等间隔是故意设置的)正态概率图正态分布中有十个间隔相等的百分点间隔相等的百分点将正态曲线划分为相等的区域百分点与正态概率图纵轴上的百分比匹配2030107080905010%10%10%10%10%10%什么是正态概率图?数据值在X轴上正态概率图正态分布中有十从两个正态概率图得出的结论结论偏离正态不严重结论偏离正态严重从两个正态概率图得出的结论结论结论使用Minitab:
检测正态分布1. 在Minitab中打开一个新(空的)作业表。2. 根据平均值=10,标准偏差=2的正态分布生成由25个数据点组成的随机样本,然后保存在
C1中:Calc>RandomData>Normal>...使用Minitab:
检测正态分布1. 在Minita使用Minitab:
检测正态分布(续)3. 用刚保存在C1中的随机数据创建直方图:Graph>Histogram>789101112131401234567C1频率您的结果与此图不同使用Minitab:
检测正态分布(续)3. 用刚保存在使用Minitab:
检测正态分布(续)4.用保存在C1中的随机数据创建正态概率图:
Graph>ProbabilityPlot您的结果与此图不同您得到什么结论?使用Minitab:
检测正态分布(续)4.用保存在假设试验概述假设试验概述什么是假设试验?假设试验汇总了数据,这样您可检测到不同组之间的差别。假设试验用于在两个组或更多组之间进行比较。数据类型可以比较什么
示例
连续
比例
供应商A的按时交货比例是否与供应商B的相同?
离散平均值
变化
形状或分布
三个班次的平均产量是否相同?采用新方法的小组的结果与采用旧方法的小组的结果相比变化较小吗?采用不同的方法周期的分布有何区别?什么是假设试验?假设试验汇总了数据,这样您可检测到不同组之间为什么使用假设试验?发现对于经营业务具有重要意义的差别。为什么使用假设试验?发现对于经营业务具有重要意义的差别。何时使用假设试验当您需要比较两个组或更多组的以下因素时平均值可变性比例
当您无法确定是否存在真正的差别时何时使用假设试验当您需要比较两个组或更多组的以下因素时如何使用假设试验确定适合于您的数据和问题的检验类型在Minitab中合适安排数据从Statistics选项菜单选择适当的检验从Minitab输出获得p值;如果p<.05,则宣称统计上有重大的差异如何使用假设试验确定适合于您的数据和问题的检验类型比较两组平均值:
t试验比较两组平均值:
t试验:比较两组平均值的统计检验使用称为
t试验(使用Minitab)的统计检验来判断两组平均值之间的差异。
t分布:比Z分布有更大的变化(因此尾部有不同的面积,这表示不同的
P值)。其变化范围取决于自由度(df)。我们不详细解释
df;可把它看作是估计这两组的平均值和标准偏差之后样本中残留的信息量。是适当的,因为我们估计了平均值和变化(并经过统计理论证实)。t试验:比较两组平均值的统计检验使用称为t试验(使使用Minitab:比较两组的
t试验数据:C:\ProcEx\Hypo_Mod\Research.MTW1. 打开
Minitab作业表。它包含使用标准方法的100个生长周期和使用新方法的50个生长周期的时间。2. 按方法绘制研究时间的分层点图:Graph>Dotplot>(选择‘Std’和‘New’作为变量)>(选择“eachcolumnconstitutesagroup”)使用Minitab:比较两组的t试验数据:C:\P3. 对这两种方法的平均时间之差做
t试验:Stat>BasicStatistics>2Samplet…>Graphs>(选择两个图)不要选择此框如果所有数据在一列中,而组标签在另一列中,则使用此按钮
(我们使用的数据没有这样设
置)。使用Minitab:比较两组的
t试验
(续)3. 对这两种方法的平均时间之差做t试验:不要选择此框使用Minitab:比较两组的
t试验(续)使用Minitab:比较两组的t试验(续)使用Minitab:比较两组的
t试验(续)结论因为
P值很小(<.05),因此可得出结论:这两种方法的平均研究时间有统计上重大的差异。(或者这两种方法的平均研究时间不同。)注意:P值不是先前报告的.0007,因为使用
t分布比正态分布更适当。两个样本
t试验和置信区间Std与
New的两个样本TN平均值StDevSE平均值Std10015.031.880.19New5014.111.540.22muStd-muNew的95%CI(置信区间):(0.35,1.49)
t试验
muStd=muNew(与不是=):T=3.19P=0.0018DF=117t
值观察P值得出结论。它是否<.05?平均值的标准误差=平均值的标准偏差Std-New平均值之差的置信区间(下一页中讨论)对话窗口输出使用Minitab:比较两组的t试验(续)结论两个样解释置信区间95%置信区间是应包含这两组平均值之间的真实差异的值的范围。它基于平均值的差异分布,而不是个别观测数据之间的差异。它不表示我们希望的个别生长周期之间的差异值的范围;该范围应该更宽。如果组平均值之间没有显著差异,置信区间将包含0(即范围从负数[–]到正数[+])。解释置信区间95%置信区间是应包含这两组平均值之间的真实差示例哪一组较快?因为
(AveSTD–AveNEW)
是正数,标准方法时间较长,而新方法时间较短(较快)。快多少?我们有95%把握认为新方法平均要比标准方法快大约.35小时到1.49小时。个别值的差异分布平均值的差异分布(AveStd-AveNew)平均值差异的95%置信区间(.35小时到1.49小时);注意它不包含0解释置信区间(续)示例个别值的差异分布平均值的差异分布平均值差异的95%置
t试验总结:比较两个平均值
t试验是比较两个平均值的假设试验。假设两组平均值相同。它们的差=0如果
P值很小,则拒绝该假设。按照惯例,如果P值<.05则被视为小值常用符号
虚(无效)假设
H0:meanA=meanB
替代(备择)假设Ha:meanA
meanBt试验总结:比较两个平均值t试验 替代(备择)假设
t试验总结:比较两个平均值(续)步骤1. 使用
Minitab计算数据的
t统计值并提供
P值。2. 如果
P<.05,拒绝虚假设(组平均值相同),接受具有95%置信度的备择假设(组平均值不同)。3. 如果
P不是很小(.05),则可得出结论:拒绝虚假设没有足够的证据。有下列可能的解释:a. 这些组相同,或b. 变化过大或样本过小无法检测到差异。t试验总结:比较两个平均值(续)步骤练习2:使用Minitab和
t试验比较两组
平均值目的:练习使用
Minitab进行
t试验以比较两组平均值并得出结论。时间:15分钟数据:C:\ProcEx\Hypo_Mod\Techno.MTW背景:一个工具材料供应商声称其产品可增加您部门一台极重要的机器的日加工件数。它安排在该月的前五天(您的企业最忙的时间)进行一次实验,以演示该产品。下面是实验结果,还有上个月前五天的数据,以便进行比较。日期件数
材料8/110050Std8/29028Std8/312579Std8/48189Std8/513316Std9/110124New9/210860New9/315087New9/49633New9/512251New上个月当月为了使条件一致,加工检验仅比较白班的完整加工周期。练习2:使用Minitab和t试验比较两组
平均练习2:使用Minitab和
t试验比较两组平均值(续)指示:
1. 使用
Minitab分析数据。2. 分小组讨论并回答下列问题。准备报告您的结论。a. 数据是否支持供应商的声称?b. 您是否将购买该产品?c. 如何提高确定是否购买该产品的决定能力?d. 购买该产品衍生的问题是什么?练习2:使用Minitab和t试验比较两组平均值练习2:答案问题1:Minitab输出练习2:答案问题1:Minitab输出练习2:答案(续)描述性统计数字变量
材料
N平均值
中值
TrMeanStDevTransactNew51159110860115912190
Std51063210050106322229变量 材料
SE平均值
最小值
最大值
Q1Q3TransactNew979963315087987813669
Std997818913316860812948新方法平均值要高959件两种材料都有相当大的标准偏差。这样很难辨别真实差异。练习2:答案(续)描述性统计数字变量 材料练习2:答案(续)问题1:Minitab输出(续)置信区间范围从负数到正数,并包含0P值
.05两个样本
t试验和置信区间材料的两种样本
T材料 N平均值标准偏差SE平均值New5115912190979Std5106322229997mu(New)-mu(Std)的95%置信区间:(-2348,4265)
t试验
mu(New)=mu(Std)(对比不等的情况):T=0.69P=0.51DF=7练习2:答案(续)问题1:Minitab输出(续)置信练习2:答案(续)问题2a&2b:数据不支持供应商的声称。两种方法的平均日加工件数之间没有显著差异。即使在这5天抽样中平均多生产959件,也没有足够的证据可以作为购买新材料的原因。不能将差异与随机变化区别开来。练习2:答案(续)问题2a&2b:数据不支持供应商的问题2c&2d:改进分析要提高检测真实差异的能力,您可:构建一个加工变化前后(例如前3个月)生产的件数控制图,以观察这五个数据点是否适合季节或月周期。收集更多数据(增大样品大小
n)以进一步减少平均值的变化。比较工具磨损模式以检测这两种材料中的其它差异。练习2:答案(续)问题2c&2d:改进分析练习2:答案(续)将
t试验应用于您的企业考虑要点考虑两组之间的差异不明显—而两组平均值的
t试验却可能有用这一情况。如果对您的数据使用
t试验,推测作结论时您所做的假设。(下一节我们将深入讨论。)需要澄清什么问题?将t试验应用于您的企业考虑要点假设试验的解释假设试验的解释假设试验如何作用因为变化,没有完全相似的两件事。问题:您在样本、组、过程等等之间看到的差异是由于随机的普通原因变化,还是由于存在真实差异。为了确定这点,不同的假设试验可提供不同方法来评估在不同情况下的普通原因变化。它们检验在该情况下一个差异是否明显要比预期的普通原因变化大。如果答案为否,则差异没有统计证据。如果答案为是,则可推断这些组明显不同。假设试验使用更大的样本,因为平均值的变化随着样本大小的增大而减小。假设试验如何作用因为变化,没有完全相似的两件事。什么是假设试验?检验虚假设—H0:组之间没有差异
与备择假设相反—Ha:组不同
获得虚假设的
P值—使用数据和适当的假设试验统计数字获得
P值(使用
Minitab)。如果
P<.05,则拒绝
H0
并决定使用
Ha如果
P.05,不能拒绝
H0什么是假设试验?检验虚假设—为何使用假设试验?当无法确定是否存在真实差异时使用假设试验。例如,分层点图显示组平均值之间没有明显差异:您想知道平均值的微小差异是由于随机变化还是反映了真实差异。假设试验比分层点图提供更明确的结果(如果假设满足的话)。为何使用假设试验?当无法确定是否存在真实差异时使用假设试验。假设试验的假设如果数据是连续的,我们假设基本分布是正态。您可能需要转换非正态数据(如周期)。当比较不同总体的组时,我们假设:独立样本。通过随机抽样实现。样本是总体的代表(没有偏差)。当比较不同过程的组时,我们假设:每个过程都是稳定的。没有特殊原因或随时间的变化
(没有与时间相关的差异)。样本是过程的代表(没有偏差)。这就是假设试验是一种高级工具的原因。除非过程符合标准,否则此假设不容易满足假设试验的假设如果数据是连续的,我们假设基本分布是正态。这就P值定义假设试验比较观测到的组之间的差异。假设真实差异为0(=虚假设),P值等于获得观测差异的概率。P值范围从0.0到1.0(0%可能性到100%可能性)。按照惯例,通常将
P<.05视作是差异明显的象征。如果
P<.05,则可推断真实差异为0的概率很小。P值定义假设试验比较观测到的组之间的差异。讨论:解释P值有多种方法来陈述根据P值得到的结论。您认为下面哪些最容易理解?P值用于判断观测到的组之间差异是否明显大于普通原因(随机)变化(如果P<.05,结论是肯定的)。如果
P<.05,则拒绝
H0
而决定使用
Ha。P<.05意味着组来自相同分布的概率小于5%。P值确定观测到的差异是否在统计上看较显著(如果
P<.05,结论是肯定的)。假设真实差异为0,P值等于获得观测差异的概率。如果
P值很小(<.05),我们说观测差异必须显著,因为如果没有真实差异,我们从样本中观测到这类差异的概率就较小。P值用于判断抛弃虚假设是否有足够的统计证据(如果
P<.05,结论是肯定的)。讨论:解释P值有多种方法来陈述根据P值得到的结论。您假设试验的类型假设试验目的
t试验成对
t试验ANOVA(F检验)
(方差的分析)
χ2试验比较两组平均值当数据匹配时比较两组平均值比较两组或多组平均值比较两组或多组方差比较两组或多组比例将在高级课程中解释成对
t试验,ANOVA
和
χ2试验法。假设试验的类型假设试验目的t试验成对t试验ANOVY(输出)
X(输入)
连续离散
(比例)离散(“组”)连续Χ²试验
t试验成对
t试验ANOVA逻辑回归回归不同数据类型的适当分析方法当输入(X)变量是离散变量时,使用假设试验。将离散
X当作“分组”或由分层变量来看X。示例:如果您希望按产品比较周期,那么不同产品类型就是离散
X。如果
X数据是连续的,则使用回归分析判断它们是否与输出(Y)变量
相关。假设试验回归分析YX连续离散
(比例)离散连续Χ²试验t试验逻辑回归回我使用哪种分析方法?
否,X是连续的回归主题χ²检验ANOVAt检验否,Y是离散的(比例)否,比较更多的组(平均值或方差)是是是是成对
t试验
否,比较两个独立的组平均值将两组平均值与匹配的数据相比较X是否
是离散的?
(组)Y是否
是连续的?仅比较2
组吗?Y1是否与Y2匹配我使用哪种分析方法?否,X是连续的回归主题χ假设试验中的两种误差实际(真相)组相同组不同接受Ho组相同结论或决定拒绝Ho
组不同没有错误
第一类误差没有错误我们基于假设试验所做的任何决定都有四种可能结果:我们可决定这些组是相同还是不同,以及我们可能是对或错。第二类误差实际(真相)无罪有罪无罪无罪有罪&释放结论或决定有罪无罪&入监狱有罪司法举例:所有的误差都是重要的偏重于一类误差会增加产生另一类误差的风险增加采样样本数量:降低第二类风险可探测到更小的差异.假设试验中的两种误差实际(真相)组相同组不同接受Ho组相同结
α=一类误差(TypeIError),β=二类误差(TypeIIError)。SARS新药临床试验必须设立对照组,因为对照试验的目的为比较新药与对照药物二组治疗结果的差别有无统计学显著意义。由于临床治疗中所获得的疗效可能由药物引起,也可能由非药物的因素如休息、疾病或症状自愈等引起。当A药与B药治疗结果出现差别时,首先要确定这种差别是药物因素造成的还是非药物因素引起的,如A优于B不是由药物因素引起而是非药物因素偶尔造成,称为假阳性。统计学上用无效假设(NullHypothesis)来处理假阳性误差,先假设A与B两药药效之间并无差别,所出现的差别可能是非药物引起的概率(Probability),当这种概率小到一定程度时,如<5%或<1%,则前者95%或后者99%的差别是药物之间的差别所引起,这就显示由机遇(概率)所造成的可能性很小,从而否定了前面假定的无效假设,证明A药疗效优于B药不是概率引起而是药物本身存在疗效差别所引起。临床上把这种可能存在的假阳性误差称为I类误差,用α值表示,当α=0.05,说明A优于B的结论是在95%显著性水平上排斥无效假设的,也就是说A优于B由药物因素引起的可能性为95%(置信度95%,仍有5%假阳性的可能性;若α=0.01,则A优于B的假阳性只有1%的可能性.临床试验中另一种误差为假阴性误差,用β值表示。有时,A药与B药二药之间实际上存在着药物本身的差别,但在临床试验中由于区别这种差别的方法不够灵敏或能力有限而区别不出来,就是假阴性误差即II类误差,统计学上允许假阴性误差不能超过20%,即β值一般定为0.1,不能>0.2。1-β为试验中区别两种差别的能力,即获得A优于B这一结果的把握度,如β=O.2,则1-β=0.8,说明A优于B的把握度为80%。在临床试验设计中α值定得愈小,A药优于B药的显著意义愈大,假阳性愈小,但试验所需病例数也就愈多;β值定得愈小,1-β值就愈大,A药优于B药的把握度就愈大,但病例数也就需要愈多。通常临床试验中。值可定为0.05,β值定为0.2,已能满足统计学要求。假设试验中的两种误差举例:SARS新药假设试验α=一类误差(TypeIError),重要差异与显著差异显著但不重要的差异有时,您检测到一个统计上显著的差异—但它小到对您的企业没有实际的重要性。示例:安装机器的两种方法新方法明显要比标准方法快大约10分钟。要证明实施新方法的成本是适当的,有必要减少30分钟。重要差异与显著差异显著但不重要的差异重要差异与显著差异(续)重要但不显著的差异有时,一个差异在统计上不能说是显著的,但该观测差异对于您的企业而言却很重要。示例:密封容器的两种方法在实验时观测到每班增加1000个容器。增加1000个对企业很重要。新技术有更高的平均值,但在统计上却不能宣称有显著的差异(因为
P.05)。观测差异由于随机变化而产生且不存在真正的差异,或者变化太大(或样本大小太小)不能检测到差异。企业领导者需要决定是否值得冒险实施新方法。如果存在真正的差异,您最好实施新方法。但是如果新方法产生相同的结果,则只会徒劳无功。重要差异与显著差异(续)重要但不显著的差异在假设试验中处理非正态连续数据方法找到一种使数据近似为正态的转换方法。对转换的数据进行“假设试验”。注意:数据转换将在高级课程中涵盖。在假设试验中处理非正态连续数据方法比较两组或更多组的平均值比较两组或更多组的平均值我采用哪种分析方法?Xs是否离散(组〕
只比较2组?
Y1’s是否
与Y2与Y2‘s相匹配?否,Xs连续回归主题ANOVAt-试验否,比较多组(平均值方差〕)是是配对t-试验否,比较两组独立组平均值采用匹配数据比较两组平均值比较平均值?
等方差试验否,比较方差)是
Ys是否连续?X²否,Y离散比例)是是我采用哪种分析方法?Xs是否离散只比较2组?Y1’讨论:你如何比较7组?一个改进小组有兴趣比较一下7个不同的包装材料供应商,它们在不同材料上生产的平均废品总量是否存在任何明显差异你如何进行7个组的比较?你如何能同时发现7组的差异?讨论:你如何比较7组?一个改进小组有兴趣比较一下7个不同的讨论:答案点图有助于你观察比较7个组,但从数学上,你只能同时比较2个组,不能同时比较7个组。如果你进行配对比较,每次比较2组,你最终会做21个t试验这没有有效的运用时间和数据(估计方差)你也增加了犯I类错误的可能性(至少比较之中有一次)*我们必须寻求更好的方法来同步比较小组来有效利用所有的数据*TypeIerrorrate=1-(.95)21=.66=66%.讨论:答案点图有助于你观察比较7个组,但从数学上,你只能同方差分析以寻找平均值差异有一种统计的方法是运用方差来同步比较多个小组的平均值称为ANOVA:方差分析与配对比较平均值不同,它将组间方差与组内方差进行比较组间方差即由该小组平均值的s2获得
组内方差即由各组的s2
与所有小组合并后(或与适当的自由度进行平均〕 获得如果组间方差与组内方差相同,我们认各为组间平均值没有差异方差分析以寻找平均值差异有一种统计的方法是运用方差来同步比较分析方差而非平均值,续
右图有助于理解7个小组的“组间” 和“组内”方差 (
认可每条线为居中的正态分布)由图可以看出,组内变化小于组间变化,因此,试验可能会体现至少有一组与其他组存在差异。分析方差而非平均值,续
右图有助于理解7个小组的“组间”方差分析(ANOVA)获得组间方差获得组内方差如果它们相同,可断定各组间无明显差异:计算比率:两方差比率=F-统计
我们可以从F-分布中获得P-值 Minitab菜单:
Stat>ANOVA>Oneway意味着各小组间平均值无差异方差分析(ANOVA)获得组间方差意味着各小组间平均值无差ANOVA假设虚假设:H0:平均值A=平均值B=平均值C=... (或)
小组平均值无差异 (或)
=替代假设:Ha:至少有一组的平均值与其他组相比存在明显差异ANOVA假设虚假设:ANOVA假设,续如果p.05不拒绝H0没有充分的证据说明任何小组间存在统计意义上的明显差异。如果确实存在差异,那么要么是变差过大或样本太小而不能被察觉。如果p<.05拒绝H0,决定使用Ha至少有一组与其他组存在统计差异检查置信区间以发现哪组有差异(非重叠)措施:评估重要性和差异大小(足以保证进一步的措施?)ANOVA假设,续如果p.05使用Minitab:ANOVA数据:
C:\GENSixSigma\Hypo_Mod\Forms.MTW背景:一组数据包括保险面额,它是7个不同的险种(定义为A-G)的15个条款,总计105个条款.1. 按照险种的面值编制分层点图:
Graph>dotplot>(ByForm)使用Minitab:ANOVA数据:C:\GENSi使用Minitab:ANOVA,续2. 获得数据汇总:
Stat>BasicStatistics>DescriptiveStatistics>(FaceAmtbyForm)使用Minitab:ANOVA,续2. 获得数据汇总:使用Minitab:ANOVA,cont.3.方差分析(ANOVA)
或F-试验:
Stat>ANOVA>OnewayUsethismenuiftheYdataareinonecolumnandthegrouplabelsareinanothercolumn.Ifeachgroupisinitsowncolumn,usethe"Oneway(Unstacked)"menu.只检查框图和点图使用Minitab:ANOVA,cont.3.方差分使用Minitab:ANOVA,cont.
使用Minitab:ANOVA,cont.使用Minitab:ANOVA,cont.问题3:Minitab输出“平方和”One-wayAnalysisofVarianceAnalysisofVarianceforFaceAmtSourceDFSSMSFPForm
65394138990211.560.000Error987622407778Total1041301653
Individual95%CIsForMean
BasedonPooledStDevLevelNMeanStDev-------+---------+---------+---------A15446.00100.56(----*---)B15277.33105.46(----*---)C15376.67102.72(----*---)D15384.0082.27(---*----)E15476.0065.01(----*---)F15514.6771.70(---*----)G15414.0080.78(---*----)-------+---------+---------+---------PooledStDev=88.19300400500组间方差是组内方差的11.5倍圆括号表示小组平均值的置信区间(非单值〕
由P值得出结论我们假设所有小组的方差相同
方差
之间以内使用Minitab:ANOVA,cont.问题3:使用Minitab:ANOVA,cont.结论由于p<.05,拒绝H0,判断至少有一组与其他组有明显差异根据置信区间:险种B的平均面值比其他险种明显低。险种F的平均面值比B,C,D,G的明显高,但不比A,E的明显高ANOVA表明当使用险种F,E或A时,其保险面值要明显高一些。采用其他的原则(如成本,易用或其他客户调查)来
选择这三项险种使用Minitab:ANOVA,cont.结论ANOVA假设样本代表母体和过程过程是稳定的.过程中只有正常原因引起的波动在起作用随着时间的推移没有移位和趋势出现(没有与时间相关的异常原因)各组的方差相同可采用F-试验进行验证(参见下节)对假设的违背能导致在ANOVA分析中出现错误的判断.同样假设每组的基本分布也是正态分布,这可以用在回归模块中已经讨论过的残差正态概率图进行检查。ANOVA假设样本代表母体和过程比较两组或更多组的比例:χ²试验比较两组或更多组的比例:我采用何种分析方法?Xs是否离散(组〕
只比较2组?
Y1’s是否
与Y2‘s相匹配?否,Xs连续回归主题ANOVAt-试验否,比较多组(平均值方差〕)是配对t-试验否,比较两组独立组平均值采用匹配数据比较两组平均值比较平均值?
等方差试验否,比较方差)是
Ys是否连续?X²否,Y离散比例)是是我采用何种分析方法?Xs是否离散只比较2组?Y1’Y(输出)
X(输入)
连续离散
(比例)离散(“组”)连续Χ²试验
t试验成对
t试验ANOVA逻辑回归回归不同数据类型的适当分析方法当输入(X)变量是离散变量时,使用假设试验。将离散
X当作“分组”或由分层变量来看X。示例:如果您希望按产品比较周期,那么不同产品类型就是离散
X。如果
X数据是连续的,则使用回归分析判断它们是否与输出(Y)变量
相关。假设试验回归分析盒图,点图分层图分布图所有列出的图形的产生基于X和Y的数椐类型的测量数椐集合YX连续离散
(比例)离散连续Χ²试验t试验逻辑回归回离散的X和Y数据离散Ys示例:技术要求符合性(在要求之内,之下,之外)客户满意度(差,一般,好,优)包装缺陷类型(产品编码错误,纸箱损坏,缺隔板,等.)记录每个的属性可以数数每种属性的个数个数通常在表格中进行汇总(表格称为列联表)离散的X和Y数据离散Ys离散的X和Y数据,续.离散Xs示例地点(NY,LA,Denver)方法(标准的,新的)产品类型(A,B,C,D)将数据分组(它是分层的或跟随某变量)“随着地点结果有何不同?”离散的X和Y数据,续.离散Xs实例分析:不同地点的包装抱怨是否存在明显差异?一个团队正在进行一个持续改进项目以减少一主要客户在A产品中发现的包装错误。全国共有4个生产地点,团队有兴趣了解是否针对这4个生产地点的抱怨明显不同,以此来确定项目的今后步骤。对一个月前的发货进行抽样和评估以报告包装的问题按照不同地点的包装抱怨汇总如何使用数据来回答这个问题“地点不同,抱怨率是否明显不同?”
东北
东南 中部 西部 总计有包装抱怨
的发货
次 46 17 5 21 89
无包装抱怨
的发货
次 270 186 102 223 781
总发货次 316 203 107 244 870地点离散X离散Y实例分析:不同地点的包装抱怨是否存在明显差异?一个团队正在
实例分析:不同地点的包装抱怨是否存在明显差异?使用比例法进行理解使用比例(或百分比)让你比较不同的类别样本大小(或机会面积)你得出什么结论?不同地点的抱怨率是否明显不同?在虚假设的基础上即所有地点具有相同的错误率,你如何计算P值?
东北 东南 中部 西部 总计有包装抱怨发货 15%8%5%9%10%
无包装抱怨发货 85% 92% 95% 91% 90%
总发货 100% 100% 100% 100% 100%地点实例分析:不同地点的包装抱怨是否存在明显差异?使用比例法计算期望值假设不同地点间不存在实际差异来计算各数据的期望值:如果各地点间确实不存在差异,我们可以看到观测值与期望值接近X²分析实例续
地点东北东南中部西部Obs.Exp.Obs.Exp.Obs.Exp.Obs.Exp.总计有抱怨发货
4632.31720.8510.92125.089无抱怨发货
270283.7186182.210296.1223219.0781总发货316203107244870计算期望值X²分析实例续地点东北东南中部西部Obs.
X²分析实例续
c2
(c2)统计用如下方法来测评观测值与期望值的差异:X²分析实例续c2(c2)统计示例:
将运用c2分布获得本统计的P值。Minitab菜单:
Stat>Tables>Chi-SquareTest
X²分析实例续在表中计算一个单元的值,等式包括所有单元示例:X²分析实例续在表中计算一个单元的值,等式包括所
X²分析实例续X²分布0尾巴面积=P-值c2X²分析实例续X²分布0尾巴面积=P-值c2假设X²试验虚假设H0: 各组比例相同替代假设Ha: 至少有一组的比例与其他组不同假设X²试验虚假设假设X²试验,续
如果P.05不拒绝H0
没有充分的证据说明任何小组比例间存在统计意义上的明显差异。如果P<.05拒绝H0,决定使用Ha至少有一组比例与其他组存在统计差异假设X²试验,续如果P.05使用Minitab:X²试验,续数据:
C:\SixSigma\Hypo_Mod\Complaints.MTW1. 在汇总的—非原始的—数据上进行X²试验:Stat>Tables>Chi-SquareTest使用Minitab:X²试验,续数据:C:\Six使用Minitab:X²试验,续.*我们刚才使用了MINITAB的两种方法进行X²试验:一种方法适合于原始数据,而另一种适合于表中的汇总数据。两种方法得到了完全相同的X²值和P值。当然,如上所示,汇总数据中体现的每个单元的X²值可以用来确定哪组的比例值与其他组的明显不同。计算每个单元的x²,将高值画上圈
*X²试验期望值置于观测值之下
NEastSEastCentralWestTotal146175218932.3320.7710.9524.962270186102223781283.67182.2396.05219.04合计316203107244870Chi-Sq=5.784+0.683+3.230+0.629+0.659+0.078+0.368+0.072=11.502DF=3,P-Value=0.009抱怨无抱怨由第3项可以得到相同的结论,至少有一个抱怨率与其他的明显不同
使用Minitab:X²试验,续.*我们刚才使用了既然你有一个明显的X²,下一步作什么?1.确定哪个组比例不同。
2. 确定为什么这个组比例不同。既然你有一个明显的X²,下一步作什么?1.确定哪个组比例1.确定哪个组比例不同结论北部地点的抱怨率明显较高,中部地点抱怨率明显较低。抱怨比期望多
抱怨比期望少东北地点和中部地点的抱怨在X²总和中占的比重最大Chi-SquareTestExpectedcountsareprintedbelowobservedcounts
NEastSEastCentralWestTotal146175218932.3320.7710.9524.962270186102223781283.67182.2396.05219.04Total316203107244870Chi-Sq=5.784+0.683+3.230+0.629+0.659+0.078+0.368+0.072=11.502DF=3,P-Value=0.009抱怨无抱怨1.确定哪个组比例不同结论抱怨比抱怨比东北地点和中2.确定为何小组比例不同注意!查询差异的原因而非进行责备!当一组的错误率明显比其他各组(系统〕高容易导致责备,但最好把它当作改进的契机成为数据侦察员首先问如下4方面的问题工作划分:这类工作是否不同?(也许复杂的工作应分配给经验丰富的人,提高错误率.)工作方法:工作软件,硬件和方法与其他小组相比如何?工作流程:是否有标准流程,是否使用,人员是否经过培训?个人差异:生理差异(视力,左撇子,等.)是否影响了工作能力?下一步,它们“离群”的时间有多长?如果只是现在,也许是由于最近的变化是导致的。2.确定为何小组比例不同注意!查询差异的原因而非进行责备X²试验的假设样本代表母体或过程我们假设用于X²试验的离散数据的基本分布为二项分布每个单元的期望值5,否则试验无法恰当进行如果期望值<5,可能需要收集更多的数据(更大的样本)
X²试验的假设样本代表母体或过程X²试验值在制造业中,通常收集离散数据来分析服务过程的表现情况如果两组或多组间没有明显差异也就避免了疑神疑鬼可以从学习先进或鼓励后进上有所收获可以发现小组比例间的明显差异当P-值小(<.05)表明有必要确定可能导致小组间明显差异的根源检测每个单元的x²值以确定存在差异的小组记住考虑是否“统计明显”的比例差异的大小才是对经营具有真正重要的意义。X²试验值在制造业中,通常收集离散数据来分析服务过程的表现情练习5:
运用Minitab进行X²的试验目标:采用MINITAB进行X²试验并分析结果.时间:15分钟.数据:
C:\SixSigma\Hypo_Mod\Mailers.MTW背景:我们一直在跟踪3辆货车在两个制造厂间进行分总成运输的时间,运货记录表明已检查了12个月,结果汇总如下:练习5:
运用Minitab进行X²的试验目标:采用练习5:答案Minitab输出结论:货车有差异.在24至36小时之间,货车C的发货比期望值高,在36至48小时之间,货车B的发货比期望值高。Chi-SquareTestExpectedcountsareprintedbelowobservedcounts
Within2424-36hou36-48houTotal1181067955130401783.18675.48581.3426092192371065624.70236.64203.6631768558319187.1270.8861.00Total25959838464424Chi-Sq=0.403+0.018+1.583+0.395+1.315+5.458+0.660+2.812+0.148=12.793DF=4,P-Value=0.012在24小时后的发货比期望值高明显ABC大练习5:答案Minitab输出Chi-SquareT练习5:答案,续将24-36小时和36-48小时合并在一栏中,称为“超过24”进行:x²试验期望值置于观测值之下 24以内
超过24 总计1 1810 1230 3040 1783.18 1256.822 609 456 1065 624.70 440.303 176 143 319 187.12 131.88Total 2595 1829 4424Chi-Sq=0.403+0.572+0.395+0.560+0.660+0.937=3.528DF=2,P-Value=0.171结果不明显,这意味着就总体发货而言货车在24小时左右没有差异。练习5:答案,续将24-36小时和36-48小这是将X²试验运用于你的经营中的契机考虑的要点考虑你将要比较的几组(离散数据X〕的比例(离散数据Y)如果你使用X²试验数据,在下结论之前,需要明确假设是什么(在下一节中我们将更深入探讨该问题.)你需要澄清什么问题?这是将X²试验运用于你的经营中的契机考虑的要点部分7假设试验复习部分7假设试验复习练习6:确定适当的假设试验目标:练习根据不同的情况选择恰当的假设试验统计方法.时间:10mins.说明:阅读如下5种情况,确定每种情况的假设和适当的试验方法(如果愿意,可以参考后3页的汇总,分组工作〕练习6:确定适当的假设试验目标:练习根据不同的情况选择练习6:确定适当的假设试验A.可用于生产的原材料X有三处来源.在上一季度中三处材料的交付迟后比例是否相同.B.一个小组在考虑一个新的夹具是否能够减小初装两工件宽度上有缝隙对不齐的问题,30套另件中15套初装采用新夹具,另15套不用夹具.C.一个小组在调查密封失效故障,希望查出温度对密封材料强度的影响.20件未处理的零件分为二半.一半受到标准温度的处理另一半处理温度超出标准值50%.项目工程师用Minitab.随机安排工件受标准或超标温度的处理顺序.技术员记录下工件的断裂强度.是否高的温度导致低的强度?D.作为测量系统初步研究的一部分,5个技术员每人对12只零件作破坏性试验(总共60个结果.)项目组希望知道5个操作者记录的数据平均值有无不同.E.D项除此之外,项目组还想知道5个技术员所作的测量方差是否不同.练习6:确定适当的假设试验A.可用于生产的原材料X有三假设试验的类型假设试验是通过对离散Xs(过程或输入变量〕
的分析来解释Y数据(输出变量)的变化假设试验目的t-试验配对t-试验ANOVA(F-试验)(方差分析)X²试验比较两组平均值数据配对比较两组平均值比较两组或多组平均值比较两组或多组比例比较两组或多组的方差同类方差试验
假设试验的类型假设试验是通过对离散Xs(过程或输入变量〕针对数据类型的适当分析方法Y(输出)
X(输入)
连续离散
(比例)离散(“组”)连续Χ²试验
t试验成对
t试验ANOVA逻辑回归回归针对数据类型的适当分析方法YX连续离散
(比例)离散连续Χ我采用何种方法分析?Xs是否离散(组〕
只比较2组?
Y1’s是否
与Y2‘s相匹配?否,Xs连续回归主题ANOVAt-试验否,比较多组(平均值方差〕)是是配对t-试验否,比较两组独立组平均值采用匹配数据比较两组平均值比较平均值?
等方差试验否,比较方差)是
Ys是否连续?X²否,Y离散比例)是是我采用何种方法分析?Xs是否离散只比较2组?Y1’练习6:答案情况 假设
试验
A. H0:比例A=比例B=比例C x²试验
B. H0:平均值A=平均值B t-试验
C. H0:平均值A=平均值B
t-试验
D. H0:平均值1=平均值2…=平均值5
ANOVA试验练习6:答案情况 假设试验复习本模块包括:将下列5中假设试验进行比较t-试验配对t-试验ANOVA(F-试验)同类方差(ANOVA)x²试验根据收集的数据类型和/或比较类型选择适当的试验运用Minitab进行试验根据P值判断结果;分析结果假设试验复习本模块包括:假设试验假设试验因研究蜜蜂的语言而荣获诺贝尔奖
以蜂王为中心组成的井然有序的蜜蜂社会的生活,究竟是以什么样的方式维持的呢?在很长一段时间,这是一大谜。特别是工蜂们的交流方式,人们几乎一概不知。
澳大利亚出生的动物学家卡尔·冯·弗里奇(KarlvonFrisch)(1886-1982),通过孜孜不倦的实验和观察,揭示了蜜蜂是通过舞蹈的方式向同伴通报花和蜜源的地点。
在野外采集到蜜和花粉的蜜蜂返回蜂巢后,在蜂巢上起舞,因此被称为“收获舞”。同时,弗里奇还发现,收获舞有“圆形舞”和“摆尾舞”2种。他花了近40年的时间研究揭示出:蜜蜂用舞蹈的形式代替语言,向同伴通报花所在的距离和方位,对维护和繁荣自己所属的蜂巢作出了贡献。
弗里奇于1965年完成了《蜜蜂的舞蹈研究》这一大作。并且,在1973年,与尼可拉斯·丁伯根(NikolaasTinbergen)和康拉德·罗伦兹(KonradLorenz)同时荣获了诺贝尔医学生理学奖。以前不受人关注的动物行为学(Ethology)随着这3名动物行动学家获得了诺贝尔奖,取得了全球性进展。因研究蜜蜂的语言而荣获诺贝尔奖
你在这里DOEDataAnalysisIMPROVEINSTRUCTORNOTES:HypothesistestingwasusedfordiscreteXsandcontinuousYs.RegressionisusedforcontinuousXsandYs.过程分析数椐分析组织原因假设试验回归分析控制定义测量改进分析你在这里DOEDataAnalysisIMPROVEINS目录
检测正态分布假设试验概述比较两组平均值:
t试验
假设试验的解释比较两组或更多组的平均值:ANOVA试验
比较两组或更多组的比例:χ²试验复习目录 检测正态分布检测正态分布复习:正态曲线定义:正态曲线是一种概率分布,最经常发生的值位于中间,其他概率向两侧对称下降。
此图形有时称为钟形曲线。复习:正态曲线定义:正态曲线概率标准正态分布将数据标准化为平均值=0标准偏差=1
正态分布使用实际数据平均值=17标准偏差=3
值Z值–30+3+2+1–2–1817262320111495.46%99.73%68.26%正态曲线概率标准正态分布正态分布值Z值–30+3+2+Z值:与标准正态值相同SX(兴趣值)Z-=-3-2-10123平均值 = 0标准偏差= 1此标尺上任何一处的Z值标准正态分布Z值兴趣值远离平均值有多少个标准偏差Z值:与标准正态值相同SX(兴趣值)Z-=-3-2-101Z值的概率标准正态曲线下的面积=概率Z值0的概率是多少?Z值2.84的概率是多少?-3-2-10123面积=1-3-2-10123概率=.5或50%面积=.5-3-2-10123兴趣值面积=?Z值的概率标准正态曲线-3-2-10123面积=1-3P值=尾部面积兴趣值以外的曲线下的面积处于或超过兴趣值的概率小的P值(0到.05)意味着:从该分布产生兴趣值的概率较小。可能从其他分布产生。P值是兴趣值的概率兴趣值兴趣值兴趣值兴趣值P值=面积P值=面积A+BAB拒绝域拒绝域拒绝域拒绝域接受域接受域接受域P值=P值是兴趣值的概率兴趣值兴趣值兴趣值兴趣值P值0123On-holdtime(min)并非所有数据都呈正态0123456#DefectsonInvoice
515253545CycleTime(days)仅在一个方向上有长尾巴的分布被称为不对称0123On-holdtime(min)并非所有数据都呈示例:使用正态曲线计算过程均方差要确定过程均方差,找到超出规格界限外的缺陷面积如果数据不是正态,使用方法2(在测量阶段已讨论)估计的缺陷面积就不正确,且不能如实表示过程均方差将正态方法用于非正态数据的后果USLUSL平均值阴影面积占多大百分比?对于正态曲线,此百分比值是不同的。示例:使用正态曲线计算过程将正态方法用于非正态数据的后果U受非正态数据影响的方法方法非正态的结果
过程均方差计算过程均方差值不正确单值控制图错误地发现某些特殊原因,丢失其它信号假设试验关于各组之间差别的错误结论回归错误地识别重要因素;较差的预测能力实验设计关于重要因素的错误结论;较差的预测
能力必须转换非正态数据
(在高级课程中讲授)受非正态数据影响的方法方法非正态的结果过程均方差计算过程均使用正态概率图检查正态以下是在Minitab(n=25)中生成的样本正态概率图。Graph>ProbabilityPlot如果数据是正态,那些点可连成一条直线。直线表示在95%的置信范围之内。如果大约95%的数据点落在置信范围内,可以说数据是正
态的。 95%置信范围使用正态概率图检查正态以下是在Minitab(n=25什么是正态概率图?数据值在
X轴上正态分布的百分点在Y轴上(线条的不等间隔是故意设置的)正态概率图正态分布中有十个间隔相等的百分点间隔相等的百分点将正态曲线划分为相等的区域百分点与正态概率图纵轴上的百分比匹配2030107080905010%10%10%10%10%10%什么是正态概率图?数据值在X轴上正态概率图正态分布中有十从两个正态概率图得出的结论结论偏离正态不严重结论偏离正态严重从两个正态概率图得出的结论结论结论使用Minitab:
检测正态分布1. 在Minitab中打开一个新(空的)作业表。2. 根据平均值=10,标准偏差=2的正态分布生成由25个数据点组成的随机样本,然后保存在
C1中:Calc>RandomData>Normal>...使用Minitab:
检测正态分布1. 在Minita使用Minitab:
检测正态分布(续)3. 用刚保存在C1中的随机数据创建直方图:Graph>Histogram>7891
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省兴化市戴南高级中学2026届数学高三第一学期期末统考模拟试题含解析
- 2026届湖南省邵阳市双清区第十一中学高三生物第一学期期末调研模拟试题含解析
- 吉林省白山市抚松县第六中学2026届生物高三上期末学业质量监测试题含解析
- 2026届湖北省鄂东南联盟数学高一上期末复习检测试题含解析
- 2026届福州第三中学数学高二上期末检测模拟试题含解析
- 陕西省商洛市丹凤县丹凤中学2026届语文高三第一学期期末学业水平测试试题含解析
- 上海师范大学附属外国语中学2026届高二生物第一学期期末教学质量检测试题含解析
- 绵阳中学2026届数学高二上期末教学质量检测试题含解析
- 云南省曲靖市会泽县茚旺中学2026届数学高一上期末学业水平测试试题含解析
- 2026届湖南省长沙市铁路一中高二生物第一学期期末调研模拟试题含解析
- 2025年国资委主任年终述职报告
- 大学教学督导与课堂质量监控工作心得体会(3篇)
- 2025年下半年国家教师资格幼儿园《综合素质》考试真题及参考答案
- 项目专家评审意见书标准模板
- 评审委托协议书
- 黑龙江中医药大学《无机化学》2025 学年第二学期期末试卷
- 2025年高中计算机操作试题题库及答案
- 研学基地课程书籍或课件
- 杭州市西湖区人民政府西溪街道办事处公开招聘编外合同制工作人员5人考试笔试备考试题及答案解析
- 日本所有番号分类
- 2024年江苏省普通高中学业水平测试小高考生物、地理、历史、政治试卷及答案(综合版)
评论
0/150
提交评论