




已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学概念,统计概念,目的:复习基本的统计学概念。,目标:解释以下基本统计概念。1.误差2.连续数据和离散数据3.平均值、方差、标准差4.正态曲线5.用Z值将数据标准化6.中心极限定理7.工序能力-使用Z值作为衡量工序能力的指标-通过改进关键值Xs来改进Y,观测值变化,当重复进行测量的时候,通常会得到不同的答案,这就是误差!,系统误差预期的和可预测的测量结果之间的差异。举例:夏季和圣诞节假日的电灶销售量不同。,随机误差不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试.可能得到两个不同的结果。,1.,2.,观测值变化(续),我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。如果所有地区的电灶销售量是一样的,那么我们就会怀疑是数据库出了问题。.如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。,这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。,偏差的产生是很自然的,意料之中的,是统计学的基础,统计学的作用,统计学用以下方法处理误差:,(置信区间和假设检验)。,统计描述,用图表和几个总结性数字(均值、方差、标准差)描述一组数据。,统计推理,确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。,试验设计,数据的两种类型,连续(可变)数据使用一种度量单位,比如英寸或小时。离散(属性)数据是类别信息,比如“通过”或“未通过”。,连续数据,离散数据,问题,解决办法,举例:部件号离散连续1通过2.0312通过2.0343未通过2.0764通过2.0225未通过2.001,连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。,你能举出我们用来获得连续数据的三个器具例子吗?,相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。,连续数据(也称为可变数据),离散数据不能更进一步精确地细分。,离散数据是某件事发生或未发生的次数,以发生的频数来表示。离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。,无罪或有罪,离散数据(也称为属性或类别数据),地区,离散数据,离散数据举例:有凹痕的部件数量通过/未通过申诉决议产出生产线不合格品数量及时交货,离散数据需要更多的数据点才能进行有效的分析,请在下面的例子旁,写出它是“连续”还是“离散”,1销售订单准确度2数据输入准确度3销售地区4使用“合格/不合格”测量仪器得到的孔径5孔径6应答中心对话时间7制冷氟利昂的重量(克)8每百万部件中有缺陷部件的数量9装配线缺陷(ALD),应用你所学到的东西,总体全组数据,全部对象。-一个总体中的元素数量用N来表示样本总体的一个子集-样本的元素数量用n来表示平均值总体或样本的平均值-总体的平均值用来表示-样本的平均值用X或来表示方差数据与其平均值之间差值的平方的平均值。(它代表该组数据的分散程度)-总体的方差用表示-样本的方差用s2或表示均方差是方差的(正)平方根。(它也代表该组数据的分散程度)。-总体的标准差用来表示-样本的标准差用s或来表示,统计学术语,统计学术语和定义,总体全部对象.举例1998年5月在Decatur生产的所有的16立方英尺冰箱样本代表总体的一个子集数据。举例-1998年5月在Decatur生产的一百二十台十六立方英尺冰箱举例:,平均值-总体或样本的平均值。用x或来表示样本,用来表示总体。举例:给定一个样本:1,3,5,4,7,平均值就是:,统计学术语和定义,x,=,x,n,在这里X1是样本的第一个点,,Xn是样本的最后一个点。,.,i,1,n,平均值的公式,样本的平均值等于4。,标准差衡量数据分散程度的一个指标。一般用表示总体,用s或表示样本。,=,(,X,i,-,),2,i,=,1,N,N,总体的公式,方差-与平均值之差的平方的平均值。一般用s2或2来表示。,样本的公式,统计学术语和定义,举例,课堂举例:计算样本2,6,4的方差和标准差首先计算均值:(2+6+4)/3=12/3=4,计算平均值、方差和标准差,x,=,x,n,i,i=1,n,平均值方差标准差,方差(s2)=8/(3-1)=4标准差(s)=sqrt(4)=2,ixi(xi-4)(xi-4)212-2426243400和1208,课堂练习,课堂举例:计算样本1,3,5,4,7的方差和标准差(使用下面的表作为向导。)首先计算平均值X:,计算平均值、方差和标准差,x,=,x,n,i,1,n,均值方差标准差,方差(s2)=标准差(s或)=,绘制直方图,75,70,65,60,15,10,5,0,高度,频数,596163636459626665656460656264687065636468666566676466586565716369636670646764666264646461646365646866676971686665636464686765646564706568656669666665636866626765666766606763606473,90位女士的身高,用直方图形成一个连续分布,许多(但非全部)数据符合“正态”分布,或钟形曲线。,W7.6,正态分布的标准差(),拐点,1,USL,p(d),上限(USL)下限(LSL)均值()标准差(),3,拐点与平均值之间的距离是一个标准差。如果三倍的标准差都落在目标值和规范的上下限内,我们就称这个过程具有“三个西格玛能力”,Copyright1995SixSigmaAcademy,Inc.,平均值,LSL,曲线从较陡的状态变得越来越平坦,面积和概率,正态曲线与横轴之间的面积等于1,所以曲线下面的面积与缺陷发生的概率相关。,正态分布可以用来将和转换为出现缺陷的百分比。,规范上限,出现缺陷的概率=.0643,假设Z=1.52。1.52之外的正态曲线下部的面积就是出现缺陷的概率。Z值是工序能力的一种尺度,通常称为“工序的西格马”,不要与过程标准差混淆。,Z,曲线下的整个面积是1,=0,(在这里=1,=0),使用正态表,Z=1.52,下页上的表列出了Z值右边的面积。,正态分布,科学记数法,科学记数法是将数字写成一个数字的10次幂的一种方法。我们来看一些用科学记数法表示的数字。,6.43E-02是.0643的科学记数法格式。6.43E-02=6.42x10-2=.06426.43E-02,实际数字,科学记数法,6.43代表基数,将基数乘以10的幂:10-2,127,1.27E+02,22416,2.24E+04,0.0643,6.43E-02,0.000056,5.60E-05,2.051,2.05E+00,如果“E”后面的数字是负的,那么就将数字的小数点的位置挪到左边。,Z值转化为“标准正态”,我们需要利用正态分布的平均值和标准差将其转化为“标准正态”分布,以便使用标准正态分布表来获得概率。,通过转换将变量(y)转换为标准正态分布。标准正态分布的平均值(=0,标准差()=1.,规范上限(USL),出现一个缺陷部件的概率,USL-,Z=,对于规范的上限:,规范是1.030”+.030=(1.000,1.060)假设我们测量了30个部件,X=1.050,s=.015计算一下不符合规范的部件的比例,1.0201.0351.0501.0651.080,LSL,USL,目标值,正态分布举例,X,数据的实际分布,现状分析报告中的Z值就是ZBench。,ZBench的定义,PUSL是相对USL而出现缺陷的概率。PLSL是相对LSL而出现缺陷的概率。PTOT是出现缺陷的总概率PTOT=PUSL+PLSLZBench是与出现缺陷的总概率相对应的Z值,可从正态表中查到。,25.14%,.04%,ZLSL=3.33,ZUSL=0.67,25.18%,ZBENCH=.67,从正态表获得面积(合格品和不合格品的百分比),例1:Z=2.00右边的面积=_左边的面积=_例2:Z=1.57右边的面积=_左边的面积=_例3:=6.34=.03x=6.41计算Z=x-右边的面积=_左边的面积=_,中心极限定理-为什么我们得到的通常是正态分布,平均值分布n个测量结果的平均值,单个变量的分布图,每个子群中有“n”个样本。,中心极限定理-为什么我们通常得到正态分布,例1“总销量”是许多经销商的销售量的总和。一个经销商的销售量可能不是正态分布,但总销量很可能近似于正态分布。,例2一堆部件的高度可能近似服从于正态分布,尽管个别部件的高度不是正态分布。,注意:不是所有数据都符合正态分布。后面我们将讨论如何检验正态性,以及如何处理非正态分布数据。,Z作为一种能力的尺度,z,随着偏差减小,出现缺陷的概率降低,所以,能力提高。,我们希望:小z大,提高工序能力,独立变量(Xs)有时被称为“根本原因系统”。,因变量(Y)有时被称为响应变量。Y取决于独立变量,或“X”变量。,至关重要的少数变量也被称为“杠杆”变量,因为它们对因变量具有重大影响。,统计学问题:是均值偏离、偏差过大,还是两者兼而有之,W6.9,改进的焦点,Copyright1995SixSigmaAcademy,Inc.,能力,这适用于所有过程制造业和商业。,稳定运行可以从过程中消除偏差,使结果更加稳定、提高可预测度。,偏差是恶魔,发现它并且清除它!,低劣表现出色表现,客户:“我希望每天都这样”,稳定的运行,根除坏日子,提高一致性,提高平均值。,将坏日子变为好日子,原来的行为增加平均值。偏差保持不变。依然存在着坏日子!,稳定运行根除过程的“不稳定“部分(坏日子)。平均值也增加了!,初始表现,根除坏日子,改进一致性,提高平均值。,平均值,平均值,平均值,稳定的运行会降低偏差,RawData,Sorted,Q3,Q31,Q3=23646,Q1=12215,原始数据,分类后,顶部25%,底部25%,1)测量您的工序每天的产量。2)将数据按从最好到最坏顺序排列。3)将数据四等分。Q1=1/4的日子较差。3/4的日子较好。Q3=3/4的日子较差。1/4的日子较好。4)计算稳定性因子(SF):SF=Q1/Q3=12215/23646=.52,随着偏差的降低,稳定性因子越来越接近1.0。,“稳定性因子”:Q1/Q3,根除坏日子,提高一致性,提高平均值,平均值,初始表现,Q1,Q3,稳定操作降低偏差,偏差是恶魔。发现它,并且消除它!,稳定运行带来的好处,客户会看到更高的一致性和可靠性。过程的可预测性增加,更易于管理。平均值(能力)更高。利用“隐蔽的工厂”。,低劣表现出色表现,客户:“我每天都希望实现这个目标”,稳定运行:如何实现,1.在测量阶段,计算您的过程的稳定性因子。发现那些具有低稳定性因子的过程,那些具有最大改进机会的过程。2.使用分析方法筛选出可能导致坏日子的关键因素X。3.使用改进方法来确认将坏日子变成好日子的关键因素X。4.控制关键因素X,保持高稳定性。,使用六个西格玛方法来实施稳定操作。,关键概念:第3部分统计学概念,误差存在于所有过程。连续(可变)数据可以有意义地进一步分割,例如,长度,重量。离散数据是以类别形式存在的,不能进行分割。总体就是全部对象。样本就是总体的一个子集。平均值分布的平均数。标准差分布的分散程度。方差标准差的平方。正态分布对称分布于平均值两边的数据,钟形曲线。标准正态分布具有平均值(m)=0和标准差(s)=1的正态分布。,关键概念:第3部分统计学概念,中心极限定理表明,无论单个变量是不是服从正态分布,多个变量的平均值或总和通常近似于正态分布。Z值是平均值与规范的上下限之间所包含的标准差个数Y(响应变量)-因变量X(因素)-独立变量Y=f(X):Y取决于X。通过确定和改进关键的X变量来改进Y。工序能力过程的偏差与其要求(规范)之间的比较。稳定运行-集中于降低偏差,使坏日子变成好日子。稳定性因子-Q1/Q3.第一个四等分/第三个四等分。,统计过程控制,目标1.能够使用“XBar和S图表”进行连续数据分析。能够使用“p”控制图表进行离散数据分析。能够确定每一种图表类型的控制极限范围。能够对图表进行解释并确定工序什么时候处于失控状态。5.能够解释依据图表信息采取措施的重要性。,第3部分:统计过程控制,目的介绍统计过程控制的概念,什么是:统计过程控制(SPC),统计基于概率的决策方法。过程-所有重复性的工作或步骤。控制-监控工序运行。基于与“ttest”假设检验相同的概念进行分析,能够使我们在出现的问题影响到输出结果之前,就作出有关工序的决定、采取行动、解决问题。,当处于稳定状态的工序变差已经被外界可指定原因所影响时,SPC发出信号。,当过程失控时,SPC将发出信号,你的任务是找出失控的原因,然后进行修正,确保问题不再发生。,6个西格玛质量的重点是将控制范围转移到工序的上游,以充分利用对工序输入变量特征(关键X)的控制,6个西格玛与SPC,控制图表应用于过程变量;自变量;设计变量X1,X2,.,Xk,提高因变量的稳定性,响应值Y1,Y2,.,Ym,Y,X,什么时候使用SPC?,希望获悉什么信息?关键过程变量(X或Y)在随时间变化吗?(即该过程稳定吗?)如何观察输出变量?基于实时数据、显示过程变化的图表,SPC是一个严密的过程,它要求操作小组积极参与数据的采集和分析。,失控状况,记录采取的修复行为,UCL,LCL,XBar图表,样本/分组(按时间排序),Sigma图表,控制下限,总平均中心线,控制上限,控制图表包含内容,平均Sigma中心线,控制图表,统计过程控制图是由贝尔实验室的Waltershewhart在1920年开发的,它提供了测量过程的观察值相与用统计方法计算出的“控制极限范围”(期望值)的图形比较。绘制随时间而变化的表现。一个过程的改变包括平均值和/或方差的改变,因此我们总是同时绘出平均值以及方差的控制图(Xbar和S)。平均值的控制极限表示双边假设检验极限,用于推断观测的样本均值是否发生了变化。Sigma的控制极限或极差表示方差在何处显示差异。,过程的稳定性,下图显示多种不稳定过程,控制图能够有助于确定这些不稳定状态什么时候产生、以及存在于什么环境。,不稳定过程不存在可预测的表现,而且稳定的运行状态可能不是持续不变的。,时间,均值/方差,过程稳定性,当过程输出值仅包括一般原因变差时,该过程被认为是稳定的。分组平均值和方差的测量值介于它们的控制极限范围之内,且未显示出存在可指定来源(特定原因)变差的证据。如果在控制图表中出现数据的非随机型态,或当某一点超出控制极限时,这是表示在你的过程中出现了可指定来源(特定原因)的变差的明显信号。,一个稳定过程的输出值很少超出正负三个Sigma范围。,稳定过程变差区域(仅存在一般原因变差),平均值与极差Xbar减少可能发生的错误。)4.5s-与顾客需求相对比的单个测量值的长期过程性能目标。6.0s-与顾客需求相对比的单个测量值的短期过程变差目标。,当过程处于稳定状态时,3s极限对变化的灵敏度较高,过度反应的可能性较低。,一个消费者服务组织希望能够监控消费者对公司的满意度。每周都对公司的个地区服务中心的调查结果进行评估,并制成表格。下面的实例说明了Xbars控制图如何用于监控“消费者满意度”(在这个示例中,满意值越高说明公司运营情况越出色。)创建Xbar-s控制图表的主要信息:分组总数量=25分组大小,n=10总平均值,X=4.096S=.1403,变量控制图示例,控制限计算公式:,实际数据的控制限计算,参见下页的常量SPC表,控制图常量与控制限范围,变量控制图控制限常量,下列表格包括用于构建SPC控制图的不同常量。,用于计算控制图极限范围的标准偏差是以绘制图的类型为基础的。对于Xbar图,它是分组平均值的标准偏差,这与合并标准差类似。对于S图表,它是分组标准偏差的标准偏差。两种类型的公式都依赖于分组的大小。,控制图的使用,控制图表可以在测量和分析阶段用于跟踪过程的变化,分析显著的变化并记录。,控制图在控制过程中用于保持改进的结果。用图进行监控并记录输入变量(X),分析X的变化并进行控制。,控制图说明,对图表的解释与说明是在确定过程能力之前,是以持续进行的过程控制为基础,.首先解释Sigma图表。在初始能力分析期间,如果你能够识别那些造成“失控”情况的特殊原因变差,那么,在计算控制极限范围时,可以将这些数据点删除。,一般过程变差“乏味”,这个图表代表一个可预测的过程,在该过程中变差仅受随机变差的支配。图中各点的上下跳动是不可预测的,但是它们都趋向于围绕着中心线(然而,不是非常接近)并且保持在控制极限范围之内。这种型态是任何控制图的目标,它不一定表明过程的最佳能力,也不一定表明工序能满足规格要求,但是,它显示该工序是稳定的。,特定原因改变“发生了什么?”,在偶然情况下,某个因素进入过程并引起一个突发性的短暂改变。这个原因可在XBar图中表现为失控的一束点集,而S图通常并不会因为这些移动点而受到影响。,一些典型原因:引入了一批不合规格的材料测量系统的暂时间的偏移不同的检验员不同类型的工具,有时过程会产生异常现象,其结果是偶然出现一些“奇异点”,它们很明显并不属于基本过程分布的一部分。一个异常点产生过后,该过程恢复正常状态,直到下一个异常点出现。,一些典型原因:测量中产生的错误置于一堆的底层(或顶层)的原材料条棒、线圈等的末端污垢或进口材料,奇异点,奇异点,奇异点,过程之外“啊哈!现在出现一些有趣的现象”,一些典型原因:调节错误或不正确设置原料或润滑剂的改变移动变化,现象:连续九个数据点位于中心线的一边。,这种变化发生后,该过程会产生零件尺寸的平均值增大、产出增加或硬度增强等现象。该过程的基本变差并未改变,极差也未显示变化的出现。,过程突然移动“你做过什么?”,现象:连续七个数据点呈上移趋向连续七个数据点呈下移趋向,过程趋势“过程向何处发展?”,一种趋向是过程的水平的逐渐移动,仅仅反应在xBar图表中。有时原料、测量和人为因素可能会引发过程趋势,但是这不大可能。问题通常出现在设备本身、电源供应、或先前的过程环境。,一些典型原因:这种现象通常与“工具磨损”有关。例:电镀作业和多种化工作业中的电镀槽损耗电路管磨损,区域测试,概率分布区域,如果以下情况发生,过程处于“失控”状态,Copyright1995SixSigmaAcademy,Inc.,分组数,平均值和极差图(XbatR),如果靠人工进行,Sigma的计算是非常烦琐的,因此XbarR图便成为人工控制图的首选方法。,通过计算分组内数据的极差来显示变差(极大极小)使用A2Rbar得出3s/sqrt(n)的近似值,使用D3和D4乘以Rbar找出极差变差的控制极限的上下限。以类似于XbarS的方法进行分析。,单个数据点和移动极值图(XmR),单个变量X移动极差图适用于分组内并不存在可测量的变差的情况(如:过程温度、压力或其它类似的测量值),或者适用于合理分组数据不可得时(由于成本或其它限制因素)。,小心如果不当地应用于一个具有“组内”变差的过程时)如上图所示的控制图数据),所绘之图有时难读、难用。当跟踪单个测量值时,没有关于短期和长期变差差异的信息。,可以探测到过程中任何大小的变化,这种可编程的灵敏性使EWMA成为监控受控过程的优秀工具。注意EWMA的形状,该图所使用的数据和我们前面连续数据图中的数据相同。我们注意到平均值存在向上的趋势,其中还有均值向下的显著位移。,指数加权移动极差(EWMA)图表,EWMA图比其他任何控制图灵敏得多。每个EWMA图中的数据点都融有前面观察的信息,而且该图经过成形,特征值控制图,npp,主要属性图,np-测量所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学生视角下图书馆藏书更新对阅读推广活动的优化策略论文
- 初中历史教学中学生历史思维能力培养研究论文
- 节能制度与管理制度
- 英维克档案管理制度
- 茶饮店员工管理制度
- 观众对绿色剧院演艺的感知
- 评估工作总结
- 《树和喜鹊》课件
- 财务与会计之非流动负债知识答题(一)
- 湖南省株洲市醴陵市2024-2025学年七年级下学期期末能力测试练习数学试卷(含答案)
- 机器学习在教育领域的应用研究
- 一例ANCA相关性血管炎患者的护理查房
- 2024年全国初中数学联合竞赛试题参考答案及评分标准
- 海洋波浪发电课件
- 八年级数学下册 期末考试卷(湘教版)
- 2024年甘肃金川集团股份有限公司招聘笔试参考题库含答案解析
- 注册安全工程师继续教育题库
- 工程项目监理人工智能与机器人技术应用
- 边防派出所知识讲座
- 基于GIS的四川省旅游资源调查、分类与评价
- 录播教室设备投标方案(技术标)
评论
0/150
提交评论