概率统计与测量系统分析.ppt_第1页
概率统计与测量系统分析.ppt_第2页
概率统计与测量系统分析.ppt_第3页
概率统计与测量系统分析.ppt_第4页
概率统计与测量系统分析.ppt_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

6SigmaBB测量阶段培训课件,讲师:尹桂平2016年10月13日,1、当面对销售、薪酬、财务成本、安全事故等数据是否无从下手?2、原料消耗,二氯甲烷消耗等数据与瑕疵检测仪检测数据有区别吗?3、设备故障停机数据属于什么分布?4、我们使用的测量系统是有效的吗?5、怎样去衡量每个制造过程的能力?,对数据,你知道哪些?,测量阶段,主要目的了解过程的现状测量系统满足要求,确保测量数据准确可靠过程的概念Y=F(X,.),主要内容,5.1过程分析与文档5.2概率与数理统计基础5.3数据的收集和整理5.4测量系统分析5.5过程能力分析5.6服务过程测量,5.1过程分析及文档,5.1.1流程图5.1.2因果图与因果矩阵5.1.3其它过程分析工具与文档,过程分析的目的使项目团队对准备改进的过程达到统一的认识定位识别非增值步骤形成文档、对比,5.1.1流程图,流程图(flowchart,orflowdiagram)是展现过程步骤和决策点顺序的图形文档,是将一个过程的步骤用图的形式表示出来的一种图示技术流程图的绘制,绘制过程流程图是一个很好的开端,要达成共识,进行充分的分析。流程绘制完后,要关注产生过程输出缺陷或问题的重点关注区域在哪流程中非增值步骤或环节在何处流程中是否存在瓶颈流程中是否有缺失、冗余、错误的步骤等宏观流程图(SIPOC)与详细流程图,5.1.2因果图与因果矩阵,因果图(cause-effectdiagram)也称石传磬图(Ishikawachart)或鱼骨图(fishbonechart),它是揭示过程输出缺陷或问题与其潜在原因之间关系的图表。因果图的绘制判断过程的起始、结束点,老7种工具,数据收集:调查表、分层法数据分析:直方图、散布图、控制图问题识别:因果图优先排序:排列图,例1,因果矩阵:当预期解决的问题较复杂,有多种缺陷且它们的影响因素相互关联时,采用因果矩阵(Cause-effectmatrix),5.1.3其它过程分析工具与文档,过程失效模式与影响分析(processfailuremodeandeffectanalysis),FMEAFMEA是关于产品或过程的一种风险分析工具和文档。来自于对设计方案的风险评估。目的是寻找那些对过程输出影响较大的输入或影响因素,作为测量和分析的重点下面是一个FMEA工作单,其它文档程序文件检查单照片图表录像数据库,5.2概率与数理统计基础,5.2.1概率论的基础知识5.2.2随机变量及其分布5.2.3数学期望与方差5.2.4常用的离散分布5.3.5常用的连续分布5.2.6中心极限定理5.2.7统计量与抽样分布,5.2.1概率论的基础知识,随机事件试验事件间的关系与运算相等、包含、不相容、并、交、差、对立概率概率的性质加法定理、乘法定理、逆事件例,5.2.2随机变量及其分布,离散型随机变量及分布,连续型随机变量及其分布,5.5.2连续型随机变量及其分布,5.5.2连续型随机变量及其分布,5.2.3数学期望与方差,数学期望方差,标准差,数学期望和方差的性质当X1和X2相互独立,偏度,一般地说,对于分布的描述用位置状况、散布状况就够。如果还需要对分布的形状作更细致描述的话,那就要用到偏度和峰度了。以下为了解释偏度和峰度说起来方便,假定几个分布的均值和方差全相同。偏度(Skewness)是描述对称性的。sk0(正偏),峰度,峰度(Kurtosis)是描述分布高峰处及尾部所占的比重的。规定正态分布的峰度为0。假定两个分布均值和标准差全相同。则峰度为正时图形特征是:顶峰处更高,两端尾部更大,也即更慢地趋于0。则峰度为负则相反。,正态分布峰度为0,峰度为正:顶峰更高两尾更重,峰度为负:顶峰更矮两尾更轻,5.2.4常用的分布,常用的离散分布0-1二项B(n,p)泊松P()几何超几何常用的连续分布正态N()指数E()均匀U(a,b)Weibull,常用离散分布的性质0-1分布例E(X)=pVar(X)=p(1-p),二项分布,定义:在独立试验中,若每次出现“成功”的概率固定为p,则若记n次独立试验中出现“成功”的总次数为X,则称X的分布为二项分布,记为XB(n,p).若XB(n,p),则X的均值是=np,方差=np(1-p).,二项分布案例,掷10次骰子,出现3次6的机会是多少?,利用Minitab计算,概率密度函数二项分布,n=10和p=0.166667xP(X=x)30.155045,练习,某产品不良品率为0.2,每个盒子装100件产品,问盒中出现2个不良品的概率?有一批产品有3000件,不合格率为2%(60个不合格产品),抽150件,当样品中有1件以上不合格时,就拒收,问拒收概率?,泊松分布,泊松分布适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等。泊松分布的参数是单位时间(或单位面积)内随机事件的平均发生率。,泊松分布,稀有事件出现次数(个数、点数)的分布只有一个参数就完全确定均值方差相等均值的量纲x,方差量纲x2,泊松分布一定是无量纲的均值的可分性:如:周事故次数P(4),天事故次数p(4/7),用Minitab计算泊松分布,概率密度函数Poisson,平均值=2xP(X=x)80.0008593,几何分布,意义:首次成功发生在第k次的概率E(X)=1/pvar(X)=(1-p)/p2,超几何分布,超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。例如在有N个样本,其中m个是不合格的。超几何分布描述了在该N个样本中抽出n个,其中k个是不合格的的概率。,利用Minitab计算超几何分布,设一批产品共2000个,其中有40个次品采用无放回抽样方式随机抽取100个样品,求样品中次品数8个的概率分布。,概率密度函数超几何分布,N=2000、M=40以及n=100 xP(X=x)80.0004973,正态分布,正态分布(Normaldistribution)又名高斯分布(Gaussiandistribution),正态分布记为其中为均值,为标准差特别地,称N(0,1)为标准正态分布几何意义性质,设则,均匀分布,连续型均匀分布,如果连续型随机变量X具有如下的概率密度函数,则称X服从a,b上的均匀分布(uniformdistribution),记作XUa,b,均匀分布,例1,指数分布,指数分布的密度函数称“此时刻上在工作,而下个时刻失效的概率”为“瞬时失效率”指数分布密度函数式中的就是瞬时失效率指数分布的瞬时失效率是不随时间而变的常量,指数分布,瞬时失效率与平均寿命记瞬时失效率为,其平均寿命为,则有=1/例如,一台电视机瞬时失效率为=0.0001/天,则平均寿命=1/=10000天(=27年)对于指数分布,标准差与平均寿命相同=1/指数分布常用E()表示,指数分布,瞬时失效率是由量纲的,其量纲为(1/时间)例如,某电视瞬时失效率为0.0001/天,表示此电视今天尚在工作,明天失效的概率为万分之一(以天为单位)何时可以使用指数分布?例如,电视机寿命通常有几十年,一台电视机使用了2年或使用了3年之后,它们的瞬时失效率如何?一般而言,有早期失效期(刚开始容易失效),还有老年的耗损失效期,在此之间的正常工作期限内,可以假定瞬时失效率维持为常数。可以证明:瞬时失效率为常数的寿命分布只有指数分布(ExponentialDistribution),对数正态分布,如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。对于x0,对数正态分布的概率分布函数为,对数正态分布,在可靠性分布中,常常遇到下了情况元器件的寿命X明显不对称,右边尾巴托得很长,如果将X区对数后为正态分布,即LnX为均值是,标准差是的正态分布,则我们称X为对数正态分布。记为注意,指数分布与元器件寿命规律,一般失效规律复杂,呈浴盆曲线(BathpoolCurve),早期失效,偶然失效,耗损失效,时间t,Weibull分布,失效率与分布函数关系记失效率函数为(t)若失效率为常数,则寿命分布为指数分布,平均寿命为1/若失效率函数为浴盆曲线,则寿命分布为Weibull分布这里,k为形状参数:k1,为耗损失效分布;K=1,指数分布。b为尺度参数,卡方分布、T分布、F分布,若,中心极限定理,不论原始分布为何种分布,当样本量无限增大时,样本均值的分布都趋于正态分布当原始分布对称时,n=5,近似以很好当原始分布不对称时,n=30,近似以很好样本均值的性质;,应用,近似计算二项分布B(n,p),当n较大,P不太小不太大(0.1,0.9),可用近似正态分布近似当n较大,p较小(0.1),np不大(不超过20)时,二项分布与泊松分布很接近。会用计算机算分布函数,实例,假定生男生女的概率相等,某城市新生10000个婴儿,落在(4800,5200)之外的概率小于万分之一,统计量与抽样分布,总体与样本总体(population)所研究对象的全体,有限或无限通常为某个指标的一个分布F(X)含有若干未知参数,如:均值、标准差,皆为常数。样本(sample)为研究总体而抽取的部分个体样本统计量(statistic),如,样本均值,样本方差,样本中位数,样本标准差,都是随机变量。,总体与样本,位置参数:中位数,中位数()是按大小顺序排列的一组数据的中间值。一半的数据比中位数大,另一半数据比中位数小:数据个数为偶数时,则取中间两个数的平均值。89,110,152,199,255,324数据个数为奇数时,则取数据组中间的值作为中值。62,89,110,152,199,255,324,位置参数:分位数或百分点,分位数或百分点计算表达的是在有序的数据组中的值,因此有一定比例的数据位于该值之下。例如x0.1是表示在这个有序数据组中,有10的数据位于该值之下。这就是10分位数或P10。,100%的数据,75%,50%,25%,有序数据组,xmaxQ3=x0.75Q2=x0.50Q1=x0.25xmin,四分位数是特殊的分位数:,位置参数:四分位数,分布参数:方差,方差是对来自样本的数据分布的衡量。分母中n-1称为自由度。它作为与均值的差异,用于样本中的每个值的计算差异需要平方,否则总和将始终为0!,标准差是通过对方差求根得到:在正态分布数据中,大约68的数据在1标准差的范围内。,在我们案例中:,分布参数:标准差,统计量及其抽样分布,设若方差2已知,则若方差未知,则这里,t(n)是自由度为n的T分布,当n较大时,t分布与正态分布形状相同,抽样分布,设设,5.3数据的收集和整理,5.3.1数据类型与测量尺度5.3.2收集数据的方法5.3.3抽样方法:强调代表性抽样要具有代表性,否则结论无意义。例如,1948年美国truman(民)和Dewey竞选,网上调查等5.3.4描述性统计方法5.3.5数据的图示方法:直方图,茎叶图,箱线图,链图(游程图),正态概率图,5.3.1测量与测量等级,测量:按照某种规则赋予每个被测对象一个值。此值可以是数值,也可以是符号。测量可以划分为四个等级:离散型:名义尺度等级(nominalscale)顺序尺度等级(ordinalscale)连续型:间距尺度等级(intervalscale)比率尺度等级(ratioscale)自上而下,测量级别越来越高,测量的精度、困难程度、数据所包含的信息也越来越多,5.3.1.1名义尺度等级,每个观测值只是对象所属类别的名称或代码名义尺度是最低的级别:不具有顺序的性质,更不具有距离的性质名义尺度测量只能根据每个特性区别不同对象的类别。例如:产品的型号、编码、类别、形式等对于名义数据,基本的数据整理工作是计数,数出某个名义值出现的次数即使名义数据是代码数值,比较大小和加、减、乘、除运算没有实际意义它对应任意单值一一对应函数保持不变,5.3.1.2顺序尺度等级,观测值标明了各对象所属性的顺序按事物的某特性,将观察对象排序(名次),就达到顺序尺度等级。例如,上、中、下质量级别;国际交际舞(排序1-6);某些质量指标的评级和评分;年龄组;空气质量等级;喜好度;风级等两类无次序,如:好,坏顺序数据之间比较大小有意义,而两个数据的差别(距离)没有实际意义,严格的说,平均数是没有意义的。它对于任意单调函数保持不变,5.3.1.3间距尺度等级(区间型),观测值不仅标明了各对象所属性的顺序,而且其数据间的差距是可以比较的,称为间距尺度等级其测量得到的数据,不仅可以说明某物的某特性的值比另一物同一特性的值大或小,而且可以说明该特性相差多少,但无起始点,因而比值、倍数是无意义的例如,华氏(或摄氏)温度;日历;智商得分;无起点,因而比值无意义它对于任意线性函数保持不变,5.3.1.4比率尺度等级(比值型),观测值不仅标明了各对象属性的顺序及差距,而且其数据间的比值是有意义的,即测量的“零点”有确定的实际意义,测量达到比率尺度等级例如,称重读数为零表示没有重量;温度测量采用绝对温度,绝对零度表示分子静寂状态;长度为零或货币为零表示全空两个比率尺度数据的和、差、商,有实际意义它对于任意倍比函数保持不变。因此,货币额、长度、重量、时间间隔不同单位间可以进行换算,5.3.1.4比率尺度(对数型指标等级),以比率尺度绝对量之对数作为其指标,其差值具有比值含义,因而常有负等级例如,噪音等级(一级(10倍)地震震级(里氏级):1震级之差异对应地震能量之比为32(倍)(0.2级为2倍,2*5=32)这种指标的“算术平均”是没有意义的,5.3.3抽样方法,简单随机抽样等可能性独立性常用的方法抽签、滚球、计算机模拟、随机数表分层抽样:比例分配法、适度分配法、经济分配法系统抽样等间隔抽样最好:综合使用上述方法,5.3.4描述性统计量,描述分布位置或者中心趋势样本均值、中位数、众数描述离散程度样本极差、样本方差、样本标准差描述分布形状偏度、峰度例子,5.3.5数据的图示方法,直方图(histogram).数据源BS_直方图.MTW茎叶图(stem-and-leaf-plots).数据源EDA_脉搏.MTW箱线图(box-and-whiskerplots).数据源BS_箱线图.MTW链图(游程图)(runchart)正态概率图(normalprobabilityplot),5.3.5.1直方图,直方图(histogram)常用于了解数据的分布状况,是一组数据的图型表示。使我们容易的看到数据的分散程度和中心趋势,并于要求的分布进行比较。直方图的做法,minitab软件有现成的做法通常数据量较大实例:某银行对其所属的某营业网点进行抽样调查,测量了该网点某日上午10时至下午3时所有顾客的等待时间,试绘制直方图(BS直方图),5.3.5.2茎叶图,茎叶图(stem-and-leaf-plot)是直方图的变种,适用于较小的数据集(n5,分辩力,系统所能量测出的小数位数。测量渐进单位应为产品规格或流程变异计量单位的10分之1。,鉴别力良好,鉴别力不足,5.4.3测量系统的偏倚,测量系统的偏倚是指对同一对象进行多次测量的平均值与该对象的基准值或标准值之差。对某点处的偏倚检验要进行1-t检验结论要明确:Bias是否存在,Bias是多少?偏倚的线性性(linearity)Bias是否可以修正,如何修正若bias有线性,则可以通过线性关系加以修正修正的关键求出线性关系,Bias(偏倚),操作者偏差不同的操作者即使测量同一物件,平均值也会造成可察觉的不同仪器偏差不同的仪器即使测量同一物件,平均值也会造成可察觉的不同,MasterValue,5.4.3偏倚线性性的表达式,考查测量系统的偏倚通常只是针对某一点进行的,偏倚的线性性则是对整个测量范围(即生产过程的全变差)考虑的。要回答的问题是:在整个范围内偏倚的状况是什么样的。,评价测量系统的标准:线性性,测量系统的线性性(linearity)在其测量范围内,偏倚是其基准值的线性函数在量程范围内,将偏倚作为Y,基准值作为X进行回归分析用minitab算出线性回归方程:Y=a+bX如果a和b都可以认为是0,则称测量系统在整个量程范围内没有偏倚。在Minitab软件的分析中,则是偏倚为0的水平线完全被包含在回归显的置信区间带内,称测量系统的偏倚及线性合乎要求。通过统计检验,如果回归效应显著,即b不为0,则称测量系统有线性性(即非常量偏倚),要算出线性产生的影响(线性度及影响率),且要分析线性产生的原因加以纠正经过统计分析,如果回归效应不显著,即b=0,如此时a不为0,则可认为在整个量程范围内有共同偏倚a(即常量偏倚),测量系统的线性性(linearity)计算线性产生的影响(线性度及线性百分率)线性度(linearity):过程总波动与线性方程斜率绝对值的乘积:Linearlity=b*过程总波动它表明在整个使用过程中,测量系统可能产生偏倚的取值范围%linearity称为线性百分率,是将回归方程中的回归系数b的绝对值用百分比形式给出。因为回归系数的含义是测量对象每有一个单位的变化,测量系统的偏倚有多大的变化,故此可以用偏倚的大小与测量对象变化的比率来表示线性影响程度。当然此数越小越好。,测量系统的线性性的计算,练习题一家公司的质检部门购买一台测厚仪,在正式使用前,需要对此测量系统进行分析。根据实际需要的量程,挑选了5个具有代表性的标准部件,然后由检验员以随机的方式对每个部件测量了6次。假设已知过程总波动PV(即6倍的过程标准差)为12,试分析其偏倚和线性见数据文件(QTMSA偏倚和线性).数据源QT_MSA偏倚与线性.MTW,分析,整体偏倚值=0.117667,整体偏倚百分率15个部件的偏倚值和偏倚百分率,参考值为20时,最严重线性度=0.242664,线性百分率=2.0偏倚的线性回归方程斜率和截距相应的p值均小于0.05,在量程氛围为存在线性偏倚。,稳定性,稳定性:测量结果的分布不随时间而改变即:结果分布的均值、方差、形状不随时间而改变准确检验:控制图实际检验:先画均值、方差的趋势图来判断,然后画控制图,测量系统的重复性,重复性(repeatability):指在尽可能条件下,对同一测量对象进行多次重复测量所产生的波动。反映的是量具本身固有的波动再现性(reproducibility):指不同的操作者使用相同的量具,对相同的零件进行多次测量所产生的波动,它反映的是不同的操作者在测量过程中所产生的波动。再现性波动可以通过改进操作加以改进。重复性和再现性(R&R),精(确)度(precision):精确度是重复性与再现性的总和。精确度的线性性(linearityofPrecision)量程内最不利处的精确度,测量系统的合格标志,GaugeR&RgaugeR&R=强调测量系统对分析过程指标的能力分析RatioofP/T=强调测量系统对公差限的分析能力,仅有单侧规格线时,若仅有单侧上规格上线时若仅有单侧下规格线时,测量系统合格准则,GaugeR&RP/TRatio若两个比值都小于10%,则测量系统合格两个比值介于10%30%之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论