精益六西格玛统计工具介绍假设检验.ppt_第1页
精益六西格玛统计工具介绍假设检验.ppt_第2页
精益六西格玛统计工具介绍假设检验.ppt_第3页
精益六西格玛统计工具介绍假设检验.ppt_第4页
精益六西格玛统计工具介绍假设检验.ppt_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

六西格玛统计工具介绍(二),2014年2月,精益六西格玛理论体系全景图,客户,流程描述,控制计划,测量系统控制,过程能力分析,多变量分析,实验设计,VoC分析,失效模式分析,流程图(I/O),因果矩阵,统计过程控制,定性分析,定量分析,头脑风暴+KJ失效树鱼骨图Why-Why分析PFMEA对标分析访谈现场调研流程观察,回归分析,软件使用,项目管理,精益六西格玛意识,统计基础,精益工具,基本图表,精益六西格玛持续改进体系,精益六西格玛推行综合管理,课程大纲,假设检验概述相关与回归,统计基础-数据类型,计数型数据(离散型数据,属性型数据):通常表示事物的分类不良品数量/不良率缺陷品数量/缺陷率机器A,机器B,机器C白班/中班/夜班计量型数据(连续型数据):通常是通过测量仪器测量得到的数据压力时间长度重量,目录,假设检验相关基础概念总体参数及样本统计量推定置信区间假设检验介绍目的与意义假设检验概念介绍假设检验原理假设检验步骤假设检验常见路径双样本T与配对T的区别讨论及问答,假设检验相关基础概念,总体参数与样本统计量,s,=样本标准差,X,=样本平均值,参数估计统计量,=总体平均值,=总体标准差,抽样(Sampling),A,A,B,D,D,D,C,C,C,C,B,标本,估计的概念,点估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋月饼的保质期是3个月点估计的种类:平均的估计、标准差、方差的估计、比率的估计等区间估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋的月饼的保质期是1-6个月,置信区间,置信区间的概念(ConfidenceInterval)误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1-)%置信水平(ConfidenceLevel)是指区间估计时,能够包含总体参数的能力水平,即1-。,置信区间,90%的置信区间举例如下图如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总体平均95%置信区间的解释:大约100个置信区间中有95个会包含总体参数,或者我们有95%的把握确定总体参数在置信区间内通常我们计算95%的置信区间,置信区间,置信区间的计算通用公式:置信区间C.I.=统计量K*S(标准偏差)统计量=平均值、方差、Cp等K=统计分布常数正态分布的置信区间公式(知道的时候):样本的置信区间公式(不知道,只能计算S):样本的平均遵循t分布,置信区间,Minitab中置信区间的计算,这些都可以计算出置信区间,假设检验,假设检验的目的假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。是为了解决选择的困难性假设检验的意义用统计的方法,通过数据进行客观的判断把我决策的风险,提高决策水准假设检验是我们政府部门最需要的工具之一。,假设检验,假设检验的概念对观测的样本资料分析后对总体差异的估计是作出选择与否判断的统计性方法假设检验术语假设设定:对要进行判断的情况进行假设设定H0-NullHypothesis:说明没有变化或者差异的设定Ha-AlternativeHypothesis:说明有变化或者差异的设定假设设定练习:为了确认小学生男女身高是否有差异为了确认小学生男生比女生高为了确认小学生身高和性别是否有相关性,假设检验,假设检验的种类单边检验One-sidedhypothesis双边检验Two-sidedhypothesis,假设检验的两种错误第1种错误(TypeError,-风险)不顾NullHypothesis真实.NullHypothesis放弃的错误把良品判断为不良的时候(误判)既,可以说生产者危险1-就是置信区间第2种错误(TypeError,-风险):不顾NullHypothesis假的.NullHypothesis接受的错误不良品当成良品的时候(漏失)即,可以说顾客危险1-是检定力,即检出能力,假设检验的两种错误说明,假设检验的两种错误举例,陪审团的判决,他无罪,事实,实际清白,他有罪,实际有罪,正确,正确,清白的人进监狱,罪犯逍遥法外,I类错误(-风险),II类错误(-风险),假设检验,假设检验原理假设检验其实是个比较的过程两种假设的比较,是A还是B?我们总是用H0来说话我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0放弃H0的决策不会总是正确的,任何决定都会有风险但风险的高低及严重度,会影响我们决策于是我们很急切的指导,我们做出放弃H0的决策的风险有多大?于是我们通过抽样数据进行运算,算出放弃H0的决策的风险的大小就是我们长见的P值(P-value),假设检验,假设检验原理(续)知道了做出放弃H0的决策的风险的大小,那么风险小于多少时我们才敢于做出放弃H0的决策呢?于是我们需要提前设定一个风险判断标准而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01、0.05、0.1等但我们通常设定为0.05这也就是我们通常拿P值和0.05进行大小比较的原因。如果P0.05接受H0;P0.05放弃H0(PLowH0Go)理解练习为什么正态检验,等方差检验P要大于0.05?,假设检验,假设检验原理(续)(SignificanceLevel)置信水平:风险判断标准P-value做出放弃H0的决策犯错误的最大风险值,p值,Ho选择域,Ho弃却域,Ho选择域,Ho弃却域,p值,P值接受H0不能做决策,不能说有差异,TP,T,TP,T,假设检验,假设检验步骤,假设设定,检定统计量选择,留意水准决定,p-value计算(弃却域,检定统计量计算),判定(统计结论)p-value0.05时Ho接受P-值0.05),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结论:我们没有足够的证据拒绝零假设。是否可以说零假设是正确的(Bob的均值=25秒)?不!但是,我们通常在假定零假设是正确的情况下执行操作。,延伸,如果问题是:“Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”如何构造零假设和备选假设?你的结论是什么?如何利用刚才的结果?,假设检验-双样本t检验,“双样本t检验”解决什么问题?,典型的问题为:“我们各抽取了坐席员Bob和Jane的30通电话样本,想知道坐席员A和B的平均话后整理时长是否相等?”当然问题也可以是“Bob的平均整理时长大于Jane的平均整理时长吗?”或者“Bob的平均整理时长小于Jane的平均整理时长吗?”,建立零假设和备选假设:Bob的平均值等于Jane的平均值Bob的平均值不等于Jane的平均值决定显著性水平:=0.05(5%)随机抽取Bob和Jane各30通电话的整理时间数据作为样本选取适合方法计算P值(参考下页详细步骤)依据P值结果做出结论,按照以下步骤完成,如果P值大于或等于0.05,不能推翻零假设H0如果P值小于a,推翻零假设H0,选取适合方法计算P值详细过程,使用控制图检验样本数据稳定性,样本量不足,n25,样本量,在获取数据并试图得出一些陈述之前,我们需要确定进行这种检验数要多少数据.记住,我们有一些基于估计值的抽样“经验方法RulesofThumb并不要求Bob和Jane的两组样本量一定是相同的注意:我们将在以后的模块中讲解样本量的计算,工具或统计最小样本量平均值5-10标准偏差25-30有缺陷的比例(P)100并且nP=5直方图或帕累托图50散点图25控制图20,不同工具的样本量,通常:连续数据:30属性数据100,步骤1:检验稳定性,步骤1:检验稳定性,步骤2:检验正态性,步骤2:检验正态性,步骤2:检验正态性,数据是否为正态分布?小P-Value(.05),数据为非正态分布注意样本大小的问題,处理数据,JMP喜欢数据按栏输入我们希望下列表格结构:测量的数据至于单独的一栏“标识符”在一栏在我们的范例中,我们希望有下列栏:坐席员Operator(用Bob和Jane作为值)话后整理时长Time(用所用Bob和Jane的通话时间值)我们显然希望这些数据按照测量值和答复电话的人之间适当的关系安排.JMP能帮助我们完成这项任务,堆叠数据为下一步进行数据格式转换,数据变换,步骤3:等方差检验,步骤3:等方差检验,P-值!,EqualVarianceNotequalvariance,方差不等时的解决方法,步骤4:均值检验,Ho:Mean(Bob)=Mean(Jane)Ha:Mean(Bob)=Mean(Jane),步骤4:均值检验,结论的陈述,由于P值小于临界置信水平(本例中P=0.0157分布检验概率,单比例检验步骤,e.)比较P值和显著性水平:P-value=0.9507a=0.050.9510.05,f.)结论:所以我们不能否定零假设,流程没有得到改善!,单比例检验步骤,卡方分析,检验相互关系:卡方检验,当y和x都是属性数据,要检验相互关系时使用我们假设变量是独立的。Ho:数据是独立的(不相关)Ha:数据不独立(相关)如果p值以X拟合Y,P值,因为P值=0.000,小于=0.05,我们将否定零假设,既学院招生与性别之间并不是独立的,观察马赛克图可以看到教育学院女生比例较高,结论,JMP输出,JMP输出,进一步扩展使用“对应分析”可以看到,图中相距比较近说明而这之间具有紧密关系,例如教育学院和女生而这相距很近,而工程学院和男生距离很近。说明教育女生比例高,工程男生比例高,卡方检验注释,卡方检验是我们本周将学到的“较易分析”工具的一种,但它并不如其他假设检验那样“富有洞察力”属性数据的结果对于卡方检验,为了满足假设,期望频率必须至少为5如果该值小于5,将告警数据必须确保随机性注意其他隐藏的因子(Xs),范例:贷款审批通过率,JMP工作表结构,我们的信用审批部处理小宗商业贷款申请。许多申请得到批准,但有一些被拒绝。部门经理猜想拒绝率可能与该申请是哪天被处理的有关。她的猜想正确吗?,打开文件5-LoanApproval.JMP,范例:贷款审批通过率,P值0.05,表明贷款审批时间和通过与否存在显著相关性,本例中周五贷款通过率明显低于其他时间,范例:贷款审批通过率,对应分析图中周五和拒绝距离比较近,星期五是否不寻常?,第一次卡方检验趋向于显示星期五与其他工作日不同。我们将通过把星期一到星期四相加编为一组,按照通过/不通过计算数目,并与星期五的数据相比较。,JMP工作表结构,星期五是否不寻常?,P值0.05,表明周五贷款通过率确实和其它天存在显著差别,其他几天呢?,最后,我们不再分析星期五的数据,只分析星期一到星期四。我们试图发现剩下的几天之间是否有相互关系。,JMP数据表结构,其他几天呢?,还有哪些情况我能使用卡方检验?,行政流程充满属性数据例如:职能:(Y)和(X)人力资源:病假天数和员工或部门财会:错误的费用报告数和员工或部门销售:失去的销售额和帐户或区域或国家后勤:迟到的交货次数和配送中心或国家呼叫中心:错过的客户电话数和公司人员或班次安装:反复服务电话数和区域技术(fieldtech)采购:订单的交货天数和供应商库存:零件数和配送中心,如果你的数据成比例或百分比,将其转换为次数#,实际意义,明确问题“我关心吗?”P值可能显示统计上的意义样本容量越大,p值越小对非常大的样本容量而言,即使很小的差异或相互关系通常都比较显著在实际上这些细小的差异可能并不显著通过关注组间差异评估实际的显著性差异是否大到有所影响?如果是,那么在实际中这些差异就是显著的。既统计显著又实际显著的因子可以用于操作流程,相关性分析与简单线性回归,相关性,从这张图我们可以看出什么?这些变量是否相关?,相关性:它对我们意味着什么?,当我们提到相关性时,我们怎么想?广告投入是否与销售量有关?资本的利用与定价是否有关?你认为奥运会溜冰项目两个裁判员之间有多大的相关性?为什么当我携带雨伞时,天色看起来都不会下雨呢?,相关性与回归分析,当y和x都是连续数据,检验相互关系时使用假设变量不相关。Ho:数据独立(不相关)Ha:数据不独立(相关)如果p值.80或者80%,相关可能显著50R280%,需要判断R250%,相关可能不显著,解释时,请使用可靠的判断,回归分析-R2,R2是由回归模型解释可变性的比例评估拟合性的有用方法(越大越好)R2的值大,并不保证良好的拟合性!R2的值小,并不表示变量不重要!用R2进行实际的判断是根据对流程和产品的分析,决定模型是否描述了足够的变异,回归分析的缺陷,回归模型可用于内推法,但不能用于在数据范围外的外推法注意一些“X”值的影响注意异常值和坏值,但不要过快地把这些值从分析中去掉注意“胡乱”的相互关系或者错误的结论为了估计响应“Y”,需要知道预测变量“X”,异常值的影响,如果异常值是一个坏值,那么模型评估是错误的,而且误差被放大。然而,如果异常值是真实过程的一个值,它不应该被去掉。它是关于过程的数据的有用的一部分。参考你的日志和回归分析笔记以理解这一点分别评价有这一点和没有这一点的模型以判定其影响。,X=预测器,Y=响应,“X”值的影响,在这个范例中:有影响的点是由于预测器X的值异常大评估数据,有和没有右边远处的那一点,没有这个有影响的点,这条线会呈什么样?,“X”值的影响,如果在分析中,R2的值或者拟合斜率有较大的变化,该点的影响就太大。,范例:拟合直线图比较,有着相似的斜率,截距和R2的不同模型,着眼于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论