精益六西格玛统计工具介绍假设检验解析_第1页
精益六西格玛统计工具介绍假设检验解析_第2页
精益六西格玛统计工具介绍假设检验解析_第3页
精益六西格玛统计工具介绍假设检验解析_第4页
精益六西格玛统计工具介绍假设检验解析_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、六西格玛统计工具介绍(二),2014年2月,精益六西格玛理论体系全景图,客户,流程描述,控制计划,测量系统 控制,过程能力 分析,多变量 分析,实验设计,VoC分析,失效模式分析,流程图 (I/O),因果矩阵,统计过程 控制,定性分析,定量分析,头脑风暴+KJ 失效树 鱼骨图 Why-Why分析 PFMEA 对标分析 访谈 现场调研 流程观察 ,回归分析,软件使用,项目管理,精益六西格玛意识,统计基础,精益工具,基本图表,精益六西格玛持续改进体系,精益六西格玛推行综合管理,课程大纲,假设检验概述 相关与回归,统计基础-数据类型,计数型数据(离散型数据,属性型数据):通常表示事物的分类 不良品数

2、量/不良率 缺陷品数量/缺陷率 机器 A, 机器 B, 机器 C 白班/中班/夜班 计量型数据 (连续型数据):通常是通过测量仪器测量得到的数据 压力 时间 长度 重量,目录,假设检验相关基础概念 总体参数及样本统计量 推定 置信区间 假设检验介绍 目的与意义 假设检验概念介绍 假设检验原理 假设检验步骤 假设检验常见路径 双样本T 与配对T的区别 讨论及问答,假设检验相关基础概念,总体参数与样本统计量,s,= 样本标准差,X,= 样本平均值,参数 估计 统计量,= 总体平均值,= 总体标准差,抽样(Sampling),A,A,B,D,D,D,C,C,C,C,B,标本,估计的概念,点估计:通过

3、抽样用一个具体的值估计总体的参数 举例:通过抽样调查中秋月饼的保质期是3个月 点估计的种类:平均的估计、标准差、方差的估计、比率的估计等 区间估计:通过抽样用一个具体的值估计总体的参数 举例:通过抽样调查中秋的月饼的保质期是1-6个月,置信区间,置信区间的概念(Confidence Interval) 误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1- )% 置信水平(Confidence Level) 是指区间估计时,能够包含总体参数的能力水平,即1- 。,置信区间,90%的置信区间举例如下图 如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总

4、体平均 95%置信区间的解释: 大约100个置信区间中有95个会包含总体参数, 或者 我们有95%的把握确定总体参数在置信区间内 通常我们计算95%的置信区间,置信区间,置信区间的计算 通用公式: 置信区间C.I.=统计量K*S(标准偏差) 统计量=平均值、方差、Cp等 K=统计分布常数 正态分布的置信区间公式( 知道的时候): 样本的置信区间公式(不知道,只能计算S): 样本的平均遵循t分布,置信区间,Minitab中置信区间的计算,这些都可以计算出置信区间,假设检验,假设检验的目的 假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。 是为了解决选择的困难性 假设检验的意

5、义 用统计的方法,通过数据进行客观的判断 把我决策的风险,提高决策水准 假设检验是我们政府部门最需要的工具之一。,假设检验,假设检验的概念 对观测的样本资料分析后对总体差异的估计 是作出选择与否判断的统计性方法 假设检验术语 假设设定:对要进行判断的情况进行假设设定 H0 -Null Hypothesis:说明没有变化或者差异的设定 Ha- Alternative Hypothesis:说明有变化或者差异的设定 假设设定练习: 为了确认小学生男女身高是否有差异 为了确认小学生男生比女生高 为了确认小学生身高和性别是否有相关性,假设检验,假设检验的种类 单边检验 One-sided hypoth

6、esis 双边检验 Two-sided hypothesis,假设检验的两种错误 第1种 错误 (TypeError, -风险) 不顾Null Hypothesis 真实. Null Hypothesis放弃的错误 把良品判断为不良的时候(误判) 既, 可以说生产者危险 1- 就是置信区间 第2种 错误 ( TypeError, -风险) : 不顾Null Hypothesis 假的. Null Hypothesis接受的错误 不良品当成良品的时候( 漏失 ) 即, 可以说顾客危险 1- 是检定力,即检出能力,假设检验的两种错误说明,假设检验的两种错误举例,陪审团的判决,他无罪,事实,实际清白

7、,他有罪,实际有罪,正确,正确,清白的人进监狱,罪犯逍遥法外,I类错误 (-风险),II 类错误 (-风险),假设检验,假设检验原理 假设检验其实是个比较的过程 两种假设的比较,是A还是B? 我们总是用H0 来说话 我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0 放弃H0 的决策不会总是正确的 ,任何决定都会有风险 但风险的高低及严重度,会影响我们决策 于是我们很急切的指导,我们做出放弃H0 的决策的风险有多大? 于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险的大小就是我们长见的 P值(P-value),假设检验,假设检验原理(续) 知道了做出放弃H0 的决策的风险的大小

8、,那么风险小于多少时我们才敢于做出放弃H0 的决策呢? 于是我们需要提前设定一个风险判断标准 而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01 、0.05、0.1 等 但我们通常设定 为0.05 这也就是我们通常拿P值和0.05 进行大小比较的原因。 如果P0.05 接受H0; P0.05 放弃H0 (P Low H0 Go) 理解练习 为什么正态检验,等方差检验P要大于0.05?,假设检验,假设检验原理(续) (Significance Level)置信水平:风险判断标准 P-value 做出放弃H0 的决策犯错误的最大风险值,p 值,Ho 选择域,Ho弃却域,Ho选择域,H

9、o弃却域,p值,P值 接受H0 不能做决策 ,不能说有差异,TP,T ,TP,T ,假设检验,假设检验步骤,假设 设定,检定统计量选择,留意水准 决定,p-value 计算 (弃却域 , 检定统计量 计算),判定(统计结论) p-value 0.05 时 Ho 接受 P-值0.05),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结论: 我们没有足够的证据拒绝零假设。 是否可以说零假设是正确的(Bob的均值=25秒)? 不! 但是,我们通常在假定零假设是正确的情况下执行操作。,延伸,如果问题是: “Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?” 如

10、何构造零假设和备选假设?你的结论是什么?如何利用刚才的结果?,假设检验 - 双样本t检验,“双样本t检验”解决什么问题?,典型的问题为: “我们各抽取了坐席员Bob和Jane的30通电话样本,想知道坐席员A和B的平均话后整理时长是否相等?” 当然问题也可以是“Bob的平均整理时长大于Jane的平均整理时长吗?”或者“Bob的平均整理时长小于Jane的平均整理时长吗?”,建立零假设和备选假设: Bob的平均值等于Jane的平均值 Bob的平均值不等于Jane的平均值 决定显著性水平: = 0.05(5%) 随机抽取Bob和Jane各30通电话的整理时间数据作为样本 选取适合方法计算P值(参考下页

11、详细步骤) 依据P值结果做出结论,按照以下步骤完成,如果P值大于或等于0.05,不能推翻零假设 H0 如果P值小于a,推翻零假设 H0,选取适合方法计算P值详细过程,使用控制图检验样本数据稳定性,样本量不足,n25,样本量,在获取数据并试图得出一些陈述之前, 我们需要确定进行这种检验数要多少数据. 记住, 我们有一些基于估计值的抽样“经验方法 Rules of Thumb 并不要求Bob和Jane的两组样本量一定是相同的 注意: 我们将在以后的模块中讲解样本量的计算,工具或统计 最小样本量 平均值 5 - 10 标准偏差 25 - 30 有缺陷的比例 (P) 100 并且 nP = 5 直方图

12、 或帕累托图 50 散点图 25 控制图 20,不同工具的样本量,通常: 连续数据: 30 属性数据 100,步骤1: 检验稳定性,步骤1: 检验稳定性,步骤2: 检验正态性,步骤2: 检验正态性,步骤2: 检验正态性,数据是否为正态分布 ? 小 P-Value (.05), 数据为非正态分布 注意样本大小的问題,处理数据,JMP喜欢数据按栏输入 我们希望下列表格结构: 测量的数据至于单独的一栏 “标识符”在一栏 在我们的范例中, 我们希望有下列栏: 坐席员 Operator (用Bob 和 Jane 作为值) 话后整理时长 Time (用所用 Bob 和 Jane的通话时间值) 我们显然希望

13、这些数据按照测量值和答复电话的人之间适当的关系安排. JMP 能帮助我们完成这项任务,堆叠数据为下一步进行数据格式转换,数据变换,步骤3: 等方差检验,步骤3: 等方差检验,P-值!,Equal Variance Not equal variance,方差不等时的解决方法,步骤4:均值检验,Ho: Mean(Bob) = Mean(Jane) Ha: Mean(Bob) = Mean(Jane),步骤4:均值检验,结论的陈述,由于P值小于临界置信水平(本例中P=0.0157 分布 检验概率,单比例检验步骤,e.) 比较P值和显著性水平: P-value =0.9507 a = 0.05 0.9

14、51 0.05,f.) 结论:所以我们不能否定零假设,流程没有得到改善!,单比例检验步骤,卡方分析,检验相互关系:卡方检验,当y和 x都是属性数据,要检验相互关系时使用 我们假设变量是独立的。 Ho: 数据是独立的 (不相关) Ha: 数据不独立 (相关) 如果p值 以X拟合Y,P值,因为P值=0.000,小于 = 0.05,我们将否定零假设,既学院招生与性别之间并不是独立的,观察马赛克图可以看到教育学院女生比例较高,结论,JMP输出,JMP输出,进一步扩展使用“对应分析”可以看到,图中相距比较近说明而这之间具有紧密关系,例如教育学院和女生而这相距很近,而工程学院和男生距离很近。说明教育女生比

15、例高,工程男生比例高,卡方检验注释,卡方检验是我们本周将学到的“较易分析”工具的一种,但它并不如其他假设检验那样“富有洞察力” 属性数据的结果 对于卡方检验,为了满足假设,期望频率必须至少为5 如果该值小于5 , 将告警 数据必须确保随机性 注意其他隐藏的因子 (Xs),范例: 贷款审批通过率,JMP 工作表结构,我们的信用审批部处理小宗商业贷款申请。许多申请得到批准,但有一些被拒绝。部门经理猜想拒绝率可能与该申请是哪天被处理的有关。她的猜想正确吗?,打开文件 5- Loan Approval.JMP,范例: 贷款审批通过率,P值0.05,表明贷款审批时间和通过与否存在显著相关性,本例中周五贷

16、款通过率明显低于其他时间,范例: 贷款审批通过率,对应分析图中周五和拒绝距离比较近,星期五是否不寻常?,第一次卡方检验趋向于显示星期五与其他工作日不同。我们将通过把星期一到星期四相加编为一组,按照通过/不通过计算数目,并与星期五的数据相比较。,JMP 工作表结构,星期五是否不寻常?,P值0.05,表明周五贷款通过率确实和其它天存在显著差别,其他几天呢?,最后,我们不再分析星期五的数据,只分析星期一到星期四。我们试图发现剩下的几天之间是否有相互关系。,JMP 数据表结构,其他几天呢?,还有哪些情况我能使用卡方检验?,行政流程充满属性数据例如: 职能: (Y) 和 (X) 人力资源: 病假天数和员

17、工或部门 财会: 错误的费用报告数和员工或部门 销售: 失去的销售额和帐户或区域或国家 后勤: 迟到的交货次数和配送中心或国家 呼叫中心: 错过的客户电话数和公司人员或班次 安装: 反复服务电话数和区域技术(field tech) 采购: 订单的交货天数和供应商 库存: 零件数和配送中心,如果你的数据成比例或百分比,将其转换为次数#,实际意义,明确问题“我关心吗?” P值可能显示统计上的意义 样本容量越大,p值越小 对非常大的样本容量而言,即使很小的差异或相互关系通常都比较显著 在实际上这些细小的差异可能并不显著 通过关注组间差异评估实际的显著性 差异是否大到有所影响? 如果是,那么在实际中这

18、些差异就是显著的。 既统计显著又实际显著的因子可以用于操作流程,相关性分析与简单线性回归,相关性,从这张图我们可以看出什么? 这些变量是否相关?,相关性:它对我们意味着什么?,当我们提到相关性时,我们怎么想? 广告投入是否与销售量有关? 资本的利用与定价是否有关? 你认为奥运会溜冰项目两个裁判员之间有多大的相关性? 为什么当我携带雨伞时,天色看起来都不会下雨呢?,相关性与回归分析,当y和x都是连续数据,检验相互关系时使用 假设变量不相关。 Ho: 数据独立 (不相关) Ha: 数据不独立 (相关) 如果p值 .80 或者 80%,相关可能显著 50R280%,需要判断 R250%,相关可能不显著,解释时,请使用可靠的判断,回归分析 - R2,R2 是由回归模型解释可变性的比例 评估拟合性的有用方法 (越大越好) R2 的值大,并不 保证良好的拟合性! R2 的值小,并不表示变量不重要! 用R2 进行实际的判断是根据对流程和产品的分析,决定模型是否描述了足够的变异,回归分析的缺陷,回归模型可用于内推法,但不能用于在数据范围外的外推法 注意一些“X”值的影响 注意异常值和坏值,但不要过快地把这些值从分析中去掉 注意“胡乱”的相互关系或者错误的结论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论