六西格玛数据分析技术概述(PPT 58页).ppt_第1页
六西格玛数据分析技术概述(PPT 58页).ppt_第2页
六西格玛数据分析技术概述(PPT 58页).ppt_第3页
六西格玛数据分析技术概述(PPT 58页).ppt_第4页
六西格玛数据分析技术概述(PPT 58页).ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国人民大学六西格玛质量管理研究中心 六西格玛管理培训丛书 5 何晓群主编 六西格玛数据分析技术 何晓群编著 光盘作者 陶沙苏晨辉 中国人民大学出版社 中国人民大学六西格玛质量管理研究中心 3 1随机变量3 2随机变量的分布3 3随机变量的均值与方差3 4二项分布及其应用3 5泊松分布及其应用3 6正态分布及其应用3 7中心极限定理3 8各种概率分布计算的Minitab实现小组讨论与练习 第3章管理中常见的几个概率分布 返回目录 中国人民大学六西格玛质量管理研究中心 本章目标 1 理解随机变量及随机变量分布的基本概念2 理解随机变量的均值及方差在管理中运用的思想3 理解二项分布的意义 掌握二项分布的应用4 掌握泊松分布的意义和应用理念5 理解正态分布与6 的关系6 理解中心极限定理的意义7 掌握各种概率分布的计算实现 返回目录 中国人民大学六西格玛质量管理研究中心 3 1随机变量 日常生活中 生产实践中随机现象无处不在把随机现象的结果用变量来表示 就称为随机变量随机变量是随机现象表示的一种抽象 有了这种抽象 使得我们的研究更具普遍性 常用大写的字母X Y Z等表示随机变量 随机变量的取值常用小写字母x y z等表示 随机变量有离散型和连续型两大类 返回目录 中国人民大学六西格玛质量管理研究中心 离散型随机变量 定义 如果一个随机变量的取值是可数的 则称该随机变量是离散型随机变量 离散型随机变量是仅取数轴上有限个点或可列个点 x1 x2 x3 x4 x5 x6 x7 X 图1 公路上的汽车 完好瓷砖的数目 返回目录 中国人民大学六西格玛质量管理研究中心 连续型随机变量 定义 如果一个随机变量可取数轴上某一区间内的任一值 则称该随机变量为连续型随机变量 连续型随机变量的取值可以是整个实数轴上的任一区间 a b 如图2 X 图2 返回目录 中国人民大学六西格玛质量管理研究中心 3 2随机变量的分布 随机变量的取值的统计规律就是随机变量的分布 知道了一个随机变量的分布就掌握了它的关键 离散型随机变量的分布 随机变量X可能取哪些值 X取这些值的概率各是多大 连续型随机变量的分布 随机变量X在哪个区间上取值 它在任意小区间取值的概率是多少 返回目录 中国人民大学六西格玛质量管理研究中心 离散型随机变量的分布 离散型随机变量的分布常用下面表格形式的分布列来表示 用数学表达式表示即为 P X xi pi i 1 2 n离散型随机变量的分布应满足概率公理化定义的要求 即pi 0 p1 p2 pn 1掷一枚骰子出现的点数及其概率就可用离散型随机变量的分布列表示 返回目录 中国人民大学六西格玛质量管理研究中心 连续型随机变量的分布 连续型随机变量X 它可取某一区间内的所有值 但它的取值不能逐一列出 我们用函数f x 表示随机变量X的密度函数 用概率密度函数f x 来反映随机变量X在某一区间取值的统计规律性连续型随机变量取某一固定值的概率为零在6 管理中用连续型随机变量X常常表示产品的某种质量特性 譬如啤酒的装量 电子元件的灵敏度 电子产品的寿命等 返回目录 中国人民大学六西格玛质量管理研究中心 质量特性与概率密度函数 在生产制造业的管理现场我们常常要抽取若干样品测定某种产品的质量特性X 如在啤酒厂今天生产的啤酒中随机抽取若干瓶量测它们的装量 ml 就可用直方图表示它们的质量特性 随着测定的数量越多 直方图就会演变成一条光滑曲线 这就是所谓的概率密度函数曲线 它就刻画出隐藏在质量特性X随机取值后面的统计规律性 这条光滑曲线f x 告诉了我们什么信息 返回目录 中国人民大学六西格玛质量管理研究中心 概率密度曲线的几种不同情形 在管理现场 不同产品的不同质量特性所表现的概率密度曲线不同 这决定了形状不同 散布不同 位置不同 正是这些不同的曲线形式决定了质量特性的差别 形状不同 散布不同 位置不同 返回目录 中国人民大学六西格玛质量管理研究中心 概率密度函数的性质 概率密度曲线的纵轴在做直方图时 它是 单位长度上的频率 由于频率的稳定性 于是用概率代替了频率 从而纵轴就演变成为 单位长度上的概率 这也是为什么把密度曲线称为概率密度曲线的缘由 连续型随机变量的密度函数f x 具有如下性质 1 2 3 其中表示质量特性值在区间 a b 中的概率 这里涉及到积分概念 不必感到忧虑 因为积分计算不是重点 返回目录 中国人民大学六西格玛质量管理研究中心 3 3随机变量的均值与方差 前面第1章中看到的具体数据可以用均值和方差来分别描述数据的集中趋势和离种趋势 随机变量也有均值和方差的概念 用它们分别表示分布的中心位置和分散程度 在掷骰子例子中 每次掷下后出现的点数不仅相同 平均出现的点数是多少 在啤酒的装量测定中 每瓶啤酒的装量严格来说都不一样 它们的平均装量是多少 这就是随机变量的均值问题 相对均值而言 每次掷骰子出现的结果都在它的左右 那么平均的偏差有多大 假如一批瓶装啤酒的平均装量是640ml 各瓶偏离640ml的多少都不一样 它们平均偏离是多少 这就是随机变量的方差及标准差问题 返回目录 中国人民大学六西格玛质量管理研究中心 随机变量均值与方差的理解 生产或服务过程中的差别是难以避免的 生产过程中由于种种随机因素的影响 使得我们无法避免变异的产生 在扔飞镖时 谁都想发发命中靶心 可遗憾的事常常发生 计算多次投标的平均结果就是求均值 计算相对均值的离散程度就是计算方差 如何理解上面两图的结果 返回目录 中国人民大学六西格玛质量管理研究中心 如何理解直方图 直方图的上下公差限的总宽度是对生产能力的一个设计 在大部分时间里 生产运行的结果就在这一区间上发生 譬如 根据啤酒装量的抽检数据建立了如下的直方图 期望值640 返回目录 中国人民大学六西格玛质量管理研究中心 直方图的解释 图形纵轴表示在某一范围内量测到的数目 公差限以内就是合格品 出了公差限就是废品 上图中的T值就是均值 640ml 也即数学期望 这是一个理想值 也就是说 设计人员期望每瓶啤酒的装量正好是640ml 然而由于种种说不清道不明的原因的影响 不可能 也不存在正好的640ml 于是只要在上下公差限之内的都是合格品 出了上下公差限的就是废品 假如总共抽检了300瓶啤酒 有10瓶低于下规格限LSL 15瓶超过了上规格限USL 因此 这批产品的废品率是25 300 0 083合格率是1 0 083 0 917 即合格率为91 7 返回目录 中国人民大学六西格玛质量管理研究中心 实际与理想的差距 我们应该意识到 一个生产过程内在的精度不是由设计人员及设计方案所规定的 就像我们扔飞镖每一发都想命中靶心 但往往事与愿违 提高质量的核心就是优化流程 减小变异 提高生产流程内在的精度 这是6 管理的精髓 返回目录 中国人民大学六西格玛质量管理研究中心 6 管理的目标是缩小实际与理想的差距 T是目标值 期望值 设计值 然而常常在生产实际中 生产实际的中心值会发生变化 偏离目标值 这也说明实际生产结果的中心值是独立于设计值规定的目标值 T 的 6 管理的目的就在于优化流程 减小变异 使实际生产结果的中心值尽可能与设计的目标值重合 LSL USL T 返回目录 中国人民大学六西格玛质量管理研究中心 均值的计算公式 离散型随机变量的数学期望 均值 连续型随机变量的数学期望 返回目录 中国人民大学六西格玛质量管理研究中心 均值计算举例 例3 1 掷骰子试验中出现的点数用随机变量X表示 随机变量X的均值 数学期望 为即掷骰子出现的结果很不一样 但它们的平均取值是3 5例3 2 电子产品首次发生故障 需要维修 的时间通常遵从指数分布 譬如某种品牌的手机首次发生故障的时间T 单位 小时 遵从指数分布问计算这种品牌的手机首次需要维修的平均时间是多少小时 解 即这种品牌的手机首次需要维修的平均时间是10000小时 返回目录 中国人民大学六西格玛质量管理研究中心 方差的计算公式 离散型随机变量的方差连续型随机变量的方差由于方差不能带单位 故用标准差来刻画随机变量相对均值的离散程度 返回目录 中国人民大学六西格玛质量管理研究中心 方差计算举例 例3 3 掷骰子问题中 出现点数的平均值是3 5 每次取值相对于均值的离散程度是多大 解 即相对均值平均偏离1 71点 可以证明 指数分布的均值与标准差相等 即例3 2中某种品牌的手机首次需要维修的平均时间是10000小时 即标准差 也为10000小时 标准差如此之大有点不好理解 然而 凡是遵从指数分布的产品寿命问题就是这样 也即你的期望越高 标准差必然就大 实际中 也确有同一品牌的手机有的刚刚使用就遇到故障 而有的用了好几年也不需修理 返回目录 中国人民大学六西格玛质量管理研究中心 3 4二项分布及其应用 二项分布的概率计算公式 其中是从n个不同元素中取出x个的组合数 计算公式为 二项分布的概率计算公式中有两个重要的参数 一个是n 一个是p 故通常把二项分布记为B n p 返回目录 中国人民大学六西格玛质量管理研究中心 一个产品检验的例子 例3 4 已知某生产流程生产的产品中有10 是有缺陷的 而该生产流程生产的产品是否有缺陷完全是随机的 现在随机选取5个产品 求其中有2个产品有缺陷的概率是多大 解 这是一个符合二项分布情形的问题 设X为抽取的5个产品中有缺陷的产品的个数 则X是遵从二项分布B 5 0 1 的随机变量 某一产品有缺陷的概率为p 0 1 n 5 择所要求的概率为 类似可以计算出在抽取的5件产品中有0 1 3 4 5个产品有缺陷的概率分别为 返回目录 中国人民大学六西格玛质量管理研究中心 二项分布的均值与标准差 可以证明 如果随机变量X B n p 它们的均值 方差 标准差分别为 在例3 4中 二项分布B 5 0 1 的均值 方差与标准差分别为 二项分布的计算在n很大时 像上面的那样的运算是很麻烦的 然而 通常可以通过查二项分布表直接解决这一问题 或通过Minitab软件计算 返回目录 中国人民大学六西格玛质量管理研究中心 3 5泊松分布及其应用 单位产品缺陷数的概念在任何生产流程中 缺陷的出现难以避免缺陷的出现完全是随机的如果50件产品发现了50处缺陷 则单位产品的缺陷数为1生产一件产品无缺陷的最大可能性是多少 一件产品保证不再返工或修理的最大可能性是多少 返回目录 中国人民大学六西格玛质量管理研究中心 某一产品无缺陷的最大可能性是多大 假设某种产品由10个零部件组成 返回目录 中国人民大学六西格玛质量管理研究中心 零件数和单位产品缺陷数 DPU 10 100 1000 10000 100000 3480 3500 3520 3540 3560 3580 3600 3620 3640 3660 3680 0 9010 34868 0 99100 0 9991000 0 999910000 0 99999100000 零件数 产生合格率 以DPU 1为例 返回目录 中国人民大学六西格玛质量管理研究中心 对缺陷模型的泊松模拟 DPU 1 当零件数趋于无限时 我们可以注意到合格品率趋于 泊松公式 其中 d U是单位产品缺陷数 r是缺陷实际发生的数量 因此 当r 0时 就可得到单位产品无缺陷的概率 注意 它不同于传统意义上的产品合格率 例如合格产品的数量比上所有被检验产品的数量 返回目录 中国人民大学六西格玛质量管理研究中心 泊松分布的更一般情形 泊松分布常用来描述在一指定时间 面积 体积之内某一事件出现的个数的分布 譬如 1 修一条铁路 每月出的伤亡事故数2 在某一单位时间内 某种机器发生的故障数3 一辆汽车的表面上的斑痕数4 你的手机每天接到的呼唤次数泊松分布的一般数学形式是 其中为某种特定单位内的平均数 在研究产品缺陷问题中 返回目录 中国人民大学六西格玛质量管理研究中心 一个实际例子 例3 5 某一大型矿山每年发生工伤事故的平均次数为2 7 如果企业的安全条件没有质的改变 则下一年发生的工伤事故小于2的概率是多少 解 设X为下一年发生的工伤事故数 则X遵从为2 7的泊松分布 于是X遵从的分布为于是可算得即下一年发生工伤事故数小于2的概率为24 866 可以证明泊松分布的均值与方差相等 且均为 即 返回目录 中国人民大学六西格玛质量管理研究中心 用泊松分布近似二项分布 通常在实际应用中 当时 用泊松分布近似二项分布效果良好 例3 6 已知某种电子元件的次品率为1 5 在一大批元件中随机抽取1000个 问次品数为0 1 2 3的概率是多少 解 把 电子元件的次品数 看成随机变量X 显然X遵从二项分布B 1000 0 0015 如果直接利用二项分布公式求解 就要计算显然 计算量很大 返回目录 中国人民大学六西格玛质量管理研究中心 用泊松分布近似二项分布 续 如果用泊松分布去近似计算 则泊松分布与二项分布计算结果的比较 返回目录 中国人民大学六西格玛质量管理研究中心 3 6正态分布及其应用 随机变量X N 2 的正态分布曲线 曲线拐点的横坐标 或s P a X b 返回目录 中国人民大学六西格玛质量管理研究中心 不同的 对应的正态曲线 相同 不同的情况 相同 不同的情况 返回目录 中国人民大学六西格玛质量管理研究中心 当 不变时 不同的 对应的曲线形状不变 仅仅是位置不同 而当 不变时 不同的 对应的曲线形状不同 大的曲线较矮胖 小的曲线较瘦高 因此 反映了曲线的位置 是位置参数 它是正态随机变量的平均值 也称 为正态变量的均值 或数学期望 反映了曲线的形状 即随机变量取值的离散程度 是形状参数 也称尺度参数 称 为正态变量的标准差 2为其方差 常记为 返回目录 中国人民大学六西格玛质量管理研究中心 标准正态分布 蓝色部分的面积 P 3 X 3 0 9973 返回目录 中国人民大学六西格玛质量管理研究中心 当 0 1时 称随机变量X遵从标准正态分布 记为 如果一个随机变量X遵从标准正态分布 则其取值落在横轴上任意区间的概率可通过标准正态分布表查出 标准正态分布的分布函数用表示 即例 当时 即 返回目录 中国人民大学六西格玛质量管理研究中心 把一般正态分布转换为标准正态分布 返回目录 中国人民大学六西格玛质量管理研究中心 把一般正态分布转换为标准正态分布 1 当时 要通过变换公式把一般正态分布转换为标准正态分布2 当转换为标准正态分布后 查相应的标准正态分布表3 对于 可由获取4 当时 直接查表即可5 当时 有公式 返回目录 中国人民大学六西格玛质量管理研究中心 例3 7 某批零件的长度遵从正态分布 平均长度为10mm 标准差为0 2mm 试问 1 从该批零件中随机抽取一件 其长度不到9 4mm的概率是多少 2 为了保证产品质量 要求以95 的概率保证该零件的长度在9 5mm 10 5mm之间 这一要求能否得到保证 解 已知X N 10 0 22 1 P X 9 4 9 4 10 0 2 3 0 00135 返回目录 中国人民大学六西格玛质量管理研究中心 2 P 9 5 x 10 5 10 5 10 0 2 9 5 10 0 2 2 5 2 5 2 2 5 1 0 98758 P 9 5 X 10 5 P 2 5 z 2 5 即可以用98 76 的概率保证该批零件的长度在9 5mm 10 5mm之间 返回目录 中国人民大学六西格玛质量管理研究中心 6 与正态分布 99 9937 99 999943 99 9999998 99 73 68 27 95 45 返回目录 中国人民大学六西格玛质量管理研究中心 USL 不考虑漂移时6 水准的合格率为99 9999998 1 10亿 LSL 1 10亿 USL LSL 1 10亿 0 999999998 返回目录 中国人民大学六西格玛质量管理研究中心 规格范围 LSL USL 0 001ppm 1350ppm 0 001ppm 1350ppm 标称值 西格玛水平和对应的合格率 一个容易引起误会的比较图 返回目录 中国人民大学六西格玛质量管理研究中心 流程II 流程I与流程II的比较 LSL USL 流程I 样本均值 返回目录 中国人民大学六西格玛质量管理研究中心 3 流程与6 流程的比较 6 流程比3 流程好得多 返回目录 中国人民大学六西格玛质量管理研究中心 LSL USL 1 5 的漂移 如果你达到了6sigma质量水准 就意味着在有100万个出现缺陷的机会的流程中 实际出现的缺陷仅为3 4个 6 7 5 1 5 6 当考虑漂移后 6 十亿分之二次品率6 3 4ppm 期望流程 流程平均值的漂移 4 5 面积约等于百万分之3 4 返回目录 中国人民大学六西格玛质量管理研究中心 3 8各种概率分布计算的Minitab实现 二项分布以例3 4为例 1 在工作表中填入1 5 因为选取了五个产品 2 选取Calc ProbabilityDistributions Binomial 3 选取Probability 4 在Numberoftrials 试验次数 栏中 填入5 在Probabilityofsuccess 成功概率 栏中 填入0 10 5 选取Inputcolumn并选择数据列 点击OK 返回目录 中国人民大学六西格玛质量管理研究中心 用Minitab计算二项分布概率 输入数据 选取Calc ProbabilityDistributions Binomial 返回目录 中国人民大学六西格玛质量管理研究中心 用Minitab计算二项分布概率 续 在Numberoftrials 试验次数 栏中 填入5 在Probabilityofsuccess 成功概率 栏中 填入0 10 选取Inputcolumn并选择数据列 点击OK 计算得5个产品中有2个产品有缺陷的概率是0 0729 返回目录 中国人民大学六西格玛质量管理研究中心 泊松分布以例3 5为例 1 在工作表中填入1 2 只需考虑2次事故 2 选取Calc ProbabilityDistributions Possion 3 选取Cumulativeprobability 4 在Mean 均值 栏中 填入2 7 5 选取Inputcolumn并选择数据列 点击OK 用Minitab计算泊松分布概率 返回目录 中国人民大学六西格玛

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论