问题识别的方法【PPT课件】_第1页
问题识别的方法【PPT课件】_第2页
问题识别的方法【PPT课件】_第3页
问题识别的方法【PPT课件】_第4页
问题识别的方法【PPT课件】_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1-2-统计基础,1-2-1,问题识别概要 信息统计 旧件收集 课题确定 确定目标 常用技术/工具 案例 训练题目 小组讨论,问题识别,防止再发,团队组建,原因分析,现状调查,对策制定,改进实施,效果验证,目 录,1-2-统计基础,1-2-2,送货的案例:某顾客要求甲乙供应商10点+/-5分钟整送货到位,收货员记录了每天的到货时间表,并把数据交给了主管,具体记录如下表:,问题识别常用技术/工具统计基础,统计基础导入案例,小组讨论并发表:假如你是主管,请你判断:1、采取措施前供应商是否达到顾客要求?如果都没有达到,谁家做的相对好一点?2、采取措施后,甲乙两个供应商是否都有进步?那个进步快一点;,1-2-统计基础,1-2-3,为何讲这个案例,是因为前面讲到了信息收集、目标确认,现实之中的信息都是这样的,纷繁复杂,数量众多,都是具体的分散的;要想解决问题,首先需要学会信息的描述,即用数字来衡量现状的好坏。这样是否改善了,我们才会知道,所以需要给大家导入介绍统计基础。学习内容:1、总体与样本概念;2、基本统计量:中位数、众数、均值、方差、标准差、极差;3、随机事件、概率、波动与分布。学习目的:在“信息收集”阶段,统计基础是用来对所收集材料进行初步分析、后续所有阶段都需要这方面的基础知识。把实际收集到的数据、信息用数值显示和描述。用以前的事实来推断未来的情况。“统计基础”是“高级统计学”的基础。基本统计概念不是根据直观经验、而是根据事实挖掘出的深度信息。,统计基础导入案例,问题识别常用技术/工具统计基础,1-2-统计基础,1-2-4, 样本 : 从总体中实际抽出的观测值的集合。,总体:对象的全体(全集)。(对所有有投票权的投票结果,一日生产量,特定产品的不良率。 ),例:2007年吉利集团生产的全部汽车数是约 30万辆。为了调查2007年机车的整体质量水平,在全球各地区任意抽出200名用户调查。这时的总体和样本是什么? 总体 : 2007年吉利集团生产的全部汽车数是约 30万辆样本 : 全球各地区任意抽出的200辆,问题识别常用技术/工具统计基础,总体和样本,1-2-统计基础,1-2-5,问题识别常用技术/工具统计基础,总体和样本,1-2-统计基础,1-2-6,情景1:减震器在各地(山区、平原、丘陵等)的发生故障的不同概率;为了研究其故障件的情况,如何抽样? 情景2:两个不同的减震器厂家,需要选择一个作为主要供应商,如何对其产品质量水平进行判定,如何抽样? 抽样检验:按照规定的抽样方案,随机地从一批或一个过程中抽取少量个体(作为样本)进行的检验,根据样本检验的结果判定一批产品或一个过程是否可以被接收。检验的对象是一批产品根据抽样结果应用统计原理推断产品批的接收与否接收批中人可能包含不合格品;不接收批中当然也包含合格品,总体和样本,问题识别常用技术/工具统计基础,1-2-统计基础,1-2-7,对数据中心的测度,包括平均值,中位数,众数等。.,例 ) 产品完成所需AF 的7个工序。下面测定了每工序所需要的时间。 求每工序所需要的平均时间。,极端值 30分对平均的影响大!, 均值 n 个观测值的均值, 观测值的总和除以观测值个数 对于 极端值很敏感。,平均 :,2 2 1 3 2 9 30,A B C D E F G,(单位 :分),观测值总和,观测值个数,=,计算),问题识别常用技术/工具统计基础,中心位置,身高与门,1-2-统计基础,1-2-8, 中位数 数据按从小到大顺序排列时,中间位置的值。 中位数不受极端值的影响。, 众数 数据频度数多的数。 众数不受极端值的影响。,例 ) 前面问题中众数是多少?,在2, 2, 1, 3, 2, 9, 30中频度数 2值为 3,拥有最多 的频度, 因此众数是 2 。,中位数,众数不受极端值的 影响。,n 为奇数时 :,n 为偶数时 :,1 2 2 2 3 9 30,1 2 2 2 3 9 10 30,2和 3的平均,2.5,问题识别常用技术/工具统计基础,中心位置,1-2-统计基础,1-2-9,显示数据离中心位置分散多少的测度,代表性的有方差、标准差、4分位数等。,B汽车每百升平均行驶距离比 A汽车高,但分布的离散大,所以不能说 一定是B汽车好!,A 汽车,B 汽车,下面是测量A ,B汽车每百升油行驶公里数的数据分布。 各位喜欢什么样的汽车?,A,B,例 ),统计分析中只考虑平均判断会得到错误的结果,还应考虑数据分散程度的离散性。,问题识别常用技术/工具统计基础,离散性,1-2-统计基础,1-2-10,方差和标准偏差是数据离开平均值的距离,表示数据分散的程度。可以使用各数据值和平均的差异,即把偏差都合起来,结果为0,所以使用距离的平方, 即,偏差的平方。,30,40,50,60,70,假如,从 点到 的乘方距离是 , 分散被定义为平均乘方距离 (按统计理由 分母不是 n,而是使用 n-1),标准差取乘方根分散的形态。, 方差与标准偏差,例 ) 数据 : 4 8 7 5 2 6 3 平均 5 偏差的和 : (-1) + 3 + 2 + 0 + (-3) + 1+ (-2) = 0,样本方差 :,标准差 :,问题识别常用技术/工具统计基础,离散性,1-2-统计基础,1-2-11, 4分位数(Quartile) : 数据按顺序排列时,被 4等分的数。, 4 分位范围(IQR ) : Q3-Q1,Q1: 第 1/4分位数 = 相当于25% 的值,Q2: 第 2 /4分位数=相当于 50% 的值,Q3: 第 3 /4分位数= 相当于75% 的值,例) 有如下数据时,求4分位数和 IQR .,2, 8, 20, 4, 9, 5, 4, 3,计算 ) 按顺序排列 :,Q1 = 3.25,Q2 (中位数) = 4.5,Q3 = 8.75,2 3 4 4 5 8 9 20, 极差: 在一组数据中,用最大值和最小值的差表示。 = 最大值 最小值,问题识别常用技术/工具统计基础,离散性,1-2-统计基础,1-2-12,例题 1,以下是吉利集团第一期3824培训班入学考试成绩,请分析结果。,利用质量专业软件求全部数据的基础统计量,问题识别常用技术/工具统计基础,演练,1-2-统计基础,1-2-13,统计 基本统计量 显示描述性统计,步骤 2,选择变量列,使用分层变量,选择分析图形,问题识别常用技术/工具统计基础,演练,1) 基本统计量 : 显示统计量和分析图表,数据输入,步骤 1,选择统计量,1-2-统计基础,1-2-14,平均,标准差, 4分位数,下四分位数: 数据按从小到大顺序排列时, 25% 位置的数 ( 第1/4分位数 ) 46.50,上四分位数: 数据按从小到大顺序排列时, 75% 位置的数 ( 第3/4分位数 ) 62.00,平均值 : 对观测值的平均 54.43,中位数 : 对观测值的中央值 54.00,标准差 : 对观测值的标准偏差 12.84,问题识别常用技术/工具统计基础,演练,结果确认,步骤 3,1-2-统计基础,1-2-15,结果确认,步骤 4,直方图,箱线图,信赖区间(平均),正态性检验,基础统计量,4分位数,平均,标准偏差,中位数的信赖区间,信赖区间 (中位数值),问题识别常用技术/工具统计基础,演练,1-2-统计基础,1-2-16,误差就是对目标的偏离,即变异误差(变异) =X-X0偶然性误差:变异大小和方向的变化是随机的,也叫偶然波动,由偶然因素引起的。系统性误差:变异大小和方向的变化保持不变或按一定规律变化,叫异常波动,由异常因素引起的。,问题识别常用技术/工具统计基础,认识到波动无处不在;用统计的方法去把握质量波动;根据统计的推理采取行动,减少波动。,统计学基本观点,1-2-统计基础,1-2-17,异波小-准确度好偶波小-精密度好系统误差小偶然误差小-,异波大-准确度差偶波小-精密度高系统误差大偶然误差小,异波小-准确度高偶波大-精密度差系统误差小偶然误差大,异波大-准确度差偶波大-精密度差系统误差大偶然误差大,过程控制中有时用精度来反映质量的波动(变异)程度。精度可分为:准确度:反映系统波动的影响程度;精密度:反映偶然波动的影响程度;精确度:反映系统波动和偶然波动综合的影响程度,问题识别常用技术/工具统计基础,统计学基本观点,1-2-统计基础,1-2-18, 计量型数据 : 能测定的品质特性的值。 例) 强度 (kg/cm2), 重量(kg) , 长度(cm), 温度(C) 等计量型数据。,数据的类别, 计数型数据: 按个数能数的品质特性的值 例) 缺陷数,不良品数等计数型数据。,1,2,3,4,一,二,三能数啊!,有测定单位吧,问题识别常用技术/工具统计基础,概率分布基础,1-2-统计基础,1-2-19,对有发生可能的所有情况特定事件A发生的可能性,即,无数次反复进行同样的实验时, 发生事件A的比率。,样本空间: 在实验或观察中所有可能发生的实验结果的集合。,随机事件 : 样本空间的部分集合,具有某特定观察的实验结果的集合。,例) 想一想掷两个骰子。,样本空间 S = (1, 1), (1, 2), , (6, 6) : 36种所有实验结果的集合。 事件 : 样本空间的部分集合。 E1 = 第一个骰子出现1时 = (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6) 掷两个骰子时第一个骰子出现1情况的概率P(E1) P(E1) = P(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6)= 6/36 = 1/ 6,概率,问题识别常用技术/工具统计基础,概率分布基础,1-2-统计基础,1-2-20,概率变量,硬币出现的情况,即,可以认为样本空间是 (前面, 前面), (前面,后面), (后面, 前面), (后面, 后面) . 这时,假如把概率变量 X 为硬币前面出现的个数, (前面, 前面)情况时,概率变量 X是 2. 因此概率变量X可以如下表示。 X(前面,前面) =2, X(前面, 后面) =1, X(后面, 前面) =1, X(后面, 后面) =0,概率变量对应 样本空间的数。,例) 想一想掷两个硬币的情况。,对样本空间的各个值赋予实数的函数。,问题识别常用技术/工具统计基础,概率分布基础,1-2-统计基础,1-2-21,X=x,0,1,2,个,事件,(后,后),(前, 后), (后, 前),(前, 前),P(X=x),1/4,2/4,1/4,1,1/2,1/4,0,1,2,在这里 X叫 概率变量,给概率变量值对应概率的关系叫 概率分布。,前例的概率分布用表和图形表示如下。,P(X=0) = 1/4 , P(X=2) = 1/4, P(X=1) = 1/2,下面求概率变量 X 为 1的概率。 X= 1的情况意味着硬币前面出现的个数为一个,因此出现 (前面, 后面) , (后面, 前面)的两种情况,概率是全部4种情况中的两种即可知1/2 ,所以给各个的概率变量值对应概率如下。,问题识别常用技术/工具统计基础,概率分布基础,1-2-统计基础,1-2-22,概率分布 给概率变量的数值对应概率的关系,有计量型概率分布和计数型概率分布。,缺陷数是数据: 泊松分布, 注意 现场的连续性数据一般随正态分布。但信赖性数据是随指数分布或 Weibull(威布尔)分布的情况多,在只规定单侧规格或工程有异常情况时, 数据 一般也不按正态分布。, 概率分布的种类,计数型 概率分布 : 概率变量X是计数型概率变量时,不良品数据: 二项分布,计量型 概率分布 : 概率变量X是计量型概率变量时,正态分布,问题识别常用技术/工具统计基础,概率分布基础,1-2-统计基础,1-2-23,正态分布是最自然的分布,某一定范围内的所有实数值都可以取的概率分布,是计量型概率分布中最有代表性的分布。,概率密度函数是平均 为 中心对称的钟模样。- 分布的模样和位置用分布的平均和分散决定。- 从社会性,自然性现象出来的分布大部分与 正态分布类似。- 拥有平均 ,分散 2 的正态分布如下表示,正态分布的概率密度函数,1,2,1 = 1,1,2,1,2,1,2,2,1, 随与 的正态分布模样 ,1 2 , 1 = 2,1 = 2 , 1 2,1 2 , 1 2,问题识别常用技术/工具统计基础,概率分布基础,正态分布,1-2-统计基础,1-2-24,Z,X,=,-,s,为了使概率计算容易,把正态分布标准化为平均 = 0, 标准偏差 = 1,Z 变换 : 正态分布的标准化,用标准化的概率变量 Z 表示,X N (100, 102)的 正态分布, - , - 2, - 3, + 3, + 2, +,100,90,80,70,120,110,130,标准化,Z,X,=,-,100,10,Z N (0, 12)的 标准正态分布,0,- 1,- 2,- 3,3,2,1,Z ,问题识别常用技术/工具统计基础,概率分布基础,标准正态分布,1-2-统计基础,1-2-25,平均是 20,标准偏差是 5的正态分布中, 使用软件求下面各概率。. (a) P(X15), 即 X15的概率? (b) P(X30), 即 X30的概率? (c) P(Xx) = 0.90的 x值?,通过下例看一下利用专业质量软件正态分布的概率计算。,例题 2,问题识别常用技术/工具统计基础,练习,概率分布计算,1-2-统计基础,1-2-26,概率密度函数 输入 x 概率密度函数 f (x)值计算,累计概率,逆累计概率,专业软件概率分布中求概率值的方法,输入x 累积概率 F (x)值计算,输入累积概率 F (x)值 计算相关 x值,f (x),问题识别常用技术/工具统计基础,概率分布基础,1-2-统计基础,1-2-27,(a) P(X15), 即 X 概论分布 正态(N),步骤1,选择累积概率,输入平均和标准偏差,输入系数,常数输入在特定列时,问题识别常用技术/工具统计基础,练习,1-2-统计基础,1-2-28,结果解释,步骤 2,x = 15,P X15 = P ,X-20,5,15-20,5,= P Z 概论分布 二项分布,A公司生产的制品不良概率是 0.01. 把这些产品各10个一捆销售,不良品一个以上时可以换。这时一捆被换的概率是多少?,例题 3,计算 ) P( X 2 ) = 1 - P( X 1 ) = 1- P( X = 0 ) - P( X = 1 ) = 1 - 0.010 0.9910 - 0.011 0.999 = 1 - 0.90438 - 0.09135 = 0.00427,10 0,10 1,二项分布在现场的不良品数据时多使用吧!,1-2-统计基础,1-2-32,关于P( X 1 的 概率,因此, 知道P( X 2 ) = 1 - P( X 1 ) = 1- 0.9957 = 0.0043,结果确认,步骤 2,问题识别常用技术/工具统计基础,练习,1-2-统计基础,1-2-33,适用于按时间或空间发生频率低的随机事件的每单位发生数等适用的分布。,例) 机器一天的故障次数,每单位时间打来的电话次数,制品的每单位面积 缺点数,交叉路上一天发生的交通事故数,大量生产制品的不良数。,一般 在n大, p小时适用,例) 显示随每单位缺点数值的概率值的图表。,问题识别常用技术/工具统计基础,概率分布基础,泊松分布 (Poisson Distribution),1-2-统计基础,1-2-34,概率密度函数,平均发生次数 :

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论