六西格玛绿带教程相关与回归PPT课件.ppt_第1页
六西格玛绿带教程相关与回归PPT课件.ppt_第2页
六西格玛绿带教程相关与回归PPT课件.ppt_第3页
六西格玛绿带教程相关与回归PPT课件.ppt_第4页
六西格玛绿带教程相关与回归PPT课件.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 DMAIC阶段 Define 界定Measure 测量Analyze 分析Improve 改进Control 控制项目启动寻找Y=f(x)建立基准测量Y=f(x)确定要因分析Y=f(x)消 除要因 优化Y=f(x)贯彻执行更新Y=f(x)Breakthrough!DMAIC六西格玛改进程序SIPOC过程图C&E矩阵和FMEA多变量研究假设检验试验设计筛选优化的过程30 50个X10 - 15 个X8 10个 X4-8 关键的X 3-6个关键的X 漏斗效应控制计划MAI CD相关分析和回归分析因果矩阵分析多变量分析相关与回归分析相关分析和回归分析因果矩阵分析多变量分析相关与回归分析因果矩阵分析

2、法 因果矩阵分析法是寻找影响主要过程输出变量的主要输入变量的一种方法。 因果矩阵分析法步骤:(1)确定主要过程输出变量;(2)确定主要过程输出变量的重要度;(从重要到不重要101级)(3)列出过程步骤(工序);(4)针对每个主要过程输出变量,确认对该输出有影响的输入变量;(5)确定输入变量和输出变量之间相关程度(从相关到不相关100级)(6)计算每个工序输入变量的总分;(7)根据总分确定输入变量的优先级别(得分最高的几个输入变量可能为关键输入变量)(8)对关键输入变量影响的真实性加以验证。案例: 某公司加工X产品,为了确认对输出存在主要影响的过程输入变量,该公司决定对生产过程进行因果分析。因为

3、缺陷有几种,所以用因果图分析效率较低,该公司六西格玛团队决定最终用因果矩阵分析法来帮助分析。1. 确定过程主要输出变量 通过头脑风暴法,结合目前的过程缺陷,得出X产品加工过程主要输出如下:X产品加工过程ABCDEF主要输出2. 确定过程主要输出变量的重要度如下表:3. 列出过程步骤,并与过程主要输出联立成关 系矩阵,如表所示:4. 针对每个主要输出变量,在每个工序列出对 该输出有影响的输入变量,如表。5. 确定输入变量与输出变量之间的相关程度, 如表。6. 计算每个工序输入变量的总分 从表中可知,“i”的总分为410,“0”的总分为220,“e”的总分为186,占前三位,因此,认为以上几个输入

4、变量为影响过程输出的关键输入变量,需重点给予改进。7. 根据总分确定输入变量的优先级别8. 对关键输入变量影响的真实性加以验证相关分析和回归分析因果矩阵分析多变量分析相关分析与回归分析多变量分析多变量图(Multi-Vari Chart):适用于连续型数据,描述变量间的关系多变量图:直观地提供过程各影响因素之间的关系以及它们对过程输出影响的坐标图。六西格玛团队在研究多个变量时,可用多变量图形象地描述变量间的关系。这些图在方差分析等数据分析之前做,可以对数据有一些初步的形象了解。多变量图例:项目团队研究三种材料在某种条件下的时间效应。数据收集过程是在三个通电时间0.5,1.0,1.5分钟里分别测

5、量每种材料(材料1,材料2和材料3)的5个样品,在进行数据分析前,了解是否有明显的趋势成交互作用。 A通电时间B材料 C超导强度0.50.50.50.50.50.50.50.50.51.01.01.01.01.01.01.01.01.01.51.51.51.51.51.51.51.51.5111222333111222333111222333232021221920191821222019242522201922181816212320202224多变量图在输出的多变量图中,每一材料类型上都有连接三个点的连线,这三个点表示在对应的材料类型下,各个时间段里材料的超导强度的平均值,反映了各个材料类

6、型组内的信息,图中虚线连线上的各个点分别代表三种材料的超导强度的平均值,反映了各个材料类型组间的信息,它们虽有差别,但并不严重。同种材料内分别对应的通电时间(通电时间分别为:0.5,1.0,2.0分钟)的超导强度差异较大,而且不同材料对应同样的通电时间的图象样子差别很大, 说明材料的种类与通电时间的长度有交互作用。回归分析( Regression Analysis)二类关系相关系数相关系数的检验一元线性回归模型回归方程的显著性检验利用回归方程作预测利用回归方程作控制可化为线性回归的例子两变量间关系确定关系: 例:圆面积S与半径R相关关系: 例:(1)儿子的身高与父亲的身高 (2)教育投资与家庭

7、收入 (3)体重与身高 (4)合金钢强度与合金钢中的碳含量因果关系:例:发炎与发烧例1 由专业知识知道,合金的强度y(107Pa)与合金中碳的含量x(%)有关。为了生产强度满足用户需要的合金,在冶炼时如何控制碳的含量?如果在冶炼过程中通过化验得12组数据,列于下表中:为解决这类问题就需要研究两个变量间的关系。画散点图。为了研究两个量间存在什么关系,可以画一张散点图,具体见下图: 回归分析是研究一个随机变量y与另一些变量x1,x2,xk(普通变量或随机变量)之间关系的统计方法。在某些问题中,诸x带有“原因”的性质,故称之为自变量。而y带有“结果”的性质,故称之为因变量。有时x与y之间并无明显的因

8、果关系,但仍沿用自变量与因变量的名称。有时也称x为“因子”或“因素”,称y为“指标”或“响应”。 相 关 系 数(correlation coefficients)散点图呈现上图的形状,即n个点基本在一条直线附近,但又不完全在一条直线上,我们希望用一个量来表示他们的密切程度,这个量称为相关系数,记为r,它被定义为:可以证明有-1r1。在合金钢的例子中可算得:相关系数r 示意图与说明相关系数r大小是表示两个变量x与y之间线性相关的程度。当r=1时,n个点在一条直线上,这时两个变量间完全线性相关。 xy r=1,完全线性正相关xyr=-1,完全线性负相关当r0时,称两个变量间具有正相关,这时当x的

9、值增加时,y的值也有增大的趋势。0yx强正相关变量之间有很强的正相关性,暗示变量之间可能存在显著的因果关系。在此模式下,一般能够建立起有效的回归方程。yx0弱正相关变量之间有一定的正相关性,暗示变量之间可能存在较弱的因果关系,或者变量(其中之一或全部)受其他变量的显著影响。当r0.576,如今r=0.9705,可以显著性水平=0.05认为,合金强度y与其碳含量x间存在线性关系。一元线性回归模型假定有两个变量:x是自变量,其值是可以控制或精确测量的,认为它的非随机变量。y是因变量,对给定的x值,y的取值事先不确定,故y是随机变量。假设(x,y)的散点图显示有直线关系,则我们可以认为观测值y由两部

10、分迭加而成:一是随x的变化而呈线性变化的趋势,用0+1x表示;二是其它随机因素影响的总和,用表示,常设N(0,2)。故有如下的数据结构式:yi=0+1x+i,i=1,2,n回归系数的最小二乘估计。按最小二乘法:记若 与 满足如下等式:则称 , 为0 ,1的最小二乘估计。0 与1的最小二乘估计可以验证: , 使Q(0,1)达到最小,故其为最小二乘估计。回归方程:此回归方程总经过 和 二点 计算步骤5. 写出回归方程例一的计算表回归方程的显著性检验我们建立回归方程的目的是去表达两个具有线性相关的变量间的定量关系,因此,只有当两个变量具有线性相关关系时所建立的回归方程才是有意义的。两个变量间是否存在

11、线性相关关系的。检验有两种方法方法之一,便是上一小段所叙述的求两个变量间的相关系数,对于给定的显著性水平,当相关系数r的绝对值大于临界值 时,便认为两个变量间存在线性相关关系,所求得的回归方程是有意义的。方法之二,是用方差分析的方法。这个方法具有一般性。平方和分解式n个观察值y1,y2,yn的总的波动可用总偏差平方和ST表示:其中 为n个观察值的平均。引起这种波动的原因有二: 1. 由于自变量x取不同值引起y的变化; 2. 其它因素(除x以外)引起y的变化,统归结为随机误差。这二个原因可从总平方和分解式看出,即:其中方差分析表其中各平方和的计算:例续 下面我们对用方差分析的方法作回归方程的显著

12、性检验。 (1)计算各类偏差平方和由前面的计算知: (2)列方差分析在=0.05时,F1-(1,10)=4.96,现在F4.96,这表明在=0.05水平上方程有意义的。利用回归方程作预测当求得了回归方程 ,并经检验确认回归方程是显著的,则可以将回归方程用来做预测。所谓预测是指当x=x0时对相应的y的取值y0所作的推断。由于y是随机变量,其实际取值是无法预测的,我们只能对其平均取值作出估计,这便称为y的预测值。显然,如果x=x0,那么y的预测值为另外,我们还可以给出y0的预测区间:在x=x0时,随机变量y0的取值与其预测值 总会有一定的偏离。人们要求这种绝对偏差 不超过某个的概率为1-,其中是事

13、先给定的一个比较小的数(030),t分布可以用正态分布近似,进一步,若x0与 相差不大时,可以近似取为:其中u1-/2是标准正态分布的1-/2分位数。xy(*)例续:1如果取x0=0.16,则得预测值为:2求概率为1-的预测区间:(1)先求的估计 ;(2)由给定的,查t分布表的分位数t1-/2,比如取=0.05,则t0.975(10)=2.228;(3)按(*)计算的值。本例中 ,lxx=0.0186,故(4)写出预测区间 ,本例中为(4632,52.54)。3如果求近似区间,由于u0.975=1.96,故有则近似区间为(49.43-2.63,49.43+2.63)=(46.80,52.06)

14、,此处两个区间相差较大,这是因为n较小的原因。利用回归方程作控制控制问题是予报(测)的反问题。若要求观察值y在一定范围y1yy2内取值,那么应把自变量x控制在什么范围内?即要寻找这样两个值x1和x2,使得:y-(x1)=y1y+(x2)=y2xy y2y1x1 x2由于(x)的计算较为复杂,实际中常用近似分布: ,由此可得:如果要控制y在y1yy2内,也只要通过方程分别解出x1和x2,从而确定x值的控制范围xy y2y1x1 x2 可化为线性回归的例子在实际中,两个变量之间的相关关系大多呈非线性的,这时选用恰当类型的曲线比直接配直线更符合实际情况。在不少情况下,通过简单的变量变换,可把非线性回

15、归问题转化为线性回归问题来解。例 炼钢厂出钢时盛钢水用钢包。在使用中由于钢液及炉渣对包衬耐火材料的浸蚀,钢包容积不断增大。这里钢包容积用盛满钢水时的重量y表示,相应使用次数用x表示。如此共测13组数据如下:1. 确定曲线回归方程形式 常见的思路有二条: 这里由散布图(右图)可确形式有多种 根据专业知道 根据数据的散布图0 10 201111101091081071062. 曲线回归方程中参数的估计 先线性化,以(1)为例,令v=1/y,u=1/x(1)转化为 v=a+bu 利用最小二乘法可得a与b的最小二乘估计 可得回归方程改写为y关于x的回归方程 变换后的数据类似可得(2),(3),(4)的

16、回归方程在上述四个回归方程中选用哪一个是合适的?比较准则: 相关指数R愈大愈好(R2又称为决定系数),其中 剩余标准差s愈小愈好结论:选方程(1)为好可化为线性回归的函数双曲函数的一般形式为 或 。指数函数的一般形式为y=aebx。幂函数的一般形式为y=axb。对数函数的一般形式为y=a+blnx。“S-型”函数的一般形式为“反S-型”函数的一般形式为数据分析: 证实原因验证引起缺陷的原因,可以通过三种途径:逻辑分析统计推断试验验证先从逻辑分析开始。(1)逻辑分析因果逻辑假定团队认为许多弄错的订单是由于销售人员在订单的管理过程中出了差错而引起的,这也许能解释部分出错订单,但它不能解释不熟悉的顾

17、客(小商人和计算机新用户)会出现更多差错这一现象。如果订单管理系统出了问题,你应该想到所带来的影响对于所有顾客都是差不多的。 (1)逻辑分析要使假定的原因真的成立,它必须通过合乎逻辑的测试解释从数据反应出的可见问题和潜在问题,当然这些潜在问题现在还没有出现。(2)原因的统计检验有这样两种简单的统计方法可以用来分析并确定因果关系:相关分析:利用散布图分析潜在的因果关系数据整理、分层来验证原因相关分析:利用散布图分析潜在的因果关系判断原因X和结果Y之间的相关程度,从散布图可以有一个大概的印象,精确的计算也可以借助回归分析和相关分析得到对数据进行整理或分层图得到数据的模型,或者数据没有任何模型。相关分析:利用散布图分析潜在的因果关系散布图提供了验证因果假设的一种途径,从成对数据去验证自变量X与因变量Y之间的相关关系。成对数据顾名思义是指X、Y是来自同一个观测个体,“成对”本身就反映了一种潜在的原因和结果:正如构建一个体系,体系的复杂度(X变量或是潜在的原因)与构建该体系所花时间(Y输出或结果)之间潜在着一种因果关系。成对数据沿着X、Y轴分布,再分析其相关性, 相关分析:利用散布图分析潜在的因果关系散

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论