A阶段绿带教材(最新)_第1页
A阶段绿带教材(最新)_第2页
A阶段绿带教材(最新)_第3页
A阶段绿带教材(最新)_第4页
A阶段绿带教材(最新)_第5页
已阅读5页,还剩219页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

6Sigma绿带培训-分析阶段,第一章概述(1)多变量分析(2)方差组分分析(3)中心极限定理第二章假设检验(1)假设检验简介(2)均值比较(3)方差比较(4)比例比较(5)样本量选择,第三章相关性分析(1)X-Y图(2)相关系数(3)误解分析(4)Minitab练习(抛射器)第四章一般线性回归分析第五章多元回归分析第六章分析阶段路径第七章附录第八章非参量统计(阅),目录,DM阶段回顾与试题讲解,多变量分析,第一章概述,变异的2个来源3种分类多变量分析数据采集抽样要求组内、组间、组外的含义Minitab制作多变量图路径,三种数据结构及相关分析方法方差组分分析四大用途Minitab进行方差组分分析路径,模块目标,流程图/鱼骨图,筛选DOE,因果矩阵与FMEA,多变量/方差组分/中心极限定理,优化DOE,通过优化并控制关键X达到流程优化和控制的目的,6Sigma改进过程中的漏斗效应,假设检验,30-50个X,10-15个X,8-10个X,4-8个关键X,3-6个关键X,应用环境,变异的来源,单件产品内部批次内单件产品之间不同批次之间不同操作员之间不同生产设备之间设备生产转换前后不同时间段,测量系统的重复性测量系统的再现性校准前后的稳定性不同测量人员之间量程范围内的线性度,来自流程的变异,来自测量系统的变异,变异,什么是多变量分析?,多变量分析:基本概念及作用,从多个角度通过图表观察造成流程绩效指标变异的原因观察流程的短期与长期能力间的差距及造成差距的主要原因与方差组分分析一起使用,可以明确流程变异的根本原因,流程绩效指标随流程输入和流程指标变化的图标展示在生产中对当前流程水平进行过程能力分析的手段流程稳定性的直观观察,多变量分析的作用是什么?,多变量图,R内:单元内部的变化范围R间:单元间的差别R时:不同时间段的差别,图为某注塑车间随时间(151821)的不同,注塑强度差异的多变量图,R内,R间,R间,多变量分析:多变量图,通常在一个图表上展示2-4个X对连续变量Y的影响,多变量图与控制图的比较,多变量分析:与控制图的比较,有助于发现将流程稳定在最佳条件下的一些有用线索,变异来源,多变量分析:应用环境,顺序,空间,时间,来自单件内部的变异,来自同一批次不同单件间的变异化工厂的不同反应容器之间不同的设备或操作员工之间,连续生产的单件之间不同的生产安排之间不同的原料或批次之间,固定间隔的不同时间段,如每小时,班组,日,星期等短时间间隔(小时,班组)与长时间间隔(日、星期)的比较等,常见变异来源分类,多变量分析:应用环境,常见的变异来源图示,多变量分析:应用环境,揭示常见的变异来源产品单元内,单元之间,批次之间,人员,设备,班组,时间,原料,生产调整等。测量系统的重复性与再现性分析理解测量误差的来源。,应用举例,多变量分析:应用环境,如果要确定是时间因素带来的变异,进行多变量分析时应尽量采用系统抽样的方式(定时或固定间隔采样),为了充分暴露问题,应尽量使用长期数据,考虑了各个造成变异的因素后,才能客观反映问题的来源,一般要求样本的方差达到流程总变异的80%以上。,抽样指导原则:1、空间/位置原因变异每个单件上至少选择两个位置2、顺序每个批号或每个时间段至少选取3个连续生产的部件3、时间因素至少挑选20个固定间隔的抽样时间段,多变量分析数据采集要求,多变量分析:应用环境,应用Minitab画多变量图,黑带老王希望了解培训和经历对员工生产率的影响,根据与项目团队的交流发现员工在岗时间(1-5年)和培训项目(有基础培训与专家培训两种),分别为40和80小时。对工件的加工时间用来衡量生产率。部分相关数据如图所示。数据在Minitab文件multivariate-crossed.maw中。打开文件按下图进行练习。,实例操作,多变量分析:图形制作,StatQualityToolsMulti-VaryChartResponse:TimeFactor1:TrainingHoursFactor2:Experience点击“Options”并选择所有三项(包括DisplayindividualDataPoints)OK,应用Minitab画多变量图,多变量分析:图形制作,应用Minitab练习,你能得出什么结论?,多变量分析:图形制作,多变量分析:图形制作,再练习一次,但两个因子的顺序互换StatQualityToolsMulti-VaryChartResponse:TimeFactor1:ExperienceFactor2:TrainingHours点击“Options”并选择所有三项(包括DisplayindividualDataPoints)OK,应用Minitab练习“多变量分析”,多变量分析:练习,多变量分析:练习,应用Minitab练习,你能得出什么结论?,方差组分分析,第一章概述,交叉结构举例,注意内容,三种因子数据结构,交叉结构:根据具体生产运营情况,有完全交叉的因子关系嵌入结构:因子间存在从属关系交叉与嵌入混合结构:交叉与从属结构混合的情形,在进行多变量分析前应该特别注意数据是如何收集的及因子之间的相互关系,在一次MSA分析中,由3个检验员对10个部件进行了MSA分析。要求:3个检验员对所有10个部件都重复测量对于测量结果来说,部件和质检员都是造成偏差的来源由于所有的检验员和所有部件都组合过,是典型的交叉结构其它交叉结构实例:试验设计中的全因子试验模型,方差组分分析:因子数据结构,交叉结构图示,方差组分分析:因子数据结构,在超市购买洗发水,香皂,罐装饮料等,都可以发现一个产品序列号。产品的序列号可以追踪到生产日期和批次。再生产商内部,任何一件产品只能来自某个批次,某个生产线,某班组,某批原料。同一批次的产品只能来自某个生产线,可能属某班组,某批原料。几个班组可能只是在某个生产线工作(如不同地域)所有生产线可能在同时只处理同一批原料。这就可能构成完全嵌入的从属关系。,嵌入式结构举例,方差组分分析:因子数据结构,嵌入式结构图示,方差组分分析:因子数据结构,因子数据结构不同,采用的定量分析方法就不同,方差组分分析可用于:,识别最大的变异来源通过对最大变异来源的消除达到改善流程的目的为改善阶段流程的优化确定方向建立更有效的样本采集计划,交叉结构采用方差分析(包括固定模型和随机模型)的方法分析通嵌入结构采用方差组分分析可以把各个来源所造成的变异进行分离,并计算出各自为总体的偏差(以方差计算)所带来的份额有多少,方差组分分析:用途,方差组分分析举例,某化工厂黑带小张意图减少洗发水罐装量偏差过大的问题。罐装是在不同工厂,不同设备及有不同班组的员工进行。为了定量了解上述原因对罐装量(以克为单位)变异的影响,小张分别到四个工厂的四个班组中随机抽取了四位操作员,每位操作员工作时抽取三个样品(每间隔800个生产产品)进行了分析。这是一个典型的嵌入式结构,可借助完全嵌入结构的方差分析(即方差组分分析)定量研究成果作为该结果。文件名称为:shapooweight.mtw.,方差组分分析:分析案例,多变量分析:举例,方差组分分析:分析案例,班组间变异,操作员间变异,内部变异,工厂间变异,多变量分析结论,方差组分分析:分析案例,请注意输入顺序:从高级开始逐级下沿,进行定量分析,方差组分分析Minitab应用,方差组分分析:分析案例,方差组分分析举例,方差组分分析:分析案例,方差组分分析举例,方差组分分析:分析案例,同一操作员随时间进行会有不同的罐装量,这是造成变异的最大原因不同员工罐装量有区别,应研究培训或操作规程的制定执行情况不同工厂罐装数量有不同之处,应调查原因是什么不同班组之间没有明显的区别,方差组分分析结论,方差组分分析:分析案例,绿带李小姐负责供应商质量管理工作,她需要了解是否存在供应商与本公司之间对某产品某项指标的检验结果是否相同。由于供应商来自另外一个国家,来料的品质检验难以按照交叉检验的方式进行。为此,李小姐要求供应商在其两个生产基地各自选五件产品,并各随机选择一个检验员进行重复测量。在本公司也选了五件产品,也挑选了一位检验员进行了重复测量。结果汇总到文件nestedr所以我们不能否定零假设。数据不能提供足够的证据否定平均强度等于2.85磅。,Minitab输出结论,我们现在展示进行假设检验的细节我们在检验关于抽样对象均值的声明由于n30,根据中心极限定理,抽样均值的分布接近正态分布。,由于1.96BasicStatisticNormalitytest,正态性检验,P值计算,d)计算P值,使用Minitab:StatBasicStatistics1-Samplet,e)因为0.001Normalitytest2、T检验:StatBasicStatistic1-samplet,由于P值大于临界置信水平(本例中为0.05),或者说,由于均值的置信区间包含了目标值,我们可以做出下述结论:我们没有足够的证据拒绝零假设。,我们没有足够的证据拒绝零假设。是否可以说零假设是正确的(总体均值的真值=950)?不!但是,我们通常在假定零假设是正确的情况下执行操作。,结论,均值比较:一个小样本均值检验,情况2,检验两个抽样对象的均值是否相等,第二章假设检验,双对象总体均值::大样本,双样本Z检验用于检验两个抽样对象总体均值,并且每个抽样数量都较大。Minitab软件不提供双样本Z检验。所以,我们必须使用双样本T检验。标准双样本Z检验或T检验用于互相独立的两个样本。当样本是相互依赖的时候我们要使用成对T检验。,独立样本:例如,两个公司的交货期,依赖样本:热处理前后同一产品的硬度,均值比较:双样本检验,两个独力大样本均值比较,当比较来自两个独立的大量抽样的均值,使用以下检验统计方法:,Z=,我们在检验零假设,1=2,因此,(1-2)=0因为虽提供类的检验方法类似单样本Z检验,所以我们只用Minitab计算P值,并得出结论。,举例订单生成,某公司有两个办公室都生成订单。为了确定是否一个部门比另一个的速度更快,黑带从每个部门的80个订单的“订单时间”数据。数据在“Ordergeneration.mtw”A)建立零假设和备选假设。H0:officeA=officeBH1:officeAofficeBB)确定显著水平,=0.05C)随机抽取样本。OfficeA:n=80y=1.48s=0.45OfficeB:n=80y=1.58s=0.51D)计算P值UsingMinitabStatBasicStatistics2-sampletTick“Assumeequalvariance”,E)比较P值和显著性水平。P-value=0.183所以,我们不能否定零假设。F)结论:数据不能提供足够的证据证明时间存在差异。,Two-SampleT-TestandCI:OfficeA,OfficeBTwo-sampleTforOfficeAvsOfficeBNMeanStDevSEMeanOfficeA801.4780.4470.050OfficeB801.5790.5080.057Difference=mu(OfficeA)-mu(OfficeB)Estimatefordifference:-0.10125095%CIfordifference:(-0.250716,0.048216)T-Testofdifference=0(vsnot=):T-Value=-1.34P-Value=0.183DF=158BothusePooledStDev=0.4786,Minitab输出,均值比较:独立大样本均值检验,双样本t检验用于检验两个均值是否相等,并且是小样本抽样。使用双样本t检验的条件是:1.整体标准差未知。2.每个母体的分布必须是正态分布例子将比较两组均值:下述数据代表了来自两个不同群组的10个测量值。Dataisin:LPC(2-samplet).MTW判断两组的均值是否相同?1、零假设和被选假设是:H0:1=2;H1:122、正态性验证:StatBasicStatisticsNormalitytest,检验两个总体均值:小样本,均值比较:独立小样本均值检验,如果t或tStack/UnstackStackColumns,选择“StoreSubscriptsin”,输出变量在C3中,输出变量在C4中,将变量名加到堆叠数据中,4、堆叠数据的等方差检验:StatBasicstatisticsTestforequalvariance5、堆叠数据的T检验:StatBasicStatistics2-SampletTwo-sampleT-TestandC1:sampleA,sampleB,Two-SampleT-TestandCI:sampleA,sampleBTwo-sampleTforsampleAvssampleBNMeanStDevSEMeansampleA10899.135.811sampleB101093.642.713Difference=mu(sampleA)-mu(sampleB)Estimatefordifference:-194.50095%CIfordifference:(-231.680,-157.320)T-Testofdifference=0(vsnot=):T-Value=-11.04P-Value=0.000DF=17,均值比较:独立小样本均值检验,如果一个抽样同另一个抽样有关,这两个抽样就是相关的。如果你对某一洗发液对于治疗脱发的效果进行陈述,你应对同一群人使用该洗发液前后的脱发情况进行测量。你需要成对数据。如果你对同一批电脑晶片在跌落测试前和测试后进行测量,两个测量之间就存在相关性。在这些例子中,我们不是检验两个不同的数据集。相反,我们需要的是数据前和后的区别,来研究前后差异是否显著。,相关样本,均值比较:总结,成对T检验,利用Minitab软件检验两个相关的样本是否相等。两个相关的样本必须是随机抽取的每个抽样整体都应该整体呈正态分布StatBasicStatisticsPairedt,练习:一轮胎公司认为他们新生产的轮胎的里程数较竞争者的提高,选择了12部车,用新轮胎跑1000哩,再用竞争者的轮胎跑1000哩。假定里程的差异服从正态分布。File:CarMileage.MTWStatsBasicStatsPairedt,练习,结论是什么?,结论是什么?如果我们将数据组作两样本t检验会如何?双样本T检验与1Samplet检验有何不同?,均值比较:总结,情况3,检验超过两个的抽样对象均值是否相等,第二章假设检验,假设检验利用以下格式进行:H0:1=2=3=4,,=n;H1:至少一个均值与其它不同,均值比较:三个以上样本检验,单因子方差分析(OneWayANOVA),ANOVA假定母体是正态分布抽样是随机的每个抽样对象方差相等每个抽样对象的随机抽样数量没有必要相等。例子:在美国空军学院进行试验,确定当地是否有酸雨。分别在学院的三个地点测量雨的酸性。地点1位较高地点;地点2为中间地势;地点3为低地。测量的值为PH。各地点的酸性是否存在差异?,按照以下步骤:A)H0:A=B=C;H1:至少一个不同;B)=0.05B)随机在各地点分别测量7个数据。C)用Minitab软件计算P值。StatANOVAOne-way,File:Anova(Acidity).MTW,One-wayANOVA:Station1,Station2,Station3SourceDFSSMSFPFactor20.0470.0230.190.832Error182.2600.126Total202.307S=0.3543R-Sq=2.02%R-Sq(adj)=0.00%Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev-+-+-+-+-Station177.31430.4598(-*-)Station277.42860.2628(-*-)Station377.35710.3101(-*-)-+-+-+-+-7.207.407.607.80PooledStDev=0.3543,Minitab输出,均值比较:三个以上样本检验,TestingofVariances方差比较,第二章假设检验,学习目标,1、了解ANOVA定义、术语2、一元、二元ANOVA。4、ANOVA原理。5、一元/二元ANOVA应用。,情况1,单一标准差与标准比较,第二章假设检验,“通常我们对由不同方法或处理过程中产生的响应的均值差异感兴趣。有时对数据的变异程度感兴趣。通过制程改善以减少过程的方法非常重要,即使没有改变均值。同样,两种或多种分析方法的变异也是感兴趣的话题。”例子:可口可乐装瓶公司希望减少瓶装重量的变异。经过一些变更后,他们声称过程的标准差是0.02。数据在:Coca-Cola.MTW,注:Minitab没提供单独标准差的检验。作为替代,必须检查标准差的置信区间并确定置信区间是否包含声明值。,方差比较:单一标准差与标准比较,方差的推论,单一标准差,StatBasicStatisticsGraphsummary,结论:由于标准差的置信区间包含了声明值,我们可以做出下述陈述:我们没有足够的证据拒绝零假设=0.02,Minitab输出,方差比较:单一标准差与标准比较,ANOVA是方差/变异的分析ANOVA是发现变异源头的有效方法,方差比较:什么是ANOVA,ANOVA术语,因子:一个对响应变量(非独立)可能有影响的独立变量,并以不同的水平出现在实验内。水平:一个输入因子的特定设定;例如:一个热处理的4个水平是100,200,300,400。交互作用:交互作用的出现是当一个输入因子对输出所产生的效果取决于另一个输入因子的水平时。,一元/二元/多元ANOVA,1、检验单个因子的2个以上水平的平均值是否有显著差异-一元ANOVA2、存在两个(或更多)因子时,检验平均值是否有显著差异-二元,多元ANOVA.,例:假设某餐厅经理认为,送餐的时间会受到员工的影响,也就是说,不同的员工送餐的时间是不同的(即使送餐的距离等其他因素完全相同),现在他需要比较三名不同员工:Jack,Bob,Rena的送餐时间有无统计差异,他该使用何种统计工具?,方差比较:一元ANOVA举例,这种通过收集数据来比较同一因子的不同水平对Y的影响是否存在差异的方法,就叫做单因子设计,因为影响Y输入变量只有一种:即员工,该例中影响Y的因子(输入变量)有几种?该因子有几个不同的Level?,假设员工Jack,Bob,Rena每人送6份快餐的时间,记录在上页表格中,(假设每次送餐的距离等其他因素完全相同),即Y=送一份快餐的时间,以分钟为单位。,假设对于送餐时间,除了不同的员工有影响外,天气(晴天,雨天)是另外一个产生变异(影响送餐时间)的可能原因。,1、假设影响送餐时间的原因有两种:员工和天气2、这种同时比较两个因子不同水平各自对Y的影响叫做双因子设计,例如Y的输入变量(X)有两种:员工和天气3、假设每个因子有L个水平,各水平的反复数都是m,数据列表如下:,一元ANOVA原理,方差比较:一元ANOVA举例,左边和右边同时平方如下,总平均值是,假设数据为Xij总平均是,上式可变为如下:,方差比较:一元ANOVA举例,所以上页方程式变为如下方程式:略写SS代表方差的总和SS,DegreeofFreedom(DOF)自由度是?自由度是指在一个系统中不影响其他变数、不受任何约束,能够独立变动的数目。(独立样本的个数)样本方差的自由度为n-1,因为:中,x1-x,x2-x,.xnx,这n个量并不能自由变化,而是受到一个=0,少了一个自由度。,方差比较:一元ANOVA举例,自由度的计算SS(total)的自由度SS(Between)的自由度SS(within)的自由度,方差比较:一元ANOVA举例,F分布,ANOVA是通过比较群间变异与群内变异,来判断到底是群间变异和群内变异哪个比较大。当MSA与MSE相差不大时,则F较小,说明该因子是不显著的,当F值越大说明群间的效果越明显,即该因子是显著的。(也可利用F分布确认P-value),方差比较:一元ANOVA举例,方差比较:一元ANOVA举例,=,=,=l-1,=l(m-1),=lm-1,平方和(SumofSquares),SSA=,SSE=,SST=,F值,因子(factor),SSBetween,SSWith,Total,=,方差比较:一元ANOVA举例,输出:焊接强度输入的水平:3个:A,B,C这是一个具有3个水平的单因子实验,一个采购工程师要调查某个电阻焊接系统中,3种不同型号(A,B,C)的焊接机对焊接强度的影响是否有显著差异,他收集了一些数据。,方差比较:一元ANOVA举例,实际问题,应用Minitab计算,Minitab利用p值决定每个变异来源的显著性。记住:P值是当零假设是正确时得到观察样本的概率。,在此单因子实验中,零假设是H0:焊接强度均值相等备择假设是H1:焊接强度均值不相等,方差比较:一元ANOVA举例,应用Minitab计算,One-wayANOVA:C4versusC5SourceDFSSMSFPC52161.7380.879.590.003Error12101.208.43Total14262.93S=2.904R-Sq=61.51%R-Sq(adj)=55.10%Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev+-+-+-+-MachineA59.8003.347(-*-)MachineB515.4003.130(-*-)MachineC517.6002.074(-*-)+-+-+-+-7.010.514.017.5PooledStDev=2.904,如果平均焊接强度相等的话,得到观察样本的概率为0.3%,方差比较:一元ANOVA举例,分析结果,抛射器练习第1轮,限制条件:要素水准1.栓的位置1,2,3,42.停止角1,2,3,4,5,63.杯高1,24.吊钩位置4,5,65.橡皮带数目1,26.起始角160-180度7.球的类型塑料或橡皮,距离(米),小组角色34567发射者11111测量者11111数据输入文员11111设置调整11111质量/流程检验员1111计时员111回球员11,抛射器练习第1轮,说明1.组成4-7人的小组2.分配责任给所有的小组成员3.按以下设置安装抛射器4.3个作业员各射击5次并记录距离问题1.计算射击的平均值和标准偏差2.如果规定公差是+/-5厘米,计算西格玛值,设置:1.栓的位置32.停止角33.杯高14.吊钩位置45.起始角170度,抛射器练习第1轮,Exercise1练习1,文件:塑胶强度,某工程师认为反应温度对生产的塑胶产品的强度有影响,所以他为了证实这一点,进行了实验。他设定了4种不同温度,每种温度测试了3回,总计12次实验,数据如下表,请分析并判断工程师的想法是否正确?,Exercise2练习2,对某个数字电路的4种不同的设计进行研究,以比较噪声量(我们希望噪声越小越好)。得到了如下数据。这4种电路设计造成的噪声相同吗?哪个设计最好?,电路设计噪声1182021308280617356803472625355049546837897分析后得出您的结论。,情况2,检验两个抽样对象的方差是否相等,第二章假设检验,检验两方差(正态),方差比较:二元ANOVA图形,两方差相同还是不同?使用F检验:比较F=to,和S1S2.如果F,那么否定两者相等基于,分子自由度为n1-1,分母自由度为n2-1,等方差检验,StatANOVATestforequalVariance,假如P,接受H0;如果PANOVATestforequalvariance,对2样本,这与F检验相对,经理决心改善送餐时间。他认为:人员和天气都可能影响送餐时间影响送餐时间的因素:员工(Jack、Bob、Rena)天气(晴天、雨天、风天)经理取了3名员工,分别调查了他们在晴天,雨天,风天的表现情况,收集数据如下:文件在:送餐时间。,方差比较:二元ANOVA举例,送餐时间,叠加数据,注意:Minitab需要将相同类型的数据放在一栏。,制作变量图,多变量图结果,StatQualityToolsMulti-VariChart,方差比较:二元ANOVA举例,主效果图,StatANOVAMainEfectsChart,方差比较:二元ANOVA举例,交互作用效果图,StatQualityToolsSummetryPlot,方差比较:二元ANOVA举例,二元ANOVA分析,StatANOVA,比较计算的Chi-Square和临界值,P值,Minitab软件计算P值,用Minitab建立列联表和P数值:StatTablesChi-squaretest,ExpectedcountsareprintedbelowobservedcountsChi-SquarecontributionsareprintedbelowexpectedcountsC1C2C3C4Total15123571279961992397.85315.76282.38996.0032.7505.38585.5000.00022152203898241648329.15261.24233.62824.0039.5866.509103.3470.000372757751618203640727.00577.00516.001820.000.0000.0000.0000.000,因为P值=0.000,小于=0.05,我们将否定零假设。,结论,比例比较:多比例检验,样本量的选择,第二章假设检验,选择样本量的重要性,如果样本量太小?问题:不能发现差别如果样本量太大?问题:太灵敏资源浪费,样本量计算,样本选择的步骤,step1:确定需研究的响应变量(Y)step2:选择适当的统计检验方法Step3:确定两类风险Step4:确定需要的偏移灵敏度Step5:建立或评估现有过程参数Step6:确定样本量,抽样风险,H0:没有差异H1:有差异,不否定零假设,否定零假设,Decision决策,TrueState真实情况,偏移灵敏度,进行实验前,首先要确定显著差异。显著差异除以标准差,得到偏移灵敏度/。,对比平均值的检验,1-SampleTests:Stat/PowerandSampleSize/1-SamplezStat/PowerandSampleSize/1-Samplet2-SampleTests:Stat/PowerandSampleSize/2-Samplet,Example1,用64昂司的盒子装冰其淋,差异不能超过3昂司装冰其淋的机器的过程变异为1昂司。要求置信度为0.99,检出能力为.5.7.9时样本量分别为多少.,Stat/PowerandSampleSize/1-Samplez,DifferencesizepowerActualPower320.50.952224320.70.952224320.90.952224,Stat/PowerandSampleSize/1-Samplet,DifferencesizepowerActualPower340.50.619933350.70.894714360.90.992651,某工程师要了解新机器的功效,现有机器的平均值为5;标准差为1;如果新机器的均值比现有机器大过3,他将建议购买.考虑到投资的成本,他希望投资失误的风险限制在0.5%.检出能力时样本量分别为多少?,Example2,Stat/PowerandSampleSize/2-Samplet,DifferencesizepowerActualPower340.50.6875350.70.8741360.90.9563,对比比率的检验,1ProportionTestStat/PowerandSampleSize/1-Proportion2-ProportionTestStat/PowerandSampleSize/2-Proportion,某高层想评估当地的SixSigma意识水平.他想知道是否他的员工至少有50%的人了解SixSigma理念.如果低于45%,他将推进培训计划.要求=0.05=0.15;样本量应为多少?,Example3:1-Proportion,Stat/PowerandSampleSize/1-Proportion,Testingproportion=0.5(versusRegressionFittedLinePlot,应用Minitab画散点图,案例分析1,黑带想了解一化合物蒸馏过程中氧气的纯度(Y)与冷凝器中的碳氢化合物的%之间的关系。数据在Oxygenpurity.mtw中请做出散点图:MinitabGraphPlot,相关性分析:散点图,散点图(Scatterplot):显示两个变量之间的关系打开工作表BATTERIES.MTW点击“OpenWorksheet”,在Minitab自带的“我的电脑C盘ProgramFilesMinitab14Correlation,Minitab:StatBasicStatisticsCorrelation,案例分析3,相关性分析:相关系数,Correlations:Hydrocarbon%,Oxygenpurity%PearsoncorrelationofHydrocarbon%andOxygenpurity%=0.937P-Value=0.000,结论是什么?,H0:=0(无相关性)H1:0(有相关性),1、收集数据范围过窄2、外推法3、因果归属4、掩饰真正的相关或制造虚假的相关5、过多的集中在相关系数上,相关性分析:常见错误,相关分析的常见错误,错误1:数据覆盖范围过窄,在窄范围内收集数据,较宽范围的数据可提供一个评估结果,错误2:外推法,在数据范围以外对相关性进行外推,数据范围内的关系在其他区域内不一定适用。,相关并不意味着因果,仅仅是两个变量间存在的关系,错误3:因果归属,虽然该相关系数(r)为0.918,但捕杀鹳并非是控制人口的好办法。,控制“X”不会影响“Y”,相关性分析:常见错误,掩饰真实的相关或创造虚假的相关,数据实际上是来自不同的数据来源,错误4:曲解数据,错误5:过多的数据集中于R,过多的集中于相关系数,上图有相关系数R0.7,相关性分析:常见错误,通常,人们过于把R(或)值作为一个“好”的相关的依据。前面的图形说明了将数据图表变化是多么重要。但是当图表(和接下来的诊断)展示出一个合法的线性关系或数学模型时,我们可以做如下结论:,错误5:过多的数据集中于R,R20.4:相关性明确存在R20.7:我们可以使用该关系,但必须慎重R20.9:可使用的关系存在R20.95:关系良好,注意:这些“规则”是基于经验的主观判断,相关性分析:常见错误,使用理论模型,或源自他处的知识。2.正确的数据收集-使用正交实验数据-使用大范围的自变量-将数据收集的顺序随机化3.使用回归诊断法-散点图-残值图(观察值-预计值)对预计值对自变量对抽样顺序,可通过以下方法来避免回归中易出现的错误,-Minitab会标注出残值大、影响大的观测数据-看看它们!-估计系数的显著性检验-残值的标准差(拟合有多好?)4.当拟合平方项和交互作用项(例如对应表面设计)时,先“对中”自变量。使用:平方项:相互作用项:,相关性分析:避免方法,SimpleLinearRegression一般线性回归分析,第四章一元线性回归分析,结束本章的学习后,学员将可以:解释什么是回归分析?进行一般线性回归分析与解释假设测定系数R2和调整过的R2回归诊断置信区间有影响的观测数据估计标准误,学习目的,学习目的,回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)之间的统计关系的方法。Y=f(X1,X2,X3,Xn)其中,Y是响应变量,X1到Xn是因变量,决定两个来自不同变量源的响应(或输出)之间线性关系的方法。也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间的联系强度,在这里-1R1。按照惯例,R表示真实的系数,R表示我们的最佳估算。,相关性分析:概念,回归分析概念,回归与相关,回归应用于如下几个方面:预测系统模型因子筛选参数估算一般线性回归(SLR)模型,其中:,一般线性回归分析:回归分析与相关,如何理解回归,最小平方的方法,残差(或误差)由ei确定最适合的直线即是残差平方和最小的那条线。,=-(a+b),是最小值,本方法假设X无误差,在Minitab中,可通过以下两种方法得到一般线性回归模型(最佳拟合线):,StatRegressionRegression,StatRegressionFittedLinePlot,例1:A黑带想了解一化学蒸馏过程中氧气的纯度(Y)与冷凝器中的碳氢化合物的%之间的关系。,案例分析1,一般线性回归分析:案例应用,数据在文件中Oxygenpurity.mtw中建立Oxygenpurity(Y)对Hydrocarbon%(X)之间的一般线性回归模式应用“StatRegressionRegression,RegressionAnalysis:Oxygenpurity%versusHydrocarbon%TheregressionequationisOxygenpurity%=74.3+14.9Hydrocarbon%PredictorCoefSECoefTPConstant74.2831.59346.620.000Hydrocarbon%14.9471.31711.350.000S=1.08653R-Sq=87.7%R-Sq(adj)=87.1%AnalysisofVarianceSourceDFSSMSFPRegression1152.13152.13128.860.000ResidualError1821.251.18Total19173.38,与Hydrocar的关系解释了y值87.7%的变异。,F测试显示了测定系数87.7%,具有统计显著性,一般线性回归分析:案例应用,测定系数,R2是由回归线代表y中变异数量。,R2=1代表回归等式与抽样数据完全吻合,测定系数定义R2,一般线性回归分析:案例应用,整体显著性,在Minitab中P数值是对回归等式的整体显著性的测量P-valueRegressionFittedLinePlot,一般线性回归分析:回归分析与相关,案例分析2,拟合线图,回归模型拟合线与整体显著性,从文件Oxygenpurity.mtw中,建立Oxygenpurity对Hydrocarbon%(X)之间的一般线性回归模式并进行残差分析。,MinitabStatRegressionRegression,残差分析,一般线性回归分析:回归分析与相关,残差图表,置信区间,置信区间(CI):对于一个给出的X,Y的平均值的分布区间。该区间在X=X处最窄;X值离X越远其区间宽度越大。预测区间(PI):对于一个给出的X值相应的个别的Y值的区间。由于其应用个体值,该区间比置信区间宽。,一般线性回归分析:回归分析与相关,抛射器练习第2轮,说明射击160度、170度、180度各10次并记录距离问题1.求出回归方程。,设置:1.栓的位置32.停止角33.杯高14.吊钩位置45.起始角160-180度,从文件Oxygenpurity.mtw中,测定对于已获得的线性回归模型的95%置信区间和预测区间。MinitabStatRegressionFittedLinePlot,案例分析3,一般线性回归分析:置信与预测区间,CI与PI,我们可以预测两个数我们不可以用此模型预测数据范围以外的或y。此模型只是在数据范围内才被验证为有效。从文件Oxygenpurity.mtw中,给定的X值为1.15,确定和y的95%的区间。,给出x值,预测y的均值,给出x值,预测y的数值,利用回归模型的预测,一般线性回归分析:置信与预测区间,MinitabStatRegressionRegression,案例分析4:预测,案例分析4:Minitab输出,PredictedValuesforNewObservationsNewObsFitSEFit95%CI95%PI191.4730.250(90.947,91.999)(89.130,93.815)ValuesofPredictorsforNewObservationsNewObsHydrocarbon%11.15,一般线性回归分析:置信与预测区间,1)在正常数据模式以外的数据2)强烈影响回归结果的数据(也就是显著改变斜率或y轴截取值)这些现象并不一定是坏现象,因此你不一定要删除他们。不管怎样,在分析回归结果之前应该识别这些数据点并评估其影响。具有影响的数据可由于下列原因而被删除:测量误差数据输入误差违反物理定律,具有影响的数据点,具有影响的数据现象:界外点,界外点具有很大的残差数值的现象数据。,一般线性回归分析:置信与预测区间,界外点的处理方法,对于如下两种情况,可以取消界外点:1)对不将其纳入分析中有合理的解释(例如:输入错误)2)若纳入这些数据,会令回归分析的合理的解释失效。但是,因原因2被撤销的点必须和回归分析结果同时报告,要么作为一次计数要么作为一个称为“虚假”数值的百分比。这些点通常是一个造成问题的根源,因此,一定不可被“隐藏”。,所有分析都应报告上述界外点,案例分析5,从Oxygenpurity.mtw文件中,测定在数据组内部是否存在具有影响的数据点。,一般线性回归分析:置信与预测区间,MultipleRegressionAnalysis多元回归分析,第五章多元回归分析,学习目的,结束本章的学习后,学员将可以:解释什么是多项式回归和多元回归进行多项式回归分析。进行多元回归分析。,多元回归:多项式回归,在前一节,我们讲解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论