MultiVari多变量分析.ppt_第1页
MultiVari多变量分析.ppt_第2页
MultiVari多变量分析.ppt_第3页
MultiVari多变量分析.ppt_第4页
MultiVari多变量分析.ppt_第5页
已阅读5页,还剩170页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Six Sigma 训练,Multi- Vari 多变量分析,目的,提供Multi-Vari 多变量分析导览 Noise (噪音)变量的处理 Multi- Vari 分析计划 资料收集 资料分析 报告格式,MAIC中的Multi-Vari 分析,何为Multi- Vari ?,可控制及不可控制的输入对输出的影响之初步分析 收集资料但不影响流程作业 着重于: 研究不可控的Noise变量(不可控:即控制的代价太高或者无法实施控制) 为什么Noise变量的变异会对流程长期或不定期影响其中心值和变异大小,导致流程不稳定,项目追踪,项目叙述,Process Map,C&E Matrix,初步的FEMA,MSA,流程能力分析,Multi- Vari Studies,DOE(或其他改善方法),Control Plan,交接训练,最终流程 能力研究,项目权责 移交,项目报告,测 量,分 析,改 善,控 制,在开始收集资料之前,和您的小组讨论,顾客曾收集类似的资料吗? 供应商曾收集类似的资料吗? 是否有现成的资料? 现有的资料足够吗?,Multi- Vari 导览,最有用的分析工具之一。目的在提供改善行动的方向及输入 收集资料的方法是“不影响流程”,流程在其自然状态下被分析 在短时间内收集资料并分析,以决定流程能力、稳定性、及KPIVs和KPOVs(Xs& Ys)间的关系 Multi-Vari 分析应该持续到输出变量的所有范围都被观测,为何需用Multi-Vari 分析,以统计置信度决定流程KPOVs的能力 确认流程变异的可指性因素 分析对流程影响的常见因素(不同班次Shift-to-Shift,不同轮次Run-to-Run,不同操作员Operator-to Operator,不同操作时间Time-to-Time) 初步了解流程的稳定性 提供下一步实验设计(DOE)所需的方向及输入,阶段,阶段一 执行短期流程能力分析:参考流程改善计划的测量阶段 以短期流程能力分析的资料及记录,导出能深入研究流程的计划 阶段二 初步分析可控制变量、不可控制(noise)变量及物料输入变量对于输出变量的影响 着重于流程中主要不可控制变量的影响特性 初步了解可控制输入及流程输出之间的关系,Multi-Vari计划的步骤,决定目标 确认要分析的KPIVs及KPOVs 确认每个变量的测量系统 着重在能确保流程能力的变量 确定抽样计划 确定资料收集、格式及记录的程序 确定流程程序及设定 成立项目组及训练小组成员 清晰地划分责任 确定资料分析的方法,变量选择,Ys,流程基线我们流程目前状况如何,Xs,确认哪个输入变量影响流程输出,输出资料,输入资料,对分析而言,我们该如何选“正确的”Xs及Ys ?,哪个是重要的资料?,测量正确的输出 着重于可测量的流程特性 并非项目收益 也可能需收集受限制的Ys 哪一个Ys,哪个是重要的资料?,测量正确的输入 来自于C&E及FEMA的重要Xs 在Process Mapping 中,所可能遗漏的Noise变量或其它变异来源 哪一个Xs,主要关注点:,首先研究不可控制的Noise变量 Noise变量的变异会对流程长期或不定期影响其中心值和变异大小,导致流程不稳定 在我们对重要的可控制输入变量进行系统化分析前,我们需尽可能先将Noise变量的变异消除,三种典型的Noise变异来源,位置性:地点对地点 或人员对人员 同一机器,端点间的变异 加温室的温度变异 操作员1和操作员2之间的变异 区域1和区域2之间的变异 周期性:批货对批货 不同批量单位之间的变异 不同批的货品之间的变异 时间性:时间对时间 班次中的变异 月中对月末 星期一对星期三,Noise 其它分析方法,对于Continuous Processes (连续流程) 测量在一段时间内的变异 例如:在每班次中做四次测量 测量短时间间隔的变异 例如:班次间的变异 测量长时间间隔的变异 例如:不同天、周及月度的变异 对于Discrete Processes(不连续流程) 测量同一物件的变异 例如:对每个oven cavity 做四次测量 测量同一批量的变异 例如:每个批次中不同oven cavity的变异 测量不同批量的变异 例如:一个月中不同批量的变异,不要忘记有关MSA的问题,对重要的输入及输出执行GR&R 确认分析过程依循MSA程序,以取得前后一致且可靠的资料 对于某些变量,可能需要建立一个新的测量方法BB/GBs常发现目前未被记录的重要变量 切记,一个“嘈杂”的测量工具会扭曲您对流程变异的真实了解 你记得下列程式吗(第一周课程)?,S2观察=S2实际+S2测量,观察变异=实际变异+测量系统变异,选择变异总结,依靠Process map、C&E、 FMEA找出变量 着重项目小组可能遗漏的潜在Noise变量 考虑X与Y变量的测量系统,练习,写下您分析的目的 描述一个输出变量和它的测量方法 描述一个可控输入变量和它的测量方法 描述一个不可控输入变量和它的测量方法 与您的组员讨论你的结果 您有15分钟完成此练习,选择资料收集方法,项目小组应在何时、何处收集资料? 我们应收集多少资料? 错误的方法会误导整个项目,为何要抽样?,分析100%流程或母体的资料点是不实际也不可能的,抽样策略通常被两个与变量相关的问题所主导,什么变异来源对此分析而言可视为正态、一般或无关? 什么变异来源对特殊起因而言可视为特殊的或可指定的因素? 子群分组的黄金定律 (1)包含每一子群组内的变异,所有变异来源对此分析而言是一般起因或正态流程变异 (2)选取连续的子群组时,特殊起因的变异来源将会发生在子群组间 组内最小化、组间最大化,Special 及Common Cause 变异,范例:库存盘点的正确性 重要的X变量可能包含: 哪个仓库? 何时记录月库存? 在架子的高层或低层? 谁负责最后的盘点? 上次盘点距现在已多久了? 此零件库存有多久了? 哪个班次负责最后盘点? 是生产线回流还是新购入的零件? 何种影响会生产,如果我 1、连续三个月使用同一个仓库及同一个班次的资料 2、连续六个月使用所有仓库中新购入零件的资料 3、使用同一个仓库中所有班次及所有零件的资料 4、连续12周使用所有仓库、所有零件及所有班次的资料,抽样设计(Sampling Design),你可使用一种或多种下列抽样设计 抽样设计有助于确保取得流程的代表性样本(representative sample, 并可避免采集大量资料 Nilson Rating 基于1500个观众 这些观众代表全国的收视者 抽样设计: Simple Random Sample (简易随机抽样) Stratified Sampling (分层抽样) Cluster Sampling (聚类抽样) Systematic Sampling(系统抽样) Subgroup Sampling(子群组抽样),标准抽样策略,1、Simple Random Sample (简易随机抽样) 规则:无偏颇的每个单位被选取的机会均等 独立的每个单位的选取,对于其他单位的选取机会没有影响 范例:对每一单元指定索引键,再将索引键随机排列 2、Stratified Random Sample(分层随机抽样) 规则:在每个群组中采用简易随机抽样 代表性必须在每个群组中抽取足够的样本 范例:从每一个顾客群组(100以下、100500、)中随机抽样 3、Systematic Sampling 系统抽样(每隔n单位或物件进行进行抽样) 规则:设定第n个选取选取样本时,须考虑意外吻合的发生 例如:若抽样零件尺寸,应避免每四小时抽样一次 范例:每隔10个从生产线上抽样一次,随机不是随便,Simple Random Sample (SRS),在SRS中每个n单位的样本被选取到的机会均等 范例:在每个铸压周期后,由1到镶板数中产生10个随机值 随后根据所需的输出测量这些镶板 SRS的特性 无偏颇:每个单位被选取到的机会均等 独立的:每个单位的选取,对于其他单位的选取机会没有影响 在连续流程中(Continuous Process)使用SRS是非常困难的,因为没有明确的单位。一般而言,我们自物料流程中取样,Stratified Sample,将母体分成数个同质群组,再自每个群组中随机抽样 范例:光纤绞线 有很多包含数个Spinerettes 的Block 从每个Block中随机抽取一个Spinerette 此抽样将代表每个Block对输出变异的影响 另一范例 若您有两个铸压模,自每个铸压模中随机抽样镶板 此抽样能代表每个铸压模对输出变异的影响,标准抽样策略,4、Cluster Sample(聚类抽样:自小聚类中随机抽样) 规则:聚类与群组的分群是不相同的,聚类分群原则可依地域或某些自 然特性 代表性与随机性的抽样原则与群组随机抽样方式相同 范例:在仓库存量分析中,每一列架子可视为聚类,可对每一列架子进 行随机抽样 5、Subgroup Sample (子群组抽样:依频率对步骤或活动的输出进行抽样,通常抽样频率的单位是时间) 规则:注意变异来源,子群组抽样是否能显示您所感兴趣的变异? 频率:事先决定的,可依照控制图(Control Chart)抽样频率来抽样 范例:在10点、12点、2点、4点各抽样5 个零件,Cluster Sample,将样本分成同类的聚类,再自每个聚类中随机抽样 范例:回到光纤绞线的例子 通常光纤绞线流程有众多的blocks,每个block 包含一些Spinerettes 将每个block 编号,且随机抽取blocks 再自被选取的block中,随机抽取Spinerettes 此方法不需用所有的blocks ,但能表达block 对输出变量的影响,练习:协助这些工作小组! 确认问题并对他们的工作提出建议,1、有一个小组在研究“First Call Resolution”。大约有15%受访问者被要求填写问卷调查。其中仅有10%完成问卷调查。 2、有一小组在研究焊接强度。他们取样式时间一共四天,每天从 4:00p.m到5:00p.m所产生的零件中选取样本 3、有一小组研究子装配周期时间。他们仅在资料已备妥的生产线抽取时间样本 4、另一小组研究收款作业的正确性。他们抽样计划为每20个账单抽取一份,为期30天 5、有一小组研究物料短缺。他们将对资料库中所有的物料进行子群组抽样,抽样计划,好的抽样计划能截获所有Noise变异的来源 Lot-to-Lot (批货对批货),batch-to-batch(批量对批量) 不同班次、操作员、机器、或制程 对每个样本而言,不需每次测量输入变量值 范例: 每小时对输出变量值进行抽样 我们假设周围湿度(输入变量)在四小时内保持定值 练习:对一主要输出变量,列出两个变异来源及适当 的抽样计划,要收集多少资料?,好的抽样计划能捕获所有的变异来源 -顾客间的变异 -不同的内部销售员 -周和周之间 -不同厂商 -不同作业员 -年份、月份不同 -不同流程 - 训练程度 对每个样本而言,不需要每次测量输入变量值 例如:若仅有一位销售员服务一位特定的顾客,我们可假设该顾客的每项账目,均与此销售员相关,不同于以pareto 方法收集资料; 不论流程产出好的或坏的结果我们都要收集资料,要收集多少资料?,提示表,工具或统计值 最小抽样数 Average 5-10 Standard Deviation 25-30 Proportion Defective(P) 100和np或=5 Histogrm 或 Prareto 50 Scatter Diagram/ Correlation 25 Control Chart 20 注意:这些数值为最小值。抽样数越多所得之结论越值得信赖,资料收集计划,我的资料收集计划:(对于每个X与Y) 收集什么资料: 何处收集资料: 何时收集资料: 收集多少资料点: 欲使用的抽样策略:,抽样的质量的常见议题,SELECTION BIAS (选取偏差) 没有选取规则,以决定何者为你应抽样的物件 便利性抽样,系统性抽样可提供一些选取规则 CHANGES IN THE ENVIRONMENT (环境改变) 环境改变使样本不再具有代表性 NON-RESPONSE BIAS (无反应偏差) 尤其是在进行问卷调查中,无回应的和有反应的常具有很不同的特性 MEASUREMENT BIAS (测量偏差) 通常和批量大小不同有关 不具代表性的批量只对大量供应者抽样,却没有对少量供应者抽样 SAMPLING PLAN EXECUTED IMPROPERLY(抽样计划执行错误) 务必注意偏差及其他可能会影响你资料质量的问题,如何记录资料? 为何使用资料收集表?,使每个资料收集人,使用相同的收集表 确保每个人用同样方法收集资料 清楚定义资料收集程序 在注解栏可以说明Outlier 或非预期的结果 不平常的环境状况 资料收集者的观察 容易记录资料,建立表格时,同时建立电子数据库的格式,确保资料便于收集,且易于记录到资料表或软件的spreadsheet 资料表格式的编排方式应该符合分析软件所需的格式(Excel Minitab) 提早计划使您易于整理资料,并能得到更好的资料质量!,资料格式,资料能够快速记录到资料库(如:Minitab) 记得在表格栏中包含下列项目: ID信息(时间,批次,班次,地点,) 不可控输入(Noise) 流程输入 流程输出 Comment(注解) 在分析时,我们常会需要资料的时间序列关系,所以务必清楚记录所需的时间资料,资料收集表,通常使用的表格有Check sheets (查检表)及Concentration Diagram (集中图)。你必须根据项目的需要设计此种表格 使用标准表格,使资料收集及资料收集程序标准化,也能协助不同编译人员对收集资料的后续整合工作 关键要素: 为每个所要记录的资料准备一个空间 明确说明资料收集表上的编码原则及格式 包含注解栏 表格越简单越好 表格编排须符合电子数据库的格式 总是先试用新设计的表格,如何记录资料?,使用标准资料收集表能协助您确保资料的一致性 同时,建立电子表格使资料输入更快速更一致,Date Time Person Shift Customer Order Vendor Comments 8:00 JAY 1 A 12587 SDK 8:00 Steve 1 B 13004 BANK 95 9:00 Lave 1 C 13769 F&F Had to wait for Don to finish,资料分析概述,计划好您将如何分析资料、呈现资料及欲选择的工具,分析资料,就如侦探 寻找线索,资料分析,确认stability(稳定性)及capability(流程能力) 探究变量间的关系 区分总变迁(通过statement/variance component analysis) 适当地处理Noisy资料 所考虑的问题: 流程是否稳定? 流程是否符合规格的需要? 哪些是Noisy变量所引起的主要变异来源? 哪些为可控变量所引起的主要变异来源?,确认stability和 capability,Stability Control charts (控制图) Time series charts (时间序列图) Capability Capability Macro (Pooled 及Overall Sigma) Capability Sixpack,您有何种资料?,Attribute Date (属性资料) Yes/No 输出: 是/否毁坏 计数式输出:不良品数 输入变量的设定:顾客级别、班次、星期几、厂商编号 Variable Date(变量资料) 连续输出:产量、厚度、流程周期 连续输入:时间、压力、温度、湿度,我们需知道每个X和Y的资料类型,分析输入及输出的工具,流 程,Noise 输入 (离散性),Noise 输入 (连续性),Controllable 可控制输入,主要流程输出,温度 压力 供应速率 浓度,室内温度 气压 相对湿度 原料特性,不同作业员 不同机器 不同班次 供应者/零件,产出量 颜色,资料 类型决定图形及统计分析工具的选取,Continuous Y Discrete X Boxplots Dot Plots Main Effects Plots Interaction Plots Descriptive States Equal Variances T-tests and ANOVA Continuous Y Continuous X Scatterplots Correlation Regression Multiple Regression,Discrete Y Continuous X 或 Discrete Y Discrete X Boxplots Dot Plots Main Effects plots Scatterplots ANOVA (以上几种可能需要将Xs和Ys调换) ChiSquare Logistic Regression,处理Noisy 资料,Outliers (奇异点,与母体背离的资料) Boxplots, histograms, dotplots 和moving range charts 皆为识别Outliers的适当的图形方法 谨慎研究Outliers:它们可能是由于资料输入错误所造成的,它们也许能引导我们去寻找关键的Noise变量 若我们能够合理解释Outliers 的发生原因,则可将其从资料中移除 处理Outliers 的程序 以图形来确认 若我们能够合理解释Outliers的发生原因,先将其从资料中移除再作分析 若Outliers无法被解释,则须分析二次:一次包含Outliers,一次不包含Outliers 根据结果的不同,加以注解,收集资料前,成立小组并加以训练,小组成员必须一致地遵循抽样计划:可以考虑由你自己执行第一次抽样 执行Pilot Run 来测试您的程序 注意非最初的或非正常的操作状况 测量和监控主要的关键流程输入 记录任何非平常事件 尽快将资料登陆到资料库 工作日记,你若不切实执行,再好的计划也无济于事,Multi-Vari 计划 总结,要测量什么? 使用何种抽样计划? 资料如何被收集? 测量程序是否可靠? 如何显示资料? 如何分析资料? 小组成员对何时做、做什么是否明确?,应用到您的项目,目的:建立您项目第一份Multi-Vari 计划草案 程序: 确认欲研究的主要输出变量 确认欲研究的主要输入变量:可控的及不可控的 确认每个输入、输出变量的测量系统,并辩别何者是需要评估的 以变异来源为指引确定您的抽样计划(何时、何地收集资料?) 列出您用来分析资料的图形工具,Checklist: 阶段一Capability Study,1、依您所认为“最佳设定”设定流程,并记录关键流程输入变量值(KPIVs) 2、确认方法,以建立合理子群组 3、操作流程一小段时间,以尽可能排除外部变异 目标为收集约30个时间点的资料 4、要求小组组员仔细观察并作笔记 5、测量及记录主要流程输出变量值(KPOV),Checklist: 阶段一Capability Study,6、执行Capability Six-pack 并察看: Normal Plot, Histogram SPC Charts (检查Stability, Accuracy) 7、执行Capability Analysis及确认其短期及长期的流程能力指标 完成worksheet 8、诊断Mean (平均数)的漂移和Variance(变异)的变化 9、依诊断结果决定改善计划,Checklist: 阶段二Multi-Vari,1、决定目标 2、确认要分析的KPIVs及KPOVs 3、确认每个变量的测量系统 能确保流程能力 4、确定抽样计划 5、确定资料收集、格式及记录的程序 6、流程运行的程序及设定的描述 7、成立及训练小组 8、清楚划分责任 9、确定资料分析的方法,Checklist: 阶段二Multi-Vari,10、操作流程和收集资料 11、分析资料: 流程是否稳定?是否可控? 何者为影响输出变量的主要Noise变量? 12、执行后续DOE,以确认结果 13、结论 14、结果报告与建议,Multi-Vari 易犯错误,在不影响流程自然运作的状态下所收集的“X”,其变异范围可能太狭窄 交互作用存在,但我们一次只观察一个“X” 有Multi-colinearity 及Confounding 的存在,结果报告,描述 目的 需测量的输入及输出变量 抽样计划 流程设定 Stability 及Capability Trend/Control charts Capability及Capability Sixpack 分析 Histogram , Cp, Cpk , Sigma Analysis of rational subgroup (合理子群组分析) 变量间的变异关系 以图形表示(Boxplots, Scatterplots, etc.) 统计分析 结论 对后续分析的建议,结 论,以资料为后盾 以图形化及统计格式呈现 非推测或直觉思考 理性思考,数据是最有力的证据!,总 结,Multi- Vari 分析概览 检视Noise变量及分析方法介绍 Multi-Vari 分析计划 确认资料收集方法 资料分析范例 检查报告格式,假 设 检 验 Hypothesis Testing,目 标,介绍Hypothesis Testing 的基本观念 将Hypothesis Testing 与接下来的MAIC课题相连结,例一,April 15th,1997,Washington,DC(AP) 全球温室效应持续增加,已经到了警戒水平。EPA继续计划控制美 国境内工厂的CO2排放量,气温平均变化,1960s 70s 80s,1960s 70s 80s,Co 排放量,例二,亲爱的先生: 您在专栏中写到,孕妇怀孕的天数为266天。谁说的?我怀我的孩子总共10 个月又5天(305天),因为我知道我怀孕的确切日期。我的先生是海军,我只 有在那一天有机会跟他相聚,且自那一天后我再也没有机会与他见面,直到孩 子出生。 我既不喝酒也不到处乱来,所以没有理由这孩子不是他的。烦请您更正您 关于怀孕266天的文章,不然的话,我就麻烦大了! - 圣地牙哥一读者,你该如何回应她?以及她的先生?,分析此争议,平均怀孕天数是266天 如果她声称怀孕260天,令人怀疑吗? 如果她声称怀孕400天,令人怀疑吗? 从哪个时间点开始会令你怀疑?请标示,220,230,240,250,260,270,280,290,300,平均值,背 景,长久以来,医生确信婴儿的自然分娩有以下的特征: 正 态 分 布 平均值= 266 天 标准差= 16 天,Probability: 第一周课程回顾,-3 -2 -1 0 1 2 3 ,3 (99.7%的观察值),2 (95%的观察值),1(68%的 观察值),Hypothesis Testing 的观念可帮助我们,适当地处理不确定性 降低主观因素 质疑假设 避免遗漏重要信息 决策错误的风险管理,实际上,我们可以在预期不佳的情况下,逮到一个好的流程 我们可以在流程良好的情况下,抽取到不良的样本 不论何种情况,我们都可能做出错误的推断 我们声称改善了流程,结果却可能只是取样的现象而已,Hypothesis Testing,Hypothesis指“某件事情为真”的陈述 若抛10次硬币得到8次人头,我们会说这枚硬币是不平均的 虽然我们会猜错(例如几率是5%),我们仍愿意承担该风险 在工厂内,我们以同样的方式检验 我们常将不寻常发生的事件归咎于某因素,而非偶然 问题: 如何确认不寻常事件? 如何用统计方法协助我们作出决策? 样本资料中必然存在自然变异 如何得知某件事件是“真正发生”或只是偶然?,Hypothesis Testing:如何进行,收集资料后,计算: Test Statistic (如:signal-to-noise ratio SNR信噪比) P-Value P-Value是指当H0为真时,此结果会发生的几率 P-Value是从假设或实际几率分配而来(例:Normal, T-distribution, Chi- Square, F-distribution, etc),SNR值大 “P-Value”小 H0被拒绝,SNR值小 “P-Value”大 H0不被拒绝,假设检验的应用,Xbar and S Chart,该点是真正的out of control 还是只是正常的流程变异,SPC图表,总体方法论,实际问题,实际解决方式,统计结果,统计问题,Y = f (x1,x2, xk),Statistical thinking will one day be as necessary for Efficient citizenship as is the ability to read and Write. H.G.Wells Circa 1925,主要术语,Ho = Null Hypothesis (虚无假设) Ha = Alternative Hypothesis(备择假设) P Value = Probpability Value(概率值),Hypothesis Testing 对统计学家的意义,Ho:群组A的平均数= 群组B的平均 Ha:群组A的平均数 群组B的平均 Ho:此斜线斜率为零 Ha:此斜线斜率不为零 Ho:群组A的变异= 群组B的变异 Ha:群组A的变异 群组B的变异 Ho:变量X与变量Y相互独立 Ha:变量X与变量Y相互不独立,Hypothesis Testing 对大众而言意义?,Ho:公司员工对招聘不受应聘者年龄所影响 Ha:公司员工对招聘受应聘者年龄所影响 Ho:资料为正态 Ha:资料非正态 Ho: Ha:,Hypothesis Testing 的基本法则,我们建立Hypothesis 来解释我们所未知的事情 一般来说,Hypothesis 的形式为:Y=f(x1,x2, xn) 借测试Xs对Y的影响,来验证该Hypothesis的真假 我们总假设null hypothesis 为真 然后,找寻令人信服的证据来支持或推翻该hypothesis 若不能接受null hypothesis,则接受alternative hypothesis,Hypothesis 与决策风险,接受或拒绝一项hypothesis,此决定也伴随着已知程度的风险和置信 因此,我们必须在分析前预先指明决策风险的大小及可接受的检验敏感度 一旦上述值设定完成后,我们就有足够的资料来决定理想的抽样大小 我们也必须考虑实际的成本、时间及或获得资料的限制,以制定合理的抽样计划,Hypothesis 与决策风险,陈述“Null Hypothesis”(Ho),收集证据(实际的样本),决定: 该证据表明? 拒绝Ho?或不拒绝Ho?,决策错误,在决定拒绝或接受假设时,可能会发生下列两种错误,实际上清白,范例:审判,无辜者坐牢,罪犯逍遥法外,Hypothesis Testing : 如何运作,收集资料后,计算: Test Statistic (如:SNR的方式,Z或T-Score) P-Value P-Value 是指当Ho为真时,此结果会发生的几率 P-Value基于假设的或实际的概率分布(例如:Normal, T-distribution, Chi-Square,F-distribution,等),“P-Value” 小 “Z”或“T”值大,等 Ho被拒绝,“P-Value” 大 “Z”或“T”值小,等 Ho 不被拒绝,Hypothesis 与决策风险,P Value 极为重要,记住这句话,If P is Low , Ho Must Go! “P值小,Ho则弃” “小P无Ho”,P值需多低? 应视情况而定,我们希望这些观察值随机出现的可能性低于10%(=0.10) 5%或许会令我们觉得放心( =0.05) 1%会令我们极具信心( =0.01) 该的等级设定,是依据我们对“无差别”的假设信某种概率分布 然而,这将视期望目标及后果而定,在大多数情况下我们采用=0.05,风险因子,因子被用来指出,若我们错误地拒绝Null Hypothesis (Type 1 Error)时,所愿意承担的风险程度 我们将视为决定接受/拒绝的门槛值 若p ,拒绝null hypothesis(发生改变) 若p ,接受null hypothesis(没有改变) 此因子代表这样的风险:我们可能会采取没有改善效果的行动 因此,我们所选的值应包含这些实际因素:财务风险,安全风险,改变后顾客受影响的风险 典型的值为5%或10%,风险因子,1 =当总体中存在一具体变化时,侦测出该变化的机会 也称为“Power of the test:检验能力“ 与Type 2 Error (错误地接受null hypothesis)相关 实际意义为:可能忽略改进的机会 一般说来, 错误的成本较 错误要低 在工业实验中典型的值为10%-20%,将Hypothesis Testing 与 MAIC Roadmap相连接,流程改善方法论,步骤一:流程测量,步骤四:流程控制,步骤三:流程改善,步骤二:流程分析,规划项目并确认流程输入输出 主要变量,更新control plan,应用DOE确认关键的输入,重新审查资料并重点区分主要 输入变量,完成MultiVari studies 并鉴定 潜在的主要输入,完成FMEA并评估Control plan,对主要的测量系统执行 gage studies,执行短期的流程能力研究并评估 Control plan,持续的确认流程稳定性及能力,完成流程Control plan,决定最佳的操作程序,产品/流程发展工具的Roadmap,Y=F(X1,X2,X3,XK),还记得这个简单的公式吗?,数据类型,不连续型/属性型 不连续事件的记数(1,2,3,4个不良品) 定性描述 民主党/共和党 好/坏 机器1/机器2 连续型/变量型 小数位数是有意义的 时间、重量、厚度,等等,统计工具Roadmap 的“目的”,为Belt有系统地提供使用统计工具的方法 “不要在需要榔头时,使用起子” 有系统地提供将工具和Minitab 连结的方法 减少混淆与焦虑 “Regression , ANOVA and ChiSquare - 总是打架!”,分析Roadmap 教授们不会教给你的东西,情境一 领班想知道两名员工卸货时 是否有显著的时间差异(以分钟为测量单位),Y为何? 资料类型为何? X为何? 资料类型为何? 使用何种工具?,情境二 人事部门想了解年龄 (old 与young)与人员受聘的关联性,Y为何? 资料类型为何? X为何? 资料类型为何? 使用何种工具?,情境三 设计小组想了解引擎寿命与车辆重量有无关系,Y为何? 资料类型为何? X为何? 资料类型为何? 使用何种工具?,情境四 交通部门想了解 卡车重量与车内人员受重伤程度之间有无关联,Y为何? 资料类型为何? X为何? 资料类型为何? 使用何种工具?,回顾,介绍Hypothesis Testing 的基本观念 将Hypothesis Testing 与后续的MAIC相连接,Hypothesis Testing 专有名词,1、Null Hypothesis (Ho) 2、Type I Error 3、Alpha Risk 4、Significance Level (显著性水平) 5、Alternative Hypothesis (Ha) 6、Type II Error 7、Beta Risk 8、Significant Difference (显著性差异) 9、Power(检验力) 10、Test Statistic(检验统计量),T Test (T检验) 与 Selected Nonparametric Tests(非参数检验),目的,介绍t-Test及其在平均数比较中的重要性 介绍Means(平均数)/Medians(中位数)检验的基本概念,统计检验,在假设检验模块中,我们讨论不同群组的比较 我们想知道是否有充足的统计证据来拒绝Null Hypothesis(虚无假设) 我们收集资料后,该如何“检验”这些资料呢? 有数种不同的检验方法,视资料的类型和比较的对象而定 在此,我们将检验数量型输出资料Variable Output data 与属性型输入资料attributes Input data,分析Roadmap 我们将讲授的内容,X Data,离散,连续,X Data,离散,连续,Chi-Square,ANOVA Means/Medians Tests,Regression,2,3,4 way ANOVA Medians Tests,Multiple Regression,X Data,单一 X,多元 Xs,单一 Y,多元 YS,离散,连续,分析 Roadmap 单一 X: 单一Y,Continuous(连续),Discrete(离散),Y Data,Continuous(连续型)Y和Discrete(离散型)X,ANOVA Means/ Medians Tests,1 Level X 的比较,2 Level X 的比较,3 Level X 的比较,1 level 的范例: 顾客1的20个交货时间样本 2 levels 的范例: 顾客1和顾客2的20个交货时间样本 3 levels 的范例: 顾客1、2和3的20个交货时间样本,Continuous Y 和Discrete X Roadmap,Continuous Y 和Discrete X Roadmap,Hypotheses,Null Hypotheses (Ho):我们的交货时间与目标时间并无不同 Alternate Hypotheses (Ha):我们的交货时间大于目标时间,分析Roadmap :单一样本,开启工作表t-Test.MPJ 中的 1 Sample t,分析Roadmap :1个样本,分析Roadmap :1个样本,正态分布 检验是否为正态分布的三种方法,1)Histogram (直方图) 资料是否呈钟型曲线? 2)Normality Plot (正态分布测试图) 资料点是否为一直线? 3)P Value P Value 是否大于5%?,分析Roadmap :1个样本,我们马上会回到单一样本检验!,分析Roadmap,ANOVA Means/ Medians Tests,1 Level X 的比较,研究 Stability (若可行),研究Shape,研究 Spread,研究 Centering,OR,ANOVA Means/ Medians Tests,注意: 当2 levels 时,我们用它们的某些方面 来做比较,2 levels 的范例: 对顾客1和2交货时间是否有显著性差异?,分析Roadmap :2个样本,开启工作表 2 Sample t,分析Roadmap: 2个样本,实际问题是: 对顾客1与2的交货时间是否有显著性差异?,Null Hypotheses (Ho):对顾客1和2的交货时间没有不同 Alternate Hypotheses (Ha):对顾客1和2的交货时间不同,Hypotheses,分析Roadmap: 2个样本,2 Level X 的比较,研究 Stability (若可行),Minitab 焦点或问题是?,SPC Chart I-MR,是否有任何明显的变化趋势或模式, 足以证明资料并非来自单一的母体或 流程?,研究Shape,描述统计与 正态检验,资料是否为正态分布? 小p值(小于5%),资料为 非正态分布 注意样本大小的问题,分析Roadmap: 2个样本,两个平均值的比较,有两种方法来比较两组样本的平均值 Two Sample tTest Oneway ANOVA 我们将讨论此两种方法,并比较它们的相似处于不同处,T-Tests,当我们比较两组样本的平均值,或比较样本平均值与我们所想要的特定值(如:规格界限),我们将使用t-test 此检验方法样本特性与参与分布(T分布)比较,用以决定此样本是否有统计差异 在开始分析资料前,让我们来认识一些基本的术语,检验Two Means 之间的差异,当n1与n2相等时:,T-Values,T-values以标准差为单位 例:t-value= 2.0时,表示实验效应与0(或某目标值)的距离为2个标准差 由正态分布我们得知,自中心点偏移2个标准差的情况是不常发生的 每个t-value都有一个相对应的概率值(p) 概率值:若影响值为0,则得到的t-value 的概率值是“p” 我们决定接受或不接受假设的p值是0.05-0.10,Six Sigma训练,ANOVA 与Selected Nonparametric Tests (非参数检验),目 的,简介One-way ANOVA基本统计模式 确认One-way ANOVA的统计假定 学习不同的探索性分析与图解的技巧 学习如何执行F-test 研究方差比较的统计性检验,Analyze Roadmap 单一X: 单一Y,X Data Discrete(离散) Continuous(连续),Y Data Continuous(连续) Discrete(离散

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论