假设检验经典培训教材.ppt_第1页
假设检验经典培训教材.ppt_第2页
假设检验经典培训教材.ppt_第3页
假设检验经典培训教材.ppt_第4页
假设检验经典培训教材.ppt_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、假设检验,二OO四年二月二十五日,培训资料,目标: 完成该章你将能够: 1) 写假设检验-原假设和备择假设。 2) 解释假设检验的结果。,熟悉连续变量和逻辑变量的假设检验。,目的:,情况: 在三个不同的销售区域使用相同促销方法,销售量分别是: A区: 1000 B区: 850 C区: 700,“历史”的解释方法: 销售VP给A区经理较多的奖金。 销售VP考虑换 掉C区 经理。,“Six Sigma”解释的方法: 销售VP问:“在95%置信度下是否有统计上的差异?” 回答说:“是的,A区销售与总平均值有统 计上的差异。” VP研 究A区的最佳实践。,统计“能够 ”. 推论两组数据的平均值是否相同

2、 推论两组数据的偏差是否相同 推论两组数据的缺陷率是否相同,统计“不能” 直接说那一个较好 告诉我们如何解决问题 做出决定 确定规范或极限,总体:整个集合的全体特征,样本:具有总体特征的子集,根据样本确定总体!,为什幺需要假设检验?,总体参数与样本统计,总 体参 数,样本统计,平均 值,标准偏差,比例(百分数),s,p,P,1. 总体参数(值)是固定的,但不知道。 2. 样本统计是用来估计总体值的。,假设是对总体值进行阐述,而不是对样本统计。,置信区间,使用置信区间我们可以利用样本估算总体的平均值和标准方差 置信区间是基于下列要素的取值范围: 样本平均值 (X) 和样本标准方差(s) 置信区间

3、的取值范围会包括: 总体平均值 () 及总体标准方差()。,在风险水平一定的情况下,样本平均值周边的多大范围能将总体平均值包括在内? 置信区间,置信区间,置信区间.置信限.,置信下限,置信上限,置信区间,真实的总体平均值和标准方差可以落在置信上限和下限之间的任何一点!,置信限是 置信区间内的最大值和最小值 !,置信限,置信度是希望让总体平均值和标准方差落在根据样本计算出的置信区间内的概率大小! 6 西格玛和业内通常使用95%的 置信度,这意味着: 在95%的情况下总体平均值和标准方差落在置信区间内 在5%的情况下(alpha 风险),总体平均值落在置信区间外。 如果我希望提高信心 (99% 的

4、置信度).或者承担更多风险 (75% 的置信度).,真实情景下,需要明确愿意承受的风险度!,置信度,置信度 = 承担业务风险的意愿,高风险 75%,中等风险 85%,低风险 95%,Kmart LFL Watts 举例,X 轴 LSL,X 轴 USL,1 Watt 的增加 = Kmart 发生1亿美元的成本/照明公司的担保风险,Kmart 需求,60.8,60.9,61.0,61.1,X 轴估计,Average Watts,置信水平 样本容,99% 259 95% 132 85% 53 75% 23,故障几率,假设检验: 依据数据进行决策的核心,实际答案,统计问题,数据,知识,“经验”,本能,

5、实际问题,统计答案,1. 所有流程均具有变动性,2. 从给定流程取得的样本可能有所不同,3. 如何区分基于样本的“几率性”差异和真正的流程差异?,真实情况,Ho,Ha,判决,Ho,Ha,无罪,监禁,有罪,释放,无罪释放,有罪,监禁,无罪,有罪,释放,监禁,真实情况,接受,Ho,Ha,Ho,Ha,I 类 错误a,II 类 错误b,正确判决,正确判决,a,b,Ho,Ha,a 和 b 处在不同区域;故我们不可能同时犯 I 类和 II 类错误,临界限制,何时需要假设检验?,如果想分析输入以确定是否影响输出,输入A,输入C,输入B,过程,发票,输出,如果在“改进”实施前想确认一下。,任何时侯如果想根据样

6、本作客观的判断,就用假设检验!,如果想知道两个不同的过程产生的结果是否相同,假设检验路线图,数据类型,连续 变量,数据正态,正态理论检验,平均值的检验,.,标准偏差检验,数据非正态,非参数的检验,位 置的检验,离数的检验,逻辑变量,比例数,可计数数据,常用的假设检验,连续变量,平均值的检验,标准偏差的检验,一个样本的T检验,样本相关,成对T检验,样本不相关,二个样本的T检验,结构图,平均值的分析ANOM,无结构图,均方差的分析ANOVA,一个总体,两个总体,三个或以上总体,标准偏差的 CHI平方检验,均方差的同一性,BARTLETTS,TEST.,LEVENES,TEST.,一个总体,两个总体

7、,三个或以上总体,标准偏差 比率的F检验,Tukey的 快速检验,将数据转变成连续数据(开平方根) StatANOVA 1-Way, 2-Way, or GLM,逻辑变量,比例分析 StatANOVAAnalysis of Means Binomial (np5),比例分析 StatControl ChartP (np5),可计数数据 分析 StatControl ChartU,或,比例 分析 StatControl ChartP (np5),或,可计数数据,比例数(样本数N是常数),比例 数(样本数N不是常数),平均值分析:,F,E,D,C,B,A,0,.,4,0,0,.,3,5,0,.,3

8、,0,0,.,4,1,1,3,2,6,0,.,2,9,6,1,7,4,0,.,3,5,3,7,5,H,i,t,R,a,t,i,o,平均值图形分析,ANOM是检验总体平均值的 图形检验,方差分析: ANOVA,单因子ANOVA:检验有一个变量时,总体平均值是否相等 双因子ANOVA:检验有两 个变量时,总体平均值是否相等 ANOVA-General Linear Model:检验有两个以上变量时,总体平均值是否相等,利用样本数据 提供的信息来接受或拒绝一个关于总体 参数(平均值,标准偏差,比例数,可计数数据)的陈述(假设) 的统计推论。,“原假设 ”HO,是对总体参数的一个陈述,通常 HO是“没

9、影响”或“没差 别”的陈述。,原假设,“备择假设”Ha或H1,是Ho被 拒绝时可被接受的陈述,除非试验结果强烈 反对Ho,我们应该接受Ho。,原假设:在统计证据证明你有罪前,你是清白的。,數据 的收集与分析 (Minitab),结果:p 值 0.05 OR 在判定限以内不拒绝H0 P 值 0.05 OR 超出判定限拒绝H0,结论,问题阐述,列出将要采取的行动,If p 0.05或 超出判定限那幺.,H0,H,日常语言,统计 语言,没有差别,有差别或一个比另一个好,=, =/, or =/,接受Ho,拒绝Ho,在判定限内,超出判定限,用P值,用判定限,P 值 0.05,P 值 0.05,Two

10、sample T for C1 vs C4 N Mean StDev SE Mean C1 10 9.410 0.357 0.11 C4 10 8.460 0.320 0.10 95% CI for mu C1 - mu C4: ( 0.63, 1.27) T-Test mu C1 = mu C4 (vs not =): T= 6.26 P=0.0000 DF= 17,Two sample T for C1 vs C2 N Mean StDev SE Mean C1 10 9.410 0.357 0.11 C2 10 9.420 0.429 0.14 95% CI for mu C1 - mu

11、 C2: ( -0.38, 0.36) T-Test mu C1 = mu C2 (vs not =): T= -0.06 P=0.96 DF= 17,统计语言,实际语言,“没有足够的数据显示差别”,“看起来是有差别”,假设陈述练习,我们收集两个发货中心关于定单满足率的数据 ,想知道这两个发货中心的定单满足率是否有差异 写一个合适的假设检验,数据收集与分析 (Minitab),Result : 在判定限以内不拒绝 H0 超出判定限 拒绝H0,问题阐述,H0,H,日常语言,统计语言,结论,數据收集与分析(Minitab),結果 :,在判定限以內,不拒絕H0,超出判定限,拒絕H0,问题阐述,H0,

12、H,日常语言,统计语言,结论,定单满足率沒有差异,P1=P2,定单满足率有差异,P1P2,配货中心正在考虑使用一种新的包装材料 现在,包裹灯泡使用的是漂白过的,对环境有污染的纸质材料,备选的包装材料是一种对环境没有污染, 超柔,未经漂白的纸 我们要做一项实验来测试超柔、未经漂白的纸是否能有效减少破损;只有在证明超柔纸能有效减少破损的情况下才会被替代使用 写一个合适的假设检验,假设陈述练习,数据收集与分析 (Minitab),结果 : 在判定限以内不拒绝 H0 超出判定限拒绝H0,问题阐述,结论,数据收集与分析 (Minitab),结果 : 在判定限以内 不拒绝 H0 超出判定限 拒绝H0,问题

13、阐述,H0,H,日常语言,统计语言,结论,不同的包装材料对破损没有影响 不同的包装材料对破损有影响,B1=B2 B1 B2,练习 : 巧克力豆/投诉计数,一个 绿带项目主要目的是从第二季度开始减少每个地区的投诉次数 。每张桌子发一勺巧克力豆,其数量代表每个区域第一季度收到的投诉次数 。每桌选一位代表在教室前面的黑板上计下投诉的次数。 其后,每桌会收到另外一勺巧克力豆,其数量代表每个销售区域第二季度收到的投诉次数。 请在前面的黑板上同样计下第二季度的投诉次数 请分析以下按季度和地区的数据,以确认绿带项目是否成功,销售地区季度投诉次数 Region 1 1 Region 1 2 Region 2

14、1 Region 2 2 Region 3 1 ETC.,练习 : 巧克力豆/投诉计数,你的假设是什么? 你有什么类型的数据? 你需要做的第一件事是什么? 你将做何种假设检验? 你检验哪些因子(变量) ?,练习 : 巧克力豆/投诉计数,用Minitab将计数型数据转换为连续数据 象左表一样排列数据 Calculate Calculator Store Result in Variable = Claims Expression = Square Root (SQRT) Number = Claims 可得到一列连续数据,运行ANOM & ANOVA,练习 : 巧克力豆/投诉计数,ANOM: S

15、tatAnovaAnalysis of Means Response = Claims Factor = Region Ok ANOVA: StatANOVATwo Way Response = Claims Row Factor = Qtr Column Factor = Region OK,Two-way Analysis of Variance Analysis of Variance for Claims SourceDFSSMSFP Qtr11299.6 1299.655.660.002 Region410.62.60.110.971 Error493.423.4 Total9140

16、3.6,销售拜访练习,3,0,0,2,0,0,1,0,0,0,1,0,0,8,0,6,0,4,0,2,0,0,销售经理玛丽,把销售拜访频率作为她的绿带项目,原先的黑带 为此设定了规范, 即 每周每个销售员打35个电话,影响销量的KPIVs,产品库存情况,有竞争力的价格,产品质量,销售拜访频率,广告,其它,KPIVS,风险系数,百分比,理解不同的客户经理, 经验, 时间 , 客户类型, 和 销售区域对 每周销售拜访次数的影响。,学习目标:,PIVs 客户经理 经验 时间 客户类型 销售区域,KPOV 每周销售拜访次数,小结一下如何顺利完成这个练习, 以保证收集正确的数据!,销售拜访练习,销售员财

17、务周销售区域经验水平客户类型销售拜访次数 1 - Nancy King11 - 北区1 - 没有经验的1 - 小型24 2 - Sue Smith12 - 南区3 - 有经验的2 - 中等35 3 - Jack Enjill13 - 东区2 - 中等的3 - 大型25 4 - George How14 - 西区2123 5 - Mike Sell113232 6 - Dan Dollar121322 7 - Jim Jones133130 1211222 2223336 3232127 4242226 5213333 6221124 7233232 1311327 2323139 333223

18、6 4342338 5313140 6321228 7333335 1411130 2423242 3432338 4442137 5413245 6421330 7433140,销售拜访小結,你的假设是什么? 你有什么类型的数据? 你需要做的第一件事是什么? 你将做何种假设检验? 你检验哪些因子(变量) ?,首先你将计数型数据转换成连续数据.,转换方式:原来 计数型数据取平方根,以销售员为因子的ANOVA图,StatANOVAANOM Response= SR Sales Calls Factor 1 =Salesperson,每周销售拜访次数,销售员,平均值,以经验为因子的ANOVA图,每

19、周销售拜访次数,经验,平均值,以财务周为因子的ANOVA图,财务周,平均值,每周销售拜访次数,以客户类型为因子的ANOVA,客户类型,平均值,每周销售拜访次数,以销售区域为因子的ANOVA 图,销售区域,平均值,每周销售拜访次数,Analysis of Variance: ANOVA,单因子ANOVA:检验有一个变量时,总体平均值是否相等 双因子ANOVA:检验有两 个变量时,总体平均值是否相等 ANOVA-General Linear Model:检验有两个以上变量时,总体平均值 是否相等,运行Anova (GLM - General Linear Model).,确保对转换后的数据运行An

20、ova!,Salesperson, Sales Region, Experience Level, FW, Cust Type,结论,销售拜访的Anova结果,统计结论基于95%的置信度!,将数据转变成连续数据(开平方根) StatANOVA 1-Way, 2-Way, or GLM,可计数数据,比例数(样本数N是常数),比例数(样本数N不是常数),逻辑变量,比例分析 StatANOVAAnalysis of Means Binomial (np5),比例分析 StatControl ChartP (np5),可计数数据 分析 StatControl ChartU,或,比例 分析 StatCo

21、ntrol ChartP (np5),或,比例数的练习:,某公司生产的节日灯。这种灯有绿,红,桔黄,黄,淡褐,深褐色。你可以用巧克力豆做这个练习。 客户关心的是在每一个包装箱里不同颜色灯泡的数量一致。而在公司生产过程中,有多个工作 台生产各种颜色的灯泡。你的小组决定研究一下在你们的工作台产生的结果的否有别于 其它工作台。 在每个工作台抽取30只灯泡,记录黄色灯的数量。 作如下的分析; 用记录的数据分析每个工作台黄色节日灯的比例 是否相同。 运用Minitab。,工作台,#抽样数,#黄色灯的数量,用Minitab: ANOVAAnalysis of Means 选择Binomial 样本大小30

22、,缺陷比例,比例數分析:,N不是常數,將數据轉變成連續数据(开平方根) StatANOVA 1-Way, 2-Way, or GLM,计数型数据,比例数(样本数N是常數),比例 數(样本数N不是常数),比例分析 StatANOVAAnalysis of Means Binomial (np5),比例分析 StatControl ChartP (np5),比例 数分析: N不是常数 STATCONTROL CHARTP,#1,#2,#3,#1 输入结果数据所在列 #2 输入样本大小所在列 #3 输入H值以替代3 西格码控制限,比例分析,样本数 95% 21.386 31.91 42.14 52.

23、29 62.39 72.48 82.54 92.60 102.66 112.70 122.74 132.77 142.79 152.83,H值,选择95%置信度下相应的H值,比例数分析,N不是常数,用假设检验方法时,有得出错误结论的风险 !,假设检验 - 错误类型,原假设 是真,原假设 是假,接受原假设,拒绝原假设,结论正确,第 I 类错误,结论正确,第 II 类错误 一般可能性为 .20 接受Ho,第 I 类错误的概率为. 第 II 类错误的概率为,一般可能性为 .05 接受 Ha,例子- 选择适当的假设检验,A) 电视广告之后,海飞丝 的销售有统计上的显著增加吗? B) 用2种不同的促销方

24、法(送礼物和降价), 脑白金的销量有显著差异吗? C) 比较 三种彩管产品的订单完成率(相等的样本大小和相同的测量程序及标准)。 D) 印尼包装纸的质量比规范要求的好吗?,回答问题,1) 在比例图分析中判定限的改变显示: a)样本尺寸不是常 数 b) 缺陷率不是常数 c) 该图无效 d)上面都 不对 2) 对/错Anova能够被用于计数型原始数据的分析 3) 如果 我想估计星期六的天气对打高尔夫球的人数的影响,我分别记录了几个好天气和坏天气的数据 ,应采用的 假设检验是: a) 2个样本的T检验 b)比例 数分析 c) 记数型数据的ANOVA d) Tukeys 的快速检验 4) 解释下列比例

25、分析,关于假设检验知道些什么?,1) A hypothesis test helps to objectively decide whether or not there is a _ . 假设检验帮助客观地判断是否存在_。 2) The _ hypothesis is a statement of no effect or no difference. _假设是声明无影响或无差异。 3) For P values 0.05 we (fail to reject, reject) the null hypothesis. 如果P值 0.05,我们(接受,拒绝)原假设。 4) We reject

26、 the null hypothesis if data lies (outside, inside) the decision limits. 如果数据位于判定限(之外,之内),我们拒绝原假设。 5) The type of data and number of _ help to determine which test to conduct in minitab. 数据类型和_的个数帮助决定执行minitab中的何种检验。 6) What type of test is used to compare the mean of two related populations? 哪种类型的检

27、验被用于比较两个相关总体的平均值?,附录,取样,置信区间 /假设检验,取样,置信区间 /假设检验,什么都不知道从这儿开始!,置信区间“太宽” 或 无法区分有显著差异的过程,平均数 标准偏差 缺陷率 (P),5-10 25-30 100 而且 nP 5,统计概念 最少的样本大小,已有数据 从这儿开始!,计算样本大小,计算样本大小,置信区间“太宽” 或 无法区分有显著差异的过程,决定样本大小 - 一个反复的过程,其中:n = 样本大小 p = 平均缺陷率 Ha = 查表值, a 通常取 0.05 E = 估计误差,比例数,计算样本大小的公式与数据类型有关,计数型数据,连续数据 (平均数),这里:n

28、 = 续计数的次数 Ha =查表值, a 通常取 0.05 C = 平均数 E = 估计误差,n,E,H,=,a,c,*,这里:n = 样本大小 Ha = 查表值, a 通常取 0.05 s = 标准偏差 (或其估计值) E = 估计误差,E,*,2,s,试验统计表, (H0.05),11.96 22.24 32.39 42.49 52.57 62.63 72.68 82.73 92.77 102.80,122.86 152.93 182.98 203.02 253.09 303.16 353.19 403.22 503.29 753.40 1003.48,平均值或比例数的个数 H0.05,平

29、均值或比例数的个数 H0.05,表示: 测试的平均数或 比例数(总体)的个数,表示: H0.05用于逻辑或 连续数据样本 大小的 值,样本大小取决于你的.,你必须决定在某一置信度下可以接受的误差,或者说怎样的区别才会 被认为是有显著差异的。 如果你不知道你可以接受的误差你可以从用1/2标准偏差开始 数据与你的取样方法有很大关联如果样本不能代表总体,你不会得到正确的答案 !,最重要的是你的专业判断. 正确地取样 (有代表性和适当的样本大小),逻辑数据: 比例数的样本大小,配货中心打算采用可提高定单正确性的新系统。分别用新、旧系统处100 个定单,我们定义定单准确性1% 的改进为显著的改进,我们可

30、以使用新系统吗? 旧系统 新系统 正确的 定单数 97/100 98/100,ANOM 显示没有显著区别 . 因为我们 的样本大小 不足以区别1% 的改进,我们能觉察到的最小的改进是4%!,但是, 如果我们先计算样本大小呢.,从历史数据, I 我知道 p = 97% 根据我的专业知识,我知道如果改进达到% (E=1%) 我会使用新1 查表知道, H = 2.24 n = (0.97*(1-0.97)*(2.24/0.01)*2 = 1460,用较大的样本重做假设检验.,旧系统新系统 正确的 定单数 1445/15001465/1500,新、旧系统各取1500个定单 . 在95% 置信度下有显著的差别 !,Old System,New System,0,.,9,7,5,0,.,9,7,0,0,.,9,6,5,0,.,9,7,6,1,0,4,0,.,9,6,3,8,9,6,0,.,9,7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论