




已阅读5页,还剩100页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
假设试验 因研究蜜蜂的语言而荣获诺贝尔奖 你在这里 INSTRUCTORNOTES HypothesistestingwasusedfordiscreteXsandcontinuousYs RegressionisusedforcontinuousXsandYs 过程分析 数椐分析 组织原因 假设试验 回归分析 控制 定义 测量 改进 分析 目录 检测正态分布假设试验概述比较两组平均值 t试验假设试验的解释比较两组或更多组的平均值 ANOVA试验比较两组或更多组的比例 试验复习 检测正态分布 复习 正态曲线 定义 正态曲线是一种概率分布 最经常发生的值位于中间 其他概率向两侧对称下降 此图形有时称为钟形曲线 正态曲线概率 标准正态分布将数据标准化为平均值 0标准偏差 1 正态分布使用实际数据平均值 17标准偏差 3 值 Z值 3 0 3 2 1 2 1 8 17 26 23 20 11 14 95 46 99 73 68 26 Z值 与标准正态值相同 标准正态分布 Z值兴趣值远离平均值有多少个标准偏差 Z值的概率 标准正态曲线下的面积 概率Z值 0的概率是多少 Z值 2 84的概率是多少 3 2 1 0 1 2 3 兴趣值 面积 P值 尾部面积兴趣值以外的曲线下的面积处于或超过兴趣值的概率小的P值 0到 05 意味着 从该分布产生兴趣值的概率较小 可能从其他分布产生 P值是兴趣值的概率 拒绝域 拒绝域 拒绝域 拒绝域 接受域 接受域 接受域 并非所有数据都呈正态 仅在一个方向上有长尾巴的分布被称为不对称 示例 使用正态曲线计算过程均方差要确定过程均方差 找到超出规格界限外的缺陷面积如果数据不是正态 使用方法2 在测量阶段已讨论 估计的缺陷面积就不正确 且不能如实表示过程均方差 将正态方法用于非正态数据的后果 平均值 阴影面积占多大百分比 对于正态曲线 此百分比值是不同的 受非正态数据影响的方法 方法 非正态的结果 过程均方差计算 过程均方差值不正确 单值控制图 错误地发现某些特殊原因 丢失其它信号 假设试验 关于各组之间差别的错误结论 回归 错误地识别重要因素 较差的预测能力 实验设计 关于重要因素的错误结论 较差的预测能力 必须转换非正态数据 在高级课程中讲授 使用正态概率图检查正态 以下是在Minitab n 25 中生成的样本正态概率图 Graph ProbabilityPlot如果数据是正态 那些点可连成一条直线 直线表示在95 的置信范围之内 如果大约95 的数据点落在置信范围内 可以说数据是正态的 什么是正态概率图 数据值在X轴上正态分布的百分点在Y轴上 线条的不等间隔是故意设置的 正态概率图 正态分布中有十个间隔相等的百分点 间隔相等的百分点将正态曲线划分为相等的区域百分点与正态概率图纵轴上的百分比匹配 从两个正态概率图得出的结论 结论偏离正态不严重 结论偏离正态严重 使用Minitab 检测正态分布 1 在Minitab中打开一个新 空的 作业表 2 根据平均值 10 标准偏差 2的正态分布生成由25个数据点组成的随机样本 然后保存在C1中 Calc RandomData Normal 使用Minitab 检测正态分布 续 3 用刚保存在C1中的随机数据创建直方图 Graph Histogram 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 C1 频率 您的结果与此图不同 使用Minitab 检测正态分布 续 4 用保存在C1中的随机数据创建正态概率图 Graph ProbabilityPlot 您的结果与此图不同 您得到什么结论 假设试验概述 什么是假设试验 假设试验汇总了数据 这样您可检测到不同组之间的差别 假设试验用于在两个组或更多组之间进行比较 数据类型 可以比较什么 示例 连续 比例 供应商A的按时交货比例是否与供应商B的相同 离散 平均值 变化 形状或分布 三个班次的平均产量是否相同 采用新方法的小组的结果与采用旧方法的小组的结果相比变化较小吗 采用不同的方法周期的分布有何区别 为什么使用假设试验 发现对于经营业务具有重要意义的差别 何时使用假设试验 当您需要比较两个组或更多组的以下因素时平均值可变性比例当您无法确定是否存在真正的差别时 如何使用假设试验 确定适合于您的数据和问题的检验类型在Minitab中合适安排数据从Statistics选项菜单选择适当的检验从Minitab输出获得p值 如果p 05 则宣称统计上有重大的差异 比较两组平均值 t试验 t试验 比较两组平均值的统计检验 使用称为t试验 使用Minitab 的统计检验来判断两组平均值之间的差异 t分布 比Z分布有更大的变化 因此尾部有不同的面积 这表示不同的P值 其变化范围取决于自由度 df 我们不详细解释df 可把它看作是估计这两组的平均值和标准偏差之后样本中残留的信息量 是适当的 因为我们估计了平均值和变化 并经过统计理论证实 使用Minitab 比较两组的t试验 数据 C ProcEx Hypo Mod Research MTW1 打开Minitab作业表 它包含使用标准方法的100个生长周期和使用新方法的50个生长周期的时间 2 按方法绘制研究时间的分层点图 Graph Dotplot 选择 Std 和 New 作为变量 选择 eachcolumnconstitutesagroup 3 对这两种方法的平均时间之差做t试验 Stat BasicStatistics 2Samplet Graphs 选择两个图 使用Minitab 比较两组的t试验 续 使用Minitab 比较两组的t试验 续 使用Minitab 比较两组的t试验 续 结论因为P值很小 05 因此可得出结论 这两种方法的平均研究时间有统计上重大的差异 或者这两种方法的平均研究时间不同 注意 P值不是先前报告的 0007 因为使用t分布比正态分布更适当 两个样本t试验和置信区间Std与New的两个样本TN平均值StDevSE平均值Std10015 031 880 19New5014 111 540 22muStd muNew的95 CI 置信区间 0 35 1 49 t试验muStd muNew 与不是 T 3 19P 0 0018DF 117 t值 观察P值得出结论 它是否 05 平均值的标准误差 平均值的标准偏差 Std New平均值之差的置信区间 下一页中讨论 对话窗口输出 解释置信区间 95 置信区间是应包含这两组平均值之间的真实差异的值的范围 它基于平均值的差异分布 而不是个别观测数据之间的差异 它不表示我们希望的个别生长周期之间的差异值的范围 该范围应该更宽 如果组平均值之间没有显著差异 置信区间将包含0 即范围从负数 到正数 示例哪一组较快 因为 AveSTD AveNEW 是正数 标准方法时间较长 而新方法时间较短 较快 快多少 我们有95 把握认为新方法平均要比标准方法快大约 35小时到1 49小时 解释置信区间 续 t试验总结 比较两个平均值 t试验是比较两个平均值的假设试验 假设两组平均值相同 它们的差 0如果P值很小 则拒绝该假设 按照惯例 如果P值 05则被视为小值常用符号虚 无效 假设H0 meanA meanB 替代 备择 假设Ha meanA meanB t试验总结 比较两个平均值 续 步骤1 使用Minitab计算数据的t统计值并提供P值 2 如果P 05 拒绝虚假设 组平均值相同 接受具有95 置信度的备择假设 组平均值不同 3 如果P不是很小 05 则可得出结论 拒绝虚假设没有足够的证据 有下列可能的解释 a 这些组相同 或b 变化过大或样本过小无法检测到差异 练习2 使用Minitab和t试验比较两组平均值 目的 练习使用Minitab进行t试验以比较两组平均值并得出结论 时间 15分钟数据 C ProcEx Hypo Mod Techno MTW背景 一个工具材料供应商声称其产品可增加您部门一台极重要的机器的日加工件数 它安排在该月的前五天 您的企业最忙的时间 进行一次实验 以演示该产品 下面是实验结果 还有上个月前五天的数据 以便进行比较 日期件数材料 8 1 10050 Std 8 2 9028 Std 8 3 12579 Std 8 4 8189 Std 8 5 13316 Std 9 1 10124 New 9 2 10860 New 9 3 15087 New 9 4 9633 New 9 5 12251 New 上个月 当月 为了使条件一致 加工检验仅比较白班的完整加工周期 练习2 使用Minitab和t试验比较两组平均值 续 指示 1 使用Minitab分析数据 2 分小组讨论并回答下列问题 准备报告您的结论 a 数据是否支持供应商的声称 b 您是否将购买该产品 c 如何提高确定是否购买该产品的决定能力 d 购买该产品衍生的问题是什么 练习2 答案 问题1 Minitab输出 练习2 答案 续 描述性统计数字 变量材料N平均值中值TrMeanStDev TransactNew51159110860115912190 Std51063210050106322229 变量材料SE平均值最小值最大值Q1Q3 TransactNew979963315087987813669 Std997818913316860812948 新方法平均值要高959件 两种材料都有相当大的标准偏差 这样很难辨别真实差异 练习2 答案 续 问题1 Minitab输出 续 置信区间范围从负数到正数 并包含0 P值 05 两个样本t试验和置信区间材料的两种样本T材料N平均值标准偏差SE平均值New5115912190979Std5106322229997mu New mu Std 的95 置信区间 2348 4265 t试验mu New mu Std 对比不等的情况 T 0 69P 0 51DF 7 练习2 答案 续 问题2a 2b 数据不支持供应商的声称 两种方法的平均日加工件数之间没有显著差异 即使在这5天抽样中平均多生产959件 也没有足够的证据可以作为购买新材料的原因 不能将差异与随机变化区别开来 问题2c 2d 改进分析要提高检测真实差异的能力 您可 构建一个加工变化前后 例如前3个月 生产的件数控制图 以观察这五个数据点是否适合季节或月周期 收集更多数据 增大样品大小n 以进一步减少平均值的变化 比较工具磨损模式以检测这两种材料中的其它差异 练习2 答案 续 将t试验应用于您的企业 考虑要点考虑两组之间的差异不明显 而两组平均值的t试验却可能有用这一情况 如果对您的数据使用t试验 推测作结论时您所做的假设 下一节我们将深入讨论 需要澄清什么问题 假设试验的解释 假设试验如何作用 因为变化 没有完全相似的两件事 问题 您在样本 组 过程等等之间看到的差异是由于随机的普通原因变化 还是由于存在真实差异 为了确定这点 不同的假设试验可提供不同方法来评估在不同情况下的普通原因变化 它们检验在该情况下一个差异是否明显要比预期的普通原因变化大 如果答案为否 则差异没有统计证据 如果答案为是 则可推断这些组明显不同 假设试验使用更大的样本 因为平均值的变化随着样本大小的增大而减小 什么是假设试验 检验虚假设 H0 组之间没有差异与备择假设相反 Ha 组不同获得虚假设的P值 使用数据和适当的假设试验统计数字获得P值 使用Minitab 如果P 05 则拒绝H0并决定使用Ha如果P 05 不能拒绝H0 为何使用假设试验 当无法确定是否存在真实差异时使用假设试验 例如 分层点图显示组平均值之间没有明显差异 您想知道平均值的微小差异是由于随机变化还是反映了真实差异 假设试验比分层点图提供更明确的结果 如果假设满足的话 假设试验的假设 如果数据是连续的 我们假设基本分布是正态 您可能需要转换非正态数据 如周期 当比较不同总体的组时 我们假设 独立样本 通过随机抽样实现 样本是总体的代表 没有偏差 当比较不同过程的组时 我们假设 每个过程都是稳定的 没有特殊原因或随时间的变化 没有与时间相关的差异 样本是过程的代表 没有偏差 P值定义 假设试验比较观测到的组之间的差异 假设真实差异为0 虚假设 P值等于获得观测差异的概率 P值范围从0 0到1 0 0 可能性到100 可能性 按照惯例 通常将P 05视作是差异明显的象征 如果P 05 则可推断真实差异为0的概率很小 讨论 解释P值 有多种方法来陈述根据P值得到的结论 您认为下面哪些最容易理解 P值用于判断观测到的组之间差异是否明显大于普通原因 随机 变化 如果P 05 结论是肯定的 如果P 05 则拒绝H0而决定使用Ha P 05意味着组来自相同分布的概率小于5 P值确定观测到的差异是否在统计上看较显著 如果P 05 结论是肯定的 假设真实差异为0 P值等于获得观测差异的概率 如果P值很小 05 我们说观测差异必须显著 因为如果没有真实差异 我们从样本中观测到这类差异的概率就较小 P值用于判断抛弃虚假设是否有足够的统计证据 如果P 05 结论是肯定的 假设试验的类型 假设试验 目的 t试验 成对t试验 ANOVA F检验 方差的分析 2试验 比较两组平均值 当数据匹配时比较两组平均值 比较两组或多组平均值比较两组或多组方差 比较两组或多组比例 将在高级课程中解释成对t试验 ANOVA和 2试验法 Y 输出 X 输入 连续 离散 比例 离散 组 连续 试验 t试验成对t试验ANOVA 逻辑回归 回归 不同数据类型的适当分析方法 当输入 X 变量是离散变量时 使用假设试验 将离散X当作 分组 或由分层变量来看X 示例 如果您希望按产品比较周期 那么不同产品类型就是离散X 如果X数据是连续的 则使用回归分析判断它们是否与输出 Y 变量相关 假设试验 回归分析 我使用哪种分析方法 否 X是连续的 回归主题 检验 ANOVA t 检验 否 Y是离散的 比例 否 比较更多的组 平均值或方差 是 是 是 是 成对t试验 否 比较两个独立的组平均值 将两组平均值与匹配的数据相比较 X是否是离散的 组 Y是否是连续的 仅比较2组吗 Y1是否与Y2匹配 假设试验中的两种误差 我们基于假设试验所做的任何决定都有四种可能结果 我们可决定这些组是相同还是不同 以及我们可能是对或错 第二类误差 实际 真相 无罪 有罪 无罪 无罪 有罪 释放 结论或决定 有罪 无罪 入监狱 有罪 司法举例 所有的误差都是重要的偏重于一类误差会增加产生另一类误差的风险增加采样样本数量 降低第二类风险可探测到更小的差异 一类误差 TypeIError 二类误差 TypeIIError SARS新药临床试验必须设立对照组 因为对照试验的目的为比较新药与对照药物二组治疗结果的差别有无统计学显著意义 由于临床治疗中所获得的疗效可能由药物引起 也可能由非药物的因素如休息 疾病或症状自愈等引起 当A药与B药治疗结果出现差别时 首先要确定这种差别是药物因素造成的还是非药物因素引起的 如A优于B不是由药物因素引起而是非药物因素偶尔造成 称为假阳性 统计学上用无效假设 NullHypothesis 来处理假阳性误差 先假设A与B两药药效之间并无差别 所出现的差别可能是非药物引起的概率 Probability 当这种概率小到一定程度时 如 5 或 1 则前者95 或后者99 的差别是药物之间的差别所引起 这就显示由机遇 概率 所造成的可能性很小 从而否定了前面假定的无效假设 证明A药疗效优于B药不是概率引起而是药物本身存在疗效差别所引起 临床上把这种可能存在的假阳性误差称为I类误差 用 值表示 当 0 05 说明A优于B的结论是在95 显著性水平上排斥无效假设的 也就是说A优于B由药物因素引起的可能性为95 置信度95 仍有5 假阳性的可能性 若 0 01 则A优于B的假阳性只有1 的可能性 临床试验中另一种误差为假阴性误差 用 值表示 有时 A药与B药二药之间实际上存在着药物本身的差别 但在临床试验中由于区别这种差别的方法不够灵敏或能力有限而区别不出来 就是假阴性误差即II类误差 统计学上允许假阴性误差不能超过20 即 值一般定为0 1 不能 0 2 1 为试验中区别两种差别的能力 即获得A优于B这一结果的把握度 如 O 2 则1 0 8 说明A优于B的把握度为80 在临床试验设计中 值定得愈小 A药优于B药的显著意义愈大 假阳性愈小 但试验所需病例数也就愈多 值定得愈小 1 值就愈大 A药优于B药的把握度就愈大 但病例数也就需要愈多 通常临床试验中 值可定为0 05 值定为0 2 已能满足统计学要求 假设试验中的两种误差举例 SARS新药假设试验 重要差异与显著差异 显著但不重要的差异有时 您检测到一个统计上显著的差异 但它小到对您的企业没有实际的重要性 示例 安装机器的两种方法新方法明显要比标准方法快大约10分钟 要证明实施新方法的成本是适当的 有必要减少30分钟 重要差异与显著差异 续 重要但不显著的差异有时 一个差异在统计上不能说是显著的 但该观测差异对于您的企业而言却很重要 示例 密封容器的两种方法在实验时观测到每班增加1000个容器 增加1000个对企业很重要 新技术有更高的平均值 但在统计上却不能宣称有显著的差异 因为P 05 观测差异由于随机变化而产生且不存在真正的差异 或者变化太大 或样本大小太小 不能检测到差异 企业领导者需要决定是否值得冒险实施新方法 如果存在真正的差异 您最好实施新方法 但是如果新方法产生相同的结果 则只会徒劳无功 在假设试验中处理非正态连续数据 方法找到一种使数据近似为正态的转换方法 对转换的数据进行 假设试验 注意 数据转换将在高级课程中涵盖 比较两组或更多组的平均值 我采用哪种分析方法 Xs是否离散 组 只比较2组 Y 1 s是否 与Y 2 与Y2 s相匹配 否 Xs连续 回归主题 ANOVA t 试验 是 是 配对 t 试验 比较平均值 等方差试验 否 比较方差 是 Ys是否连续 X 否 Y离散比例 是 是 讨论 你如何比较7组 一个改进小组有兴趣比较一下7个不同的包装材料供应商 它们在不同材料上生产的平均废品总量是否存在任何明显差异你如何进行7个组的比较 你如何能同时发现7组的差异 讨论 答案 点图有助于你观察比较7个组 但从数学上 你只能同时比较2个组 不能同时比较7个组 如果你进行配对比较 每次比较2组 你最终会做21个t试验这没有有效的运用时间和数据 估计方差 你也增加了犯I类错误的可能性 至少比较之中有一次 我们必须寻求更好的方法来同步比较小组来有效利用所有的数据 TypeIerrorrate 1 95 21 66 66 方差分析以寻找平均值差异 有一种统计的方法是运用方差来同步比较多个小组的平均值称为ANOVA 方差分析与配对比较平均值不同 它将组间方差与组内方差进行比较组间方差即由该小组平均值的s2获得组内方差即由各组的s2与所有小组合并后 或与适当的自由度进行平均 获得如果组间方差与组内方差相同 我们认各为组间平均值没有差异 分析方差而非平均值 续 右图有助于理解7个小组的 组间 和 组内 方差 认可每条线为居中的正态分布 由图可以看出 组内变化小于组间变化 因此 试验可能会体现至少有一组与其他组存在差异 方差分析 ANOVA 获得组间方差获得组内方差如果它们相同 可断定各组间无明显差异 计算比率 两方差比率 F 统计我们可以从F 分布中获得P 值Minitab菜单 Stat ANOVA Oneway 意味着各小组间平均值无差异 ANOVA假设 虚假设 H0 平均值A 平均值B 平均值C 或 小组平均值无差异 或 替代假设 Ha 至少有一组的平均值与其他组相比存在明显差异 ANOVA假设 续 如果p 05不拒绝H0没有充分的证据说明任何小组间存在统计意义上的明显差异 如果确实存在差异 那么要么是变差过大或样本太小而不能被察觉 如果p 05拒绝H0 决定使用Ha至少有一组与其他组存在统计差异检查置信区间以发现哪组有差异 非重叠 措施 评估重要性和差异大小 足以保证进一步的措施 使用Minitab ANOVA 数据 C GENSixSigma Hypo Mod Forms MTW背景 一组数据包括保险面额 它是7个不同的险种 定义为A G 的15个条款 总计105个条款 1 按照险种的面值编制分层点图 Graph dotplot ByForm 使用Minitab ANOVA 续 2 获得数据汇总 Stat BasicStatistics DescriptiveStatistics FaceAmtbyForm 使用Minitab ANOVA cont 3 方差分析 ANOVA 或F 试验 Stat ANOVA Oneway UsethismenuiftheYdataareinonecolumnandthegrouplabelsareinanothercolumn Ifeachgroupisinitsowncolumn usethe Oneway Unstacked menu 使用Minitab ANOVA cont 使用Minitab ANOVA cont 问题3 Minitab输出 平方和 One wayAnalysisofVariance AnalysisofVarianceforFaceAmt SourceDFSSMSFP Form 65394138990211 560 000 Error987622407778 Total1041301653 Individual95 CIsForMean BasedonPooledStDev LevelNMeanStDev A15446 00100 56 B15277 33105 46 C15376 67102 72 D15384 0082 27 E15476 0065 01 F15514 6771 70 G15414 0080 78 PooledStDev 88 19300400500 组间方差是组内方差的11 5倍 圆括号表示小组平均值的置信区间 非单值 由P值得出结论 我们假设所有小组的方差相同 方差 之间 以内 使用Minitab ANOVA cont 结论由于p 05 拒绝H0 判断至少有一组与其他组有明显差异根据置信区间 险种B的平均面值比其他险种明显低 险种F的平均面值比B C D G的明显高 但不比A E的明显高ANOVA表明当使用险种F E或A时 其保险面值要明显高一些 采用其他的原则 如成本 易用或其他客户调查 来选择这三项险种 ANOVA假设 样本代表母体和过程过程是稳定的 过程中只有正常原因引起的波动在起作用随着时间的推移没有移位和趋势出现 没有与时间相关的异常原因 各组的方差相同可采用F 试验进行验证 参见下节 对假设的违背能导致在ANOVA分析中出现错误的判断 同样假设每组的基本分布也是正态分布 这可以用在回归模块中已经讨论过的残差正态概率图进行检查 比较两组或更多组的比例 试验 我采用何种分析方法 Xs是否离散 组 只比较2组 Y 1 s是否 与Y2 s相匹配 否 Xs连续 回归主题 ANOVA t 试验 是 配对 t 试验 比较平均值 等方差试验 否 比较方差 是 Ys是否连续 X 否 Y离散比例 是 是 Y 输出 X 输入 连续 离散 比例 离散 组 连续 试验 t试验成对t试验ANOVA 逻辑回归 回归 不同数据类型的适当分析方法 当输入 X 变量是离散变量时 使用假设试验 将离散X当作 分组 或由分层变量来看X 示例 如果您希望按产品比较周期 那么不同产品类型就是离散X 如果X数据是连续的 则使用回归分析判断它们是否与输出 Y 变量相关 假设试验 回归分析 盒图 点图 分层图 分布图 所有列出的图形的产生基于X和Y的数椐类型的测量数椐集合 离散的X和Y数据 离散Ys示例 技术要求符合性 在要求之内 之下 之外 客户满意度 差 一般 好 优 包装缺陷类型 产品编码错误 纸箱损坏 缺隔板 等 记录每个的属性可以数数每种属性的个数个数通常在表格中进行汇总 表格称为列联表 离散的X和Y数据 续 离散Xs示例地点 NY LA Denver 方法 标准的 新的 产品类型 A B C D 将数据分组 它是分层的或跟随某变量 随着地点结果有何不同 实例分析 不同地点的包装抱怨是否存在明显差异 一个团队正在进行一个持续改进项目以减少一主要客户在A产品中发现的包装错误 全国共有4个生产地点 团队有兴趣了解是否针对这4个生产地点的抱怨明显不同 以此来确定项目的今后步骤 对一个月前的发货进行抽样和评估以报告包装的问题按照不同地点的包装抱怨汇总如何使用数据来回答这个问题 地点不同 抱怨率是否明显不同 实例分析 不同地点的包装抱怨是否存在明显差异 使用比例法进行理解使用比例 或百分比 让你比较不同的类别样本大小 或机会面积 你得出什么结论 不同地点的抱怨率是否明显不同 在虚假设的基础上即所有地点具有相同的错误率 你如何计算P值 计算期望值假设不同地点间不存在实际差异来计算各数据的期望值 如果各地点间确实不存在差异 我们可以看到观测值与期望值接近 X 分析实例续 地点 东北 东南 中部 西部 Obs Exp Obs Exp Obs Exp Obs Exp 总计 有抱怨发货 46 32 3 17 20 8 5 10 9 21 25 0 89 无抱怨发货 270 283 7 186 182 2 102 96 1 223 219 0 781 总发货 316 203 107 244 870 X 分析实例续 c2 c2 统计用如下方法来测评观测值与期望值的差异 示例 将运用c2分布获得本统计的P值 Minitab菜单 Stat Tables Chi SquareTest X 分析实例续 X 分析实例续 X 分布 0 尾巴面积 P 值 c 2 假设X 试验 虚假设H0 各组比例相同替代假设Ha 至少有一组的比例与其他组不同 假设X 试验 续 如果P 05不拒绝H0没有充分的证据说明任何小组比例间存在统计意义上的明显差异 如果P 05拒绝H0 决定使用Ha至少有一组比例与其他组存在统计差异 使用Minitab X 试验 续 数据 C SixSigma Hypo Mod Complaints MTW1 在汇总的 非原始的 数据上进行X 试验 Stat Tables Chi SquareTest 使用Minitab X 试验 续 我们刚才使用了MINITAB的两种方法进行X 试验 一种方法适合于原始数据 而另一种适合于表中的汇总数据 两种方法得到了完全相同的X 值和P值 当然 如上所示 汇总数据中体现的每个单元的X 值可以用来确定哪组的比例值与其他组的明显不同 计算每个单元的x 将高值画上圈 既然你有一个明显的X 下一步作什么 1 确定哪个组比例不同 2 确定为什么这个组比例不同 1 确定哪个组比例不同 结论北部地点的抱怨率明显较高 中部地点抱怨率明显较低 抱怨比期望多 抱怨比期望少 东北地点和中部地点的抱怨在X 总和中占的比重最大 2 确定为何小组比例不同 注意 查询差异的原因而非进行责备 当一组的错误率明显比其他各组 系统 高容易导致责备 但最好把它当作改进的契机成为数据侦察员首先问如下4方面的问题工作划分 这类工作是否不同 也许复杂的工作应分配给经验丰富的人 提高错误率 工作方法 工作软件 硬件和方法与其他小组相比如何 工作流程 是否有标准流程 是否使用 人员是否经过培训 个人差异 生理差异 视力 左撇子 等 是否影响了工作能力 下一步 它们 离群 的时间有多长 如果只是现在 也许是由于最近的变化是导致的 X 试验的假设 样本代表母体或过程我们假设用于X 试验的离散数据的基本分布为二项分布每个单元的期望值 5 否则试验无法恰当进行如果期望值 5 可能需要收集更多的数据 更大的样本 X 试验值 在制造业中 通常收集离散数据来分析服务过程的表现情况如果两组或多组间没有明显差异也就避免了疑神疑鬼可以从学习先进或鼓励后进上有所收获可以发现小组比例间的明显差异当P 值小 05 表明有必要确定可能导致小组间明显差异的根源检测每个单元的x 值以确定存在差异的小组记住考虑是否 统计明显 的比例差异的大小才是对经营具有真正重要的意义 练习5 运用Minitab进行X 的试验 目标 采用MINITAB进行X 试验并分析结果 时间 15分钟 数据 C SixSigma Hypo Mod Mailers MTW背景 我们一直在跟踪3辆货车在两个制造厂间进行分总成运输的时间 运货记录表明已检查了12个月 结果汇总如下 练习5 答案 Minitab输出结论 货车有差异 在24至36小时之间 货车C的发货比期望值高 在36至48小时之间 货车B的发货比期望值高 Chi SquareTest Expectedcountsareprintedbelowobservedcounts Within2424 36hou36 48houTotal 118106795513040 1783 18675 48581 34 26092192371065 624 70236 64203 66 31768558319 187 1270 8861 00 Total25959838464424 Chi Sq 0 403 0 018 1 583
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑需求分析方案设计模板
- 《鱼我所欲也》经典篇目理解默写
- 旋塞质量监控报告
- 公司软件采购审批管理办法
- 建筑创意方案设计模板图片
- 浙教版七年级科学上册第四章 第1节 物质的构成说课稿
- Unit 1 Animals教学设计-2025-2026学年小学英语三年级下册牛津上海版(试用本)
- 瓦斯抽放工技术考核试卷及答案
- 秦皇岛策划方案咨询公司
- 《第8课 家乡赞歌-山里的孩子心爱山》(教案)-2023-2024学年人音版(2012)音乐三年级下册
- 2025变压器振动监测与故障诊断装置
- 工程对赌协议合同模板
- 格拉斯哥昏迷评分法详解(GCS)
- GB/T 45403-2025数字化供应链成熟度模型
- 盒饭采购合同协议
- QGDW11337-2023输变电工程工程量清单计价规范
- 小学昆虫知识科普单选题100道及答案
- 防性侵教师培训
- 纸箱厂应急救援预案演练方案
- 钟祥旅游景点
- YY频道模板文档
评论
0/150
提交评论