




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本资料来源 第4部分 双样本置信区间和假设检验 第4部分 双样本置信区间和假设检验 目的 目标 比较方差 采用F 检验法 Bartlett检验法和Levene检验法 比较平均值 采用双样本置信区间和假设检验 理解统计重要性和实际重要性之间的区别 本章的目的是使用假设检验来检查两个总体的平均值和方差之间的差异是否存在统计显著性 位于洗衣机上的传动装置的总高度将影响制动性能 我们所关心的CTQ是总高度 目标值 5 394英寸 有8个不同的固定架用于固定该部件以便加工 您想了解一些什么 固定架是否为重要的X变量 分析步骤 1 将数据制成图表 并观察差异 2 使用假设检验和置信区间来确定此差异是否确实存在 3 得出结论 打开Minitab中的文件 lth L 6Sigma Minitab Training Minitab Session2 lth mtw 举例 总高度 数据列表 第一步 制图 数据显示行设备1设备2设备3设备4设备5设备6设备7设备815 3905 3875 3945 3885 3865 3885 3885 38825 3895 3875 3945 3895 3845 3885 3895 38935 3905 3875 3935 3885 3855 3885 3885 38845 3895 3875 3945 3905 3855 3885 3885 38855 3885 3885 3945 3895 3845 3885 3885 38865 3915 3885 3955 3925 3875 3915 3915 39075 3915 3895 3965 3915 3885 3915 3925 39185 3915 3895 3975 3915 3875 3915 3915 39095 3915 3885 3955 3915 3875 3905 3895 389105 3895 3875 3955 3905 3875 3905 3895 390 变量N平均值中值Tr平均值标准方差SE平均值设备1105 38995 39005 39000 00110 0003设备2105 38775 38755 38760 00080 0003设备3105 39475 39455 39460 00120 0004设备4105 38995 39005 38990 00140 0004设备5105 38605 38655 38600 00140 0004设备6105 38935 38905 38920 00140 0004设备7105 38935 38905 38910 00150 0005设备8105 38915 38905 38900 00110 0003 方框图可以提供设备间的差异图 设备3和5的平均值明显不同 设备2的标准差是否不同 从图形中可得出答案 假设检验给出了答案的统计置信度 Graph Boxplot 目标值 5 394 观察数据的另一种方式 抖动的分布图 采用假设检验法来分析差异是实实在在的还是偶然发生的 您想知道什么 1 方差 统计问题 不同固定架方差之间看上去明显的差异是实际存在还是偶然发生的 实际问题 我们是否应该努力制造象2号那样的固定架 以减少方差 2 平均值 统计问题 不同固定架均值之间看上去明显的差异是实际存在还是偶然发生的 实际问题 我们是否应该努力制造象3号那样的固定架 以使它们接近目标值 根据您希望比较的内容选择假设检验法 采用什么工具确定差异是确实存在 还是偶然发生 比较方差F检验法 2个方差 Bartlett检验法 用于正态数据 Levene检验法 用于非正态数据 比较平均值双样本t成对t 1 2 为什么使用假设检验和置信区间 在六个西格玛项目中 我们使用图形和假设检验来筛选少数关键Xs 假设检验有助于确定差异是确实存在 还是偶然发生 置信区间给出总体值 参数 最可能的取值范围 所有潜在 X s 关键少数 X s 为什么使用假设检验和置信区间 由于所有数据均存在偏差 因此 即使总体是一样的 样本数据也会存在细微差异 让我们来看一看在生成一些随机数据 无规律的数据 时会发生什么情况 1 产生8组随机数据打开新的工作表 File New MinitabWorksheet OK生成10行数据 保存在c1 c8栏中 Calc Randomdata Normal 为什么使用假设检验和置信区间 2 在一栏中进行叠加 Manip Stack Unstack Stack叠加c1 c8 将叠加的数据保存在c9 在10中存储下标 为什么使用假设检验和置信区间 3 将数据制图 并寻找差异 Graph Boxplot制作c9 Y 和c10 X 固定架 的对比图 为什么使用假设检验和置信区间 4 请注意 样本平均值和方差存在着差异 即使所有8组数据都取自同一总体也不例外 有些统计程序的前提条件是方差相同 而大多数程序对这一假并不敏感 因此 它通常不是我们所关心的问题 如果您利用Minitab进行双样本t检验 它将问您是否假设方差相同 您可以使用方差检验来作出判断 比较方差 何时应该比较方差 如果您对改变了工序 并想确定输出结果中的方差是否改变 您可以将工序改变前后的方差进行比较 手工计算的F 检验 比较2个方差 计算F s12 s22 其中s12 两个样本方差中较大的方差 和s22 两个样本方差中较小的方差如果计算的F值比表格中的F值更大 则否定零假设并接受存在差异 举例 比较固定架1和固定架2的方差s1 00110固定架1的标准方差s2 000823固定架2的标准方差每个样本的容量为10 各自的自由度为9 计算的F 001102 0008232 1 79分子的自由度为9 分母的自由度为9的F分布临界值为3 18 由F表格中得出 计算的F值比表格的F值小 因此 无法拒绝方差相等这个零假设 结论 没有足够的证据来以95 的置信度说明方差已经改变 F表格 分子自由度 分子自由度 分母自由度 课堂练习 手工计算F 检验 F s12 s22其中s12 一个分布的方差 两个样本方差中的较大方差 s22 另一分布的方差 两个样本方差中的较小方差 比较固定架7和固定架8的方差s7 00149固定架7的标准方差s8 00110固定架8的标准方差每个样本的容量为10 分子的自由度是多少 分母的自由度是多少 F表格的临界值是多少 哪个方差值更大 而应置于分子 计算的F是多少 计算的F值是否比表格的F值大 您的结论是什么 您有证据能够以95 的置信度来说明固定架7和固定架8之间的方差不同吗 方差齐性Stat ANOVA HomogeneityofVarianceBartlett检验法 正态数据Levene检验法 非正态数据 采用Minitab比较方差 Ho 12 22 k2p 时无法拒绝HoHa i2 j2 至少一对 p 时接受Ha 一般为 05 假设 比较所有8个固定架的方差 假设是什么 Ho Ha Stat ANOVA HomogeneityofVariance 0 0005 0 0015 0 0025 0 0035 西格玛的95 置信区间 Bartlett检验法 检验统计值 4 298 P 值 0 745 Levene检验法 检验统计值 0 818 P 值 0 576 因素级别 1 2 3 4 5 6 7 8 总高度的方差齐性 统计结论 我们无法得出8个固定架之间的方差存在差异的结论 我们在图形中观察到的差异可能是由于偶然因素而发生的 实际结论 不应该将所有固定架都制造成象设备2那样来减少方差 方差齐性检验 我们现在转向平均值 您希望知道什么 统计问题 固定架之间方差的明显差异是实际存在还是偶然出现的 实际问题 是否应该努力制造3号那样的固定架 以使其均值接近目标值 目标值5 394 现在转向双样本t 单样本比较将一组数据与标准值比较 双样本比较两组数据互相比较 BillMark Billpar 为什么计算置信区间和假设检验 单样本比较将一组数据与标准值比较 双样本比较互相比较两组数据Ho m1 m2或者 Ho m1 m2 0 如果 1 2的置信区间不包括0 则说明m1和m2之间的差异是显著的 单击 Graphs 点击两次 OK 运行 采用Minitab进行 双样本t 以比较两个固定架 假设是什么 Ho Ha 选择Ha单侧或双侧 Stat BasicStatistic 2 Samplet 如果F检验未拒绝Ho 单击 AssumeEqualVariance 比较固定架1与固定架3 单击 Boxplotsofdata P值 05 拒绝Ho Minitab给出了置信区间和假设检验 Ho和Ha的假设 m1 m2的置信区间 不包括0 0 置信区间的说明 平均值差异的最可能估计值为 5 3899 5 3947 0 0048 实际差异 如果我们包括总体的所有数据 可能大于该值 也可能小于该值 我们有95 的置信度说明实际值在 0 00586和 0 00374之间 这是总体差异的近似值范围 与数据一致的数值 以这种方式组成的区间中有95 的区间包含实际总体值 您出错的机率是5 0 0不在该区间内 因此 我们可以有力的证明固定架之间的差异确实存在 而不是偶然出现 这意味着我们可以否定2个平均值是相等这一零假设 Ho m1 m2orm1 m2 0 P值 05 否定Ho Minitab给出了置信区间和假设检验 固定架1和3的平均值之间确实存在统计差异 固定架是关键X Ho和Ha的假设 置信区间 不包括0 0 假设检验的说明p值小于 05 因此 我们拒绝Ho 得出结论 2个固定架间差异确实存在 而非偶然发生 其实 我们有超过99 9 的置信度相信差异确实存在 计算t的绝对值 9 50 9 50 比表格中自由度为18的值 2 101 大 说明该差异具有统计显著性 拒绝范围 无法拒绝HO 表格值 临界值 表格值 临界值 表格值 临界值 表格值 临界值 拒绝范围 无法拒绝HO 拒绝范围 拒绝范围 2 2 无法拒绝HO 双侧检验 单侧右检验 单侧左检验 注意 备择假设 Ha 决定拒绝范围 单侧和双侧检验 Ha 不等于 Ha 大于 Ha 小于 假设检验 双样本t 手工方式 为了确定统计显著性 将计算的tcalc与t表格中的t n1 n2 2 2 值进行比较 置信区间x1是第一个样本的平均值x2是第一个样本的平均值n1是样本大小n2是样本大小t n1 n2 2 2 取自t表格 由自由度 n1 n2 2 单侧面积 2决定sp是合并标准差sp是方差的加权平均值 权数为自由度ni 1 计算双样本置信区间并用t检验来比较两个固定架 课堂练习 统计显著性并非偶然出现的差异 实际重要性差异重要得足以使您采取行动 统计显著性与实际重要性 您必须确定具有统计显著性的差异是否具有实际重要性 统计显著性实际重要性是否是重要X可能需要更多数据否重要 但不值得改变不是重要X 有关固定架之间差异的结论 1 固定架的方差之间不存在具有统计显著性的差异 图中显示的明显差异可能是偶然出现 2 固定架1和固定架3的平均值之间存在具有统计显著性的差异 图中所观察到的平均值差异不是偶然出现 注意 通过大量双样本假设检验来比较众多群组 如8个固定架 是不可靠的 共有 8 7 2 28种可能的假设检验 其中部分差异会由于偶然因素而具有统计显著性 更好的方法是采用方差分析 这将在第7部分介绍 成对t检验 问题 一位操作人员用两种卡钳来进行质量检查 有人问他 两对卡钳是否会影响其检查的准确度 检查员收集了以下数据来回答这一问题 两个卡钳是否提供同样的测量结果 清除Minitab 不要保存 Window Closeallgraphs点击 Data 窗口中的任意位置 然后点击右上角的 X 在Minitab中打开文件 ttests L 6Sigma Minitab Training Minitab Session2 Ttest mtw 您的工作表将如下所示 此处键入标题 描述性统计VariableNMeanMedianTrMeanStDevSEMeancalip1120 266250 266500 266200 001220 00035calip2120 266000 265500 265900 001760 00051diff120 000250 000500 000400 002010 00058 为何采用成对t 为何使用 为了降低变异性 部件间的差异 并作出更精确的估测 更小的置信区间 您希望知道什么 卡钳的测量结果是否相同 何时采用成对检验 对同一件试验单元或在相似条件下进行两次测量 在此例中 对同一部件进行了两次测量 每行数据都有匹配内容时举例 外罩在喷漆前后的平整度 话务员在受培训前后的成绩 假设Ho 1 2 0Ha 1 2 0Ha 1 20 对于Minitab中的双样本t检验 在各独立栏中输入两次测量结果 首先将数据绘制成图形 差异直方图 c9 一些差异是正数 卡钳1更高 而一些差异是负数 卡钳2更高 差异的平均值是否明显不同于0 首先将数据绘制成图形 卡钳2与卡钳1的分布图 单击Options添加抖动度 首先将数据绘制成图形 卡钳2与卡钳1的分布图 单击Frame和Min Max显示相同的X和Y轴范围 首先将数据绘制成图形 卡钳2与卡钳1的分布图具有抖动轴刻度相等均等线卡钳1 卡钳2 一些点位于均等线之上和之下 有时卡钳1的测量值更高 有时卡钳2的测量值更高 下面 利用单样本t检验来检验其差值以比较两个样本的平均值 假设是什么 Ho Ha 拒绝的标准是什么 0 位于C I 之内 无法拒绝Ho 必须使用两种测量方式的差值来进单样本t检验 我们不能说两个卡钳测量结果的平均值不同 Stat BasicStatistics 1 Samplet 置信区间VariableNMeanStDevSEMean95 0 CIdiff120 000250 002010 00058 0 00102 0 00152 问题方法平均值的取值范围是什么 单样本置信区间平均值是否与假设值不同 单样本假设检验2个平均值之间差异的取值范围两个平均值之间差异的置是什么 信区间两个总体的平均值是否相同 双样本假设检验对于成对数据 两个样本的平均值成对t检验 以及差异的是否相同置信区间 您想知道平均值的哪些内容 问题说明 呼叫中心不可用性的变化范围广 平均值为53 这导致应答率很低 造成客户不满意 CTQ 客户关系不可用性测量结果 每日的不可用时间缺陷 一日的可用时间 35 单位 每日 M F机会 每日 M F客户 呼入的客户 课堂练习 打开文件CALLCNTRL 6sigma Minitab Training Minitab Session2 CALLCNTR mtw 使用C2与C6栏中的数据相互比较这三个呼叫中心的不可用性 首先将数据绘制成图形 使用假设检验来确定3个呼叫中心可用性的方差和平均值之间是否存在显著差异 在运行某些例行程序之间 您需要对数据进行 退栈 Manip Stack Unstack Unstack在 不可用性 中对数据进行退栈存储在数据栏c14 c16中使用数据栏2中的下标 3个呼叫中心1 中心A 24样本 2 中心B 24样本 3 中心C 12样本 关键概念 第4部分双样本置信区间和假设检验 方差F 检验是比较2个方差的假设检验在Minitab中 方差检验称为 方差齐性 Bartlett检验法比较正态数据的方差Levene检验法比较非正态数据的方差平均值t 检验用于比较2个数据组的平均值成对t 检验比较数据成对时两个总体的平均值差异置信区间总体参数的取值范围 与数据一致的值 关键概念 第4部分双样本置信区间和假设检验 统计风险 错误 将实际上相同的东西误认为存在差异 在装配线上拒绝好的部件 风险 产生 错误的风险根据惯例 风险为5 或 0 05 P值 所观察到的显著性水平 在总体值相同的情况下 观察到存在这么大差异的机率 如果所观察到的显著性水平 p 小于可接受的风险 则接受Ha 拒绝Ho 如果所观察到的显著性水平 p 大于可接受的风险 则拒绝Ha 无法拒绝Ho 附录 假设检验术语 1 零假设 Ho 不存在变化或差异的命题 如果没有充分的证据拒绝它 就假设这一命题是真的 2 备择假设 Ha 存在变化或差异的命题 如果拒绝Ho 则认为这一命题是真的 3 一类错误 当Ho实际上为真时而被拒绝所产生的错误 或是接受存在差异 但事实上却没有差异时所犯的错误 4 风险 出现第一类错误的最大风险或机率 这个机率总是大于零 通常为5 研究人员决定拒绝Ho所可以接受的最大风险 5 显著水平 同 风险 6 二类错误 当Ho实际上为伪而没有被拒绝所产生的错误 或是接受没有差异 但事实上存在差异时所犯的错误 7 风险 二类错误出现的风险或机率 或者是说 忽略了问题的有效处理或解决方案 8 显著性差异 用于描述统计假设检验结果的术语 即 差异大得不能合理地归因于偶然因素 9 功效 统计检验能力 以检查出差异 或正确地拒绝Ho的机率 通常用来确定样本大小是否足以检查出数据之间的差异 10 检验统计值 标准化数值 z t F等 代表Ho的可行性 它以已知的方式分布 因此可以确定这种观察值出现的机率 通常 Ho的可行性越高 则检验统计值的绝对值就越小 在这种分布范围内观察到这个值的机率也就越大 B14 8 T分布的单侧使用 实际的总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美的集团工作流程体系
- 2025年事业单位工勤技能-湖北-湖北水生产处理工三级(高级工)历年参考题库含答案解析
- 文化场馆扩建工程2025年社会稳定风险评估研究
- 2025年事业单位工勤技能-浙江-浙江土建施工人员一级(高级技师)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-河南-河南舞台技术工一级(高级技师)历年参考题库含答案解析
- 2024版房产证抵押合同样本
- 2025年事业单位工勤技能-河北-河北理疗技术员三级(高级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江西-江西药剂员三级(高级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广西-广西计算机信息处理员二级技师历年参考题库含答案解析
- 2025年事业单位工勤技能-广西-广西放射技术员四级(中级工)历年参考题库典型考点含答案解析
- 智能航运管理-洞察阐释
- 被迫签署离职协议书
- 内蒙古华电正能圣圆伊金霍洛旗风光制氢一体化项目(风电部分)-环境影响报告书
- 学习解读《水利水电建设工程验收规程》SLT223-2025课件
- 《肥胖症诊疗指南(2024年版)》解读课件
- 感冒急性鼻炎护理
- 2025《安全生产法》培训课件
- 上门灭蚊合同协议
- 2025报关单填制规范
- 2025届四川省泸州市高三下学期第三次教学质量诊断性考试英语试题(原卷版+解析版)
- 缓刑解除矫正个人的总结(范文模板)
评论
0/150
提交评论