联想集团sigma培训资料对比实验页ppt课件.ppt

上传人：儿*** IP属地：广东上传时间：2020-03-30 格式：PPT 页数：71 大小：1.20MB 积分：30 举报 版权申诉

已阅读5页，还剩66页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

对比实验欢迎光临6sigma世界统计基础知识参数估计假设检验对比实验报告编写和练习课程进程为什么要学习对比实验许多的问题需要就某些参数作出接受或拒绝的决定这说明是一个假设它代表把一个实务的问题演绎成统计学上的问题而这个决策过程便称为 HypothesisTesting我们把实现假设检验的过程成为对比实验统计学上的测试能为我们就问题作出客观解说相比较以前我们只能作出主观的解说这是后续学习内容的基础统计基础知识第一单元总体 Population 在统计问题中我们把研究对象的全体成为总体个体构成总体的每个成员称为个体样本 Sample 从总体中抽取部分个体所组成的集合称为样本样品样本中的个体称为样品样本容量样品的个数称为样本容量常用n表示 1 1总体和样本样本随机样本 Randomsample 能够被推广应用于更大的总体的样本总体的每个个体有一个已知的有时是相等的机会被包含在该样本中简单随机样本 Simplerandomsample 1 同一性样本与总体有同样的分布2 独立性如果给定第一个事件无论它的结果是什么第二个事件的机会都一样 1 2统计量和抽样分布统计量不含未知参数的样本函数称为统计量抽样分布统计量的分布称为抽样分布有序样本是从总体X中随机抽取的容量为n的样本将它们的观测值从小到大排序这便是有序样本统计推断过程统计学的主要任务 1 研究总体是什么分布 2 这个总体即分布的均值方差是多少样本统计量例如样本均值方差总体均值方差抽样 1 2常用统计量描述中心位置的统计量 1 众数 mode 一个变量的众数是指出现次数最多的值不过它不一定唯一 2 中位数 3 均值 mean 1 2常用统计量描述数据分散程度的统计量 1 极差 range 2 方差 variance 3 标准差 standarddeviation 4 标准误差 standarderror 是很多不同样本的均值的标准差 5 变异系数 1 3正态分布正态分布 1 3正态分布标准正态分布它是特殊的正态分布服从标准的正态分布的随机变量记为z 概率密度函数记为 z 1 3正态分布标准正态分布的变换 1 3正态分布标准正态分布的分位数 0 975是随机变量z不超过1 96的概率1 96是标准正态分布N 0 1 的0 975的分位数记为z0 975 0 975 0 025 1 4常用的抽样分布正态样本均值的分布 10 X n 4 n 16 总体分布抽样分布 1 4常用的抽样分布 t分布 1 4常用的抽样分布 F分布设X1 X2 Xn是来自正态总体N 1 12 的一个样本 Y1 Y2 Yn是来自正态总体N 2 22 的一个样本且相互独立则将F n 1 m 1 称为第一自由度为 n 1 第二自由度为 m 1 的F分布 1 4常用的抽样分布 F分布 F 1 10 5 10 10 10 参数估计第二单元 2 1点估计点估计的概念 pointestimation 用样本均值估计总体均值用样本方差估计总体方差用样本标准差估计总体标准差 2 2区间估计区间估计的概念 intervalestimate 置信区间 confidenceinterval 则称这种置信区间为等尾置信区间 2 2区间估计点估计与区间估计的区别我是意见是这个值是10 但误差在 1之间 2 2区间估计 2 2区间估计置信水平的概念是的置信水平为1 的置信区间它的含义是能盖住未知参数的概率为1 置信区间量化了数据的不定性 2 2区间估计总体均值置信区间的计算已知未知 2 2区间估计 2分布方差置信区间的计算 2 2区间估计置信区间的长度 1 大的样本产生较短的区间小的样本产生较长的区间 2 低的置信水平产生较短的区间高的置信水平产生较长的区间 N 100 N 200 N 300 N 400 N 500 Exercise 研究草莓酱的重量是多少答案 95 的置信区间假设检验第三单元 3 1假设检验问题例草莓酱的净重服从正态分布N 2 6月份从产品中随机抽取50瓶称重的平均重量为180 5克 5月份从产品中随机抽取50瓶称重的平均重量为179 6克问从总体上是否重量比原来少了 1 这不是一个参数估计问题2 要求对 6 5 0作出回答是与否3 这类问题被称为统计假设检验问题估计的主要任务是找参数值等于几假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值 3 2定义假设H0和Ha H0要判断0 9克这个值是否超出了样本变换所能造成的差异的范围我们先要问一问在总体均值相等的情况下样本均值会发生什么情况即是否两个均值的差等于0 在统计学上被称为零假设 nullhypothesis 之所以用零来修饰假设其原因是假设的内容总是没有差异或没有改变 3 2定义假设H0和Ha HA零假设其逻辑上的反面假设是两个参数有区别这种反面假设称为备择假设 alternativehypothesis 当零假设所提问的问题被否定时备择假设的答案就是正确的如果样本数据能证明对于零假设提出的问题应该否定那么我们就拒绝 reject 零假设而倾向于备择假设 3 3怎样回答零假设所提出的问题概率 p 值p 值是当零假设正确时得到所观测的数据或更极端的数据的概率这个概率称为p 值 p value 当p 值小到以至于几乎不可能在零假设正确时出现目前的观测数据时我们就拒绝零假设 p 值越小拒绝零假设的理由就越充分注意有时错误以为p 值与零假设对错的概率有关但这是不可能的 p 值指的是关于数据的概率 p 值告诉我们在某总体的许多样本中某一类数据出现的经常程度 3 3怎样回答零假设所提出的问题假设检验机制为了求p 值统计理论指出要把观测到的0 9这个样本均值之差变换成标准得分标准得分 0 0 2 142p 值 0 0347 3 3怎样回答零假设所提出的问题假设检验机制 t值等于2 142的概率是0 0347 因此两个样本均值之差等于0 9的概率也是0 0347 换句话说就是如果两总体均值相等的话从均值相等的总体中抽取200个样本两两相减所得之差只有3 47个样本的样本均值相差在0 9 是小概率 0 05 事件我们拒绝零假设 2 142p 值 0 0347 3 4显著水平显著水平我们不是在数据收集完毕之后计算p 值而是在收集数据以前就已经确定好的小概率来构造一个区间当样本数据落入这个区间时就拒绝零假设这个小概率称为检验的显著水平 significantlevel 通常选0 05 一个检验的显著水平是抽样所得的数据拒绝了本来是正确的零假设的概率拒绝域当样本数据落入这个区间时就拒绝零假设那么这个区间就称为拒绝域临界值 criticalvalues 拒绝域的边界所对应的标准得分的值对于双边检验样本统计量的临界值是两个值 3 4显著水平 3 5风险和 3 5 和的关系你不能同时减少两类错误 3 6假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断案例1 例草莓酱的净重服从正态分布N 180 22 5月份随机抽取50罐称重的平均重量为179 6克问是否符合标准平均净重 179 6g 3 7OnetoStandard的问题是假设检验的特例其中一个已知 3 7OnetoStandard的问题计算标准得分已知时使用z统计量计算未知时使用t统计量计算双侧问题 Ho值临界值临界值 a 2 a 2 样本统计量拒绝域拒绝域接受域抽样分布 1 置信水平 3 7OnetoStandard的问题单侧左检验 3 7OnetoStandard的问题单侧右检验 3 7OnetoStandard的问题 JMP中的操作 3 7OnetoStandard的问题 JMP中的操作 3 7OnetoStandard的问题 JMP中的操作案例2 例草莓酱的净重服从正态分布N 2 6月份从产品中随机抽取50瓶称重的平均重量为180 5克 5月份从产品中随机抽取50瓶称重的平均重量为179 6克问从总体上是否重量比原来少了假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断 3 8OnetoOne的问题建立假设假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断 3 8OnetoOne的问题 F检验假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断 3 8OnetoOne的问题相等时t的计算 Sp为s1 s2的加权平均称为两个样本的联合方差 3 8OnetoOne的问题不等时t的计算 3 8OnetoOne的问题假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断 3 8OnetoOne的问题假设检验的步骤 1 建立假设2 数据独立性检查3 数据正态性检查4 如为OnetoOne问题进行方差的F检验5 计算检验统计量6 给出显著性水平通常 0 057 定出临界值写出拒绝域8 判断 3 8OnetoOne的问题因为Prob 0 0347 0 05 所以我们拒绝零假设接受备择假设 3 8OnetoOne的问题不等实验和报告编写第四单元练习 30分钟例两家供应商的硬盘性能指标数据问是否这两个供应商有显著差异谢谢大家课程开发人员孟繁一高武附录假设检验术语零假设 Ho 不存在变化或差异的命题如果没有充分的证据拒绝它就假设这一命题是真的备择假设 Ha 存在变化或差异的命题如果拒绝Ho 则认为这一命题是真的一类错误当Ho实际上为真时而被拒绝所产生的错误或是接受存在差异但事实上却没有差异时所犯的错误二类错误当Ho实际上为伪而没有被拒绝所产生的错误或是接受没有差异但事实上存在差异时所犯的错误假设检验术语风险出现第一类错误的最大风险或机率这个机率总是大于零通常为5 研究人员决

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

联想集团sigma培训资料对比实验页ppt课件.ppt

文档简介

温馨提示

最新文档

评论

联想集团sigma培训资料对比实验页ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档