




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、对比实验联想集团 欢迎光临6sigma世界统计根底知识参数估计假设检验对比实验报告编写和练习课程进程为什么要学习对比实验许多的问题需求就某些参数作出接受或回绝的决议,这阐明是一个假设。它代表把一个实务的问题演绎成统计学上的问题。而这个决策过程便称为:Hypothesis Testing我们把实现假设检验的过程成为对比实验。统计学上的测试能为我们就问题作出客观讲解,相比较以前,我们只能作出客观的讲解。这是后续学习内容的根底。统计根底知识第一单元总体(Population):在统计问题中,我们把研讨对象的全体成为总体个体:构成总体的每个成员称为个体样本(Sample):从总体中抽取部分个体所组成的
2、集合称为样本样品:样本中的个体称为样品样本容量:样品的个数称为样本容量,常用n表示1.1总体和样本样本随机样本(Random sample):可以被推行运用于更大的总体的样本。总体的每个个体有一个知的有时是相等的时机被包含在该样本中。简单随机样本(Simple random sample):1、同一性:样本与总体有同样的分布2、独立性: 假设给定第一个事件,无论它的结果是什么,第二个事件的时机都一样。1.2统计量和抽样分布统计量:不含未知参数的样本函数称为统计量。抽样分布:统计量的分布称为抽样分布。有序样本: 是从总体X中随机抽取的容量为n的样本,将它们的观测值从小到大排序,这便是有序样本。统
3、计推断过程统计学的主要义务:1、研讨总体是什么分布?2、这个总体即分布的均值、方差是多少?样本总体样本统计量例如:样本均值、方差总体均值、方差抽样1.2常用统计量描画中心位置的统计量:1、众数mode:一个变量的众数是指出现次数最多的值,不过它不一定独一。2、中位数:3、均值mean:1.2常用统计量描画数据分散程度的统计量:1、极差range:2、方差variance3、规范差standard deviation:4、规范误差standard error :是很多不同样本的均值的规范差。5、变异系数:1.3正态分布正态分布:1.3正态分布规范正态分布:它是特殊的正态分布,服从规范的正态分布的
4、随机变量记为z,概率密度函数记为z1.3正态分布规范正态分布的变换:1.3正态分布规范正态分布的分位数:0.975是随机变量z不超越1.96的概率1.96是规范正态分布N0,1)的0.975的分位数,记为z0.9750.9750.0251.4常用的抽样分布正态样本均值的分布: =10Xn = 4Xn =16总体分布抽样分布1.4常用的抽样分布t分布: Xt 分布与正态分布的比较正态分布t 分布t不同自在度的t分布规范正态分布t (df = 13)t (df = 5)1.4常用的抽样分布F分布:设X1,X2,Xn是来自正态总体N(1,12 )的一个样本, Y1,Y2,Yn是来自正态总体N(2,2
5、2 )的一个样本,且相互独立,那么:将F(n-1 , m-1 )称为第一自在度为(n-1),第二自在度为(m-1)的F分布1.4常用的抽样分布F分布:F1,10)(5,10)(10,10)参数估计第二单元2.1点估计点估计的概念point estimation: 用样本均值估计总体均值用样本方差估计总体方差用样本规范差估计总体规范差2.2区间估计区间估计的概念interval estimate:置信区间confidence interval: ,那么称这种置信区间为等尾置信区间。2.2区间估计 置信区间下限值1 - aa/2a/2x 置信区间上限值点估计与区间估计的区别:我是意见是这个值是10
6、,但误差在1之间。2.2区间估计2.2区间估计置信程度的概念: 是的置信程度为1-的置信区间。它的含义是能盖住未知参数的概率为1-。置信区间量化了数据的不定性。2.2区间估计总体均值置信区间的计算: 知: 未知:2.2区间估计2分布:方差置信区间的计算:2.2区间估计置信区间的长度:1、大的样本产生较短的区间,小的样本产生较长的区间。2、低的置信程度产生较短的区间,高的置信程度产生较长的区间。N=100N=200N=300N=400N=500ExercisesX=sXnDistribution of Sampling AveragesXX研讨草莓酱的分量是多少?答案:=95的置信区间假设检验第
7、三单元3.1假设检验问题例:草莓酱的净重服从正态分布N,2, 6月份从产品中随机抽取50瓶称重的平均分量为180.5克, 5月份从产品中随机抽取50瓶称重的平均分量为179.6克, ,问从总体上能否分量比原来少了?1、这不是一个参数估计问题2、要求对6-5=0作出回答:是与否3、这类问题被称为统计假设检验问题估计的主要义务是找参数值等于几;假设检验的兴趣主要是看参数的值能否等于某个特别感兴趣的值3.2定义假设H0和HaH0要判别0.9克这个值能否超出了样本变换所能呵斥的差别的范围,我们先要问一问在总体均值相等的情况下,样本均值会发生什么情况,即能否两个均值的差等于0,在统计学上被称为零假设(n
8、ull hypothesis)之所以用零来修饰假设,其缘由是假设的内容总是没有差别或没有改动3.2定义假设H0和HaHA零假设其逻辑上的反面假设是“两个参数有区别。这种反面假设称为备择假设alternative hypothesis。当零假设所提问的问题被否认时,备择假设的答案就是正确的。假设样本数据能证明对于零假设提出的问题应该否认,那么我们就回绝reject零假设而倾向于备择假设。3.3怎样回答零假设所提出的问题概率:p-值p-值是当零假设正确时,得到所观测的数据或更极端的数据的概率,这个概率称为p-值p-value。当p-值小到以致于几乎不能够在零假设正确时出现目前的观测数据时,我们就回
9、绝零假设。 p-值越小,回绝零假设的理由就越充分。留意: 有时错误以为p-值与零假设对错的概率有关,但这是不能够的. p-值指的是关于数据的概率。 p-值通知我们在某总体的许多样本中,某一类数据出现的经常程度。3.3怎样回答零假设所提出的问题假设检验机制:为了求p-值,统计实际指出要把观测到的0.9这个样本均值之差变换成规范得分。规范得分:0.0H00.00.510.9观测到的差样本均值的差规范得分2.142 p-值0.03473.3怎样回答零假设所提出的问题假设检验机制:t值等于2.142的概率是0.0347,因此两个样本均值之差等于0.9的概率也是0.0347 ,换句话说就是假设两总体均值
10、相等的话,从均值相等的总体中抽取200个样本两两相减所得之差只需3.47个样本的样本均值相差在0.9,是小概率0.05事件,我们回绝零假设。H00.00.510.9观测到的差样本均值的差规范得分2.142 p-值0.03473.4显著程度显著程度:我们不是在数据搜集终了之后计算p-值,而是在搜集数据以前就曾经确定好的小概率来构造一个区间。当样本数据落入这个区间时就回绝零假设。这个小概率 称为检验的显著程度significant level,通常选0.05.一个检验的显著程度是抽样所得的数据回绝了本来是正确的零假设的概率。回绝域:当样本数据落入这个区间时就回绝零假设,那么这个区间就称为回绝域。临
11、界值critical values:回绝域的边境所对应的规范得分的值。对于双边检验,样本统计量的临界值是两个值。3.4显著程度Ho值临界值临界值a/2 a/2 样本统计量回绝域回绝域接受域抽样分布1 - 置信程度3.5风险和sX=sXnDistribution of Sampling AveragesXX3.5和的关系sX=sXnDistribution of Sampling AveragesXX他不能同时减少两类错误!3.6假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057
12、、定出临界值,写出回绝域8、判别案例1例:草莓酱的净重服从正态分布N180,22, 5月份随机抽取50罐称重的平均分量为179.6克,问能否符合规范?平均净重:179.6g3.7One to Standard的问题是假设检验的特例: 其中一个 知3.7One to Standard的问题计算规范得分: 知时,运用z统计量计算 未知时,运用t统计量计算双侧问题Ho值临界值临界值a/2 a/2 样本统计量回绝域回绝域接受域抽样分布1 - 置信程度3.7One to Standard的问题单侧左检验 表格值(临界值)回绝范围无法回绝HOHa: (大于)3.7One to Standard的问题单侧右
13、检验回绝范围无法回绝HO 表格值(临界值)Ha: (小于)3.7One to Standard的问题JMP中的操作3.7One to Standard的问题JMP中的操作3.7One to Standard的问题JMP中的操作案例2例:草莓酱的净重服从正态分布N,2, 6月份从产品中随机抽取50瓶称重的平均分量为180.5克, 5月份从产品中随机抽取50瓶称重的平均分量为179.6克, ,问从总体上能否分量比原来少了?假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057、定出临界
14、值,写出回绝域8、判别3.8One to One的问题建立假设:假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057、定出临界值,写出回绝域8、判别假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057、定出临界值,写出回绝域8、判别3.8One to One的问题FcritaF检验:假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to
15、One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057、定出临界值,写出回绝域8、判别3.8One to One的问题 相等时t的计算:Sp为s1 ,s2的加权平均,称为两个样本的结合方差。3.8One to One的问题 不等时t的计算:3.8One to One的问题假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057、定出临界值,写出回绝域8、判别3.8One to One的问题Ho值临界值临界值a/2 a/2 样本统计量回绝域回绝域接受域抽样
16、分布1 - 置信程度假设检验的步骤1、建立假设2、数据独立性检查3、数据正态性检查4、如为One to One问题进展方差的F检验5、计算检验统计量6、给出显著性程度 ,通常 =0.057、定出临界值,写出回绝域8、判别3.8One to One的问题由于Prob0.03470.05,所以我们回绝零假设,接受备择假设!3.8One to One的问题不等实验和报告编写第四单元练习30分钟例:两家供应商的硬盘性能目的数据,问能否这两个供应商有显著差别?谢谢大家!课程开发人员:孟繁一、高武附录假设检验术语零假设 (Ho) -不存在变化或差别的命题。假设没有充分的证据回绝它,就假设这一命题是真的。备择假设(Ha) - 存在变化或差别的命题。假设回绝Ho,那么以为这一命题是真的。一类错误 - 当Ho 实践上为真时而被回绝所产生的错误,或是接受存在差别、但现实上却没有差别时所犯的错误。二类错误 - 当Ho 实践上为伪而没有被回绝所产生的错误,或是接受没有差别、但现实上存在差别时所犯的错误。假设检验术语
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 体谅对方夫妻吵架保证书3篇
- 租赁经营的市场统计与数据分析应用考核试卷
- 相机滤镜类型与场景应用考核试卷
- 测绘技术在城市热岛效应研究中的应用考核试卷
- 知识产权海关协助考核试卷
- 《论语(英译本)》中理雅各的‘孔子变形记’解析
- 2025标准租赁协议合同书
- 2025年租赁合同样本
- 2025国内劳务合同模板
- T-ISC 0027-2023 《互联网企业未成年人网络保护管理体系》
- 近视防控技术的进展
- 工作场所安全与环境保护管理制度
- 电气自动化试题及答案
- 内控评价收集资料清单
- 虹桥商务区核心区一期及南北片区集中供能专项规划
- 六年级数学上册第二单元《位置与方向》测试题-人教版(含答案)
- 专题11二次函数中矩形存在性综合应用(专项训练)(原卷版+解析)
- 广东省医疗服务价格项目及价格
- 泼水节文化介绍课件
- 第3课我爱我家教学课件2021-2022学年赣美版美术八年级下册
- 2024年江苏省泰州市泰兴市中考一模物理试卷(含答案解析)
评论
0/150
提交评论