第一节假设检验的基本概念_第1页
第一节假设检验的基本概念_第2页
第一节假设检验的基本概念_第3页
第一节假设检验的基本概念_第4页
第一节假设检验的基本概念_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计数理统计 第七章第七章 假设检验假设检验第一节第一节 假设检验的基本概念假设检验的基本概念第二节第二节 单正态总体的假设检验单正态总体的假设检验*第三节第三节 双正态总体的假设检验双正态总体的假设检验数理统计数理统计 假设检验的基本思想和方法假设检验的基本思想和方法假设检验的一般步骤假设检验的一般步骤参数假设检验与区间估计的关系参数假设检验与区间估计的关系第一节第一节 假设检验的基本概念假设检验的基本概念数理统计数理统计 假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验这类问题称作这类问题称作假设检验问题假设检验问题 .总体分布总体分布已知已知时时检验未知参数的某个

2、假设检验未知参数的某个假设总体分布总体分布未知未知时时假设检验问题假设检验问题我们将讨论不同于参数估计的另一类重要的统计推断问题我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是这就是根据样本的信息检验关于总体的某个假设是否正确根据样本的信息检验关于总体的某个假设是否正确.一、假设检验一、假设检验(hypothesis testing)的基本思想和方法的基本思想和方法数理统计数理统计 生产流水线上罐装可乐不断地封装生产流水线上罐装可乐不断地封装, 然后装箱外运然后装箱外运. 怎么知道这批罐装可乐的容量是否合格呢?怎么知道这批罐装可乐的容量是否合格呢?把每一罐都打开倒入量杯把每一罐都打

3、开倒入量杯, 看看容量是否合于标准看看容量是否合于标准. 这样做显然不行!这样做显然不行!罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.让我们先看一个例子让我们先看一个例子:每隔一定时间每隔一定时间, 抽查若干罐抽查若干罐. 如每隔如每隔1小时小时, 抽查抽查5罐罐, 得得5个容量的值个容量的值x1, , x5, 根据这些值来判断生产是否正常根据这些值来判断生产是否正常.如如发现不正常发现不正常, 就就应停产应停产, 找出原因找出原因, 排除故障排除故障, 然后再生产然后再生产;如如没有问题没有问题, 就继续按规定时间就继续按规定时间再抽样再抽样,

4、以此监督生产以此监督生产, 保证质量保证质量.通常的办法是进行抽样检查通常的办法是进行抽样检查!数理统计数理统计 很明显很明显, 不能由不能由5罐容量的数据罐容量的数据, 在把握不大的情况下就判断生产不正常在把握不大的情况下就判断生产不正常, 因为停产的损失是很大的因为停产的损失是很大的;当然也不能总认为正常当然也不能总认为正常, 有了问题不能及时发现有了问题不能及时发现, 这也要造成损失这也要造成损失.如何处理这两者的关系如何处理这两者的关系, 假设检验面对的就是这种矛盾假设检验面对的就是这种矛盾.在正常生产条件下在正常生产条件下, 由于由于种种随机因素的影响种种随机因素的影响,每罐可乐的容

5、量应在每罐可乐的容量应在355毫升上下波动毫升上下波动. 这些因素中没有哪一个占有特殊重要的地位这些因素中没有哪一个占有特殊重要的地位. 因此因此, 根据根据中心极限定理中心极限定理, 假定每罐容量服从假定每罐容量服从正态分布正态分布是合理的是合理的.现在我们就来讨论这个问题现在我们就来讨论这个问题.罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.这样这样, 我们可以认为我们可以认为x1, , x5是取自正态总体是取自正态总体 n(,2)的样本的样本, 当生产比较稳定时当生产比较稳定时, 2是一个常数是一个常数. 数理统计数理统计 它的对立假设是:它的

6、对立假设是:称称h0为原假设为原假设(或或零假设零假设)(null hypothesis);称称h1为备选假设为备选假设(或或对立假设对立假设) (alternative hypothesis);.在实际工作中在实际工作中,往往把不轻易否定的往往把不轻易否定的命题作为原假设命题作为原假设. h0: = 0 (0 = 355)h1: 0现在要检验的假设是:现在要检验的假设是:那么那么, 如何判断原假设如何判断原假设h0 是否成立呢是否成立呢?由于由于是正态分布的期望值是正态分布的期望值, 它的估计量是样本均值它的估计量是样本均值 ,因此可以根据因此可以根据 与与0的差距的差距 来判断来判断h0

7、是否成立是否成立.xx|0x较小较小时时, 可以认为可以认为h0是是成立成立的的;当当|0x当当较大较大时时, 应认为应认为h0 0不成立不成立, 即生产已不正常即生产已不正常. .|0x问题归结为对差异作定量的分析问题归结为对差异作定量的分析, 以确定其性质以确定其性质.较大、较小是一个相对的概念较大、较小是一个相对的概念, 合理的界限在何处合理的界限在何处? 应由什么原则来确定应由什么原则来确定?数理统计数理统计 问题是问题是: 如何给出这个量的界限如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验中基本上不会发生小概

8、率事件在一次试验中基本上不会发生 .问题是问题是, 根据所观察到的差异根据所观察到的差异,如何判断它究竟是由于偶然性在起作用如何判断它究竟是由于偶然性在起作用, 还是生产确实不正常?还是生产确实不正常?即即: 差异是差异是“抽样误差抽样误差”还是还是“系统误差系统误差”所引起的所引起的?这里需要给出一个量的界限这里需要给出一个量的界限!我们称这个小概率为我们称这个小概率为显著性水平显著性水平(the level of significance), 用用表示表示.的选择要根据实际情况而定的选择要根据实际情况而定. 常取常取:0.1,0.01,0.05. 这种误差反映偶然、非本质的因素所引起的随机

9、波动这种误差反映偶然、非本质的因素所引起的随机波动.然而然而, 这种随机性的波动是有一定限度的这种随机性的波动是有一定限度的, 如果差异如果差异超过超过了这个了这个限度限度, 则我们就则我们就不能不能用抽样的随机性来解释了用抽样的随机性来解释了.必须认为这个差异反映了事物的本质差别必须认为这个差异反映了事物的本质差别, 即反映了生产已不正常即反映了生产已不正常. 这种差异称作这种差异称作:“系统误差系统误差”差异可能由抽样的随机性引起的差异可能由抽样的随机性引起的, 称为称为: “抽样误差抽样误差”或或 随机误差随机误差数理统计数理统计 欲判断假设欲判断假设h0的真假的真假, 先假定先假定 h

10、0真真, 在此前提下构造一个能说明问题的小概率事件在此前提下构造一个能说明问题的小概率事件 a试验取样试验取样, 由样本信息确定由样本信息确定 a是否发生是否发生, 若小概率事件若小概率事件 a发生发生, 这与小概率原理相违背这与小概率原理相违背, 说明试验的前提条件说明试验的前提条件 h0不成立不成立, 拒绝拒绝 h0, 接受接受 h1;若小概率事件若小概率事件 a没有发生没有发生, 没有理由拒绝没有理由拒绝 h0, 只好接受只好接受h0概率反证法概率反证法:数理统计数理统计 提出假设提出假设:选检验统计量选检验统计量:0(0,1)xunn : :由于由于 已知已知,它能衡量差异它能衡量差异

11、大小且分布已知大小且分布已知 .|0 x罐装可乐的容量按标准应在罐装可乐的容量按标准应在 350 毫升和毫升和 360 毫升之间毫升之间. 一批可乐出厂前应进行抽样检查一批可乐出厂前应进行抽样检查, 现抽查了现抽查了n 罐罐,测得容量为测得容量为 x1, x2, , xn,问这一批可乐的容量是否合格问这一批可乐的容量是否合格?例例1: 现在回到我们前面罐装可乐的例中现在回到我们前面罐装可乐的例中:在提出原假设在提出原假设h0后后, 如何作出接受和拒绝如何作出接受和拒绝h0的结论呢的结论呢?h0: = 355h1: 355故我们可取故我们可取拒绝域拒绝域(或或否定域否定域)为:为: w: |u|

12、u/2也就是说也就是说,“|u|u/2”是一个小概率事件是一个小概率事件.考察由样本值算得该统计量的实测值考察由样本值算得该统计量的实测值,如果如果落入区域落入区域w, 则拒绝则拒绝h0 ; 否则否则, 不能拒绝不能拒绝h0.2|puu 对给定的显著性水平对给定的显著性水平, 可以在查到分位点的值可以在查到分位点的值 u/2, 使使:数理统计数理统计 如果如果h0是对的是对的, 那么衡量差异大小的某个统计量那么衡量差异大小的某个统计量落入区域落入区域 w(拒绝域拒绝域)是个小概率事件是个小概率事件. 如果该统计量的如果该统计量的实测值落入实测值落入w, 也就是说也就是说,h0 成立下的小概率事

13、件发生了成立下的小概率事件发生了,那么就认为那么就认为h0不可信而否定它不可信而否定它. 否则否则我们就我们就不能否定不能否定h0(只好接受它只好接受它).这里所依据的逻辑是:这里所依据的逻辑是:不否定不否定h0并并不是肯定不是肯定h0一定对一定对, 而只是说而只是说差异还不够显著差异还不够显著, 还没有还没有达到足以否定达到足以否定h0的的程度程度.所以假设检验又叫所以假设检验又叫: “显著性检验显著性检验”如果显著性水平如果显著性水平 取得取得很小很小, 则则拒绝域拒绝域也会比较也会比较小小.其产生的后果是其产生的后果是: h0难于被拒绝难于被拒绝.如果如果 很小很小的情况下的情况下h0仍

14、被拒绝仍被拒绝, 则说明实际情况很可能与之有则说明实际情况很可能与之有显著差异显著差异.基于这个理由基于这个理由, 人们常把人们常把 =0.05时拒绝时拒绝h0称为是称为是显著显著的的, 而把在而把在 =0.01时拒绝时拒绝h0称为是称为是高度显著高度显著的的.数理统计数理统计 第一步:第一步:提出原假设和备择假设提出原假设和备择假设: : 5 .32:5 .32:10 hh已知已知 xn(, 2), 2未知未知.能衡量差异大小且分布已知能衡量差异大小且分布已知第二步:第二步:取一检验统计量取一检验统计量, ,在在h0成立下求出它的分布成立下求出它的分布: :32.5 (5)6xtts 例例2

15、: 某某工厂生产的一种螺钉工厂生产的一种螺钉, 标准要求长度是标准要求长度是32.5毫米毫米. 实际生产的产品实际生产的产品, 其长度其长度x 假定服从正态分布假定服从正态分布 n(, 2), 2未知未知, 现从该厂生产的一批产品中抽取现从该厂生产的一批产品中抽取6件件, 得尺寸数据如下得尺寸数据如下:32.56, 29.66, 31.64, 30.00, 31.87, 31.03问问: 这批产品是否合格这批产品是否合格?解解: 分析分析: 这批产品这批产品(螺钉长度螺钉长度)的全体组成问题的总体的全体组成问题的总体 x. 现在要现在要检验检验 e(x)是否为是否为 32.5.二、假设检验的一

16、般步骤二、假设检验的一般步骤数理统计数理统计 即:即:“| t |t/2(5)” 是一个是一个小概率事件小概率事件 . 第三步:第三步:对给定的显著性水平:对给定的显著性水平:=0.01, 查表确定临界值查表确定临界值: :0322. 4)5()5(005. 02 tt , ,使使: : 2|(5)ptt 得否定域得否定域(rejection region) w: | t |4.0322小概率事件在一次试小概率事件在一次试验中基本上不会发生验中基本上不会发生 .故不能拒绝故不能拒绝h0 .第四步:第四步:将样本值代入算出统计量将样本值代入算出统计量 t 的实测值的实测值, ,| t |=2.9

17、971.645故拒绝故拒绝h0 , 即认为这批燃料率较以往生产的有显著的提高。即认为这批燃料率较以往生产的有显著的提高。 落入否定域落入否定域解解: :提出假设提出假设: : 0100:40:hh00.051.645xuun 取统计量取统计量: :否定域为否定域为w :0.05uu =1.645例例1: 某厂生产的固体燃料推进器的燃烧率服从正态分布某厂生产的固体燃料推进器的燃烧率服从正态分布:2( ,),40/ ,2/ .ncm scm s 现在用新方法生产了一批推进器。从中随机取现在用新方法生产了一批推进器。从中随机取 n=25只, 测得燃烧率的样本均值为测得燃烧率的样本均值为: 41.25/ .xcm s 这批推进器的燃烧率是否较以往生产的推进器的燃烧率有这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高显著的提高?取显著性水平取显著性水平 =0.05. 设在新方法下总体均方差仍为设在新方法下总体均方差仍为 2cm/s, 问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论