第八讲巴巴假设检验_第1页
第八讲巴巴假设检验_第2页
第八讲巴巴假设检验_第3页
第八讲巴巴假设检验_第4页
第八讲巴巴假设检验_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八讲巴巴假设检验第八讲第八讲 假设检验假设检验一、基本概念一、基本概念二、二、Neyman-Pearson 引理引理三、一致最优势检验三、一致最优势检验一、基本概念一、基本概念在自然科学和社会科学等中,常常要对某在自然科学和社会科学等中,常常要对某些重要问题做出回答:是或否。些重要问题做出回答:是或否。如月球比地球如月球比地球早形成吗?早形成吗? 一种新药对某种病有效吗?一种新药对某种病有效吗? 某种某种股票会张吗?股票会张吗?新推出的电视节目收视率高吗?新推出的电视节目收视率高吗?等等。等等。为了回答这些问题,为了回答这些问题,我们需要对感兴趣我们需要对感兴趣的问题进行试验或观察获得相关数

2、据,的问题进行试验或观察获得相关数据, 根据这根据这些数据决定是或否的过程称为假设检验。些数据决定是或否的过程称为假设检验。(Hypothesis Testing)在这节,给出一般的在这节,给出一般的Neyman-Pearson假设假设检验构架。检验构架。原假设和备择假设原假设和备择假设的的分分是是统统计计模模型型,关关于于总总体体设设XP, 布或关于参数布或关于参数 的推测,的推测, :即即H称为称为假设,假设,其中其中 是是 的非空真子集。的非空真子集。 在一个假设检验中,常涉及两个假设。在一个假设检验中,常涉及两个假设。所所要检验的假设称为原假设或零假设,要检验的假设称为原假设或零假设,

3、记为记为 。0H而与而与 不相容的假设,称为备择假设或对立不相容的假设,称为备择假设或对立0H假设,假设,记为记为 。1H对参数统计模型对参数统计模型 而而, P言,原假设和备择假设这对矛盾的统一体言,原假设和备择假设这对矛盾的统一体1100 :,:HH称为假设检验问题。称为假设检验问题。在假设检验问题中,在假设检验问题中,的两个互的两个互是是和和 10不相交的非空子集,不相交的非空子集, 10但并不要求但并不要求一定成立。一定成立。保留这个的灵活性,保留这个的灵活性, 不仅是理论的不仅是理论的需要,需要,也有其实际意义。也有其实际意义。,仅包含一个参数,即仅包含一个参数,即如果如果000 则

4、称则称0H为简单假设为简单假设(Simple Hypothesis), 否则称为复否则称为复合假设合假设(Composite Hypothesis), 对备择假设也有对备择假设也有简单假设和复合假设。简单假设和复合假设。拒绝域、接受域、检验统计量和检验函数拒绝域、接受域、检验统计量和检验函数检验一个假设,就是根据某一法则在原检验一个假设,就是根据某一法则在原假设和备择假设之间做出选择,假设和备择假设之间做出选择,而基于样本而基于样本x做出拒绝做出拒绝 或接受或接受 所依赖的法则称为检验。所依赖的法则称为检验。0H0H这样一个检验就等同于将样本空间分成这样一个检验就等同于将样本空间分成两个互不相

5、交的子集两个互不相交的子集 和和 ,WcW时就拒时就拒当当Wx绝绝 ,0H成立;成立;认为备择假设认为备择假设1H时就接时就接当当cWx成成立立。,认认为为受受00HH称称 为拒绝域,为拒绝域,W(Rejection Region)称称cW为接受域为接受域(Acceptance Region)。 这样检验和拒绝这样检验和拒绝域就建立起一一对应关系。域就建立起一一对应关系。为了确定拒绝域,为了确定拒绝域,往往根据问题的直观背往往根据问题的直观背景,景,寻找合适的统计量寻找合适的统计量 ,)(xT为真时,为真时,当当0H要要能由统计量能由统计量 确定出拒绝域确定出拒绝域 ,)(xTW这样的统这样的

6、统计量计量 称为检验统计量称为检验统计量(Test Statistic)。)(xT为了便于描述拒绝域及数学理论上的需要,为了便于描述拒绝域及数学理论上的需要,有必要引入函数有必要引入函数, 0, 1)(WxWxx 它是拒绝于上的示性函数,它是拒绝于上的示性函数,称其为检验函数。称其为检验函数。时时接接受受,当当时时拒拒绝绝当当000)(1)(HxHx 种检验函数也称为非随机化的,种检验函数也称为非随机化的, 而随机化的检而随机化的检验函数的定义是:验函数的定义是:这这上取值的样本的函数上取值的样本的函数在在1 , 0。)(x 在随机化检验时,在随机化检验时,有了样本有了样本 后,后,x),(x

7、 计算计算试验,试验,为成功概率做为成功概率做依依Minomial)(x 若若,成功就拒绝成功就拒绝0H。否则接受否则接受0H两类错误、功效和功效函数两类错误、功效和功效函数由于样本时随机的,由于样本时随机的, 进行检验时可能犯进行检验时可能犯两类错误,两类错误,其一是当其一是当 为真时,却拒绝为真时,却拒绝 ,0H0H称为第一类错误,称为第一类错误,其概率为其概率为.,)(0 WxP其二是当其二是当 为假时,却接受为假时,却接受 ,0H0H称为第二类称为第二类错误,错误,其概率为其概率为定义定义8.1 一个检验的功效一个检验的功效(Power)定义为当定义为当 假假0H时拒绝时拒绝 的概率,

8、的概率,0H即即.),(1)(1 WxP而第一类错误和功效可以看成函数而第一类错误和功效可以看成函数 ),()(xEWxPg的不同取值,的不同取值,这个函数称为功效函数。这个函数称为功效函数。(Power Function);时时,当当)()(0 g 时,时,而当而当1 。)()( g.,1)(1 WxPWxP检验的水平检验的水平当样本容量当样本容量 固定时,固定时,n要减少犯第一类错要减少犯第一类错误的概率,误的概率,就会增大犯第二类错误的概率;就会增大犯第二类错误的概率;反反之,之,若要减少犯第二类错误的概率,就会增大若要减少犯第二类错误的概率,就会增大犯第一类错误的概率。犯第一类错误的概

9、率。即就是说当样本容量固即就是说当样本容量固定时,定时,不可能同时减少犯两类错误的概率,不可能同时减少犯两类错误的概率, 这这是一对不可调和的矛盾。是一对不可调和的矛盾。Neyman-Pearson检验原理就是控制犯第一检验原理就是控制犯第一类错误的概率在给定的范围内,类错误的概率在给定的范围内,寻找检验使得寻找检验使得犯第二类错误的概率尽可能的小,犯第二类错误的概率尽可能的小,即就是使检即就是使检验的功效尽可能的大。验的功效尽可能的大。这样就是在给定一个较这样就是在给定一个较小的数小的数 (一般取为一般取为0.01,0.05,0.1等等),)10( 在满足在满足0,)( xEWxP的检验函数

10、类中,的检验函数类中,寻找使得功效寻找使得功效)()(1 WxPxE尽可能大的检验函数。尽可能大的检验函数。,对对给给定定的的1 , 0 对对所所有有的的若若检检验验)(x ,0 ,)( xE满满足足则称则称 是一个水是一个水)(x 平平( Level)为为 的检验。的检验。 根据这个定义,根据这个定义, 水平不唯一。水平不唯一。若若 是水平是水平)(x 为为 的检验,的检验, 则对任何满足则对任何满足 的的 ,1 )(x 也是水平为也是水平为 的检验。的检验。 称称),(sup0 xE为检验为检验 的大小的大小(Size)或真实水平。或真实水平。)(x 实用上当提到一个检验的水平时,实用上当

11、提到一个检验的水平时,一般是一般是指它的真实水平。指它的真实水平。二、二、 Neyman-Pearson 引理引理设统计模型为设统计模型为 ,, P1100 :,:HH考虑检验问题考虑检验问题。其其中中10 ,),(sup),(sup)(01 xpxpxL 比检验比检验(Likelihood Ratio Test)。对较大对较大 拒绝原假设拒绝原假设 的检验称为似然的检验称为似然)(xL0H定义似然比定义似然比(Likelihood Ratio)为为是是密密度度函函数数或或分分布布率率,其其中中),( xp是统计是统计)(xL量。量。在这节,我们先讨论简单原假设对简单备择在这节,我们先讨论简单

12、原假设对简单备择假设的检验问题,假设的检验问题,设统计模型为设统计模型为 ,, P,其其中中,10 下节讨论较复杂的检验问题。下节讨论较复杂的检验问题。即参数空间仅包含两个参数,即参数空间仅包含两个参数,所考虑的检验问所考虑的检验问题为题为比较两个检验比较两个检验 的优劣的一个自然的优劣的一个自然)()(21xx 和和1100 :,:HH(1)的准则就是比较它们功效的大小。的准则就是比较它们功效的大小。),()(2111xExE 若若差,差,不比检验不比检验则称检验则称检验)()(21xx )(1x 或或检检验验好好。比比检检验验)(2x 根据这点我们有所谓最优的根据这点我们有所谓最优的检验定

13、义如下。检验定义如下。定义定义8.2 在检验问题在检验问题(1)中,中, 是水平为是水平为设设)(x的检验,的检验,的的检检验验如如果果对对任任一一水水平平为为)(x 有有)()(11xExE 成立,成立,的的是是水水平平为为则则称称 )(x(Most Powerful Test)最优功效检验,最优功效检验,简记为简记为MPT。对于检验问题对于检验问题(1),下面的下面的N-P引理不但彻底解决了检验问题引理不但彻底解决了检验问题(1) 的的而且还给出了构造而且还给出了构造MPT检检验的方法。验的方法。虽然这个引理仅针对检验问题虽然这个引理仅针对检验问题(1),但它对解决复合假设检验问题最优检验

14、的存在但它对解决复合假设检验问题最优检验的存在起到非常重要的作用。起到非常重要的作用。,),(),()(01 xpxpxL似然比为似然比为MPT的存在问题,的存在问题,规定:规定:. 0)(0),(),(10 xLxpxp时时,当当 ,)(0),(, 0),(10 xLxpxp时时,当当 就检验问题就检验问题(1),(1)及及检检验验存存在在常常数数0k,)(, 0)(, 1)(时时当当时时当当kxLkxLx 满足满足.)(0 xE(2)(3)。的的是水平为是水平为且检验且检验MPT )(x,有,有对给定对给定)1 , 0( (2),则必存在,则必存在的的是水平为是水平为如果如果MPT )(x

15、, 0k常数常数。满足式满足式使得使得)2()(x 的功的功进一步若进一步若 。也也满满足足式式则则)3()(x , 1)(1xE 效效满满足足引理引理8.1(Neyman-Pearson引理引理)注注:(1)为为连连续续随随机机变变量量时时,当当)(xLMPT的的检验统计量可取为非随机化的形式检验统计量可取为非随机化的形式,)(, 0)(, 1)(kxLkxLx ,)()(00确定确定由由其中常数其中常数 kxLPxEk。:的的拒拒绝绝域域具具有有形形式式)(kxLxW。这这是是因因为为0)(0 kxLP 这说明此种情形下这说明此种情形下引理的证明可参看引理的证明可参看高等统计学高等统计学(

16、郑忠国郑忠国)。(2)为为离离散散随随机机变变量量时时,当当)(xLMPT的的检验统计量具有形式检验统计量具有形式.)(, 0)(,)()()(, 1)(00kxLkxLkxLPkxLPkxLx 由于没有给出由于没有给出N-P引理的证明,引理的证明, 关于关于)(x 具有这种形式的原因解释如下:具有这种形式的原因解释如下:。由由其中常数其中常数)()(00kxLPkxLPk (5)为为离离散散随随机机变变量量时时,当当)(xLMPT的检验的检验统计量未必具有形式统计量未必具有形式.)(, 0)(, 1)(kxLkxLx 如果对给定的如果对给定的 , 存在存在k恰有恰有,)()()(000 kx

17、LPkxLPxE(6)则则MPT的检验统计量具有形式的检验统计量具有形式(6),即具有形,即具有形为为 的拒绝域。的拒绝域。)(kxLxW:的分布函数是阶梯函数,的分布函数是阶梯函数,)(xL但由于但由于故可能不存在故可能不存在k使得使得 )()()(000kxLPkxLPxE成立,成立,。)()(00kxLPkxLP 却只能找到却只能找到k有有,)(0 xE因此为了使因此为了使就有必要改变就有必要改变)(x .)(, 0)(,)(, 1)(kxLkxLrkxLx 上的取值,上的取值,:在事件在事件)(kxLx可令可令注意这样的做法是合适的,注意这样的做法是合适的, 仍具有仍具有N-P引引)(

18、x 理中理中MPT的形式。的形式。.)()()(000 kxLPkxLrPxE从而可得所待定的从而可得所待定的r为为.)()(00kxLPkxLPr 由于由于,)(0 xE即即因此此时的水平为因此此时的水平为 的的MPT是随机检验,检验是随机检验,检验 统计量具有式统计量具有式(5)。由于当由于当 时,时, )(0kxLP, 1r所以式所以式(5)更具一般性,包括了式更具一般性,包括了式(6)。例例8.1)1 ,(,21 NXXXn是是来来自自正正态态总总体体设设的简单样本。的简单样本。求检验问题求检验问题)0(01110 :,:HH。的的的的水水平平为为MPT)10( 解解)0( 由由N-P

19、引理知,引理知,MPT的拒绝域具有形式的拒绝域具有形式.)(kxLxW:似然比统计量为似然比统计量为,21exp)0 ,(),()(2111 nxnxpxpxL由于由于, 01 的严格单调增函数,的严格单调增函数,为为且且xxL)(故故.)(cxxkxLx:xH 为为真真时时,又又因因为为当当0),1, 0(nN所以对给定所以对给定,的水平的水平 , ncncnxPcxP/1/1/1 有有这样这样.1nuc 的的,所所求求的的从从而而对对给给定定的的MPT 拒绝域为拒绝域为 。cxxW:注意这个例子的注意这个例子的MPT仅与水平仅与水平 有关,有关, 而与而与备择假设中备择假设中 的具体取值无关,只要的具体取值无关,只要 。1 01 作为课后练习,作为课后练习,试求原假设不变而备择假设试求原假设不变而备择假设改为改为 时的时的MPT。011 :H例例8.2分布的简单分布的简单是来自是来自设设PoissonnXXX,21样本,样本,试求检验问题试求检验问题)10(11110 :,:HH。的的的的水水平平为为MPT)10( 解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论