假设检验与置信区间_第1页
假设检验与置信区间_第2页
假设检验与置信区间_第3页
假设检验与置信区间_第4页
假设检验与置信区间_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、假设检验与置信区间1引言数理统计是具有广泛应用的数学分支,而假设检验与置信区间问题在其中占有很重要的地位.假设检验和置信区间作为两种重要的统计推断方法在农林科学、经济管理、医疗卫生、金融保 险、证券投资、科学研究、工程技术、质量控制及国防研究、灾害防治等各方面应用日益广泛,其 对决策的科学性的作用也为越来越多的人所认识.这两种方法都是通过对具体事物的随机抽样所得 样本数据,用数理统计学的方法进行统计分析并作出判断的,掌握它们之间的关系、各自的适用范 围和应用条件以及应注意的问题对作出正确的统计推断至关重要.然而现在高校农林、工科和经济 类各专业广泛采用的概率论和数理统计教材却对这些问题未涉及或

2、空泛叙述,使统计工作者和学生 容易产生疑惑并在应用于实际问题时出现错误.为此本文通过实例研究了这两种方法的内在联系及 其区别,探讨了这两种方法各自适用范围和应用条件及应注意的问题.2统计推断假设检验和置信区间的基本概念2.1统计假设检验的涵义统计假设检验的一般提法是:在给定备择假设H1下,对原假设H0作出判断,若拒绝原假设H0, 那就意味着接受备择假设H1,否则就接受原假设H0.简单的说,假设检验问题就是要在原假设H0 和备择假设H1中作出拒绝哪一个接受哪一个的判断.皿P31。)2.2统计假设检验法则一般法则以定义在子样空间上的一个函数为依据所构成的一个准则.一旦子样观察值3 ,x ,L ,x

3、 )确定后,我们就可根据这一准则作出判断;拒绝H还是接受H .我们的检验法则12n00本质上就是把子样空间X划分成两个不相交子集c和C*,使得当子样(弓,L,勺)的观察值点(x , x ,L ,x ) g C,我们将拒绝原假设H (也即接受备择假设H );若(x , x ,L ,x ) e C*,我们 12n0112n将接受原假设H0(也即拒绝备择假设H ). h(p310)2.3置信区间的定义皿P325)设母体具有概率函数f (x;0 ),9为未知参数.弓,L,勺为取自这个母体&的一个子样.若对 于事先给定的a,0 a 1,存在两个统计量9()1,L , & )和9(E,L , E )使得P

4、。(E,L , E) 0 0(E ,L , E ) = 1-a1n1n则称区间(0,0)为参数0的置信度为1-a的置信区间,0和0分别称为置信度1-a的置信下限和置 信上限.2.4置信区间的阐述由定义知道,置信区间(0,0)是一个随机区间,并且它的两个端点都是不依赖未知参数0的随 机变量,应着重指出的是,定义中等式的含意是指在重复取样下,将得到许多不同的区间(03 ,L ,x ),0(x ,L ,x ),根据贝努利大数定律,这些区间中大约有100(1-a )%的区间包含未 TOC o 1-5 h z n 1n知参数.但对于一次抽样所得到的一个区间,决不能说“不等式0(x ,L , x ) 0

5、0(x ,L , x )1n1n成立的概率为1-a ”.因为这时0(x ,L ,x ),0(x ,L ,x )是两个确定的数,从而只有两个可能,1n1n要么这个区间包含0 ;要么这个区间不包含0 .因此定义说区间(0(x ,L ,x ),0(x ,L ,x )属于包 1n 1n含未知参数0的区间类的置信度是1-a .所以提置信度以示与概率有所不同,其理由即在于 此. h( P 327)3假设检验和置信区间的内在联系参数的区间估计及假设检验虽然提法不同,但解决问题的思想方法是一样的,都是选取一个子样 函数,使这个子样函数落在某个已知区间上的概率很小(等于已知的a )而由此得到结果.3.1例题分析

6、例1若总体E N(四,6),其中C 2未知,从该总体中抽得一个容量为n的样本,以E及S2分别 记其样本均值和样本方差的无偏估计,其中15-s2 = 才(& -?)2 .n -1ii=11)对如下检验问题:H0:日=%, H: 口。七给出显著性水平为a的检验法;)求参数R的置信度为1-a的置信区间.解 由题意可知E N(日q2)和(n -1)s2 x2(n-1)b 2且E与s2相互独立,因此1)在H: pH*成立的条件下,统计量t = -Jn t(n -1)s因此所提检验问题的接受域为&-日 八 / n寸n t(n -1)1 2即ss(n-1宇 Eo +1(n -1).22)在寻求参数P的置信区

7、间时,&择 因含有未知参数所以不是统计量,但它仍是解决问s题的关键,以抽样分布理论,有P( P历 t (n 一 1) = 1 -a1- 2这等价于 TOC o 1-5 h z HYPERLINK l bookmark68 o Current Document P (&-1 (n -1)二 p& +1 (n -1)堂)=1 -a1-an1-a!n22因此得到P置信度为1-a的置信区间为(&-t (n -1=, & +1 (n -1=).1-a,n1-a t (n -1) = a ,1-心2而 t(n -1)a1-2来定1 -a的置信区间,而在假设检验中则用 t (n-1) = 1 -aCL2来定

8、出接收域.3)可以从日的置信区间出发作检验.如果*属于日的1 -a置信区间,即-1 (n-日 t (n -1), HYPERLINK l bookmark62 o Current Document s1-a2也即;落在接受域内,故接受原假设H0 ;反之如果0不属于的1 -a置信区间,那么必有-y/n 30 ; H: u 30,由数据可知:E = 28.67 , s = 1.633,统计量t =支成,s拒绝域为(8,1(6-1),查表得t005(5) = 2.015,统计量实值为t = 1.995,可见此统计量之值 未落入拒绝域,因此接受H0,即这种柴油机合格.此题的解法完全遵循著名统计学家Ne

9、yman和Pearson提出的方法,解法经典规范,似乎不存 在什么问题.但我们对题设样本数据稍加分析,恐怕对这种柴油机合格的结论就不会很有信心:从样 本数据看,仅有一台运转时间略高于设计要求,一台刚好合格,其余4台均不合格,6台运转平均 时间 = 28.67也明显低于设计要求,如果用置信区间的方法来分析,由题设条件知:t =日打s服从自由度为n 1 = 5的t分布.式中r为这种柴油机的“实际”每升柴油平均运转时间,n = 6为 样本容量,s为样本标准差的无偏估计,根据已知数据不难推出.r 30的概率,即概率Pr 30 = pt = 昂 s的值接近95%,按区间估计,由得到的数据来看,如无特殊的

10、理由,我们很难认为这种柴油机合格, 即柴油机耗油一升油运转时间大于30分钟.为什么用假设检验和置信区间这两种统计推断方法结果 竟然大相径庭,其中缘由值得研究.4.2假设检验与置信区间的区别由前面的分析知,虽然参数的假设检验与置信区间的统计处理是相通的,但两者之间又有区别: 第一,两者的要求各不相同,置信区间是要求以一定的置信度给出未知参数的所在范围;而假设检 验是要求以一定的水平来判定未知参数取已给定的值.第二,两者各对问题的了解程度不同,置信 区间对未知参数几乎一无所知;而假设检验对未知参数有所了解,但无确切把握.所以在实际应用 时究竟选择哪种方法作统计推断必须注意各自的适用范围和条件,否则

11、就会产生矛盾.如果我们知 道这种柴油机设计很成熟,技术参数如耗油量等通常达到设计要求有把握,柴油机制造工艺稳定, 工人装配技术熟练,柴油机一般试运行一段时间磨合后柴油机耗油量会下降,这种柴油机被误判为 不合格代价高昂,则我们选H0为:这种柴油机合格,并在a = 0.05下对之进行假设检验将比较合适, 尽管这时样本数据似乎不理想,但经检验还不能动摇我们对的信心.这时进行区间估计显然将得出 这种柴油机不合格的结论,而该结论没有考虑到我们已有的非样本信息,因此是不全面的.如果信 息仅如例子所列除样本之外并无其它值得重视的考虑,则用区间估计并据之判断无疑比盲目提出一 个并无根据的更为合理,则按置信区间

12、的结果认为这种柴油机不合格并无不当.因此,这两种统计 推断方法适用的情况应有所不同.在实际应用中如果我们对问题有很多实际的了解和经验或有许多 非样本信息需要考虑,则我们应选用假设检验方法,非样本信息的影响通过H0和a的选定发生作 用;如果我们对问题除样本信息外没有其他信息考虑,用置信区间方法较为妥当,因为既能得到参 数的区间又有置信度的数值,作判断较为客观、较少失误.5产生不同结果的原因既然用同一批样本数据产生了不同的统计推断结果,其原因当然要从两种不同方法依据的原理 和适用条件的差异方面讨论.这两种统计推断方法都是基于数理统计理论的推断方法,都是通过样 本数据来推断总体性质即由部分来推断整体

13、,由于样本数据的随机性,统计推断结论不可能百分之 百正确反映整体情况,出现推断失误的可能是存在的,我们只能尽量减少而不可能完全消除它.5.1假设检验方法的理论依据在统计对象的某些性质未知时,我们通过对它的总体的某些了解,如历史经验,常规情况等, 对其性质作出“一般成立”的假设,即“原假设” H 0然后以随机抽样所得样本数据,经由前叙规 范的假设检验程序对H0是否“真的”成立进行统计意义上的检验,如果样本数据不否定丑。,我们 即认为H 0通过了检验而加以接受,否则我们否定H 0而接受其对立假说H1.这种检验相当于对总体的一次抽样测试,以试验结果作判断,因此可能发生H0本来成立却被检 验结果否定即

14、“弃真”的错误和H0本来不成立却通过了检验而被接受即“受伪”的错误.在假设检 验中H0处于十分有利的“受保护”地位,它的“接受域”远大于“拒绝域”,没有强有力的反证不 能轻易否定,而它的对立假设H1则只有否定了 H0才能接受,因此H0与H1地位很不对等.十分明 显,选定哪一个假设作H0从而使其处于强有力地位,理由并非来源于我们对样本数据的分析判断, 而是我们在作假设检验的第一步即已人为确定了的,可以说与样本信息并无关系.这就产生了一个问题,我们作检验的客观依据是样本信息,而对检验结果有重大影响的H0的选 定却与之无关,似乎由检验者人为选定,假设检验岂不陷于“说你行你就行,说你不行你就不行” 这

15、样的推断是否有足够的科学性呢?应该说,如果我们不能正确选定H0,如象某些论者和教材所说 应选“希望证实的反面”或没有充分理由随便选一个假设作灯,那末确有可能陷于这种情况.我们 0前面所举的例题,用假设检验方法,如选“这种柴油机不合格”作H0,在同样的a下很容易算得 “拒绝域”为(-8,2.015)而样本统计量,仍为-2.00,也未落入“拒绝域”,则H0(这种些油机不 合格)也将被接受,除此之外a值的大小对检验结果有时也有很大影响,如本例题中,如果我们选 a= 0.1则“拒绝域”将扩大为(-8,-1.476)则在H 0不变的情况下也将得出判断:这种柴油机不合 格.显然这将使人们无所适从.5.2置

16、信区间的理论依据置信区间与假设检验不同,它对参数所在区间的估计在置信水平1-a选定后完全由样本数据决 定,显然十分客观但它不适用于有许多非样本信息需要考虑的情况.以前题为例,如果我们知道这 种柴油机设计很成熟,技术参数如耗油量等通常达到设计要求有把握,柴油机制造工艺稳定,工人 装配技术熟练,柴油机一般试运行一段时间磨合后柴油机耗油量会下降,这种柴油机被误判为不合 格代价高昂,则我们选H 0为:这种柴油机合格,并在a= 0.05下对之进行假设检验将比较合适, 尽管这时样本数据似乎不理想,但经检验还不足以动摇我们对H0的信心.这时进行区间估计显然将 得出这种柴油机不合格的结论,而该结论没有考虑到我

17、们已有的非样本信息,因而是不全面的.如 果信息仅如例题所列除样本数据外并无其它值得重视的考虑,那么用置信区间并据之判断无疑比盲 目提出一个并无根据的H更为合理,则按区间的结果认为这种柴油机不合格并无不当.06实际应用时应注意的两个问题6.1置信区间应注意问题统计推断是基于一定的概率保证程度的,离开概率谈统计推断是没有意义的.如 户64.9 r v 72.56 = 0.95 ,表示总体均值在(64.9,72.56)之间的可信程度是95%,而不能说总体 均值就一定在区间(64.9,72.56)之内,尚有5%的可能此均值在区间之外.该结果也不能理解为均值 落入区间(64.9,72.56)内的概率为9

18、5%,因为均值是一个给定的数,在数轴上有确定的位置,不存在 落入的问题,而是指反复抽样多次,每个样本确定一个随机区间,该区间要么包含R的真值,要么不包 含P的真值包含P真值的可能性为95% .6.2假设检验应注意问题进行统计检验时,必须考虑有可能犯的两种类型的错误.一是当原假设正确时,由于样本的随机 性,它的观察值仍然可能落在拒绝区域,这时作出了拒绝原假设的决定,因而犯了错误,这类错误称为 第一类错误,其发生的概率称为犯第一类错误的概率或弃真概率,它直接跟置信水平有关又叫错误a , 是研究者根据研究需要而定的,是可以控制的.二是当原假设不正确时,同样由于样本的随机性,它的 观察值也可能落入接受区域,从而作出接受原假设的决定,这类错误称为第二类错误,其发生的概率 称为犯第二类错误的概率或受伪概率,此错误又叫错误6 ,它不是研究者可以直接控制的.对于一个 好的检验法,当然希望它能作出正确的决策,也就是不犯或少犯错误.由于样本的随机性,要不犯错误 是不可能的,最好是使得犯两类错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论