基于单个均值检验的第二类错误成因及计算_第1页
基于单个均值检验的第二类错误成因及计算_第2页
基于单个均值检验的第二类错误成因及计算_第3页
基于单个均值检验的第二类错误成因及计算_第4页
基于单个均值检验的第二类错误成因及计算_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、期末研究学习论文基于单个均值检验的第类错误成因及计算姓名:教师: 时间:2013.12基于单个均值检验的第类错误成因及计算摘要在统计假设检验中,不可避免会遭遇两种类型的错误:第类错误(拒真错误)与第类错误(纳伪错误)。可以认为,第一类错误由检验中的实际推断原理引起,第二类错误由检验中的逻辑谬误引起。第一类错误出现的概率为显著性水平,即小概率事件发生的概率。第二类错误的计算方法是阐述的重点,也是在解决这一问题上与目前的方法不一致的地方。本文基于对单个均值的检验,着重分析了第类错误的成因、能否计算及如何计算。本文发现,犯第类错误的概率为, 是可以控制的;而另一方面,由于非真状态不唯一,真实分布的未

2、知,的数值通常是不可控制。一般地,的数值也与显著性水平,样本容量,真实参数的值有密切关系。特别地,的数值随着真实和原假设中的偏离程度而变化,越小,犯第类错误的值会显著增大。本文倾向于认为的数值在实际情况中是不能计算的。事实上,当且仅当真实已知,才能计算得到的精确值,这与样本方差是否看作一个统计量相关性不大(这种情况可用检验解决)。而在这种情况下, 已然是个已知数,那么也无从谈起进行假设检验。对于将作为一个统计量,我们得到了其分布,可求得其方差为(为修偏系数)当时,随着修偏系数,用样本数据代替误差将越来越小关键词:假设检验,第类错误,修偏系数,成因,计算目录一、问题重述1二、基本命题2三、第类错

3、误成因分析2四、第类错误概率值的计算3五、第类错误概率值影响因素分析5六、第类错误概率值计算的反思6七、结论8八、参考文献8II一、问题重述考虑方差末知时正态总体的假设检验若检验的显著水平为,易知其拒绝域为X显然,拒绝域所犯第I类错误的概率为。若考虑第类错误,则由基本公式由于在条件下,所以部分同学认为,获得抽样数据(样本根方差)后,第II类错误的概率是可求的。但另一部分同学则认为,由于右端表达式中,是一统计量,是随机变量,不能用样本数据来代替,此问应从长计宜。更多的同学了解了以上两种思想后,认为的表达式是不确定的,不能计算。由此认为该检验犯第II类错误的概率是不存在的。请进行深入的分析思考,推

4、断验证,尽力对这个问题作出全面恰当的回答。1二、基本命题A、 作为一个总体的大多数样本的统计量的值,将会落在一个被指定的区域(接受域).B、某一样本的统计量的值落在一个被指定的区域.C、若A为真,且推断过程无误,则B可能为真;若B为真,且推断过程无误,则A为真.D、在检验中,我们要根据实际推断原理,即概率很小的事件在一次试验中实际上几乎不会发生.三、第类错误成因分析统计检验中为什么会出现第类错误与第类错误呢?一般认为,那是因为“弃真”与“纳伪”。显然,本文所追求的回答不能这样简洁,停留于此,无疑是在问题的外围打转。当然,也无意于更不可能追溯至问题最初源头,而只能在较有高度的地方停下来去看问题的

5、来源,进而弄清问题的实质。回顾统计假设检验中的一般步骤:第一步,根据问题的需要提出原假设,即写出所要检验假设的具体内容,如假设; 第二步,根据原假设的内容,建立合适的样本函数 (也称为检验函数),它在原假设为真的条件下为一统计量,并且其分布为已知;第三步,选取显著性水平 (通常取),在为真的条件下,寻找区域,使得,由于较小,所以是个小概率事件;第四步,检验小概率事件是否发生,若发生,则拒绝原假设;若发生,则接受原假设.通常称为拒绝域,称为接受域。上述第四步作出统计推断的依据便是命题D,即“小概率事件实际不可能”原理。然而小概率事件并非不可能事件,我们只抽了一个样本,如果这个样本确实来自某个指定

6、的总体,但不排除它的统计量的值刚好落在否定域内,即小概率事件发生了。但在检验中,我们并不知道这个事件是小概率事件,而依据实际推断原理拒绝了原假设场,或认为这个样本不是来自那个总体。因此,我们犯了“弃真”的错误错误。换言之,错误由实际推断原理引起的。相比之下,分析错误出现的原因较前者复杂,究其根本原因便在于,命题A到命题B的演绎推理,命题C是我们在检验中所依据的原则。如果A是真的,且我们从A到B演绎推论如果也是正确的,那么B可能是真实的。相反,果结果B是真实的,那么能否就此得出A必定是真实的结论呢?我们的回答是不能。如果我们这么做,就会犯逻辑学家称之为以推论结果来证实前提的谬误。如果B是真实的,

7、我们可以说A也许是真的。因为可以有许多备择的假设,也都能推出B的正确来。四、第类错误概率值的计算4.1 与已知,检验设其中已知,接受原假设时所犯第二类错误的值:若检验的显著水平为,易知其拒绝域为显然,拒绝域所犯第I类错误的概率为。若考虑第类错误,则由基本公式:以下以实例进行说明.例4.1已知某公司员工收入服从正态分布。现作50人的抽样调查,人均收人的结果,元.求接受原假设时所犯第二类错误的值.解:这是一个假设检验的问题,总体,待检验的原假设与备择假设分别为:这是一个双侧检验问题,检验的拒绝域为,取显著性水平,查表知.则可得接受域的临界值:是对于真实总体 来说,样本均值为的部分(图1的阴影部分)

8、,都将误认为而被接受。这部分面积就是犯第二类错误的数值:图14.2 未知, 已知,检验回到期末研究学习问题上来,当未知时,用样本标准差替换,这就形成了检验统计量:当时,.此时接受原假设时所犯第二类错误的值:4.3 小结表1:在已知情况下正态总体的第二类错误概率检验法条件原假设备择假设检验统计量检验已知检验未知五、第类错误概率值影响因素分析由前结果便可分析比较得到与、与n之间的关系。现以已知情况下双侧检验为例说明:此时,,()5.1随的减少而增大这是因为,当与n确定时:为标准正态分布密度函数。由的性质可知,越大值越小,已知,所以,是关于的单减函数,随的减少而增大。5.2 随n的增大而减少是关于n

9、的单减函数,随n的增大而减少。5.3 随的减少而增大所以是的严格增函数。而从正态分布的性质知,又是的严格减函数,于是是的严格减函数。这就表明,当样本容量n不变时,要减少犯第一类错误的概率,必将导致犯第二类错误的概率的增大。六、第类错误概率值计算的反思6.1 关于回到原题目,“但另一部分同学则认为,由于右端表达式中,是一统计量,是随机变量,不能用样本数据来代替,此问应从长计宜。”将作为一个统计量, 那么可用一个概率分布去描述。以下是对概率密度函数的理论推论:设是来自正态总体的样本,其样本方差为。由定理可得,,其密度函数为为严格单调递增函数,则有从而这说明不是的无偏估计。令,称为修偏系数,表2结出

10、了的部分取值,则,可以证明,当时,有,这说明是的渐近无偏估计,同时在样本容量较大时,说明这时用样本数据代替误差将会几乎为零。 表2:正态标准差的修偏系数表51.063891.0317131.021021.253361.0509101.0281141.019431.128471.0424111.0253151.018041.085481.0362121.0230161.01686.2 关于回到例4.1,我们已经得到当,在显著性水平时, 现令,同理可计算得到:可见的值在减小5便增长了10倍左右。不难验证当时:可见当减小到1时,已经超过了90%!这让笔者想到,在假设检验中,是人为提到的接近已知的“理

11、想”值了,恰恰反映了总体分布均值与理想值的偏差,偏差的范围通常是有控制的,即给定最大偏差允许值,凡是偏差不超过这个充许值的,就应该认为是“允许”、“合格”或是“正常”的。因此,对于例4.1,当,我们就应该更有理由认为就是“真实值”了,此时,便也不在存在犯第二类错误的问题。从另一个角度,笔者认为,此时的也失去了其实际意义。针对上述情况,本文提出了改进的已知时的计算方法。依然以例4.1作说明,对于真实分布,考虑时的“理想接受域”。即将代入,则在显著性水平时,“理想接受域”的临界值:对于真实总体 来说,样本均值为的部分(图2的阴影部分),都将误认为而被接受。这部分面积就是犯第二类错误的数值:笔者认为

12、此时的的数值较之前方法计算的在处理很小的情形下更合理。图二七、结论对于:当时,随着修偏系数,用样本数据代替误差将越来越小对于:在已知的情况下:1、犯两类错误的概率是相互有关联的,当样本容量n固定时,犯第一类错误的概率的减小会导致犯另一类错误的增加.2、当零假设不真时,参数的真值越接近零假设下的值时,犯第二类错误的概率就越大.3、要同时降低犯两类错误的概率和,或者要在保持 (或)的条件下降低 (或),需要增加样本容量n.另一方面,若未知,可将依据表1列出的关系式视作的函数,这样一来,要得到的真实值将不在可能。八、参考文献【1】刘琼荪.概率论与数理统计M.高等教育出版社.2013【2】邱芳.统计假设检验中的两类错误J.滨州师专学报. 2003(2)【3】蔡越江.论假设检验中的两类错误J.数理统计与管理. 1999(03)【4】朱学军.综合确定假设检验两类误判概率及样本容量的探讨J.嘉兴学院学报.1994(03)【5】柯玉琴. 略谈假设检验第二类错误的概率J.科技信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论