假设检验基本概述_第1页
假设检验基本概述_第2页
假设检验基本概述_第3页
假设检验基本概述_第4页
假设检验基本概述_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、假设检验基本概述1、例子和小概率原理v(1)例1:某企业生产一种零件,过去大量资料表明,零件的平均长度为4厘米,标准差为0.1。工艺改革后,抽查100个零件,测得样本平均长度为3.94厘米。问工艺改革前后零件长度是否发生显著变化?v(2)分析:A、这是有关改革前后零件平均长度是否为4的假设检验。有两种可能:一是没有变化,但抽样随机性使样本均值与总体均值有差异,又未超出误差范围,则认为总体均值不变;二是发生显著变化,即样本均值与总体均值差异超出误差范围,认为总体均值发生显著变化。 v 2v(2)分析:B、根据样本平均数的抽样分布定理 若对总体均值假设 为真,则给定置信度 ,应有 v即 ,样本均值

2、与总体均值之差在误差范围,接受假设。若 v即 ,样本均总体均值之差超出误差范围,发生概率为 ,它又很小,小概率事件发生,拒绝假设,认为发生显著变化。 1、例子和小概率原理3 1、例子和小概率原理(3)本例解,已知假设 ,给定 ,则有 ,可计算得这样小概率事件发生,拒绝原假设,认为工艺改革前后零件长度发生明显变化。4 1、例子和小概率原理(4)小概率原理:是指发生概率很小的随机事件在一次实验中是几乎不可能发生的。这种事件称为“实际不可能事件”。小概率的标准是多大?5%的概率是不是小概率?这没有绝对的标准,一般我们以一个所谓显著性水平(01)作为小概率的界限,的取值与实际问题的性质有关。所以,统计

3、检验又称显著性检验。根据这一原理,可以作出是否接受原假设的决定52、假设检验的特点v(1)采用反证法进行逻辑推理,即为检验某假设是否成立,先假定其正确,再根据抽样理论和样本信息判断假设产生结果是否合理,最后决定是否接受原假设;v(2)依据小概率原理,即小概率事件发生,拒绝原假设,否则接受原假设;v(3)与区间估计的差别主要在于:区间估计是用给定的概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。6三、假设检验的步骤v一般有以下四步:v1、提出原假设和备择假设;v2、选择适当统计量,并确定其分布形式v3、选择显著性水平,确定临界值;v4、作出结论。7 1、提

4、出原假设和备择假设v(1)原假设又称零假设,是正待检验的假设记为H0;备择假设是拒绝原假设后可供选择的假设,记为H1 。二者相互对立,检验结果取其一。v(2)假设的提出根据检验问题具体而定,并采取“不轻易拒绝原假设”原则,即把没有充分理由不能轻易否定的命题作为原假设,把没有足够把握不能轻易肯定的命题作为备择假设。8 1、提出原假设和备择假设v(3)假设有三种形式:91、提出原假设和备择假设v(4)左侧检验和右侧检验统称单侧检验。采用那种检验根据实际问题决定,若只需判断有无显著差异或要求同时注意总体参数偏大或偏小,则采用双侧检验;若关心总体参数是否比某个值偏大或偏小,则采用单侧检验。102、选择

5、适当统计量,并确定其分布形式v不同的假设选择不同的统计量作为检验统计量。例6-1,采用113、选择显著性水平,确定临界值v(1)显著性水平表示H0为真时拒绝H0的概率,即拒绝原假设所冒的风险,用v 表示。假设检验应用小概率原理,小概率就是指 。给定显著性水平后,就可由有关的概率分布表查得临界值从而确定H0的接受区域和拒绝区域。临界值就是接受区域和拒绝区域的分界点。12 3、选择显著性水平,确定临界值v(2)不同形式假设H0 的接受区域和拒绝区域不同。双侧检验的拒绝区域位于统计量分布曲线的两侧;左侧检验的拒绝区域位于统计量分布曲线的左侧;右侧检验的拒绝区域位于统计量曲线的右侧。如图所示。13 假

6、设检验的接受区域和拒绝区域/21 /2-Z/2 Z/2 -Z 0 0 Zz(a)双侧检验v(b)左侧检验z(c)右侧检验144、作出结论v根据样本资料计算出统计量的具体值,并用以与临界值比较,作出接受或拒绝原假设的结论。如果检验统计量的值落在拒绝域内,说明样本所描述的情况与原假设有显著性差异,应拒绝原假设;反之接受原假设。15 1、概念v(1)第一类错误:当原假设为真,但由于样本的随机性使样本统计量落入拒绝区域,这时所做判断是拒绝原假设,也称拒真错误。事实上,小概率只是发生概率小,并不是不发生。v犯第一类错误的概率也称拒真概率,即显著性水平 ,P拒绝H0/ H0为真=161、概念v(2)第二类

7、错误:当原假设为不真,但由于样本的随机性使样本统计量落入接受区域,判断是接受原假设,也称取伪错误。v犯第二类错误的概率称为取伪概率,用 表示,即P接受H0/ H0不真= v可见接受原假设是因为没有发生小概率事件,没有充足的理由拒绝它。所以,接受原假设并非肯定原假设正确,含义是“不否定原假设”或“保留原假设”,即原假设可能为真,需要进一步检验证实。172、假设检验的四种情况v 假设检验中,原假设可能为真或不真,我们的判断(决策)有接受和拒绝两种。因此,检验有四种可能情况,如下表: 接受H0拒绝H0H0真实判断正确弃真错误()H0不真实取伪错误()判断正确18 3、两类错误概率的关系v(1)二者互

8、为消长:v由于样本的随机性,完全避免两类错误是不可能的,只能尽量控制犯错误的概率。一般,当n固定时,减少必然导致增大,反之减少必然会增大 。以利用Z统计量进行右侧检验的情况为例v要使小 ,则临界值Z 增大,这必然导致增大。反之,要使 小,则必然导致 增大,二者关系如下图:19两类错误概率的关系图p(x)0203、两类错误概率的关系v(2)和 的选择:取决于犯两类错误的代价。若拒真代价大,则取较小的而容忍较大的 ;反之,若取伪代价更大,则取较大的以求较小的 。通常先确定 ,即原假设为真时拒绝它的概率事先得到控制。再次可见,原假设受到保护不轻易否定。 214、检验功效v(1)检验效果好与坏,与犯两

9、类错误的概率都有关,首先不能太大;另外 得到控制的条件下,犯取伪错误的概率要尽可能地小,即不取伪的概率1-应尽可能增大。1-越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;反之亦然,可见1-是反映统计检验判别能力大小的重要标志,我们称1-为检验功效或检验力。22 4、检验功效v(2)影响检验功效的因素有显著性水平 、样本容量、原假设与备选假设间的差异程度。v给定 而使 减少,就必须增大样本容量n。因为增大n能降低抽样平均误差,样本统计量分布更集中,分布曲线更尖峭,使曲线尾部面积和 都减小;原假设与备选假设间的差异程度越大, 越小,结合 和关系图得知,若真值

10、 右移,则 增大,以 为中心的曲线右移,使曲线左尾阴影部分减小。23 第二节 总体均值、比例和方差 的假设检验v学习以下问题:v一、总体方差已知对正态总体均值的检验;v二、总体方差未知对正态总体均值的检验;v三、总体比例的假设检验;v四、总体方差的假设检验。24一、总体方差已知对正态总体均值的检验v学习以下问题:v1、Z检验法;v2、例子。25 1、Z检验法v(1)设总体为总体的一个样本,样本均值为 。现在对总体均值 进行检验。根据抽样分布定理5.1,样本均值在H0成立时,检验统计量Z及其分布为利用服从正态分布的统计量Z进行的假设检验称为Z检验法。26 1、Z检验法v(2)检验时,根据已知的总

11、体方差、样本容量和样本均值 ,计算出检验统计量Z的值。对给定的检验水平 ,查正态分布表得临界值,将Z值与临界值比较作出检验结论。271、Z检验法v(3)具体检验时:v若采用双侧检验, 则临界值为v Z /2或 Z /2,当Z Z /2时,拒绝原假设,反之则接受原假设。v若采用左侧检验,则临界值为 Z /2 ,当Z Z /2 时,拒绝原假设;反之,接受原假设。若采用右侧检验,则临界值为 Z /2 ,当Z Z /2 时,拒绝原假设;反之,接受原假设。28 2、例子v根据过去大量资料,某厂生产的产品的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16件,测得样本平均寿

12、命为1080小时。试在0.05的显著水平下判断这批产品的使用寿命是否有显著提高?v解:根据题意,提出假设:v检验统计量v由=0.05,查表得临界值:z= 1.645,由于Z=2.4 z= 1.645,所以应拒绝H0而接受H1,这批产品的使用寿命显著提高.29二、总体方差未知对正态总体均值的检验v学习以下内容:v1、t检验;v2、例子30 1、t检验(1)设总体 ,此时对总体均值检验不能用Z检验法,因为包含未知参数 ,我们可以用总体方差的无偏估计量样本方差S2代替 ,得到t统计量。由定理5.2可知,在H0成立时,检验统计量t及其分布为利用服从t分布的统计量去检验总体均值的方法称为t检验法。31

13、1、t检验v(2)具体做法:根据题意提出假设;构造检验统计量t并根据样本信息计算其具体值;对于给定的检验水平 ,由t分布表查得临界值;将所计算的t值与临界值比较,作出检验结论。v双侧检验时,若t t /2时,拒绝原假设H0,反之则接受H1。v左侧检验时,若当t t 时,拒绝原假设H0,反之则接受H1。v右侧检验时,若当t t 时,拒绝原假设H0,反之则接受H1。322、例子 v某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的检验水平上,能否认为这天自动包装机工作正常?v解:根

14、据题意检验目的是观察产品的平均每袋重量是否与标准重量一致。建立假设:v检验统计量v由=0.05,查表得临界值v由于v所以接受原假设,认为这天自动包装机工作正常。333、Z检验、t检验的适用条件vt检验法适用于小样本情况下总体方差未知时对正态总体均值的假设检验。随样本容量n增大,t分布趋于标准正态分布。因此大样本下(n30),总体方差未知对总体均值 的假设检验通常近似采用Z检验法。同理,大样本下非正态总体均值的检验也可用Z检验法。原因根据大样本分布定理,总体分布形式不明或为非正态总体时,样本平均数趋近于正态分布。这时检验统计量Z中的总体标准差 用样本标准差S代替。34三、总体比例的假设检验学习以

15、下问题:1、检验方法;2、例子。351、检验方法v由比例抽样分布定理知,样本比例服从二项分布。大样本下二项分布近似服从正态分布,对总体比例的检验通常在大样本条件下进行,根据正态分布近似确定临界值,即用Z检验。v具体:提出待检验假设:v统计量为v上式中,小写字母p代表样本的成数,大写字母P代表总体的成数。362、例子v某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200个家庭,其中68个家庭拥有电脑。试问该研究者的估计是否可信( =10%)?v解:依题意,可建立如下假设:v样本比例p=m/n=68/200=0.34v由于样本容量相当大,所以可以近似采用Z检验法v给定=0.1,查正态分

16、布表得临界值为1.645,由于vZ Z /2,应接受原假设,认为该研究者的估计是可信的.37四、总体方差的假设检验v学习以下问题:v1、检验的方法;v2、例子38 1、检验的方法只讨论正态总体方差的检验(1)需要检验的原假设为备选假设为v由于样本方差S2是总体方差 2的无偏估计量,自然可将S2与 2对比来构造检验统计量,检验统计量及其分布为v这称为X2检验。给定检验的置信水平 ,可查分布表确定临界值和拒绝域。39 1、检验的方法v(2)采用双侧检验时,建立假设v临界值为v拒绝域为v采用左侧检验时,建立假设v临界值为v拒绝域为v采用右侧检验时,建立假设v临界值为v拒绝域为40 2、例子v根据长期

17、正常生产的资料可知,某厂所产的维尼纶纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽出20根,测得样本方差为0.0042。判断该日纤度的波动与平时有无显著差异(取 =0.10)v解:假设:v统计量=0.10,查X2 分布表(自由度n-1=19),得临界值是由于 检验统计量的样本取值落入拒绝区域,所以拒绝H0。样本数据说明该日纤度的波动性与平时有显著差异.41第三节、假设检验中的其他问题v学习以下问题:v一、区间估计与假设检验的关系;v二、假设检验中的P值42一、区间估计与假设检验的关系v学习以下问题:v1、区间估计与假设检验的区别;v2、区间估计与假设检验的联系。431、区间估计与

18、假设检验的区别v(1)二者都是统计推断的重要内容。如果总体分布形式已知,只是总体参数未知,则统计推断就是推断总体参数的问题。抽样估计或参数估计是根据样本资料估计总体参数的真值,而假设检验是根据样本资料来检验对总体参数的先验假设是否成立。v(2)区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验不仅有双侧检验还有单侧检验,根据具体问题决定。441、区间估计与假设检验的区别v(3)区间估计立足于大概率,通常以较大的把握程度1- 去估计总体参数的置信区间。而假设检验立足于小概率,通常给定很小的显著水平去检验对总体参数的先验假设是否成立。假设检验更注重拒绝区域,运用概率意义的反证法,建立

19、假设本着“不轻易拒绝原假设”的原则。45 2、区间估计与假设检验的联系v(1)二者都是根据样本信息对总体参数进行推断,都以抽样分布为理论依据,都建立在概率基础上推断,推断结果都有一定的可信程度或风险。v对于同一实际问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。462、区间估计与假设检验的联系v(2)以总体均值的区间估计和假设检验为例。当总体方差已知时,由于统计量v 给定置信度1- ,有v当总体均值未知,可估计均值的置信度为1- 的置信区间为v等价于Z检验的接受区域472、区间估计与假设检验的联系v(2)若事先假设 ,可求出统计量Z 的具体值。当Z Z /2时,不

20、属于小概率事件,应接受原假设;反之,当 Z Z /2时,小概率事件发生了,应拒绝原假设。可见,区间估计中的置信区间对应于假设检验中的接受区域,置信区间之外的区域就是拒绝区域。对比例、方差等问题的区间估计和假设检验也同样存在这种对偶性。 482、区间估计与假设检验的联系v(3)例子:在例5-6中,若要求判断总体均值是否为800克,则区间估计问题变成假设检验问题。v解:假设v统计量v由于 ,所以应接受原假设。492、区间估计与假设检验的联系v(3)例子:本例还可用区间估计结果得出同样检验结论。已知1- =0.95的置信度下,总体均值的置信区间为v这区间等价于对均值进行t检验时的接受区域v 在置信水

21、平 =0.05下,总 v 体均值在778.84,803.36范围内是可信的.原假设 包含在置信区间内,接受原假设.若 在置信区间外,则应拒绝原假设.502、区间估计与假设检验的联系v(4)例子:在例6-4中,现估计总体比例的置信区间。解:已知n=200,样本比例p=0.34,统计量Z:v因此给定置信水平=0.10,总体比例的接受区域为v可得总体比例P的置信度0.90的置信区间是v即置信区间为0.285,0.39551二、假设检验中的P值v学习以下问题:v1、假设检验结论的思考;v2、P值检验的方法。521、假设检验结论的思考(1)假设检验结论是在给定的显著水平下作出的。因此,在不同的显著水平下

22、,对同一检验问题所下结论可能完全相反。例如在显著水平=0.10时,应拒绝原假设,但在=0.05时可能接受原假设,原因降低显著水平会使拒绝区域缩小,使有可能落在=0.10拒绝区域的统计量值变成落在=0.05接受区域。53 1、假设检验结论的思考v(2)给定显著性水平,对于相同的样本容量和分布,临界值固定,拒绝区域就固定。但不同样本得出的检验统计量的值不同,即使都落在相同的区域,所下结论相同,但检验的把握程度实际不同。如例6-1中Z=5或=3都大于临界值2.58,结论都是拒绝原假设,但前者把握更大。542、P值检验的方法v(1)在假设检验例6-2中,检验统计量Z=2.4,由ZN(0,1)可求统计量

23、Z大于2.4的概率vP(Z2.4)=1-P(Z2.4)=1-0.991802=0.0082v在这里若选定的显著性水平0.0082时,统计量的值Z=2.4必然大于临界值Z ,即统计量的值落在拒绝区域,若 0.0082时,必有Z=2.4 Z ,即统计量的值落在接受区域。可见,若拒绝原假设,显著性水平的最小值为0.0082,比它稍大一点就会接受原假设。把这种“拒绝原假设的最小显著性水平”称为假设检验的P值552、P值检验的方法v(2)一般地用 表示检验统计量,当原假设为真时,可由样本数据计算出统计量的值C,根据检验统计量 的分布,可求出P值。具体:左侧检验的P值为检验统计量 小于样本统计值C的概率,

24、即v右侧检验的P值为检验统计量 大于样本统计值C的概率,即v双侧检验的P值为检验统计量 落在以样本统计值C为端点的尾部区域的概率的2倍: (当C位于分布曲线右端时)或 (当C位于分布曲线的左端时)。若服从正态分布和t分布,分布曲线关于纵轴对成,P值表示为562、P值检验的方法v(3)计算出P值后,将给定的显著性水平与其对比,得到检验结论: v当P,则在显著性水平 下拒绝原假设;当 P ,则在显著性水平下接受原假设。实践中,当 =P时,即统计量的值C刚好等于临界值,为谨慎起见,可增加样本容量,重新抽样检验。v在统计软件中几乎都给出了P值,对决策很有益。但有时检验统计量的值很大或很小, P值很小,在一般的概率分布表查不到P的确切数值,不过此时拒绝原假设的理由已非常充足,不会影响检验结论。57表6-2 本章各例题中检验的P值58附加:如何建立假设v1、实际进行假设检验尤其是进行单侧检验时,如何建立假设是一个值得思考的问题。如果是左侧检验,即如果是右侧检验,即 这样,同一个数据却得出相反的结论。我们用下面的例子进行说明。59附加:如何建立假设v2例子:某种灯泡的质量标准是平均寿命不得低于100

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论