第六章假设检验_第1页
第六章假设检验_第2页
第六章假设检验_第3页
第六章假设检验_第4页
第六章假设检验_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 假设检验 第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验 第一节 假设检验概述一、假设检验的基本概念(一)、假设检验与区间参数估计的区别和联系1、联系:参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断。2、区别:推断的角度不同,区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。(二)、假设检验的两大类别:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 大数定理表明:就大量观察而言,事件的发生具有一定的规律性。根

2、据概率的大小,人们处理的态度和方式很不一样。在日常生活中,人们往往习惯于把概率很小的事件,当作一次观察中是极不可能看到的事件。例如,人们出门做事就有可能遇到不测事故,但却很少人因此而不敢出门。原因是:小概率事件极不可能发生。(三)小概率原理 小概率原理:即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。 统计检验的依据是统计检验的依据是小概率原理:一是认为小概率原理:一是认为小概率事件在一次观察小概率事件在一次观察中是极少出现的;二是中是极少出现的;二是如果在一次观察中出现如果在一次观察中出现了小概率事件,那么应了小概率事件,那么应该否定原有事件具有小该否定原有事

3、件具有小概率的说法或者假设。概率的说法或者假设。(1)建立假设建立假设(2)确定统计量确定统计量(4)计算检验统计量计算检验统计量(3)选择显著性选择显著性水平和否定域水平和否定域(5)判定判定所所包有含统的计步检骤验 根据以往多年的统计表明,上海根据以往多年的统计表明,上海财大英语的平均成绩为财大英语的平均成绩为90分,随机抽分,随机抽取取100个学生,其平均成绩为个学生,其平均成绩为80分,问分,问今年财大学生的英语成绩是否下降?今年财大学生的英语成绩是否下降?(四)、假设检验的步骤(5个)1)、原假设(null hypothesis):需要通过样本去推断其正确与否的命题称为原假设。用 表

4、示,即:2)、)、备选假设(alternative hypothesis):与原假设对立的是假设,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。用 表示,备选假设与原假设相对立,原假设成立,则备选假设不真实,如原假设不真实,则备选假设成立。 关于均值,原假设与备选假设有三种情况: 双侧检验 左侧检验 右侧检验0:90hu 1h101010:huuhuuhuu000000:huuhuuhuu0h2、确定适当的检验统计量 确定适当的统计量,且能在原假设成立的条件下知其分布。 一般来说,检验统计量的基本形式可表示如下:

5、 3、 选择显著性水平和否定域选择显著性水平和否定域 被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用表示),它决定了否定域的大小。因此,有人也把第一类错误称之错误 。相应地第二类错误被人称为 错误。 在原假设成立的条件下,统计检验中所规定的小概率标准一般取为=0.05或=0.01。 由所决定的否定域与接受域之间的分界值被称为临界值, 如z 。样本统计量被假设参数检验统计量统计量的标准差4 4计算检验统计量计算检验统计量 在完成了上述工作之后,接下来就是做一次与在完成了上述工作之后,接下来就是做一次与理想试验尽量相同的实际抽样理想试验尽量相同的实际抽样(比如实际做一次重比如实际

6、做一次重复抛掷硬币的试验复抛掷硬币的试验),并从获取的样本资料算出检,并从获取的样本资料算出检验统计量。根据显著性水平确定统计量的否定域或验统计量。根据显著性水平确定统计量的否定域或临界值,并注意是单侧检验还是双侧检验。临界值,并注意是单侧检验还是双侧检验。5 5判定判定 假设检验系指拒绝或保留原假设的判断,又称假设检验系指拒绝或保留原假设的判断,又称显著性检验。在选择否定域并计算检验统计量之后,显著性检验。在选择否定域并计算检验统计量之后,我们完成最后一道手续,即根据计算结果决定假设我们完成最后一道手续,即根据计算结果决定假设的取与舍。如果结果落在否定域内,我们将在已知的取与舍。如果结果落在

7、否定域内,我们将在已知犯第一类错误概率的条件下,否定零假设。反之,犯第一类错误概率的条件下,否定零假设。反之,如果结果落在否定域外,则不否定零假设,与此同如果结果落在否定域外,则不否定零假设,与此同时,我们就有了犯第二类错误的危险。时,我们就有了犯第二类错误的危险。 二、两种类型的错误 1、决策结果存在四种情形: 接受拒绝 真实判断正确弃真错误(第一类错误或错误) 不真实取伪错误(第二类错误或错误) 判断正确0h0h0h0h 在统计检验中,无论是拒绝或者接受原假设,都不在统计检验中,无论是拒绝或者接受原假设,都不可能做到百分之百的正确,都有一定的错误。可能做到百分之百的正确,都有一定的错误。1

8、)、第一类错误:原假设是真实的,判断结论是拒绝原假)、第一类错误:原假设是真实的,判断结论是拒绝原假设,这种错误叫着设,这种错误叫着“弃真错误弃真错误”,在原假设为真的情况,在原假设为真的情况下,检验统计量刚好落入小概率的拒绝区域,使我们拒下,检验统计量刚好落入小概率的拒绝区域,使我们拒绝原假设,因此犯第一类错误的概率大小等于显著性水绝原假设,因此犯第一类错误的概率大小等于显著性水平平,我们可通过控制显著性水平大小的方式来控制犯弃,我们可通过控制显著性水平大小的方式来控制犯弃真错误的概率。在统计学上把第一类错误也叫着真错误的概率。在统计学上把第一类错误也叫着错误。错误。2)、第二类错误:原假设

9、不真实,结论是接受原假设,这)、第二类错误:原假设不真实,结论是接受原假设,这种错误叫着种错误叫着“取伪错误取伪错误”,犯第二类错误的概率记为,犯第二类错误的概率记为 ,因此,在统计学上称第二类错误为因此,在统计学上称第二类错误为 错误。错误。3)、不管我们如何选择否定域,都不可能完全避免第一类)、不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言,犯第一类错压缩到最小。对任何一个给定的检验而言,犯第一类错误的危险越小,犯第二类错误的概率就越大;反之亦然。误的危险越小

10、,犯第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。结果的概率之和。 2、两类错误及其关系、两类错误及其关系三、检验功效1、检验功效或检验力:在犯第一类错误的概率得到控制的条件下,犯取伪错误的概率也要尽可能地小,或者说,不取伪的概率1-应尽可能增大。1-越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率

11、越小,检验的判别能力就越差。可见1-是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。2、影响检验功效的因素1)、 取值:大,检验功效就大(1-)2)、要满足、都尽可能的小,只有增加样本的容量,但样本容量都是有限的,因此在实际应用中会先控制 原因如下:a、遵循统一原则,讨论问题较方便。b、原假设清晰,备选假设模糊,对于一个模糊的假设和一个清晰地假设,我们更关心原假设为真时,我们却把它放弃了的可能性有多大。3)、原假设与备选假设的差异程度,差异明显,则减少,检验功效就大。第二节 总体参数检验 一、单侧检验与双侧检验 (一)、双侧检验/21/2-z/2 z/2双侧检验双侧检验中拒绝

12、域位于正态分布的两边上,对于提出的 ,只要 或 二者之中有一个成立,就可以否定原假设,这种假设有两个拒绝域、两个临界值,每个拒绝域的面积为/2,临界值为-z/2、z/2。00:huu0uu0uu(二)单侧检验 1、左单侧检验(下限检验) 2、右单侧检验(上限检验)0010:huuhuu z 0 0 z左侧检验右侧检验假定: z为临界值 10:huu00:huu假定z为临界值(三)、用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。 二、 总体均值和成数的单样本检验1、提

13、出原假设和备选假设、提出原假设和备选假设 (有三种情况)(有三种情况) 双侧检验双侧检验 左侧检验左侧检验 右侧检验右侧检验 2、确定统计量、确定统计量3、确定显著性水平及拒绝域、确定显著性水平及拒绝域 000000:huuhuuhuu(一)、总体(一)、总体已知,对总体均值的检验已知,对总体均值的检验101010:huuhuuhuu0xzn1)、确定显著性水平/2或z /2,即在 /2或z /2时拒绝原假设,接受备选假设,反 之接受原假设,拒绝备选假设。如z= /2 或z=/2 为了慎重,一般先不下结论,应再进行一次抽检。3)、单侧检验时,左单侧检验时,拒绝域为zz,即 z z,即z z时,

14、拒绝原假设,接 受备选假设4、计算统计量z的值5、根据统计量的值与临界值的关系,进行判定是接受原假设还是拒绝备选假设练习:1、根据长期经验和资料的分析,某砖瓦厂生产的砖的“抗断强度”服从正态分布,方差为1.21。从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg/ ):32.56 29.66 31.64 30.00 31.87 31.03 检验这批砖的平均抗断强度为32.50是否成立?(=0.05)2、某厂生产一种产品,原月产量服从平均值为u=75,方差为14的正态分布,设备更新后,为了考察产量是否提高,抽查了6个月产量,求得平均产量为78,假定方差不变,问在显著性水平=0.05下,设备更

15、新后的月产量是否有显著性提高?3、某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应购买这批灯泡?2cm(二)、总体(二)、总体未知,对总体均值的检验未知,对总体均值的检验 总体方差未知时,可用样本标准差与方差代替它们,总体方差未知时,可用样本标准差与方差代替它们,检验统计量应改为自由度为检验统计量应改为自由度为n-1的的t分布,即:分布,即: (1)xtt nsn1、提出原假设和备选假设、提出原假设和备选假设 (有三种情况)(有三种情况) 双

16、侧检验双侧检验 左侧检验左侧检验 右侧检验右侧检验 2、确定统计量、确定统计量3、确定显著性水平及拒绝域、确定显著性水平及拒绝域 1)、确定显著性水平2)、双侧检验时,拒绝域为)、双侧检验时,拒绝域为t t/2,即在 t t/2时拒绝原假设,接受备选假设,反之接受原假设,拒绝备选假设。3)、单侧检验时,左单侧检验时,拒绝域为tt,即t t,即t t时,拒绝原假设,接 受备选假设000000:huuhuuhuu101010:huuhuuhuu (1)xtt nsn4、计算统计量z的值5、根据统计量的值与临界值的关系,进行判定是接受原假设还是拒绝备选假设练习:某机器制造的肥皂厚度为5cm,今欲了解

17、机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试分别以0.05、0.01的显著性水平检验机器性能良好(即机器厚薄符合规定的假设)(三)、总体成数的检验 当样本容量较大时,下列统计量服从标准正态分布: 上式中,代表总体的成数,p代表样本的成数。 以上的z统计量可以用作总体成数检验的检验统计量。 检验的步骤和总体均值的检验步骤相同。 练习:一项调查结果表明某市老年人口比重为14.7%,该市老年人口研究会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上,调查结果是否支持该市老年人口比重为14.7%的看法?(显著性水平为0.

18、05)1pzn三、p-值检验1、定义:p-值检验就是通过计算p-值,再将它与显著性水平作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。2、p-值判断的原则是:如果p-值小于给定的显著性水平,则拒绝原假设;否则,接受原假设。或者,更直观来说就是:如果p-值很小,拒绝原假设,p-值很大,接受原假设。请大家注意的是这里的p-值是指概率,不要与成数指标相混淆。 3、z检验的p-值: 步骤1、2(作出假设、构造检验统计量)同 z检验) 步骤3:计算样本统计量 步骤4:检验统计量为z统计量的p-值计算公式, 表示检验统计量的抽样数据,则p-值的计算方法如下: 如果: , p-

19、值=2 如果: , p-值= 如果: , p-值= 步骤五:作出决策,如果p-值显著性水平,接受原假设,反之拒绝原假设。 4、t检验的p-值与z检验类同。0z1h1h1h0000p zz0p zz0p z z三、秩和检验 秩和检验也称wilcoxon-man-whitney检验。该检验方法可用于检验两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。 第三节 非参数检验 非参数检验是对总体的分布不作任何限制的统计检验。故非参数检验又称为

20、自由分布检验。非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布”不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。正因为如此,非参数检验成为管理科学中应用较为广泛的一种统计检验方法。 一、自由分布检验概述 1、自由分布检验概念:又称为非参数检验,对总体分布未加限制的检验。2、自由分布检验对比参数检验,具有以下优点: 首先,检验条件比较宽松,适应性强。

21、其次,自由分布检验的方法比较灵活,用途广泛。对于那些不能进行加、减、乘、除运算的定类数据与定序数据,可使用符号检验、秩和检验等方法进行检验。 再次,自由分布检验的计算相对简单。由于自由分布的检验方法不用复杂计算,一般使用计数方法就可以了,它的计数过程与结果都比较简单、直观与明显。3、自由分布检验缺点 由于它对原始数据中包含的信息利用得不够充分,检验的功效相对较弱。当总体的分布形式已知时,基于这种分布类型的参数方法,一般说来比非参数方法为佳。例如,对于一批资料,可同时适用于参数的t-检验、非参数的符秩检验和符号检验。其检验功效是,t-检验的最好,符秩检验次之,符号检验最差。这主要是由于符号检验对

22、信息的利用最不充分。二、符号检验(最简单的检验) 该方法是建立在以正、负号表示样本数据与假设参数值差异关系基础上的,因此称之为符号检验。该方法既适用于单样本场合,也适用于配对样本场合。 (一)单样本场合的符号检验 中位数检验 : : =a 样本每个数据都减去a,只记录其差数的符号。n+与n-分别是正、负符号的个数,当原假设为真是时 ,n+与n-应该很接近;若两者相差太远,就有有理由拒绝原假设。 0hem 例4:设有20个工人,他们一天生产的产品件数,抽样结果如下: 168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,1

23、71,186,167,170。 试以=0.10的检验水平,判定总体中位数是否是160。 解:第一步:作出假设。 : =160, : 160 由备选假设知,这个检验是双侧的。 第二步:计数。 对样本数据,大于160的记下“+”,小于160的记下“-”,等于160的,予以剔除(以0记之),结果如下: + + 0 + + + - - + + + - + + 0 + + + + + 计数以上“+”的个数是n+=15,“-”的个数n-=3,剔除数据2个。最后有效的样本个数为 n=n+n-=18 。0hem1hem 第三步:确定拒绝域。 显著水平= 0.10,由于进行双侧检验,拒绝域分布在两边,每侧概率/

24、2=0.05,查二项分布临界值表,得到拒绝域的临界值是13。 第四步:选择n+、n-较大者,再与临界值比较。 结果是1513。 第五步:判断。 由于上一步的比较结果可知,样本落入拒绝域,所以拒绝原假设,认为样本数据不能证明总体中位数等于160件。(二)配对样本场合的符号检验 样本配对场合与单样本场合的符号检验,基本原理是一致的。设从两个总体中分别抽出一个容量相等的样本,然后将两样本的数据进行一一配对,得到一组配对值。再将各对配对值相减,记录下差数的符号,计算出“+”的个数n+与“-”的个数n-。如果两个样本的总体差异不显著,配对值之差的正负号出现的概率各是1/2,则n+与n-应当非常接近;如果

25、n+、n-相差太大的话,说明两总体存在显著差异。例子见书上的。 三、秩和检验 秩和检验也称wilcoxon-man-whitney检验。该检验方法可用于检验两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。 秩和检验原理:1、设分别从两个未知的总体独立、随机地抽取容量为n1和n2的样本,把样本容量较小的总体称为总体。如果两样本容量相等,就把任意一个总体称作总体,另一个总体称作总体,这里不妨设n1n2。2、现将两个样本混合起来,并按数据

26、的大小,从小到大排列编号,每个数值的编号就是它的秩次。如果混合样本中有若干个相同的数值,则把它们的秩次进行简单算术平均,用此平均值作为这些数值的秩次,计算来自总体的n1个数据在混合样本中的秩次之和,记为t。3、显然t最小的可能值是: t1=1+2+3+n1=n1(n1+1)/2 ; 最大的可能值是 t2=(n2+1)+(n2+2)+(n2+n1)=n1(n2+1)+(n2+n1)/2。 如果两个总体分布无显著差异,则t值不应太大或太小,等于中间值(t1+t2)/2;如果总体分布于总体的右边,t将接近其最大值t2;如果总体位于总体的左边,t将接近于它的最小值t1。因此,我们可以用秩和t作为检验的

27、统计量。4、第一种方法,当n1和n2都不超过10时,查“秩和检验表”确定临界值; 第二种方法,当n1和n2都超过10时,秩和t服从正态分布: 先对t进行标准化变换,再利用标准正态分布表,确定检验的临界值。 11212121 /2,1 /12tn nnnn nnn 练习:有a、b两家厂商供应同一种商品,两家商品价格与性能一致,但使用寿命是否一致有待检验。今分别从两家生产产品中抽出样本,测定产品使用寿命(见下表,单位:小时): 试以0.05的显著性水平,检验两厂商产品寿命是否有差异? 解:第一步:作出假设。 h0:ma=mb,h1: 原假设是两厂商生产的产品没有差异,平均寿命相同,备选假设是平均寿

28、命不相同,是双侧检验。abmm 第二步:求秩和。 将样本混合、排列: 以上数据下面划横线的为b厂商产品寿命。b厂商产品样本容量小,看做总体,n1=5。a厂商产品是总体,n2=6。总体的秩和 t=2.5+4.5+6.5+6.5+9.5=29.5。 第三步:确定拒绝域。 显著水平=0.05,进行双侧检验,查“秩和检验表”,n1=5,n2=6,得临界值t1()=20,t2( )=40。 第四步:比较秩和与临界值大小。 结果是:2029.540,即 t1() t t2( ) 。 第五步:判断。 样本落入接受域,所以接受原假设,样本数据证明a、b两厂商产品的寿命也是一致的。 游程检验是适用于独立样本的另一种检验法。游程检游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方法很简单:先把两个样本混合起验的基本原理和计算方法很简单:先把两个样本混合起来,按大小排列,并赋予其秩。那么,当样本所属的总来,按大小排列,并赋予其秩。那么,当样本所属的总体是同分布的话,是不大可能出现来自总体体是同分布的话,是不大可能出现来自总体1的样本全是的样本全是高秩、而来自总体高秩、而来自总体2的样本全是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论