第八假设检验演示文稿_第1页
第八假设检验演示文稿_第2页
第八假设检验演示文稿_第3页
第八假设检验演示文稿_第4页
第八假设检验演示文稿_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八假设检验演示文稿第一页,共八十三页。(优选)第八假设检验第二页,共八十三页。例1统计资料显示,1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异。第三页,共八十三页。从调查结果来看,1990年新生儿的平均体重为3210克,与1989年新生儿平均体重相比,增加了20克。需要考虑的是:20克增加值,是由于抽样造成的?还是这两年新生儿的平均体重确实有显著的差异?第四页,共八十三页。用m0表示1989年新生儿的平均体重,用m表示1990年新生儿的平均体重;则问题“体重有无显著差异”变为“m0=m是否为真?”在上述推导下,可将问题归结为判断如下两个命题,哪个是下确的:m0=mm0≠m第五页,共八十三页。通常将假设:m

=3190称为原假设;原假设有时又称为零假设;表示为:H0:m=m0或者写为:m-m0=0;备择假设:H1:m≠m0或者写为:m-m0≠0注意:原假设与备择假设是互斥的;即它们之间只能有一个为真;第六页,共八十三页。对于上面的例子,因为X是m的无偏估计,也就是说,x在一定程度上反映了m的大小。因此,如果H0成立,则|x-m0|不应该很大,如果|x-m0|过分大,则怀疑H0的正确性,从而拒绝H0,反之则接受H0.换句话说,在H0成立的条件下,事件{|x-m0|很大}是一个小概率事件,因此,对给定的a(0<a<1),适当选择常数k,满足第七页,共八十三页。接下来,需考虑是对于给定的a,如何确定k?当总体X~N(m,s2)时,若H0成立,即m=m0,则故P(|x-m0|>k|H0为真)≤a(1)(1)等价于检验统计量第八页,共八十三页。根据标准正态分布a分位点的定义,并注意到标准正态分布密度函数关于y轴的对称性,得:

取等号使精度最高,得故检测规则为:若,则拒绝H0;若,则接受H0;/

2/

2Z拒绝拒绝临界值临界值对于给定的a,如何确定k?第九页,共八十三页。假设检验的基本思路1、反证法思想——先假定“H0为真”,如果检验中,出现了不合理现象,则表明的假设是错误的,应该拒绝H0;否则接受H0.第十页,共八十三页。假设检验的基本思路2、小概率原理——“小概率原理”认为:小概率事件在一次试验中几乎不可能发生。如果小概率事件在一次试验中居然发生了,则有理由首先怀疑原假设的真实性,从而拒绝原假设。第十一页,共八十三页。“小概率原理”关于“小概率”的值没有统一规定,因为这不是理论问题,而是实际问题;通常的做法是,根据实际问题的要求规定一个显著水平a(0<a<1),当一事件的概率不大于a时,即认为它是小概率事件。a

通常取0.1,0.05,0.01,…第十二页,共八十三页。提示:假设检验中所用的“反证法”与通常在纯数学中使用的反证法是不同的,因为这里所谓的“不合理”现象,并不是形式逻辑中出现的矛盾,而只是根据小概率事件的实际不可能性原理来判断的。第十三页,共八十三页。假设检验的流程(步骤)1.根据实际情况提出原假设(H0)和备择假设(H1);2.选择合适的检验统计量;3.根据样本观察值计算出检验统计量的观察值;4.选定显著水平a,并根据相应统计量的统计分布表查出临界值;5.根据统计量观察值和临界值,作出接受或拒绝H0的判断。第十四页,共八十三页。两类错误在上面的问题中,我们判断的依据是:样本信息(即:用样本来推断总体)。这种推断可能存在错误:(1)原假设是对的,但却被拒绝——犯这种错的概率为a,所以这种错误也称a错误(弃真错误);(2)原假设是错误的,但却被接受了——犯这种错的概率为b,所以这种错误也称b错误(取伪错误);第I类显著错误第II类显著错误第十五页,共八十三页。假设检验中各种可能结果的概率项目没有拒绝H0拒绝H0H0为真1-a(正确决策)a(弃真错误)H0为伪b(取伪错误)

1-b(正确决策)理想情况:弃真错误与取伪错误都很小!现实:在一定样本量的前提下,不能同时做到犯这两种错误的概率都很小!第十六页,共八十三页。想要同时使a和b减小的办法:增大样本容量。由于样本量是有限的,不能无限增加(否则失去抽样的意义),因此,在假设检验中,关键问题在于控制这两类错误(如:在a固定的条件下,尽量减小b)第十七页,共八十三页。注意:接受备择假设,意味着原假设一定是错的;没有拒绝原假设并不能表明备择假设一定是错的.第十八页,共八十三页。在法庭上对被告定罪,总是假定被告无罪(原假设),然后看证据是否能判被告有罪(备择假设).如果证据充分,我们可得出结论(被告有罪);如果证据不充分,我们只能说因证据不足无法认定被告有罪(不能说被告清白).第十九页,共八十三页。H0:m=m0H1:m≠m0由于第一类错误严重性大于第二类错误,因此现实的做法是,通常对犯第I类错误的概率加以控制,然后再适当考虑犯第II类错误的概率。只对犯第I类错误的概率加以控制,而不考虑第II类错误的检验,称为显著性检验问题。第二十页,共八十三页。H0:m=m0,H1:m≠m0

形如上式的假设,称为双边备择假设;形如上式的假设检验,称为双边假设检验;H0:m≤m0,H1:m>m0形如上式的假设检验,称为右边假设检验;H0:m≥m0,H1:m<m0形如上式的假设检验,称为左边假设检验;单边检验第二十一页,共八十三页。单边检验的拒绝域

设总体X~N(m,s2),s为已知,X1,X2,…,Xn是来自X的样本.现给定显著水平a,求检验问题H0:m≤m0,H1:m>m0

的拒绝域.拒绝

Z临界值首先,因为H0中的m都要比H1中的m要小;另外,我们是用样本均值对总体均值进行检验;因此,当H1成立时,观察值x往往偏大,因此,拒绝域的形式应为:x≥k(k为某一常数)第二十二页,共八十三页。拒绝

Z临界值确定常数k的方法.

要控制

P{当H0为真拒绝H0}≤a,令(1.5)第二十三页,共八十三页。

由于拒绝

Z临界值确定常数k的方法.由(1.5)得本问题的拒绝域为:即:第二十四页,共八十三页。同理可得,左边检验

H0:m≥m0,H1:m<m0的拒绝域为:Z拒绝临界值第二十五页,共八十三页。某工厂生产的固体燃料推进器的燃烧率服从正态分布N(m,s2),m=40cm/s,s=2cm/s.现在用新方法生产了一批推进器,从中随机取n=25只,测得燃烧率的样本均值为x=41.25cm/s.设在新方法下总体均方差仍为2cm/s,问用新方法生产的推进器的燃烧率是否较以往生产的推进器燃烧率有显著的提高?取显著水平a=0.05.第二十六页,共八十三页。解:按题意检验假设

H0:m≤m0,H1:m>m0这是右侧检验问题,其拒绝域为:而在本题中

z值落在拒绝域中.因此在显著水平a=0.05下拒绝H0.即认为用新方法生产的推进器的燃烧率较以往生产的有显著提高.第二十七页,共八十三页。思考:本题能否用左侧检验?为什么?对于一个单侧检验问题,能否既用左边检验又用右边检验?对于单侧检验问题,如何提出原假设与备择假设?第二十八页,共八十三页。将目的(想要得到的结果)作为备择假设(H1)进行检验!经过长期检验为是正确的放在(H0)!第二十九页,共八十三页。例:

某种灯泡的质量标准是平均燃烧寿命不得低于1000小时.已知灯泡批量产品的燃烧寿命服从正态分布,且标准差为100小时.商店欲从工厂进货,随机抽取81个灯泡检查,测得x=990小时,问商店是否决定购进这批灯泡?(a=0.05)解:若将上述问题进行左边检验,即:检验统计量为:而Z拒绝临界值

由上述计算可知,z没有落在拒绝域,即可以认为该厂生产的灯泡达到了规定的质量标准.第三十页,共八十三页。例:

某种灯泡的质量标准是平均燃烧寿命不得低于1000小时.已知灯泡批量产品的燃烧寿命服从正态分布,且标准差为100小时.商店欲从工厂进货,随机抽取81个灯泡检查,测得x=990小时,问商店是否决定购进这批灯泡?(a=0.05)若将上述问题进行右边检验,即:检验统计量为:而

由上述计算可知,z没有落在拒绝域,即可以认为该厂生产的灯泡没有达到了规定的质量标准.拒绝

Z临界值第三十一页,共八十三页。左右检验得出的结论不一样,出现了一种情况下的推断似乎矛盾的现象.其实,这也反映了统计推断的一种特点,它不是简单地按’非此即彼’的逻辑.第一种假设的背景是,从过去的历史记录看,灯泡厂有良好的声誉,商店相信该厂的质量一贯是不错的,于是选择m≥m0作为原假设.这样做对厂家有利,因为这使得达到质量标准的产品只以很低的概率(a)被拒收(弃真错误).虽然这会使商店面临接受不合格产品的风险,但厂家良好的历史记录显示了这种情况可能性很小.第三十二页,共八十三页。第二种假设的背景的是,以往的记录表明,厂家的产品质量不是很好,这时,商店坚持以m≤m0作为原假设.这样做,表明商店要求有较强的证据才相信这批产品质量达到了标准.这就类似于说,一个人一向表现不好,则必须有显著的好的表现,才能让人相信他确有进步.这样做,就达到了至少把100(1-a)%的不合格产品拒之门外.特别说明:本例的讲解,是告诉同学们,在应用的时候,需要考虑问题的背景,是作为知识传授的一部分.考试时,对假设检验问题的求解,在提原假设与备择假设时,仍按前文所讲的要求来.第三十三页,共八十三页。§2正态总体均值的假设检验第三十四页,共八十三页。一、单个正态总体N(m,s2)均值的m检验1.s2已知,关于m的检验(Z检验)

在当前条件下,前一节已经讨论了该检验问题.不论是双侧还是单侧(左侧,右侧)检验问题,都是用统计量来确定拒绝域.这种检验方法又称为Z检验法.第三十五页,共八十三页。单个正态总体N(m,s2)均值的m检验2.s2未知,关于m的检验(t检验)含有未知量,因此不能用其来来确定拒绝域.注意到样本方差S2是总体方差s2的无偏估计,因此用S代替s,采用作为检验统计量.

此时,由于s未知,统计量假设:H0:m=m0,H1:m≠m0.第三十六页,共八十三页。单个正态总体N(m,s2)均值的m检验又由于当H0为真时,,故由

其拒绝域形式为:当样本观测值过分大时,就拒绝H0.P{当H0为真拒绝H0}=,得即:拒绝域为:双侧检验的拒绝域第三十七页,共八十三页。单侧检验H0:m1≤m0H1:m1>m0拒绝域:t≥H0:m1≥m0H1:m1<m0拒绝域:t≤第三十八页,共八十三页。在实际问题中,正态总体均值与方差常为未知,经常用t检验法来检验关于正态总体均值的检验问题.第三十九页,共八十三页。例:某种元件的寿命X(以小时计)服从正态分布N(m,s2).m,s2均未知.现测得16只零件的寿命如下:159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225(小时)?取显著水平为0.05.第四十页,共八十三页。解:按题意,提出如下右边假设:

H0:m≤m0,H1:m>m0

且其拒绝域为:又由已知,可求得:n=16,t0.05(15)=1.7531,x=241,s=98.7259,即:t没有落在拒绝域中,故接受H0,认为元件的平均寿命不大于225小时.第四十一页,共八十三页。二、两个正态总体N(m,s2)均值差的检验(t检验)

设X1,X2,…,Xn1是来自正态总体N(m1,s2)的样本,Y1,Y2,…,Yn2是来自正态总体N(m2,s2)的样本,且设两样本独立.

分别记它们的样本均值为X,Y,记样本方差分别为

,.设m1,m2,s2均为未知.求检验问题:(d为已知常数)的拒绝域.(取显著水平为a)第四十二页,共八十三页。引入t统计量作为检验统计量:其中:由P{当H0为真时拒绝H0}得于是拒绝域为:第四十三页,共八十三页。拒绝域为:或第四十四页,共八十三页。在实际工作中,经常要处理的是d=0的情况.即:要检验两个总体均值是否相等的问题.第四十五页,共八十三页。单侧检验H0:m1-m2≤dH1:m1-m2>d拒绝域:t≥H0:m1-m2≥dH1:m1-m2<d拒绝域:t<第四十六页,共八十三页。例2在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一平炉上进行的。每炼一炉钢时除操作方法外,其它条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼了10炉,其得率分别为:(1)标准方法78.172.476.274.377.478.476.075.576.777.3(2)新方法79.181.077.379.180.079.179.177.380.282.1设这两个样本相互独立,且分别来自正态总体N(m1,s2)和N(m2,s2),m1,m2,s2均未知.问建议的新操作方法能否提高得率?(取a=0.05)单侧检验第四十七页,共八十三页。解:根据题意,需要检验假设:H0:m1-m2≥0H1:m1-m2<0标准方法与新方法下的样本均值与方差分别为:由于因此拒绝H0,认为新操作方法比原来的方法好.第四十八页,共八十三页。三、基于成对数据的检验例3:

有两台光谱仪Ix,Iy,用来测量材料中某种金属的含量,为鉴定它们的测量结果有无显著差异,制备了9件试块(它们的成份,金属含量,均匀性等均各不相同),现在分别用这两台仪器对每一块测量一次,得到9对观察值如下:x(%)0.200.300.400.500.600.700.800.901.00y(%)0.100.210.520.320.780.590.680.770.89d=x-y(%)0.10.09-0.120.18-0.180.110.120.130.11问:能否认为这两台仪器的测量结果有显著差异(取a=0.01)?第四十九页,共八十三页。三、基于成对数据的检验成对数据检验的一般提法:设有n对相互独立的的观察结果:(X1,Y1),:(X2,Y2),…,(Xn,Yn).令D1=X1-Y1,D2=X2-Y2,…,Dn=Xn-Yn,则D1,D2,…,Dn相互独立.又由于D1,D2,…,Dn是由同一因素引起的,可认为它们服从同一分布.现设,i=1,2,…,n.其中未知.需要基于上述样本的假设检验:H0:mD=0,H1:mD≠0;(双侧检验)H0:mD≤0,H1:mD>0;(右侧检验)H0:mD≥0,H1:mD<0(左侧检验)第五十页,共八十三页。分别记D1,D2,…,Dn的样本均值与方差为:.则所要进行的检验可视为总体方差未知的单个正态变量均值的检验(t检验),其拒绝域分别为:双侧检验右侧检验左侧检验第五十一页,共八十三页。对于例3,按题意(两台仪器的测量结果是否有显著差异),需要检验假设H0:mD=0,H1:mD≠0;(双侧检验)在例3中,n=9,ta/2(8)=t0.005(8)=3.3554,因此拒绝域为:而观察值为:

即|t|的值不落在拒绝域内,故接受H0,认为两台仪器的测量结果无显著差异.:第五十二页,共八十三页。§3正态总体方差的假设检验第五十三页,共八十三页。(一)单个总体的情况

设总体X~N(m,s2),m,s2均未知,X1,X2,…,Xn是来自X的样本.要求检验假设(显著水平为a):为已知常数.P{当H0为真时拒绝H0}=a

由于S2是s2的无偏估计,因此当H0为真时,观察值s2与的值应差不多大(否则就怀疑H0的正确性了),也就是说,应与”1”很接近,因此,{过大或过小}是小概率事件.即:双侧检验第五十四页,共八十三页。(一)单个总体的情况

设总体X~N(m,s2),m,s2均未知,X1,X2,…,Xn是来自X的样本.要求检验假设(显著水平为a):为已知常数.为计算方便,习惯上取双侧检验第五十五页,共八十三页。(一)单个总体的情况

设总体X~N(m,s2),m,s2均未知,X1,X2,…,Xn是来自X的样本.要求检验假设(显著水平为a):为已知常数.故得因此,拒绝域为:或双侧检验第五十六页,共八十三页。单侧检验(右边检验)

H0中的全部s2都比H1中的s2要小,因此,当H1为真时,S2的观察值s2往往偏大,因此拒绝域的形式为:s2≥k

常数k的确定(控制犯第一类错误的概率):P{当H0为真时拒绝H0}第五十七页,共八十三页。单侧检验(右边检验)

要控制P{当H0为真时拒绝H0}≤a,令

因为由(3.3)得:于是有:第五十八页,共八十三页。单侧检验(右边检验)拒绝域为:第五十九页,共八十三页。单侧检验(左边检验)拒绝域为:第六十页,共八十三页。例1某厂生产的某种型号的电池,其寿命(以小时计)长期以来服从方差s2=5000的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变.现随机取26只电池,测出其寿命的样本方差s2=9200.问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取a=0.02)?解:在水平a=0.02下检验如下假设:H0:s2=5000,H1:s2≠5000在本题中:n=26,因此其拒绝域为:或由观察值s2=9200得:所以,拒绝H0,认为这批电池寿命的波动性较以往有显著变化.第六十一页,共八十三页。(二)两个总体的情况设X1,X2,…,Xn1是来自总体的样本,Y1,Y2,…,Yn2是来自的样本,且两样本独立.其样本方差分别为且设均为未知.现在需要检验假设(显著水平为a)第六十二页,共八十三页。常数k的确定第六十三页,共八十三页。因此检验问题的拒绝域是:右边检验第六十四页,共八十三页。左边检验问题的拒绝域是:左边检验第六十五页,共八十三页。双侧检验问题的拒绝域是:双侧检验或第六十六页,共八十三页。例2在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一平炉上进行的。每炼一炉钢时除操作方法外,其它条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼了10炉,其得率分别为:(1)标准方法78.172.476.274.377.478.476.075.576.777.3(2)新方法79.181.077.379.180.079.179.177.380.282.1问:新旧方法得率的方差是否有显著差异(取a=0.01)第六十七页,共八十三页。解:在本例中,n1=n2=10,a=0.01显然没有落在拒绝域因此,接受H0,认为两总体方差是相等的.第六十八页,共八十三页。§4置信区间与假设检验

之间的关系第六十九页,共八十三页。区间估计与假设检验的不同点:目的不同:区间估计的目的是对未知参数的一个取值变化的范围(区间)的检验;假设检验则是对已经给出的有关未知参数的一个说法(结论)作检验,看这个说法是不是该被推翻(拒绝);态度不同:对未知参数给出估计的取值区间时,应该有相当大的把握,即应该有相当大的概率(1-a),并称其置信度;假设检验是要在已经出给的有关未知参数这个说法(假设)的条件下,确定对不能接受这个假设的容忍界限,从而制造一个小概率事件:当概率小到a以下时,便断然拒绝已经给出的说法(假设).由于a常常很小,因此假设检验对”原假设”有相当大的偏袒:不是非常有把握不拒绝原假设;第七十页,共八十三页。区间估计与假设检验的不同点(续):对未知参数给出的估计区间,是随机区间,选用的样本函数因为含有未知参数而不是统计量;假设检验在给出的假设条件下,所有的样本函数不再含有未知参数而是统计量.当显著性水平a给定后,统计量的拒绝域是确定的区间,而不是随机区间;双侧区间估计的随机区间是数直线当中一个较大的区间,双侧假设检验中统计量的拒绝域在数直线的”两侧”(两头);第七十一页,共八十三页。设X1,X2,…,Xn是一个来自总体X的样本x1,x2,…,xn是相应的样本值,Q是参数q的可能取值范围.设是参数q的一个置信水平为1-a的置信区间,则对任何qQ有,考虑显著水平为a的双边检验

H0:q=q0,H1:q≠q0(4.2)由(4.1)得

即:由显著水平为a的假设检验的定义,(4.2)的拒绝域为:

或接受域为:

第七十二页,共八十三页。也就是说,当我们要对假设(4.2)进行显著性检验(显著水平为a)时,可先求出参数q的置信水平为1-a的置信区间,然后看这个区间是否包含q0;若q0,则接受H0;若q0,则拒绝H0;第七十三页,共八十三页。反之,对于任意q0Q,考虑显著性水平为a的假设检验问题若其接受域为即:由q0的任意性知,对于q0Q,有:也就是说,是参数q的一个置信水平为1-a的置信区间.第七十四页,共八十三页。例1设X~N(m,1),m未知,a=0.05,n=16,且由一个样本算得x=5.20.则参数m的一个置信水平为1-a的置区间是考虑相应的假设检验问题H0:m=5.5,H1:m≠5.5.

由于5.5(4.71,5.69),故接受H0.第七十五页,共八十三页。单侧置信区间与假设检验的关系可类似讨论.-略第七十六页,共八十三页。§5样本容量的选取

(介绍性内容)第七十七页,共八十三页。在假设检验中,主要考虑的控制犯第一类错误的风险(概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论