第七章 假设检验课件_第1页
第七章 假设检验课件_第2页
第七章 假设检验课件_第3页
第七章 假设检验课件_第4页
第七章 假设检验课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1Hypothesis Test 7.1 7.1 假设检验假设检验的基本概念的基本概念 7.1.1 7.1.1 假设检验假设检验问题问题主页主页 退出退出 2一、假设检验的提出一、假设检验的提出参数估计是统计推断的一个参数估计是统计推断的一个 主要方面主要方面假设检验是统计推断的另一个假设检验是统计推断的另一个 主要方面主要方面参数估计:讨论如何根据样本去得到总体分布所含参数的优良估计参数估计:讨论如何根据样本去得到总体分布所含参数的优良估计假设检验:讨论怎样在样本的基础上考察上面所得到的估计值与真假设检验:讨论怎样在样本的基础上考察上面所得到的估计值与真 实值之间在统计意义上相拟合,从而做出

2、一个有较大把握的结论实值之间在统计意义上相拟合,从而做出一个有较大把握的结论例如:设某厂生产一种灯管,其寿命例如:设某厂生产一种灯管,其寿命XN( ,40000),从过去较长一段从过去较长一段时间的生产情况看,灯管的平均寿命为时间的生产情况看,灯管的平均寿命为 =1500小时,现在使用了新小时,现在使用了新工艺后,在所生产的灯管中抽取工艺后,在所生产的灯管中抽取25只,测得的平均寿命为只,测得的平均寿命为1675小时,小时,问:采用新工艺后,灯管问:采用新工艺后,灯管 的寿命是否有显著提高?的寿命是否有显著提高?拒绝拒绝H0(接受接受H1)-新产品寿命有显著提高新产品寿命有显著提高接受接受H0

3、 -新产品的寿命没有显著提高新产品的寿命没有显著提高H1:新产品的寿命新产品的寿命 1500考虑:为判别新产品的寿命是否提高考虑:为判别新产品的寿命是否提高,提出以下两个提出以下两个假设假设(hypothesis)H0:新产品的寿命新产品的寿命 =1500备择假设备择假设(H1) (alternative hypothesis)原假设(或零假设原假设(或零假设H0)(null hypothesis)注意注意:一般情况下一般情况下,我们选取我们选取 可能或希望成立的假设作为备择假设可能或希望成立的假设作为备择假设 (H1), 而将其否定形式作为原假设而将其否定形式作为原假设(H0) 有时,原假设

4、的选定还要考虑数学上的处理方便有时,原假设的选定还要考虑数学上的处理方便假设检验问题的处理方法假设检验问题的处理方法 1 1、对总体分布中的某些参数或对总体分布的类型做某种假设、对总体分布中的某些参数或对总体分布的类型做某种假设 2 2、根据样本值做出接受还是拒绝所做假设的结论、根据样本值做出接受还是拒绝所做假设的结论提出假设提出假设(例题分析例题分析)解:研究者想收集证据予以证明的假解:研究者想收集证据予以证明的假设应该是设应该是“生产过程不正常生产过程不正常”。建立。建立的原假设和备择假设为的原假设和备择假设为 H0 : 10cm H1 : 10cm 提出假设提出假设(例题分析例题分析)解

5、:研究者抽检的意图是倾向于解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并证实这种洗涤剂的平均净含量并不符合说明书中的陈述不符合说明书中的陈述 。建立的。建立的原假设和备择假设为原假设和备择假设为 H0 : 500 H1 : 500500g提出假设提出假设(例题分析例题分析)6参数假设检验参数假设检验非参数假设检验非参数假设检验假设检验假设检验1、假设假设(hypothesis) :在数理统计中,把对总体分布的各种论断:在数理统计中,把对总体分布的各种论断 称为称为 统计假设,简称为统计假设,简称为假设假设(1)、参数假设参数假设:关于总体分布中的参数的假设。:关于总体分布中的参数的假

6、设。(2)、非非参数假设参数假设:不是关于总体分布中的参数的假设:不是关于总体分布中的参数的假设如:如:H0 :F(x) 对数正态分布族对数正态分布族 H1: F(x) 正态分布族正态分布族二、假设检验的基本概念二、假设检验的基本概念2、假设检验假设检验(hypothesis test) : 在数理统计中,在数理统计中, 称判断假设是否成立的方法称为称判断假设是否成立的方法称为假设检验假设检验. .依据假设的类型假设检验可分为:依据假设的类型假设检验可分为:以下我们主要研究参数假设检验问题以下我们主要研究参数假设检验问题73、假设检验问题、假设检验问题 a、对总体分布中的某些参数或对总体分布的

7、类型做某种假设、对总体分布中的某些参数或对总体分布的类型做某种假设 b、根据样本值做出接受还是拒绝所做假设的结论、根据样本值做出接受还是拒绝所做假设的结论具体地说:具体地说:(1)如果一个检验问题只提出一个假设,而我们的目的也是如果一个检验问题只提出一个假设,而我们的目的也是为了判断这一假设是否成立,并不同时研究其他假设问题,为了判断这一假设是否成立,并不同时研究其他假设问题,这类假设检验问题成为这类假设检验问题成为显著性检验问题显著性检验问题(2) 一个检验问题可能提出两个甚至更多个假设。一个检验问题可能提出两个甚至更多个假设。 如果一个检验问题提出两个假设如果一个检验问题提出两个假设(设为

8、设为H0 -H1),且二者必,且二者必居其一,则称其中一个为居其一,则称其中一个为基本假设基本假设(零假设或原假设),(零假设或原假设),另一个为它的另一个为它的对立假设对立假设(备择假设)(备择假设) 本章所讨论的假设检验问题就是利用样本的信息在原假本章所讨论的假设检验问题就是利用样本的信息在原假设设H0与备择假设与备择假设H1之间做出拒绝哪一个接受哪一个的判断,之间做出拒绝哪一个接受哪一个的判断,这类假设检验问题成为这类假设检验问题成为H0对对H1的检验问题的检验问题8 7.1.2 7.1.2 假设检验假设检验的基本思想的基本思想一、检验法一、检验法1、 从样本从样本(X1, X2, ,

9、Xn)出发,构造出一个是用于检验出发,构造出一个是用于检验H0的统计的统计量,并且,当量,并且,当 H0 成立时,统计量成立时,统计量T的分布或渐近分布是已知的,的分布或渐近分布是已知的,2、制定一个对每一样本观测值都可明确的决定拒绝还是接受、制定一个对每一样本观测值都可明确的决定拒绝还是接受 H0的法则,在样本值的法则,在样本值 (x1, x2, , xn)确定之后,按照这个确定之后,按照这个法则做出判法则做出判断拒绝断拒绝H0 ,还是,还是拒绝拒绝H1 ,这个法则这个法则 称为称为H0对对H1的的检验法则检验法则 二、二、 检验法则检验法则 - 在样本值在样本值 (x1, x2, , xn

10、)确定之后,确定之后,统计统计量的值量的值T也也确定了,把确定了,把统计量的所有可能的取值分为两个集合统计量的所有可能的取值分为两个集合 E与与,其中其中P(T E)=( (很小)很小) ,根据小概率事件原理:,根据小概率事件原理: 如果如果T E , 则拒绝原假设则拒绝原假设H0 (即接受备择假设即接受备择假设H1) 如果如果T , 则接受原假设则接受原假设H0 (即拒绝备择假设即拒绝备择假设H1 ) 检验法则检验法则统计量统计量T常选为要检验的参数的点估计常选为要检验的参数的点估计若样本值若样本值 (x1, x2, , xn) WW若样本值若样本值 (x1, x2, , xn) 称为显著性

11、水平称为显著性水平 (Level of significance) ( (或检验水平或检验水平) ),W称为拒绝域称为拒绝域 , 称为接受域称为接受域WP(X1, X2, , Xn) W )=( (很小)很小)样本值样本值 (x1, x2, , xn)分为两个集合分为两个集合 W与与W = 50 H0成立时的成立时的三、假设检验问题的一般步骤三、假设检验问题的一般步骤 1 1、根据问题的要求提出原假设、根据问题的要求提出原假设H0和备择假设和备择假设H1 2 2、选取检验统计量、选取检验统计量T( (X1, X2, , Xn) ,在,在H0成立的情形下,确定成立的情形下,确定其分布。对于给定的

12、显著性水平其分布。对于给定的显著性水平aa, ,找到找到H0的拒绝域的拒绝域W和接受域和接受域 3 3、如果根据样本值、如果根据样本值(x1, x2, , xn)求出的检验统计值求出的检验统计值T ,出现了,出现了(x1, x2, , xn) W (小概率事件发生了小概率事件发生了), 则拒绝则拒绝 H0 ,否则否则接受接受H0WH0成立时的成立时的 H0成立时的成立时的13 7.1.3 7.1.3 假设检验中的两类错误假设检验中的两类错误一、第一类错误:拒真一、第一类错误:拒真 P(拒绝拒绝H0| H0 为真为真)=犯第一类错误的概率犯第一类错误的概率即即 P( x1, x2, , xn)

13、W | H0 为真为真)=假如我们给出了假如我们给出了H0对对H1的的某个检验法则某个检验法则,也有了样本也有了样本 (x1, x2, , xn) 的的拒绝域拒绝域 W ,和接受域,和接受域 ,但由于样本的随机性,在进行,但由于样本的随机性,在进行判断时,还是有可能犯两类错误:判断时,还是有可能犯两类错误:W二、第二类错误:受伪二、第二类错误:受伪 P(接受接受H0| H0 为假为假)=犯第二类错误的概率犯第二类错误的概率即即 P( x1, x2, , xn) | H0 为假为假)= W1415161718H0 检验检验决策决策总体情况总体情况H0为真为真H0为假为假接受接受H0正确决策正确决

14、策(1 a a) )第第类错误类错误( (bb) )拒绝拒绝H0第第类错误类错误( (aa) )正确决策正确决策(1-(1-bb) ) 我们希望进行假设检验时,所找到的我们希望进行假设检验时,所找到的W W能使能使犯第两类错误的概率犯第两类错误的概率都很小,但在样本容量给定后,要使都很小,但在样本容量给定后,要使aa、bb都很小是不可能的,都很小是不可能的,否则将会导致否则将会导致样本容量无限增大样本容量无限增大, ,这又是不切实际的。这又是不切实际的。基于这种考虑基于这种考虑, ,奈曼与皮尔逊奈曼与皮尔逊( (Neyman-Pearson) )提出一个原则提出一个原则即即在控制犯第一类错误在

15、控制犯第一类错误a a的条件下,尽量使犯第二类错误的条件下,尽量使犯第二类错误b b 小小( 人们常常把拒真比受伪人们常常把拒真比受伪 看的更重些)看的更重些)197.2 7.2 一个正态总体的参数假设检验一个正态总体的参数假设检验7.2 .7.2 .1 均值均值 的的假设检验假设检验设总体设总体X N( , 2),考虑参数考虑参数 , 2的假设检验的假设检验, ,检验水平为检验水平为a a样本样本 (X1, X2, , Xn) 来自总体来自总体X 。考虑均值考虑均值 的三种形式的的三种形式的假设假设(1(1) H0 : 0 H1 : 0(2) (2) H0 : 0 H1 : 0 (3) (3

16、) H0 : 0 H1 : 0其中其中 0 是某个给定的数是某个给定的数单边检验单边检验双边假设双边假设单边假设单边假设双边检验双边检验20一、一、 2已知(已知(U检验法)检验法) 设总体设总体X N( , 2), 2 = 02已知,已知, 是是待检待检参数参数, ,检验水平为检验水平为a a样本样本 (X1, X2, , Xn) 来自总体来自总体X 。 由于样本均值由于样本均值 是总体是总体 的好的估计量,的好的估计量, 是是待检待检参数参数, ,检验水平为检验水平为 a a ,(X1, X2, , Xn) 来自总体来自总体X 。当当H0为真时,为真时, 的取值应在的取值应在 0 的附近,

17、而的附近,而 所以对所以对 XXXN( , 2/n) ) 1 , 0(NnU X即即 当当H0为真时,为真时,U 的取值应的取值应在在 0 的附近,这时,若一次抽样的附近,这时,若一次抽样所得样本值使得所得样本值使得 U 的值太大或太小,的值太大或太小,就应该拒绝就应该拒绝H0 检验水平为检验水平为a a时,对双侧检验,拒绝域时,对双侧检验,拒绝域2W = U : | U |ua a 21) 1 , 0(NnU X检验水平为检验水平为a a时,拒绝域时,拒绝域2(1) W=U: | U|u a a 考虑考虑 2已知时已知时均值均值 的三种形式的的三种形式的假设假设(1(1) H0 : 0 H1

18、 : 0(2) (2) H0 : 0 H1 : 0 (3) (3) H0 : 0 H1 : 0其中其中 0 是某个给定的数是某个给定的数(2) W=U: Uu a a (3) W=U: Uu a a Oa a-Ua aOUa aa aOa a/2Ua a/2a a/2-Ua a/222求得求得U=1.08例例1 1:某厂一车间生产一零件,其直径据经验服从:某厂一车间生产一零件,其直径据经验服从N( , 5.2),为了检验这一车床生产是否正常,现抽取容量为为了检验这一车床生产是否正常,现抽取容量为 n=100的样本,的样本,样本均值样本均值x =26.56,要求在显著性水平要求在显著性水平a a

19、 = 0.05下检验双边假设下检验双边假设H0 : 2626) 1 , 0(NnU X解:方差解:方差 2 2=5.2=5.2已知,利用公式已知,利用公式而由而由a a = 0.05= 0.05,查标准正态分布表得,查标准正态分布表得Ua a/2/2=U=U0.0250.025=1.96=1.96可见可见 |U|=1.081.96=1.96=Ua a/2/2=U=U0.0250.025Oa a/2Ua a/2a a/2-Ua a/2所以不能拒绝原假设所以不能拒绝原假设H0 : 2626因而认为因而认为生产是正常的生产是正常的23求得求得U=1.08例例2 2:某厂一车间生产一零件,其直径据经验

20、服从:某厂一车间生产一零件,其直径据经验服从N( , 5.2),为了检验这一车床生产是否正常,现抽取容量为为了检验这一车床生产是否正常,现抽取容量为 n=100的样本,的样本,样本均值样本均值x =26.56,要求在显著性水平要求在显著性水平a a = 0.05下检验右边假设下检验右边假设H0 : 2626H1 : 2626) 1 , 0(NnU X解:方差解:方差 2 2=5.2=5.2已知,利用公式已知,利用公式而由而由a a = 0.05= 0.05,查标准正态分布表得,查标准正态分布表得Ua a=U=U0.050.05=1.64=1.64可见可见 U=1.081.64=1.64=Ua

21、a=U=U0.050.05OUa aa a所以不能拒绝原假设所以不能拒绝原假设H0 : 2626因而认为因而认为生产是正常的生产是正常的24求得求得U=1.08例例3 3:某厂一车间生产一零件,其直径据经验服从:某厂一车间生产一零件,其直径据经验服从N( , 5.2),为了检验这一车床生产是否正常,现抽取容量为为了检验这一车床生产是否正常,现抽取容量为 n=100的样本,的样本,样本均值样本均值x =26.56,要求在显著性水平要求在显著性水平a a = 0.05下检验左边假设下检验左边假设H0 : 2626H1 : 2626) 1 , 0(NnU X解:方差解:方差 2 2=5.2=5.2已

22、知,利用公式已知,利用公式而由而由a a = 0.05= 0.05,查标准正态分布表得,查标准正态分布表得Ua a=U=U0.050.05=1.64=1.64可见可见 -Ua a=-U=-U0.050.05=-1.64 =-1.64 1.08=U所以不能拒绝原假设所以不能拒绝原假设H0 : 2626因而认为因而认为生产是正常的生产是正常的Oa a-Ua a25二、二、 2未知(未知(T检验法)检验法) 设总体设总体X N( , 2), 2 = 02未知,未知, 是是待检待检参数参数, ,检验水平为检验水平为a a样本样本 (X1, X2, , Xn) 来自总体来自总体X 。 由于样本均值由于样

23、本均值 是总体是总体 的好的估计量,的好的估计量, 是是待检待检参数参数, ,检验水平为检验水平为 a a ,(X1, X2, , Xn) 来自总体来自总体X 。当当H0为真时,为真时, 的取值应在的取值应在 0 的附近,而的附近,而 2未知未知所以自然想到以所以自然想到以S代替代替 XXXN( , 2/n)Xt(n-1)STn 即即 当当H0为真时,为真时,T 的取值应的取值应在在 0 的附近,这时,若一次抽样的附近,这时,若一次抽样所得样本值使得所得样本值使得 T 的值太大或太小,的值太大或太小,就应该拒绝就应该拒绝H0 检验水平为检验水平为a a时时,对双侧检验对双侧检验,拒绝域拒绝域2

24、 W =T : | T |ta a 26Xt(1)TnnS 检验水平为检验水平为a a时,拒绝域时,拒绝域2(1) W=T: |T|t (1)na a 考虑考虑 2未知时未知时均值均值 的三种形式的的三种形式的假设假设(1(1) H0 : 0 H1 : 0(2) (2) H0 : 0 H1 : 0 (3) (3) H0 : 0 H1 : 0其中其中 0 是某个给定的数是某个给定的数(2) W=T: T(1)na a t t(3) W=T: Tt (1)na a 1.98=1.98=ta a/2/2=t=t0.0250.025所以拒绝原假设所以拒绝原假设H0 : 6565因而认为因而认为这种型号

25、的玻璃纸没有达到横向延伸率的指标这种型号的玻璃纸没有达到横向延伸率的指标2115 8181niiS( XX ).n 解:方差解:方差 2 2 未知,利用公式未知,利用公式由样本算出由样本算出45 06x. X1t(1)TnnS Oa a/2ta a/2a a/2-ta a/2287.2 .7.2 .2 方差方差 2 的的假设检验假设检验考虑考虑方差方差 2的三种形式的的三种形式的假设假设(1(1) H0 : 2 02 H1 : 2 0 2(2) (2) H0 : 2 0 2 H1 : 2 02(3) (3) H0 : 2 0 2 H1 : 2 0 2其中其中 0 2 是某个给定的数是某个给定的

26、数29一、一、 已知(已知( 2检验法)检验法) 设总体设总体X N( , 2), = 0已知,已知, 2是是待检待检参数参数, ,检验水平为检验水平为 a a样本样本 (X1, X2, , Xn) 来自总体来自总体X 。 由于样本方差是总体由于样本方差是总体 2 的好的估计量,的好的估计量, 当当H0: 2 02为真时,为真时, S2 的取值应在的取值应在 0 2 的附近,但的附近,但 = 0已知,已知,所以对所以对S2 中的样本均值,用总体均值替代更加准确,既有中的样本均值,用总体均值替代更加准确,既有即即 当当H0为真时,为真时, 2的取值应的取值应在在 n 的附近,这时,若一次抽样的附

27、近,这时,若一次抽样所得样本值使得所得样本值使得 2 的值太大或太小,的值太大或太小,对双侧检验,对双侧检验,就应该拒绝就应该拒绝H0检验水平为检验水平为a a时,对双侧检验,拒绝域时,对双侧检验,拒绝域W22222122W=: (n)(n)a aa a XX22222111()() ( )nniiiin /2a2/2(n)a21/2(n)a niin12211)(XXSX222221(1)1() (1)niinSXn 30检验水平为检验水平为 a a 时,拒绝域时,拒绝域W22222122(1) W=: (n)(n)a aa a 考虑考虑方差方差 2的三种形式的的三种形式的假设假设(1(1)

28、 H0 : 2 02 H1 : 2 0 2(2) (2) H0: 2 0 2 H1 : 2 02(3) (3) H0 : 2 0 2 H1 : 2 0 2 222(2) W=: (n)a a 2221(3) W=:(n)a a a a2(n)a a a21(n)a/2a2/2(n)a21/2(n)a31二、二、 未知(未知( 2检验法)检验法) 设总体设总体X N( , 2), = 0未知,未知, 2是是待检待检参数参数, ,检验水平为检验水平为 a a样本样本 (X1, X2, , Xn) 来自总体来自总体X 。 由于样本方差由于样本方差S2是总体是总体 2 的好的估计量,的好的估计量, 当

29、当H0: 2 02为真时,为真时, S2 的取值应在的取值应在 0 2 的附近,所以对的附近,所以对 即即 当当H0为真时,为真时, 2的取值应的取值应在在 n-1 的附近,这时,若一次抽样的附近,这时,若一次抽样所得样本值使得所得样本值使得 2 的值太大或太小,的值太大或太小,对双侧检验,对双侧检验,就应该拒绝就应该拒绝H0检验水平为检验水平为a a时,对双侧检验,拒绝域时,对双侧检验,拒绝域W22222122W=: (n1)(n1)aaaa X2222221(1)1() (1)niinSXn /2a2/2(n 1)a21/2(n 1)a32检验水平为检验水平为 a a 时,拒绝域时,拒绝域

30、W22222122(1) W=: (n 1)(n 1)a aa a 考虑考虑方差方差 2的三种形式的的三种形式的假设假设(1(1) H0 : 2 02 H1 : 2 0 2(2) (2) H0: 2 0 2 H1 : 2 02(3) (3) H0 : 2 0 2 H1 : 2 0 2 222(2) W=: (n-1)a a 2221(3) W=: (n-1)a a 43.8= 2 0.05 0.05 (30)所以拒绝原假设所以拒绝原假设H0 : 2 2 0.18说明自动机床工作说明自动机床工作一段时间后精度一段时间后精度变差变差例例1 1:一自动机床加工零件的长度服从:一自动机床加工零件的长度

31、服从N( , 2 2),原来加工精度为,原来加工精度为02 2 =0.18,经过一段时间后,要检验一下这一车床生产是否保持经过一段时间后,要检验一下这一车床生产是否保持原来加工精度,即原来加工精度,即检验检验H0 : 2 2 0.18, H1 : 2 2 0.18 ,为此为此抽取这车床所加工抽取这车床所加工 n=31n=31个个零件零件,测得数据如下表所示,测得数据如下表所示,要求在要求在显著性水平显著性水平a a = 0.05下检验右边假设。下检验右边假设。1 3 7 10 6 3 110.1 10.3 10.6 11.2 11.5 11.8 12.0频数频数ni零件长度零件长度xiX222

32、2221(1)1() (1)niinSXn a a2(n-1)a a 347.3 7.3 两个正态总体的参数假设检验两个正态总体的参数假设检验7.3 .7.3 .1两个正态总体两个正态总体均值的均值的差异性检验差异性检验设样本设样本(X1,X2, ,Xn1) 来自正态总体来自正态总体XN( 1 , 12), (Y1, Y2, , Y n2) 来自正态总体来自正态总体YN( 2 , 22),并假定并假定X 与与 Y 相互独立相互独立,检验水平为检验水平为a a考虑三种形式的考虑三种形式的假设假设(1(1) H0: 1 2 H1: 1 2 (2) (2) H0: 1 2 H1: 1 2 (3) (

33、3) H0: 1 2 H1: 1 2 若令若令 = 1 - 2,则变为,则变为(1(1* *) H0* *: 0 H1* *: 0(2(2* *) ) H0* *: 0 H1* *: 0(3(3* *) ) H0* *: 0 H1* *: 0351、 12 , 22都都已知已知22121212Y N(,)nn X 样本样本(X1,X2, ,Xn1) 来自总体来自总体XN( 1 , 12), (Y1, Y2, , Y n2) 来自总体来自总体YN( 2 , 22),并假定,并假定X 与与 Y 相互独立相互独立由于由于令令 = 1 - 2 ,当,当H0* *: 0 成立成立时,有时,有221212

34、Y N(0,)nn X即即221212() (0,1)nn XYUN即当即当H0* *: 0 为真为真时时,U的取值的取值在在0附近,从而附近,从而检验水平为检验水平为a a时时拒绝域拒绝域W分别由下式得到分别由下式得到2(1) W=U: | U|u a a (2) W=U: Uu a a (3) W=U: Uu a a 362、 12 ,= 22= 2 ,但但 2未知未知 由由 定理(定理(5.105.10)122211221212() (n +n2)(n1)(n1)11(n +n2)nnt XYTSS-即当即当H0* *: 0 成立成立时时,T的取值的取值在在0附近,从而附近,从而检验水平

35、为检验水平为a a时时拒绝域拒绝域W分别见下式分别见下式122(1) W=T: | T|t (n +n2)a a 12(2) W=T: T(n +n2)a a t t12(3) W=T: Tt (n +n2)a a Oa a-ta aOta aa aOa a/2ta a/2a a/2-ta a/237解:解:依题意提出假设依题意提出假设 H0: 1 2 H1: 1 2 例例1 1:卷烟一厂向化验室送去:卷烟一厂向化验室送去A,BA,B两种烟草,化验尼古丁的含量是否两种烟草,化验尼古丁的含量是否相同,从相同,从A,BA,B中各随机抽取重量相同的中各随机抽取重量相同的5 5例进行化验,测得尼古丁的

36、例进行化验,测得尼古丁的含量含量( (单位单位: :毫克毫克) ),并由此得到,并由此得到: :拒经验知拒经验知,A A的尼古丁含量服从的尼古丁含量服从N( 1 ,5 5),B,B的尼古丁含量服从的尼古丁含量服从N( 2 ,8 8). 问问两种烟草的尼古丁平均含量两种烟草的尼古丁平均含量 1、 2 是否有差异(是否有差异(a a = 0.05)24.4 X 毫毫克克27Y 毫毫克克由于由于 12 , 22都都已知,故已知,故利用公式利用公式求出求出U=1.612而而 a a = 0.05,查标准正态分布表得,查标准正态分布表得Ua a/2= U 0.025= 1.96可见可见 | U |= 1

37、.612 1.96 = = U 0.0250.025= = U a a/2 /2 , ,所以所以接受原假设接受原假设H0: 1 2因而认为因而认为两种烟草的尼古丁平均含量无两种烟草的尼古丁平均含量无差异。差异。221212() (0,1)nn XYUN38解:解:依题意提出假设依题意提出假设 H0: 1 2 H1: 1 2 例例2 2:为比较:为比较A,BA,B两种型号灯泡的寿命差异,两种型号灯泡的寿命差异, 随机抽取随机抽取A A型灯泡型灯泡5 5只,只,测得测得 ,方差,方差S12=965.2,随机抽取随机抽取B B型灯泡型灯泡5 5只,只,测得测得 ,方差,方差S22=1076.2,设总

38、体都是正态的,设总体都是正态的,并且知它们的方差相等并且知它们的方差相等. 问平均寿命问平均寿命 1、 2 是否有差异(是否有差异(a a = 0.05)1262.8 X 小小时时1268.2 Y 小小时时利用公式利用公式122211221212() (n +n2)(n1)(n1)11(n +n2)nnt XYTSS-求出求出T=0.267 而而 a a = 0.05,查,查t-分布表得分布表得ta a/2(8)= t0.025(8 )= 2.306可见可见 |T |= 0.267 2.306 =t=t0.0250.025= =ta a/2 /2 , ,所以所以接受原假设接受原假设H0: 1

39、2因而认为因而认为A,BA,B两种型号灯泡的两种型号灯泡的平均寿命无差异。平均寿命无差异。Oa a/2ta a/2a a/2-ta a/2397.3.2 7.3.2 两个正态总体方差的差异性检验两个正态总体方差的差异性检验( (F-F-检验法检验法) )设样本设样本(X1,X2, ,Xn1) 来自总体来自总体XN( 1 , 12), (Y1, Y2, , Y n2) 来自总体来自总体YN( 2 , 22),并假定并假定X 与与 Y 相互独立相互独立,检验水平为检验水平为a a考虑两种形式的考虑两种形式的假设假设(1(1) H0: 12 22 H1: 12 22 (2) (2) H0: 12 2

40、2 H1: 12 22 401、 1 , 2 未知未知 考虑两种形式的考虑两种形式的假设假设(1(1) H0: 12 22 H1: 12 22 (2) (2) H0: 12 22 H1: 12 22 对假设对假设(1(1) 当当H0: 12 22为真为真时时2211122222/ (1,1)/nn SFFSF的值不能太大或太小的值不能太大或太小从而从而检验水平为检验水平为a a时时拒绝域拒绝域W总体方差的差异性可用总体方差的差异性可用样本方差的比较体现样本方差的比较体现211222 (1,1)nn SFFS1/212/212W= : (1,1)(1,1)FFFnnnna aa a F2a a2

41、/Fa a12/Fa a 41考虑两种形式的考虑两种形式的假设假设(1(1) H0: 12 22 H1: 12 22 (2) (2) H0: 12 22 H1: 12 22 对假设对假设(2(2) 当当H0: 12 22为真为真时时F的值不能太大,的值不能太大,从而从而检验水平为检验水平为a a时时拒绝域拒绝域W211222 (1,1)nn SFFS12W= : (1,1)Fnna a FFa aFa a42122111122221() / (,)() /niinjjnn nn XFFY2、 1 , 2 已知已知 考虑两种形式的考虑两种形式的假设假设(1(1) H0: 12 22 H1: 12

42、 22 (2) (2) H0: 12 22 H1: 12 22 对假设对假设(1(1) 当当H0: 12 22为真为真时时122122211112222222121() /(1)/ /1() /(1)niinjjXnYn XSFSYF的值不能太大或太小的值不能太大或太小从而从而检验水平为检验水平为a a时时拒绝域拒绝域W12211211122222121() / (,)1() /niinjjnn nn XFFY1/212/212W= : ( ,)( ,)FFFn nn na aa a F2a a2/Fa a12/Fa a niin12211)(XXS43考虑两种形式的考虑两种形式的假设假设(1

43、(1) H0: 12 22 H1: 12 22 (2) (2) H0: 12 22 H1: 12 22 对假设对假设(2(2) 当当H0: 12 22为真为真时时F的值不能太大,的值不能太大,从而从而检验水平为检验水平为a a时时拒绝域拒绝域W12W= : ( ,)Fn na aFFa aFa a122111122221() / (,)() /niinjjnn nn XFFY44例例1 1:从两处煤矿各抽样数次:从两处煤矿各抽样数次, ,分析其含灰率分析其含灰率(%)(%),假定各煤矿含灰率,假定各煤矿含灰率, ,都服从都服从正态分布正态分布,依次取依次取容量为容量为5,45,4的两独立样本,

44、测得样本方差的两独立样本,测得样本方差 S12=7.505,S22 =2.593, ,问两处煤矿的含灰率的方差是否有显著差异问两处煤矿的含灰率的方差是否有显著差异(a a = 0.05) 解:解:依题意提出假设依题意提出假设 H0: 12 22 H1: 12 22 利用公式利用公式求出求出F 2.894而而 a a = 0.05,查查F分布表得分布表得Fa a/2(4,3)= F0.025(4,3 )=15.10可见可见 0.10 2.894 3.50 =F0.05(7,8 ), ,所以所以拒绝原假设拒绝原假设H0: 12 22,接受,接受H1: 12 22,因而认为因而认为甲车床生产的滚珠的

45、甲车床生产的滚珠的直径直径的方差大于乙车床的方差大于乙车床211222 (1,1)nn SFFSa aFa a 在上一讲中,我们已经了解了假设检在上一讲中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题态时,关于其中未知参数的假设检验问题 . 然而可能遇到这样的情形,总体服从何然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体种理论分布并不知道,要求我们直接对总体分布提出一个假设分布提出一个假设 . 例如,从例如,从1500到到1931年的年的432年间,每年年间,每年爆发战争的次数可以看作

46、一个随机变量,椐统爆发战争的次数可以看作一个随机变量,椐统计,这计,这432年间共爆发了年间共爆发了299次战争,具体数据次战争,具体数据如下如下:战争次数战争次数X01234 22314248154 发生发生 X次战争的年数次战争的年数 在概率论中,大家对泊松分布产生的一在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似争的次数,可以用一个泊松随机变量来近似描述描述 . 也就是说,我们可以假设每年爆发战也就是说,我们可以假设每年爆发战争次数分布争次数分布X近似泊松分布近似泊松分布.上面的数据能否

47、证实上面的数据能否证实X 具有具有泊松分布的假设是正确的?泊松分布的假设是正确的?现在的问题是:现在的问题是:又如,某钟表厂对生产的钟进行精确性检又如,某钟表厂对生产的钟进行精确性检查,抽取查,抽取100个钟作试验,拨准后隔个钟作试验,拨准后隔24小时小时以后进行检查,将每个钟的误差(快或慢)以后进行检查,将每个钟的误差(快或慢)按秒记录下来按秒记录下来.问该厂生产的钟的误差是否服从正态问该厂生产的钟的误差是否服从正态分布?分布?再如,某工厂制造一批骰子,再如,某工厂制造一批骰子,声称它是均匀的声称它是均匀的. 为检验骰子是否均匀为检验骰子是否均匀, 要把骰子实地投掷要把骰子实地投掷若干次,统

48、计各点出现的频率与若干次,统计各点出现的频率与1/6的差距的差距.也就是说,在投掷中,出也就是说,在投掷中,出现现1点,点,2点,点,6点的概点的概率都应是率都应是1/6.得到的数据能否说明得到的数据能否说明“骰子均匀骰子均匀”的假设是可信的?的假设是可信的?问题是:问题是:K.皮尔逊皮尔逊这是一项很重要的工作,不少人这是一项很重要的工作,不少人把它视为近代统计学的开端把它视为近代统计学的开端. 解决这类问题的工具是英国统计学家解决这类问题的工具是英国统计学家K.皮尔逊在皮尔逊在1900年发表的一篇文章中引进年发表的一篇文章中引进的所谓的所谓 检验法检验法.2 检验法检验法是在总体是在总体X

49、的分布未知时,的分布未知时,根据来自总体的样本,检验关于总体分根据来自总体的样本,检验关于总体分布的假设的一种检验方法布的假设的一种检验方法. 2 H0:总体:总体X的分布函数为的分布函数为F(x) 然后根据样本的经验分布和所假设的理论分然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设布之间的吻合程度来决定是否接受原假设. 使用使用 对总体分布进行检验时,对总体分布进行检验时,我们先提出原假设我们先提出原假设:2检验法检验法这种检验通常称作这种检验通常称作拟合优度检验拟合优度检验,它是一,它是一种非参数检验种非参数检验. 在用在用 检验假设检验假设H0时,若在时,若在

50、H0下下分布类型已知,但其参数未知,这时需要先分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验用极大似然估计法估计参数,然后作检验. 2检验法检验法分布拟合的分布拟合的 的基本原理和步的基本原理和步骤如下骤如下:2检验法检验法3.根据所假设的理论分布根据所假设的理论分布,可以算出总体可以算出总体X的的值落入每个值落入每个Ai的概率的概率pi,于是于是npi就是落入就是落入Ai的的样本值的样本值的理论频数理论频数.1. 将总体将总体X的取值范围分成的取值范围分成k个互不重迭的小个互不重迭的小区间区间,记作记作A1, A2, , Ak .2.把落入第把落入第i个小区间个小

51、区间Ai的样本值的个数记的样本值的个数记作作fi , 称为称为实测频数实测频数. 所有实测频数之和所有实测频数之和f1+ f2+ + fk等于样本容量等于样本容量n.kiiiinpnpf122)( iinpf 标志着经验分布与理论分布之间的差异的大小标志着经验分布与理论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布皮尔逊引进如下统计量表示经验分布与理论分布之间的差异与理论分布之间的差异:统计量统计量 的分布是什么的分布是什么?2 在理论分布在理论分布已知的条件下已知的条件下,npi是常量是常量实测频数实测频数理论频数理论频数皮尔逊证明了如下皮尔逊证明了如下定理定理:kiiiinpnpf

52、122)( 若原假设中的理论分布若原假设中的理论分布F(x)已经完全给已经完全给定,那么当定,那么当 时,统计量时,统计量n的分布渐近的分布渐近(k-1)个自由度的个自由度的 分布分布.2 2 如果理论分布如果理论分布F(x)中有中有r个未知参数需用个未知参数需用相应的估计量来代替,那么当相应的估计量来代替,那么当 时,统时,统计量计量 的分布渐近的分布渐近 (k-r-1)个自由度的个自由度的 分分布布.n2 为了便于理解,我们对定理作一为了便于理解,我们对定理作一点直观的说明点直观的说明.是是k个近似个近似正态正态的变量的平方和的变量的平方和.kiiiinpnpf122)( 这些变量之间存在

53、着一个制约关系:这些变量之间存在着一个制约关系:kiiiiinpnpfp10)(故统计量故统计量 渐近渐近(k-1)个自由度的个自由度的 分布分布.2 2 在理论分布在理论分布F(x)完全给定的情况下,每个完全给定的情况下,每个pi 都是确定的常数都是确定的常数. 由由棣莫佛拉普拉斯中心极棣莫佛拉普拉斯中心极限定理,当限定理,当n充分大时,实测频数充分大时,实测频数 fi 渐近正态,渐近正态,因此因此 在在F(x)尚未完全给定的情况下,每个未知尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个参数用相应的估计量代替,就相当于增加一个制约条件,制约条件,因此,自由度也随之减少

54、一个因此,自由度也随之减少一个. . 若有若有r个未知参数需用相应的估计量来代个未知参数需用相应的估计量来代替,替,自由度就减少自由度就减少r个个. .此时统计量此时统计量 渐近渐近(k-r-1)个自由度的个自由度的 分布分布.2 2 如果根据所给的样本值如果根据所给的样本值 X1,X2, ,Xn算得算得统计量统计量 的实测值落入拒绝域,则拒绝原假的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设设,否则就认为差异不显著而接受原假设.2 得拒绝域得拒绝域:) 1(22ka a ) 1(22rka a (不需估计参数不需估计参数)(估计估计r 个参数个参数)aa)(22P查查 分布表可得临界值分布表可得临界值2 2a a ,使得,使得 根据这个定理,对给定的显著性水平根据这个定理,对给定的显著性水平 ,a a 皮尔逊定理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论