第八章假设检验PPT课件_第1页
第八章假设检验PPT课件_第2页
第八章假设检验PPT课件_第3页
第八章假设检验PPT课件_第4页
第八章假设检验PPT课件_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、让我们先看一个例子.这一讲我们讨论对参数的假设检验 .第1页/共89页例:某工厂生产1010欧姆的电阻. .根据以往生产的电阻实际情况, ,可以认为其电阻值 X XN(N( , , 2 2),),标准差=0.1.=0.1.现在随机抽取1010个电阻, ,测得它们的电阻值为: : 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10, 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10, 10.5, 10.1, 10.2. 10.5, 10.1, 10.2. 试问: :从这些样本, ,我们能否认为该厂生产的电阻的平均值 为1010欧姆? ?第2页/共89页u确定

2、总体: :记X X为该厂生产的电阻的测量值. .根据假设,X ,X N(N( , , 2 2),),这里 =0.1.=0.1.u明确任务: : 通过样本推断X X的均值是否等于1010欧姆. .u假设: :上面的任务就是要通过样本去检验“X X的均值=10”=10”这样一个假设是否成立.(.(在数理统计中把“X X的均值=10”=10”这样一个待检验的假设记作“H H0 0:=10:=10”称为 “原假设”或 “零假设”问题怎么建立:第3页/共89页 原假设的对立面是“X X的均值10”10”记作“H H1 1:1010”称为“对立假设”或“备择假设”. .把它们合写在一起就是: : H H0

3、 0:=10 :=10 H H1 1:1010解决问题的思路分析: 样本均值是的一个良好估计. . 如果=10,=10,即原假设成立时, ,那么: :第4页/共89页这里的问题是, ,我们如何确定常数K K呢合理的思路是找出一个界限K,K, 细致的分析: : n=10 n=10 =0.1=0.1) 1 , 0(/NnXU由于) 1 , 0(10/1 . 0NXU第5页/共89页于是, ,当原假设 H H0 0:=10 :=10 成立时, ,有: 为确定常数K,K,现在我们考虑一个相当小的正数 ( (理由下面讲).).例如 =0.05.=0.05. 于是, ,当原假设 H H0 0:=10 :=

4、10 成立时, ,有: :) 1 , 0(10/1 . 010NXU2/10/1 . 010uXP10/1 . 0102/uXP10/1 . 02/uK取第6页/共89页我们就拒绝原假设 H H0 0:=10. :=10. 我们就接受原假设 H H0 0:=10.:=10. 现在我们就得到检验准则如下: :时当KX10时当KX1010/1 . 02/uK其中第7页/共89页 下面我们指出这很符合人们的逻辑, ,实际上这种思维也叫: : 带概率性质的反证法u 带概率性质的反证法的逻辑是: : 如果假设H H0 0是正确的话, ,出现一个概率很小的事件, ,则以很大的把握否定假设H H0 0. .

5、 通常的反证法设定一个假设以后, ,如果出现的事实与之矛盾,(,(即如果这个假设是正确的话, ,出现一个概率等于0 0的事件) )则绝对地否定假设. .第8页/共89页为了判断用简便方法测得的有害气体含量是否有系统偏差,提出两个相互对立的假设第9页/共89页) 1 , 0(/0NnXU第10页/共89页定义: :任何一个关于总体分布的假设称为统计假设,简称假设.若总体的分布类型已知,只要对一个或几个未知参数作出假设,就可以完全确定总体的分布.定义: :只涉及到总体分布的未知参数的统计假设称为参数假设. 在实际问题中,我们有时不知总体分布的类型,需要对未知分布函数或者它的某些特征提出假设.定义:

6、 :对总体的未知分布函数或者它的某些特征提出的统计假设,称为非参数假设.1 1 假设检验的概念与步骤假设检验的概念与步骤第11页/共89页检验法则的建立原则上依赖于小概率事件.其思想是先假设H0是正确的,在H0正确的假设下构造一个事件A,使A在H0正确的条件下发生的概率很小,即PA|H0很小,而一般认为“一个概率很小的事件在一次试验中是几乎不可能发生的”,进行一次试验,若A竟然发生,则H0的正确性值得怀疑,因而决定拒绝原假设H0.1.1 假设检验的基本思想统计假设检验问题的一般提法是:在给定备择假设H1下对原假设H0作出判断,若拒绝原假设H0,则接受备择假设,否则就接受原假设H0.第12页/共

7、89页 在H0对H1的检验问题中要作出某种判断,必须从样本(X1,X2,.,Xn)出发制定一个法则,一旦样本观察值(x1,x2,.,xn)确定,可利用所构造的法则作出判断:拒绝H0还是拒绝H1.这种法则称为H0对H1的一个检验法则,简称为一个检验法则,或一个检验. 检验法则本质上就是把样本空间划分为两个互不相交的子集C和C*,使得当样本(X1,X2,.,Xn)的观察值(x1,x2,.,xn)C时,将拒绝原假设H0,若(x1,x2,.,xn)C*,则接受原假设.这样的划分构成一个准则,称样本空间的子集C为检验的临界域(或拒绝域).第13页/共89页 一类错误是,当H0为真时,因为尽管事件A|H0

8、是小概率事件,但仍有可能发生,即样本观察值(x1,x2,.,xn)C时,按检验法则将拒绝原假设H0,这种错误称为第一类错误.犯第一类错误的概率即为我们选定的小概率事件的概率PA|H0=,称为犯第一类错误的概率或拒真概率.即 根据检验法则,若A发生则拒绝H0,否则接受H0.这不免要犯二类错误.1.2 假设检验中的二类错误P拒绝H0 |H0为真= PA|H0 =P(x1,x2,.,xn)C |H0为真 =第14页/共89页 另一类错误是,当原假设H0不真,即H1为真时,A也有可能不发生,即样本观察值(x1,x2,.,xn)C*,按检验法则将接受原假设H0,这种错误称为第二类错误.犯第二类错误的概率

9、P|H1=,称为犯第二类错误的概率或受伪概率.即P接受H0 |H1为真= P|H1 =P(x1,x2,.,xn)C* |H1为真 = 第15页/共89页 假设检验的两类错误P拒绝H0|H0为真=P接受H0|H0不真= 犯两类错误的概率: :显著性水平 为犯第一类错误的概率.H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误第16页/共89页我们当然希望独两类错误的概率与都很小,但在样本容量n固定时是无法做到的.基于这种情况,且因为人们常常把拒绝H0比错误地接受H0看得更重些.因此人们希望在控制犯第一类错误的概率的条件下,尽量使犯第二类错误的概率小,但这也是不容易的,有时甚

10、至是不可能的.于是人们不得不降低要求,只对犯第一类错误的概率加以限制,而不考虑犯第二错误的概率,在这种原则下,寻找临界域C时只涉及原假设H0,而不涉及备择假设H1,这种统计假设问题称为显著性检验问题.对给定的犯第一类错误的概率称为显著性水平.第17页/共89页(1) 根据问题的要求建立原假设H0和备择假设H1;1.3 假设检验的方法步骤(2) 选取一个适当的统计量T(X1,X2,.,Xn),要求T不含任何参数,以便计算H0为真时的条件概率;(3) 给定显著性水平,求出使PTC|H0的临界域C;(4) 若样本观察值T(x1,x2,.,xn)C,则拒绝原假设H0,否则接受H0.第18页/共89页2

11、 一个正态总体的假设检验2.1 方差已知时总体均值的双侧假设检验0100202221:,:,),(),.,(HHNXXXn要检验假设为已知常数的样本是取自正态总体设|,:,00000KXCXHX所以临界域应有形式太远波动而不偏离附近随机地应在则样本均值为真如果原假设的无偏估计为由于样本均值第19页/共89页) 1 , 0(/00NnXU由于nxuxxxn/),.,(0021算出再根据样本观察值|,2/2/2/uUCuUPu这样就得到了临界域使可查出相应的临界值下于是在给定显著性水平第20页/共89页找临界值u/2示意图0/2u/2/2u/2第21页/共89页.,;.:,|,0002/率恰好等于

12、此时犯第一类错误的概异原假设无差认为此时的总体均值与否则接受原假设有明显差异认为总体的均值此时与则拒绝原假设即若HHuuCu 例:设某厂一车间生产的钮扣,其直径据经验服从正态分布N(,5.22).为了检验这一车间生产是否正常,现抽取容量n=100的样本,得样本均值为26.56,要求在显著性水平=0.05下检验假设H0:0=26.第22页/共89页26:,26:10HH备择假设提出原假设) 1 , 0(100/2 . 526NXU建立统计量解05. 096. 1|100/2 . 526|96. 1,05. 0025. 02/XPuu即查得对于给定的显著性水平.,96. 108. 1100/2 .

13、 52656.26100/2 . 526|0认为生产是正常的从而接受原假设而Hxu第23页/共89页解 需检验假设为 5 .325 .3210:,:HH第24页/共89页由样本得 96. 105. 3621. 15 .323 .31u因而,在显著性水平=0.05下,应拒绝原假设 即不能认为这批产品的平均抗断强度为32.5(kg/cm2) 查表得 0.0251.96u拒绝域为 96. 1 UC第25页/共89页2.2 方差已知时总体均值的单侧假设检验第26页/共89页于是问题就是检验: :H H0 0:=:=0 0 即新技术或新配方对于提高产品质量无效果. .还是H H1 1: 0 0 即新技术

14、或新配方确实有效, ,提高了产品质量. .解决问题的思路:如果=0 0, ,即原假设成立时, ,那么: :就不应该太大. .反之, ,如果它过于大, ,那么想必是原假设不成立. .0X第27页/共89页 当原假设 H H0 0:=:=0 0 成立时, ,有: : ) 1 , 0(/00NnXU求解:unXP/00nuXP/00拒绝域为nuXC/00第28页/共89页解 建立假设 12. 0:12. 0:0100HH取统计量 nXU0分布未知第29页/共89页但由题设 ) 1 , 0( NnXU因而事件 UuUu故P UuP Uu在H0真实的前提下,由XPun可知 unXP0第30页/共89页因

15、而拒绝域 nuXunXC00查正态分布函数表知 1.64u由于 0.05190.12030.120.0151.640.125xUun第31页/共89页解 建立假设 65:,65:10HH拒绝域应取作 Uu 由样本求得 0.05055.066518.071.6455.5100 xUun 故应拒绝H0,不能接受这批玻璃纸. 第32页/共89页01002221:,:,),(),.,(HHNXXXn要检验假设为未知常数的样本是取自正态总体设|,:,00000KXCXHX所以临界域应有形式太远波动而不偏离附近随机地应在则样本均值为真如果原假设的无偏估计为由于样本均值.3方差未知时总体均值的双侧假设检验第

16、33页/共89页).1(|)1(|),1(,)(11) 1(/,2/2/2/12200nttCnttPntXXnSntnSXtHnii这样就得到了临界域使可查出相应的临界值下于是在给定显著性水平其中为真时当nsxtxxxn/),.,(021算出再根据样本观察值第34页/共89页找临界值t/2示意图0/2/2t/2(n1)t/2(n1)第35页/共89页.,;.:),1(|,0002/率恰好等于此时犯第一类错误的概无差异原假设认为此时的总体均值与否则接受异原假设有明显差认为总体的均值此时与则拒绝原假设即若HHnttCt.818. 5,06.45,100,65:,:例00sxHX测得样本观察值的均

17、值的样本体中抽出容量为从总现要检验服从正态分布延伸率假设其横向延伸率检验某种型号玻璃纸的第36页/共89页65:65:10HH提出假设05. 098. 1|100/65|98. 1,05. 0975. 02/SXPtt即查得对于给定的显著性水平.,98. 127.34100/818. 56506.45100/65|0指标要求没有达到认为这批玻纸的延伸率从而拒绝原假设而Hsxt) 1(100/65ntSX建立统计量解第37页/共89页第38页/共89页由观测值得3060. 205. 09212. 110098.99t故样本没有落入拒绝域,应接受H0,即可以认为打包机工作正常 解 建立假设 100

18、10010:,:HH3060. 2)8(,05. 0, 9025. 0tn故此问题的拒绝域为 3060. 2T第39页/共89页检验H0:=0 H1:02. 方差未知时总体均值的单侧假设检验 当原假设 H H0 0:=:=0 0 成立时, ,有: : ) 1(/0ntnSXT) 1(/0ntnSXP) 1(0ntnSXP) 1(0ntnsx第40页/共89页例 :某厂生产一种工业用绳, ,其质量指标是绳子所承受的最大拉力. .假定该指标服从正态分布. . 原来该厂生产的这种绳子平均最大拉力0 0 =15=15公斤. .现在采用了一种新的原材料, ,厂方称这种原材料提高了绳子的质量, ,也就是说

19、绳子所承受的最大拉力比1515公斤大了. . 为了检验该厂的结论是否真实, ,从其新产品中随机抽取5050件, ,测得它们承受的最大拉力的平均值为15.815.8公斤, ,样本标准差S=0.5S=0.5公斤. .取显著性水平 =0.01.=0.01. 问从这些样本看,我们能否接受厂方的结论,即新原材料是否确实提高了绳子的质量?第41页/共89页问题归结为检验如下假设H0:=15 H1:15 (方差2未知)此处n=50, =0.01,标准差S=0.5.解查不到t0.01(49),利用性质: 给定 ,t(n)关于自由度n是单调下降的. 我们查t0.01(45)=2.41, 则 t0.01(49)0

20、取统计量 nSXT0但在H0成立的条件下 ) 1(ntnSXT且有 ,TTTcTc故 ) 1() 1(0ntnSXPntnSXP拒绝域为 ) 1(0ntnSXC分布未知第43页/共89页第44页/共89页解 提出假设 3:,3:10HH7613. 1)14(05. 0t查表得故拒绝域为7613. 1T再根据样本求得 22436. 0, 2 . 3sx从而有 7613. 17766. 115436. 032 . 3t第45页/共89页 表: 一个正态总体均值的假设检验(显著性水平为) 第46页/共89页2.5 均值已知时的方差的双边假设检验202120200221:,:,),(),.,(HHNX

21、XXn要检验假设为已知常数的样本是取自正态总体设.1)(1,)(1,20120021200的附近随机地波动应该在统计量为真时当因此的无偏估计方差是总体样本方差已知时当niiniiXnHXXn第47页/共89页)()(,22012020nXHnii统计量下在假设 . 2/,., 0, 0,2121212122211221212212取所以一般很复杂和但这样计算最优的率尽可能地小的概一般应使犯第二类错误的选取和而和定出和就需要由水平给定了显著性因此临界域的形式为KKKPKPKK 第48页/共89页2/)(2/)(),()(,22/1222/222/122/nPnPnn即和查出两个临界值对于给定的显

22、著性水平)()(22/1222/2nnC这样得到临界域为.,),()(,),.,(0022/1222/22221HHnnxxxn原假设否则就接受就拒绝或的值若的值计算由样本观察值第49页/共89页找临界值示意图/2)(22/n)(22/1n/2第50页/共89页2.6 均值未知时的方差的双边假设检验20212020221:,:,),(),.,(HHNXXXn要检验假设为未知常数的样本是取自正态总体设.1)(11,.)(11,20120212的附近随机地波动应该在统计量为真时当因此的无偏估计方差是总体样本方差未知时当niiniiXXnHXXXn第51页/共89页)1()()1(,22012202

23、20nXXSnHnii统计量下在假设2/)1(2/)1(),1() 1(,22/1222/222/122/nPnPnn即和查出两个临界值对于给定的显著性水平)1()1(22/1222/2nnC这样得到临界域为第52页/共89页.,),1() 1(,),.,(0022/1222/22221HHnnxxxn接受原假设否则就就拒绝或的值若的值计算由样本观察值:,31.18. 0:,.18. 0),(:20202测得数据如下表所示个零件的为此抽取这车床所加工即检验假设原来加工精度一下这一车床是否保持要检验经过一段时间生产后原来加工精度服从正态分布一车床加工零件的长度例nHN零件长度 xi10.1 10

24、.3 10.6 11.2 11.5 11.8 12.0频数 ni13710631第53页/共89页.,05. 0:单侧的情形由题意只要考虑下在给定显著性水平解. 8 .43)30(.05. 0)30(205. 0205. 02查表得定出临界值由P)30(8 .435 .4418. 0)(205. 07122iiixxn由样本观察值计算出.0度变差段时间后精这说明自动车床工作一因此拒绝原假设H第54页/共89页解 需检验的假设为 22220010HH:,:488. 9)4(,711. 0)4(, 1 . 0, 5205. 0295. 0n拒绝域为 488. 971. 022或现由样本求得488.

25、 95 .13048. 0078. 0422故拒绝H0,即认为这一天纤度的分布不正常. 第55页/共89页2.7 方差的单边假设检验20212020221:,:,),(),.,(HHNXXXn要检验假设为未知常数的样本是取自正态总体设当H0为真时有 ) 1() 1() 1() 1(2222202nSnPnSnP) 1()() 1(22012202nxxsnnii第56页/共89页解 建立假设 222201:0.005 ,:0.005HH507.15)8(295. 0查表得拒绝域为 507.152W现由样本求得507.1594.13005. 00066. 08222故可接受原假设,在=0.05水

26、平上认为这批导线的电阻波动合格 第57页/共89页表: 一个正态总体方差的假设检验(显著性水平为)第58页/共89页3 两个正态总体的假设检验.,),(),.,(,),(),.,(222212112121两个样本相互独立且这的样本是取自正态总体设的样本是取自正态总体设NYYYNXXXnn221112222121212111)(111)(111niiniiniiniiYYnSYnYXXnSXnX方差的无偏估计分别为令这两个样本的均值与第59页/共89页要检验假设已知与,22213.1 方差已知时均值的双侧假设检验211210:,:HH因为 ) 1 , 0()()(22212121NnnYX) 1

27、 , 0()(222121NnnYXU当H0成立时,统计量第60页/共89页从而,对于给定的显著性水平,拒绝域为 2221212XYVunn第61页/共89页第62页/共89页解 设第一教学班的数学成绩 )57,(1NX第二教学班的数学成绩 )53,(2NY1214,0.0590.929,90.286nnxy建立假设211210:,:HH查正态分布表,求出临界值 0.0251.96u0.025221212()90.92990.2860.229357531414XYUunn接受H0,认为两个教学班的数学成绩无显著差异. 第63页/共89页3.2 方差已知时均值的单侧假设检验211210:,:HH

28、要检验假设已知与,2221因为 ) 1 , 0()()(22212121NnnYX且在H0成立时 22212121222121)()()(nnYXnnYX第64页/共89页12222212121212()()()XYXYPuPunnnn所以因而拒绝域 unnYXC222121)(第65页/共89页第66页/共89页解 设X为甲方案的关键指标值则 )35. 5 ,(21NX问题可以归结为假设 211210:,:HH正态分布表得 0.051.64u由于 64. 167. 15011. 635. 542.17234.174)(22222121nnyxu因此拒绝H0,接受H1,即认为甲方案的关键指标值

29、比乙方案的关键指标值要高一些 .)11. 6 ,(22NY设Y为乙方案的关键指标值则 第67页/共89页.2) 1() 1()2(11,21222211221210nnSnSnSnntnnSYXtHww其中为真时因为当3.3 方差未知时均值的双侧假设检验211210:,:HH要检验假设未知,2221第68页/共89页.2(|2(|),2(,212/212/212/nnttCnnttPnnt这样就得到了临界域使界值可查出相应的临下于是在给定显著性水平21212111),.,(),.,(21nnsyxtyyyxxxwnn算出再根据样本观察值第69页/共89页.,;.:,|,02102/率恰好等于此

30、时犯第一类错误的概为两个总体均值无差异认否则接受明显差异认为两个总体的均值有则拒绝原假设即若HHttCt.,10890. 410560. 9059. 2,063. 2,10050. 2:6262态分布假设轴直径的分布是正工的轴直径是否有差异试检验这相隔两小时加值和方差分别为测得其均的两个样本量为现在每隔两小时各取容毫米的轴直径为在一台自动车床上加工例YXssyx,第70页/共89页YXYXYXHH:,:,102222是为未知参数需要检验的床可以认为由于样本取自同一台车)2(11YXYXWnntnnSYX建立统计量01. 0878. 2|11|878. 2,01. 0005. 02/YXWnnS

31、YXPtt即查得对于给定的显著性水平解第71页/共89页.,878. 23 . 3210101089. 491056. 99059. 2063. 211|066的影响而生产不稳定可能是自动车床受时间异上有差认为这两个样本在生产于是拒绝原假设而HnnsyxtYXW第72页/共89页第73页/共89页解 设羊毛品在处理前后其含脂率分别为X与Y,且 ),(),(222211NYNX未知且2221检验的假设为211210:,:HH查表得 1604. 2)13(025. 0t0795. 0,0039. 0,0091. 0,13. 0,24. 022221wsssyx拒绝域的形式为 1604. 2 TW计

32、算得 1604. 26735. 2t故拒绝H0,认为处理前后含脂率的平均值有显著变化. 第74页/共89页3.4 方差未知时均值的单侧假设检验要检验假设未知,2221211210:,:HH211210:,:HH以例子说明第75页/共89页解 城市考生平均成绩 ),(211NX农村考生平均成绩 ),(222NY2221且第76页/共89页建立假设 211210:,:HH检验统计量为2111nnSYXTw查分布表得 7341. 105. 0 tt由于 05. 021734. 119925. 111ttnnSyxtw故接受H0,表示无充分的证据显示来自城市的中学考生的平均成绩比来自农村的中学考生的平

33、均成绩要高一些 .第77页/共89页表: 两个正态总体均值的假设检验(显著性水平为) 第78页/共89页2212202122212121:,:,),(),.,(,),(),.,(21YXYXYnXnHHNYYYNXXX要检验假设为未知常数两个样本相互独立且这的样本是取自正态总体设的样本是取自正态总体设2211122212121211)(111)(111niiYniiniiXniiYYnSYnYXXnSXnX方差的无偏估计分别为令这两个样本的均值与3.5 两个正态总体方差的双侧假设检验第79页/共89页/,11/,:,222122222202222KSSKSSCSSHSSYXYXYXYXYXYX所以临界域应有形式太远偏离附近随机地波动而不应在则为真如果原假设的无偏估计分别为由于).1, 1() 1, 1(2/)1, 1(2/)1, 1(,) 1, 1(,:212/212/1212/1212/2122220nnFnnFnnFFPnnFFPnnFSSFHYXYX和定出两个临界值由对于给定的显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论