第六章 假设检验_第1页
第六章 假设检验_第2页
第六章 假设检验_第3页
第六章 假设检验_第4页
第六章 假设检验_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 6 章章 假设检验假设检验o 6.1 假设检验的基本问题假设检验的基本问题 o 6.2 一个总体参数的假设检验一个总体参数的假设检验一、假设的陈述一、假设的陈述1、假设和假设检验、假设和假设检验 假设是对总体参数的具体数值所作的陈述假设是对总体参数的具体数值所作的陈述.n 总体参数包括总体均值、比率等总体参数包括总体均值、比率等n 分析之前必须陈述分析之前必须陈述1. 假设检验:先对总体的参数假设检验:先对总体的参数(或分布形式或分布形式)提出某种假设,然后利用样本信息判断假设提出某种假设,然后利用样本信息判断假设是否成立的过程;是否成立的过程;2. 有参数检验和有参数检验和非非参数检验

2、参数检验;3. 逻辑上运用逻辑上运用反证法反证法,统计上依据,统计上依据小概率原理;小概率原理;小概率原理小概率原理o 什么小概率?什么小概率?o 1.在一次试验中,一个几乎不可能发生的事在一次试验中,一个几乎不可能发生的事件发生的概率;件发生的概率;o 2.在一次试验中小概率事件一旦发生,我们在一次试验中小概率事件一旦发生,我们就有理由就有理由拒绝原假设;拒绝原假设;2、原假设与备择假设、原假设与备择假设p 原假设原假设(null hypothesis) :研研究者想收集证据究者想收集证据予以反对的假设。予以反对的假设。表示为表示为H0nH0 : = , 或或 某一数值某一数值 n例如例如,

3、 H0 : 10cmp 备择假设备择假设(alternative hypothesis):研究:研究者想收集证据予以支持的假设。表示为者想收集证据予以支持的假设。表示为H H1 1 H1: , 或或 某一数值某一数值 例如例如, H1 : 10cm, ”或或“”的假设检验,称为单侧检验或的假设检验,称为单侧检验或单尾检验单尾检验(one-tailed test)n备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验 (假设的形式假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0

4、0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0显著性水平显著性水平 (significant level)1.常用的常用的 值有值有0.01, 0.05, 0.102.由研究者事先确定由研究者事先确定3. 拒绝原假设,则表明检验的结果是显著的拒绝原假设,则表明检验的结果是显著的 不拒绝原假设,表明检验的结果是不显著的不拒绝原假设,表明检验的结果是不显著的1. 根据样本观测结果计算得到的,并据以对原假根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量;设和备择假设作出决策的某个样本统计量;显著性水平和拒绝域显著性水平和

5、拒绝域(双侧检验双侧检验 ) 显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验 )显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )决策规则决策规则1. 给定显著性水平给定显著性水平 ,查表得出相应的临界,查表得出相应的临界值值z 或或z /2 /2, t 或或t /2 /22. 将检验统计量的值与将检验统计量的值与 水平的临界值进行水平的临界值进行比较比较3. 作出决策作出决策n双侧检验:双侧检验:统计量统计量 临界值,拒绝临界值,拒绝H0n左侧检验:统计量左侧检验:统计量 临界值,拒绝临界值,拒绝H06.2 一个总体参数的检验一个总体参数的检验一、总体均值的检验一、总体均值的

6、检验二、总体比率的检验二、总体比率的检验一个总体参数的检验一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比率比率一、总体均值的检验一、总体均值的检验p检验统计量确定的因素:检验统计量确定的因素:1、样本容量的大小、样本容量的大小2、总体分布形状、总体分布形状3、总体方差是否已知、总体方差是否已知p总体均值检验统计量主要有:总体均值检验统计量主要有:1、z检验统计量检验统计量2、t检验统计量检验统计量总体均值的检验总体均值的检验 (大样本大样本)1. 假定条件假定条件n正态总体或非正态总体大

7、样本正态总体或非正态总体大样本(n 30)2. 使用使用 z检验统计量检验统计量n 2 已知:已知:n 2 未知:未知:总体均值的检验总体均值的检验( 2 已知已知)(例题分析例题分析)o【例】一种罐装饮料采用自动生【例】一种罐装饮料采用自动生产线生产,每罐的容量是产线生产,每罐的容量是255ml,标准差为标准差为5ml。为检验每罐容量是。为检验每罐容量是否符合要求,质检人员在某天生产否符合要求,质检人员在某天生产的饮料中随机抽取了的饮料中随机抽取了40罐进行检罐进行检验 , 测 得 每 罐 平 均 容 量 为验 , 测 得 每 罐 平 均 容 量 为2 5 5 . 8 m l 。 取 显 著

8、 性 水 平。 取 显 著 性 水 平 =0.05 ,检验该天生产的饮料,检验该天生产的饮料容量是否符合标准要求?容量是否符合标准要求?总体均值的检验总体均值的检验( 2 已知已知)(例题分析例题分析)oH0 : = 255oH1 : 255o = 0.05on = 40o临界值临界值(Zc):总体均值的检验( 2 未知)(例题分析)o【例】一种机床加工的零件尺【例】一种机床加工的零件尺寸绝对平均误差为寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进生产厂家现采用一种新的机床进行加工以期进一步降低误差。为行加工以期进一步降低误差。为检验新机床加工的零件平均误差检验新机床加工的零件平均

9、误差与旧机床相比是否有显著降低,与旧机床相比是否有显著降低,从某天生产的零件中随机抽取从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著均误差与旧机床相比是否有显著降低?降低? ( =0.01) 50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.97 1.811.130.961.061.00 0.940.981.101.121.03 1.161.121.120.951.02 1.131.230.741.500.50 0.590.991.45

10、1.241.01 2.031.981.970.911.22 1.061.111.541.081.10 1.641.702.371.381.60 1.261.171.121.230.82 0.86总体均值的检验总体均值的检验( 2 未知未知)(例题分析例题分析)oH0 : 1.35oH1 : 5200o = 0.05on = 36o临界值临界值(c):总体均值的检验总体均值的检验 (大大样本检验方法的总结样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形假设形式式H0 : = 0 0H1 : 0 0H0 : 0 0H1 : 0 0统计量统计量 已知:已知: 未知:

11、未知:拒绝域拒绝域nxz0 nsxz0 2/zz zz zz总体均值的检验 (小样本)o 1. 假定条件假定条件n总体服从正态分布总体服从正态分布n小样本小样本(n 30)2. 检验统计量检验统计量n 2 已知:已知:n 2 未知:未知:总体均值的检验 (小样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : =0H1 : 0H0 : 0H1 : 0统计量统计量 已知: 未知:拒绝域拒绝域nxz0nsxt0) 1(2/ntt) 1( ntt) 1( ntt总体均值的检验总体均值的检验 (例题分析例题分析)o【例】一种汽车配件的平均长度要求为【例】

12、一种汽车配件的平均长度要求为12cm,高于,高于或低于该标准均被认为是不合格的。汽车生产企业在购或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的提供商提供的10个样本进行了检验。假定该供货商生产个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在的配件长度服从正态分布,在0.05的显著性水平下,检的显著性水平下,检验该供货商提供的配件是否符合要求?验该供货商提供的配件是否符合要求? 1

13、0个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验 (例题分析)oH0 : = 12oH1 : 12o = 0.05oN=10 是否已是否已知知样本容量样本容量n 是否已是否已知知 t 检验检验z 检验检验z 检验检验 z 检验检验二、总体比率检验检验的检验的 z 统计量统计量总体比率的检验总体比率的检验 (检验方法的总结检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0: = 0 0H1: 0 0H0 : 0 0H1 : 0 0统计量统计量拒绝域拒绝域决策决策拒绝

14、拒绝H02/zz npz)1(000zzzz 总体比率的检验 (例题分析)o【例【例】一种以休闲和娱乐为主一种以休闲和娱乐为主题的杂志,声称其读者群中有题的杂志,声称其读者群中有80%为女性。为验证这一说法是为女性。为验证这一说法是否属实,某研究部门抽取了由否属实,某研究部门抽取了由200人组成的一个随机样本,发人组成的一个随机样本,发现有现有146个女性经常阅读该杂志。个女性经常阅读该杂志。分别取显著性水平分别取显著性水平 =0.05和和 =0.01 ,检验该杂志读者群中,检验该杂志读者群中女性的比率是否为女性的比率是否为80%?它们的?它们的值各是多少?值各是多少?总体比率的检验 (例题分

15、析)oH0 : = 80%oH1 : 80%o = 0.05on = 200o临界值临界值(c):总体比率的检验 (例题分析)oH0 : = 80%oH1 : 80%o = 0.01on = 200o临界值临界值(c):抽样调查的组织形式抽样调查的组织形式 通常有以下四种组织形式:通常有以下四种组织形式:一、简单随机抽样一、简单随机抽样( (纯随机抽样纯随机抽样) )即从总体单位中不加任何分组、排队,即从总体单位中不加任何分组、排队,完全随机地抽取调查单位,保证总体中每完全随机地抽取调查单位,保证总体中每个单位都有同等的中选机会。个单位都有同等的中选机会。随机抽样的抽样平均误差随机抽样的抽样平

16、均误差 ( (一一) )随机抽样的抽样平均误差随机抽样的抽样平均误差或或xx2 nn 1.1.重重复抽样复抽样取得取得的途径有:的途径有: 1.1.用用过去全面调查或抽样调查的资料;过去全面调查或抽样调查的资料;2. 2. 用用样本标准差样本标准差S S代替全及标准差代替全及标准差;3. 3. 在在大规模调查前,先搞个小规模的试验性的调查来大规模调查前,先搞个小规模的试验性的调查来确定确定S S,代替,代替;4. 4. 用用估计的方法。估计的方法。x2202()100小时 某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,000个中抽个中抽取取100100个检查其寿命,得平

17、均寿命为个检查其寿命,得平均寿命为20002000小时小时( (一般为重复抽样一般为重复抽样) ),根据以往资料:,根据以往资料:=20=20小小时,时,若若=200=200小时,小时,)(20 小时于是:例例2.2.不不重复抽样重复抽样:2xNnnN1 2xNnn(1)nN 但但实实际际中中, 往往往往 很很大大, 很很小小,故故改改用用下下列列公公式式:x400100(1)1.99()10010000 上上例例中中,若若为为不不重重复复抽抽样样,则则:小小时时( (二二) ) 成数的抽样平均误差成数的抽样平均误差 已证明得:已证明得:成数的方差为成数的方差为p(1-p)p(1-p) pp

18、p(1p) n p(1p)n (1)nN 在在重重复复抽抽样样情情况况下下:在在不不重重复复抽抽样样情情况况下下:%1374. 1)150001501 (150)98. 01 (98. 0)1 ()1 ( %14. 1150)98. 01 (98. 0)1 (%98150147 150 15000NnnppnpppnNpp若按不重复抽样方式: 某玻璃器皿厂某日生产某玻璃器皿厂某日生产1500015000只印花玻璃杯,只印花玻璃杯,现按重复抽样方式从中抽取现按重复抽样方式从中抽取150150只进行质量检验,只进行质量检验,结果有结果有147147只合格,其余只合格,其余3 3只为不合格品,试求这

19、批只为不合格品,试求这批印花玻璃杯合格率印花玻璃杯合格率( (成数成数) )的抽样平均误差。的抽样平均误差。例例二、类型抽样二、类型抽样( (分类抽样分类抽样) )先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类( (层层) ),然后再从各类,然后再从各类( (层层) )中按随机原则抽中按随机原则抽取样本,组成一个总的样本。取样本,组成一个总的样本。 类型的划分:类型的划分:一一是必须有清楚的划类界限;是必须有清楚的划类界限;二二是必须知道各类中的单位数目和比例;是必须知道各类中的单位数目和比例;三三是分类型的数目不宜太多。是分类型的数目不宜太多。类型抽样的好处是:类型抽样的好

20、处是:样样本代表性高、本代表性高、抽样误差小、抽样调查抽样误差小、抽样调查成本较低。成本较低。如果抽样误差的要求相同的话则如果抽样误差的要求相同的话则抽样数目可以减少。抽样数目可以减少。两种类型:两种类型:1.1.等等比例类型抽样比例类型抽样( (类型比例抽样类型比例抽样) );样本各组结构比例与总体各组结构比例完全样本各组结构比例与总体各组结构比例完全一致。一致。2.2.不不等比例类型抽样等比例类型抽样( (类型适宜抽样类型适宜抽样) )。样本结构与总体结构不一致的抽样。由于样样本结构与总体结构不一致的抽样。由于样本机构与总体结构的不一致,可导致样本分本机构与总体结构的不一致,可导致样本分布

21、与总体分布不同,所以误差会比较大。布与总体分布不同,所以误差会比较大。类型抽样的抽样平均误差类型抽样的抽样平均误差 在重复抽样情况下在重复抽样情况下:nix2 NNiii 22 2ixn (1)nN 在在不不重重复复抽抽样样情情况况下下:重重 复复 抽抽 样样在在 成成 数数 情情 况况 下下:pp(1p) n 不不重重复复抽抽样样:pp(1p)n(1)nN 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,丘陵公顷,丘陵60006000公顷,公顷,山地山地24002400公顷,现用类型抽样法调查公顷,现用类型抽样法调查12001200公顷,以各种麦

22、田公顷,以各种麦田占全农场面积的比重分配抽样面积数量。占全农场面积的比重分配抽样面积数量。 麦田类型抽样的平均误差计算表麦田类型抽样的平均误差计算表类类 型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)符符 号号Ninii丘陵地区丘陵地区 6000600 750337500000平原地区平原地区 3600360 840254016000山山 地地 24002401000240000000合合 计计120001200-831516000iin2例例22222iiiiiiiixn831516000692

23、930()n1200N Nn(1)nN6929301200 (1)519.697522.8()120012000 千克或千克iiiipp (1 p )n186P(1 P)15.5%n1200p(1 p)n0.1551200(1)(1)1.078%nN120012000 高产麦田比重的平均误差计算表高产麦田比重的平均误差计算表类别类别高产田高产田比重比重(%)非高产田非高产田比重比重(%)麦田不均匀麦田不均匀程度指标程度指标(%)抽样调查抽样调查面积面积(公顷公顷)pi(1-pi)ni符号符号pi1-pipi(1-pi)ni丘陵丘陵802016 60096.0平原平原9010 9 36032.4

24、山地山地604024 24057.6合计合计-1200 186三、机械抽样三、机械抽样( (等距抽样等距抽样) ) 先先将全及总体的所有单位按某一标志将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单顺序排队,然后按相等的距离抽取样本单位。位。排列次序用的标志有两种:排列次序用的标志有两种:1. 1. 选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关, 称无关标志排队。称无关标志排队。2. 2. 选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关, 称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平

25、时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例机械抽样按样本单位抽选的方法不机械抽样按样本单位抽选的方法不同,可分为三种:同,可分为三种:1.1.随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:2.2.半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)2k2kk 22kk 2) 1(kkn示意图:示意图:3.3.对对称等距抽样称等距抽样示意图:示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)机械抽样的好处:机械抽样的好处:

26、1. 1. 可可以使抽样过程大大简化,减轻抽样的以使抽样过程大大简化,减轻抽样的工作量;工作量;2. 2. 如如果用有关标志排队,还可以缩小抽样果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。误差,提高抽样推断效果。机械抽样机械抽样,实际上是一种特殊的类,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽抽一个样本,在这种情况下,则类型抽样就成了机械抽样。样就成了机械抽样。1.1.若若按无关标志排队按无关标志排队公式用以上纯随机抽样的公式,一般采用

27、公式用以上纯随机抽样的公式,一般采用不重复抽样公式:不重复抽样公式:xp2n (1)nNp(1p)n (1)nN 为为简简便便起起见见,也也可可采采用用重重复复抽抽样样公公式式。机械抽样机械抽样( (等距抽样等距抽样) )的抽样平均误差的抽样平均误差 2. 2. 若若按有关标志排队按有关标志排队2xp np(1 p) n 公式用类型抽样的公式:公式用类型抽样的公式:四、整群抽样四、整群抽样 整群抽样整群抽样即从全及总体中成群地抽取样本单位,即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。对抽中的群内的所有单位都进行观察。整群抽样的好处:整群抽样的好处:组织工作比较简单方便,组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。其它抽样方式的抽样误差大。整群抽样的抽样平均误差整群抽样的抽样平均误差 整群抽样的抽样平均误差受两个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论