版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第5 5章章假设检验假设检验第第 5 5 章章 假设检验假设检验 5.15.1 假设检验的基本问题假设检验的基本问题 5.25.2 一个总体参数的检验一个总体参数的检验 5.35.3 两个总体参数的检验(自学)两个总体参数的检验(自学)5.15.1 假设检验的基本原理假设检验的基本原理一、假设的陈述一、假设的陈述二、两类错误与显著性水平二、两类错误与显著性水平三、统计量与拒绝域三、统计量与拒绝域四、利用四、利用P P值进行决策值进行决策假设检验的基本概念假设检验的基本概念此时常常作出此时常常作出适当的假设适当的假设, ,然后进行试验或然后进行试验或观测观测,得到得到统计样本,构造统计方法统计
2、样本,构造统计方法进行判断,以进行判断,以 在实际工作中常会遇到这样的在实际工作中常会遇到这样的问题:问题:(1)某药物在改进工艺后的疗效是否有提高?)某药物在改进工艺后的疗效是否有提高?(2)假定总体服从某种分布是否成立?)假定总体服从某种分布是否成立?如何通过抽检的样本对上述问题做出如何通过抽检的样本对上述问题做出判断判断?决定是否接受这个假设。决定是否接受这个假设。假设检验假设检验就是这样一种统计推断方法就是这样一种统计推断方法,根据根据样本提供的信息样本提供的信息对所提出的对所提出的假设假设作出作出判断判断: : 是接受是接受, , 还是拒绝还是拒绝. .假设检验的基本概念假设检验的基
3、本概念若对若对参数参数有所有所了解了解但有怀但有怀疑猜测疑猜测需要证需要证实之时实之时用假设用假设检验的检验的方法来方法来 处理处理若对参数若对参数一无所知一无所知用参数估计用参数估计的方法处理的方法处理 假设检验可以看成是区间估计中置信区间的另一假设检验可以看成是区间估计中置信区间的另一种表达方式。置信区间可看作是所有可能接受的假种表达方式。置信区间可看作是所有可能接受的假设的集合。设的集合。 区间估计实际上是在一定的概率保证程度下,利区间估计实际上是在一定的概率保证程度下,利用样本资料及计算得到的有关数据,推算总体参数用样本资料及计算得到的有关数据,推算总体参数可能存在的范围,而假设检验是
4、利用样本资料所含可能存在的范围,而假设检验是利用样本资料所含信息,判断检验统计量与总体参数的差异是否显著。信息,判断检验统计量与总体参数的差异是否显著。假设检验是统计推断的另一种方式,它与假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用区间估计的差别主要在于:区间估计是用给定的给定的大概率大概率推断出总体参数的范围,而推断出总体参数的范围,而假设检验是以假设检验是以小概率小概率为标准,对总体的状为标准,对总体的状况所做出的假设进行判断。假设检验与区况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内间估计结合起来,构成完整的统计推断内容。容。什么是假
5、设检验什么是假设检验? ?( (hypothesishypothesis) )假设检验假设检验(也称(也称显著性检验显著性检验)就是事先对总)就是事先对总体参数或总体分布形式作出一个假设,然后体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,从而利用样本信息来判断原假设是否合理,从而决定应接受或否定原假设决定应接受或否定原假设对总体参数的具体数值所作的陈述对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等总体参数包括总体均值、比率、方差等分析之前必需陈述分析之前必需陈述假设检验的基本思想假设检验的基本思想先对总体的参数先对总体的参数(或分布形式或分布形式)提
6、出某提出某种假设,然后利用样本信息判断假设种假设,然后利用样本信息判断假设是否成立的过程是否成立的过程采用逻辑上的采用逻辑上的反证法反证法依据统计上的依据统计上的小概率原理小概率原理如果在某次试验或观测中,某事件出如果在某次试验或观测中,某事件出现的概率很小,这样的事件叫小现的概率很小,这样的事件叫小概率事件。通常我们把概率事件。通常我们把P0.05的事的事件叫小概率事件。件叫小概率事件。小概率由研究者事先确定小概率由研究者事先确定在某种假设的条件下,在某种假设的条件下,某一事件是一小概率某一事件是一小概率事件。如果在一次试事件。如果在一次试验或观测中,小概率验或观测中,小概率事件恰好发生了,
7、则事件恰好发生了,则我们有理由认为所做我们有理由认为所做的假设是不成立的,的假设是不成立的,从而否定原来的假设。从而否定原来的假设。概概率事件发生率事件发生,则否认假设则否认假设H0 ;否则否则, ,接受假设接受假设H0 . .小概率推断原理:小概率推断原理:小概率事件小概率事件2. 基本思想方法基本思想方法采用概率性质的反证法:采用概率性质的反证法:下面结合实例来说明假设检验的基本思想下面结合实例来说明假设检验的基本思想. .05. 00 1. 基本原理基本原理(概率接近概率接近0的事件的事件),在一次试验中在一次试验中,实际上可认为实际上可认为不会发生不会发生(这是人们长期积累起的普遍经验
8、这是人们长期积累起的普遍经验!).据一次抽样所得到的样本值进行计算据一次抽样所得到的样本值进行计算. 若导致小若导致小先提出假设先提出假设H0 , 再根再根假设检验的基本思想假设检验的基本思想m m = 50假设检验的过程假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择! 小结小结1. 假设检验就是根据样本对所提出的假设作假设检验就是根据样本对所提出的假设作出判断出判断: 是接受是接受, 还是拒绝。还是拒绝。2. 如何利用样本值对一个具体的假设进行检如何利用样本值对一个具体的假设进行检验验?通常借助于直观分析和理论分析相结合的做法通常借
9、助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所其基本原理就是人们在实际问题中经常采用的所谓实际推断原理谓实际推断原理:“一个小概率事件在一次试验中一个小概率事件在一次试验中几乎是不可能发生的几乎是不可能发生的”。3. 处理假设检验要做两件事:处理假设检验要做两件事:确定一个检验统计量确定一个检验统计量,它的值决定于样本值;,它的值决定于样本值;确定一个拒绝域确定一个拒绝域(临界域),它是拒绝原假设(临界域),它是拒绝原假设的检验统计值的集合。的检验统计值的集合。原假设原假设(null hypothesis)1.1. 研究者想收集证据研究者想收集证据予以反对予以反
10、对的假设的假设2.2. 又称又称“0 0假设假设”3.3. 总是有符号总是有符号, , 或或 4.4. 表示为表示为 H H0 0H H0 0 := = 某一数值某一数值 指定为符号指定为符号 , , 或或 例如例如, , H H0 0 :=10cm=10cm1.1. 研究者想收集证据研究者想收集证据予以支持予以支持的假设的假设2.2. 也称也称“研究假设研究假设”3.3. 总是有符号总是有符号 , 或或 4.4. 表示为表示为 H H1 1H H1 1 :某一数值,或某一数值,或 某一数值某一数值例如例如, , H H1 1 : 10cm10cm,或,或 10cm10cm【例例】一种零件的生
11、产标准是直径应为一种零件的生产标准是直径应为10cm10cm,为对生,为对生产过程进行控制,质量监测人员定期对一台加工机床产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于如果零件的平均直径大于或小于10cm10cm,则表明生产过,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设是否正常的原假设和被择假设【例例】某品牌洗涤剂在它的产品说明书中声称:某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于
12、平均净含量不少于500500克。从消费者的利益出发,克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设检验的原假设与备择假设【例例】一家研究机构估计,某城市中家庭拥有一家研究机构估计,某城市中家庭拥有汽车的比率超过汽车的比率超过30%30%。为验证这一估计是否正确,。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设陈述用于检验的原假设与备择假设 某厂生产的
13、化纤的纤度服从正态分布,纤某厂生产的化纤的纤度服从正态分布,纤维纤度的标准均值为维纤度的标准均值为1.041.04。某天测得。某天测得2525根根纤维的纤度均值为纤维的纤度均值为x=1.39x=1.39,检验与原来设,检验与原来设计的标准均值相比是否有所变化,要求的计的标准均值相比是否有所变化,要求的显著性水平为显著性水平为=0.05=0.05,则假设形式为:,则假设形式为: 某一贫困地区所估计的营养不良的人数高某一贫困地区所估计的营养不良的人数高达达20%,然而有人认为实际上比这个比例,然而有人认为实际上比这个比例还要高,要检验该说法是否正确,则假设还要高,要检验该说法是否正确,则假设形式为
14、:形式为: 下列假设检验形式的写法错误的是:下列假设检验形式的写法错误的是:1.1. 原假设和备择假设是一个原假设和备择假设是一个完备事件组完备事件组,而且,而且相互对立相互对立 在一项假设检验中,原假设和备择假设必有一在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立个成立,而且只有一个成立2.2. 先确定备择假设,再确定原假设先确定备择假设,再确定原假设 3.3. 等号等号“= =”总是放在原假设上总是放在原假设上 4.4. 因研究目的不同,对同一问题可能提出不同因研究目的不同,对同一问题可能提出不同的假设的假设( (也可能得出不同的结论也可能得出不同的结论) )(1) 当原
15、假设当原假设H0为真为真, 观察值却落入拒绝域观察值却落入拒绝域, 而而假设检验的依据是假设检验的依据是: :小概率事件在一次试小概率事件在一次试验中验中两类错误两类错误率就是率就是显著性水平显著性水平 .错误错误, 这类错误是这类错误是“以真为假以真为假”. 犯第犯第类错误的概类错误的概作出作出了拒绝了拒绝H0的判断的判断, 称为称为第第类错误类错误, 又叫又叫弃真弃真有有两两类类:设设检验所作出的结论有可能是错误的检验所作出的结论有可能是错误的. 这种错误这种错误很难发生很难发生. 但但“很难发生很难发生”不等于不等于“不发生不发生”, 因而因而假假 = P 拒绝原假设拒绝原假设H0 |
16、H0为真为真 假设检验是由局部推断总体,并且假设检验是由局部推断总体,并且是在给定检验水平是在给定检验水平 的前提下进行的前提下进行推断,推断,接受还是拒绝原假设完全取接受还是拒绝原假设完全取决于样本值,决于样本值, 因此所作检验可能导因此所作检验可能导致两类错误的产生致两类错误的产生(2) 当原假设当原假设H0不真不真, 而观察值却落入接受域而观察值却落入接受域,1当样本容量当样本容量 n 一定时一定时, 若减少犯第一类若减少犯第一类犯第犯第类错误的概率记为类错误的概率记为 2若要使犯两类错误的概率都减小若要使犯两类错误的概率都减小, 除非除非注注叫叫取伪错误取伪错误, 这类错误是这类错误是
17、“以假为真以假为真”. 从而作从而作出了接受出了接受H0的判断的判断, 称为称为第第类错误类错误, 又又错误错误的概率的概率, 则犯第则犯第类错误的概率往往增大类错误的概率往往增大.增加增加样本容量样本容量. = P 接受接受H0 | H0不正确不正确 陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H01 - 第二类错第二类错误误( ( ) )拒绝拒绝H0第一类第一类错误错误( ( ) )( (1-1- ) ) 错误和错误和 错误的关系错误的关系要使要使和和同时减
18、小同时减小的唯一办法是增加的唯一办法是增加样本量样本量 任何检验方法都不能完全排除犯错任何检验方法都不能完全排除犯错 假设检验的假设检验的指导思想是控制犯第一类指导思想是控制犯第一类误的可能性。理想的检验方法应使犯两类误的可能性。理想的检验方法应使犯两类错误的概率都很小错误的概率都很小, ,但在样本容量给定的但在样本容量给定的情形下情形下, ,不可能使两者都很小不可能使两者都很小, ,降低一个降低一个, , 往往使另一个增大。往往使另一个增大。错误的概率不超过错误的概率不超过 , , 然后然后, ,若有必要若有必要, ,通通过增大样本容量的方法来减少过增大样本容量的方法来减少 。关于原假设与备
19、择假设的选取关于原假设与备择假设的选取H H0 0与与H H1 1地位应平等地位应平等, ,但在控制犯第一类但在控制犯第一类错误的概率错误的概率 的原则下的原则下, ,使得采取拒绝使得采取拒绝H H0 0 的决策变得较慎重的决策变得较慎重, ,即即H H0 0 得到特别得到特别的保护的保护。因而因而, ,通常把有把握的、有经验的结论通常把有把握的、有经验的结论作为原假设作为原假设, ,或者尽可能使或者尽可能使后果严重的后果严重的错误成为第一类错误错误成为第一类错误。显著性水平显著性水平 (significant level)1.1. 是一个是一个概率值概率值2.2. 原假设为真时,检验统计量落
20、在拒原假设为真时,检验统计量落在拒绝域的概率绝域的概率 是指定的犯第是指定的犯第类错误概率的最大允类错误概率的最大允许值许值3.3. 表示为表示为 常用的常用的 值有值有0.01, 0.05, 0.100.01, 0.05, 0.104.4. 由研究者由研究者事先确定事先确定对不同的检验的显著性水平对不同的检验的显著性水平 ,同一个问题可能会得到不同的同一个问题可能会得到不同的检验结果。因此,检验结果。因此, 假设检验假设检验必须先给定显著性水平。必须先给定显著性水平。一般情况下,认为第一般情况下,认为第类错误的后果类错误的后果更严重,因此通常会取一个较小的更严重,因此通常会取一个较小的 值值
21、假设检验运用了小概率原理,事先假设检验运用了小概率原理,事先确定的作为判断的界限,即允许的确定的作为判断的界限,即允许的小概率的标准,称为显著性水平。小概率的标准,称为显著性水平。如果根据命题的原假设所计算出来如果根据命题的原假设所计算出来的概率小于这个标准,就拒绝原假的概率小于这个标准,就拒绝原假设;大于这个标准则接受原假设设;大于这个标准则接受原假设 假设检验中,依据显著性水平大小把概率假设检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受间称为拒绝区间,大于这个标准则为接受区间。事件属于接受区间,不
22、拒绝原假设区间。事件属于接受区间,不拒绝原假设而无显著性差异;事件属于拒绝区间,拒而无显著性差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。绝原假设而认为有显著性差异。 对显著水平的理解必须把握以下二点:对显著水平的理解必须把握以下二点: 显著性水平不是一个固定不变的数值,依据拒显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险来决定。绝区间所可能承担的风险来决定。 统计上所讲的显著性与实际生活工作中的显著统计上所讲的显著性与实际生活工作中的显著性是不一样的。性是不一样的。 1.1. 根据样本观测结果计算得到的,并据以对根据样本观测结果计算得到的,并据以对原假设和备择假设作出
23、决策的某个样本统原假设和备择假设作出决策的某个样本统计量计量2.2. 对样本估计量的标准化结果对样本估计量的标准化结果 原假设原假设H H0 0为真为真 点估计量的抽样分布点估计量的抽样分布 如:由一般正态分布转化如:由一般正态分布转化为标准正态分布的过程为标准正态分布的过程检验统计量实际上是总体参数的点估计量,检验统计量实际上是总体参数的点估计量,由于其随机性,需要进行标准化后,才能用由于其随机性,需要进行标准化后,才能用作检验的标准作检验的标准,以反映点估计量与假设的总体以反映点估计量与假设的总体参数相比,相差多少个标准差参数相比,相差多少个标准差拒绝域拒绝域C: 拒绝原假设拒绝原假设 H
24、0 的所有样本值的所有样本值拒绝原假设拒绝原假设H0的检验统计量的取值范围的检验统计量的取值范围. 临界点临界点(值值):拒绝域的边界点拒绝域的边界点(值值)(x1, x2, , xn)所组成的集合所组成的集合.(相应于检验统计量的值相应于检验统计量的值).拒绝域与临界点拒绝域与临界点检验统计量取某个区域检验统计量取某个区域C中的值时中的值时, 我们拒绝原我们拒绝原假设假设H0, 则称区域则称区域C为为拒绝域拒绝域, 拒绝域的边界点称拒绝域的边界点称为为临界点临界点.构造一个统计量构造一个统计量来决定是来决定是“接受原假设,拒绝备选假接受原假设,拒绝备选假设设”,还是,还是“拒绝原假设,接受备
25、选假设拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要量确定后,就要利用该统计量的抽样分布以及由实际利用该统计量的抽样分布以及由实际问题中所确定的显著性水平问题中所确定的显著性水平,来进一步确定检验统计,来进一步确定检验统计量拒绝原假设的取值范围,即量拒绝原假设的取值范围,即拒绝域拒绝域: 在给定的显著性水平在给定的显著性水平下,检验统计量的下,检验统计量的可能取值可能取值范围被范围被分成两部分:小概率区域与大概率区域。小概率区域就是分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平概率不
26、超过显著性水平的区域,是原假设的拒绝区域;的区域,是原假设的拒绝区域;大概率区域是概率为大概率区域是概率为1-的区域,是原假设的接受区域。的区域,是原假设的接受区域。 小小 结结双侧检验和单侧检验双侧检验和单侧检验1.1. 备择假设没有特定的方向性备择假设没有特定的方向性,并含有符号,并含有符号“ ”的假设检验,称为双侧检验或双尾的假设检验,称为双侧检验或双尾检验检验(two-tailed test) (two-tailed test) 2.2. 备择假设具有特定的方向性备择假设具有特定的方向性,并含有符号,并含有符号“”或或“”的假设检验,称为单侧检验的假设检验,称为单侧检验或单尾检验或单尾
27、检验(one-tailed test)(one-tailed test) 备择假设的方向为备择假设的方向为“ ”,称为,称为右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验 (假设的形式假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H H0 0: :=0 0H H0 0: 0 0H H0 0: 0 0备择假设备择假设H H1 1: :0 0H H1 1: :0 0 双侧检验双侧检验(原假设与备择假设的确定)(原假设与备择假设的确定)双侧检验属于双侧检验属于决策中的假设检验决策中的假设检验。也就是说,。也就是说,不论是拒绝不论是拒绝H0还是
28、接受还是接受H0,我们都必需采,我们都必需采取相应的行动措施取相应的行动措施例如,某种零件的尺寸,要求其平均长度为例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于厘米,大于或小于10厘米均属于不合格厘米均属于不合格建立的原假设与备择假设应为建立的原假设与备择假设应为 H0: m m = = 10 H1: m m 10双侧检验双侧检验(确定假设的步骤)(确定假设的步骤)1. 例如问题为例如问题为: 检验该企业生产的零件平均检验该企业生产的零件平均长度为长度为4厘米厘米2. 步骤步骤从统计角度陈述问题从统计角度陈述问题 (m m = 4)从统计角度提出相反的问题从统计角度提出相反的问题
29、(m m 4)必需互斥和穷尽必需互斥和穷尽提出原假设提出原假设 (m m = 4)提出备择假设提出备择假设 (m m 4)有有 符号符号双侧检验双侧检验(显著性水平与拒绝域)(显著性水平与拒绝域) /2 双侧检验双侧检验(显著性水平与拒绝域)(显著性水平与拒绝域) /2 双侧检验双侧检验(显著性水平与拒绝域)(显著性水平与拒绝域) /2 双侧检验双侧检验(显著性水平与拒绝域)(显著性水平与拒绝域) /2 单侧检验单侧检验(显著性水平与拒绝域)(显著性水平与拒绝域)检验检验研究中的假设研究中的假设1. 将所研究的假设作为备择假设将所研究的假设作为备择假设H12. 将认为将认为研究结果是无效的说法
30、或理论作研究结果是无效的说法或理论作为原假设为原假设H0。或者说,把希望。或者说,把希望(想要想要)证明证明的假设作为备择假设的假设作为备择假设3. 先确立备择假设先确立备择假设H1单侧检验单侧检验(显著性水平与拒绝域)(显著性水平与拒绝域)n例如,采用新技术生产后,将会使产品的例如,采用新技术生产后,将会使产品的使用寿命明显延长到使用寿命明显延长到1500小时以上小时以上属于研究中的假设属于研究中的假设建立的原假设与备择假设应为建立的原假设与备择假设应为v H0: m m 1500 H1: m m 1500n例如,改进生产工艺后,会使产品的废品例如,改进生产工艺后,会使产品的废品率降低到率降
31、低到2%以下以下属于研究中的假设属于研究中的假设建立的原假设与备择假设应为建立的原假设与备择假设应为v H0: m m 2% H1: m m 2%单侧检验单侧检验(显著性水平与拒绝域)(显著性水平与拒绝域)检验检验某项声明的有效性某项声明的有效性1. 将所作出的说明将所作出的说明(声明声明)作为原假设作为原假设2. 对该说明的质疑作为备择假设对该说明的质疑作为备择假设3. 先确立原假设先确立原假设H0 除非我们有证据表明除非我们有证据表明“声明声明”无效,否则无效,否则就应认为该就应认为该“声明声明”是有效的是有效的单侧检验单侧检验(原假设与备择假设的确定)(原假设与备择假设的确定)n 例如,
32、某灯泡制造商声称,该企业所生例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在产的灯泡的平均使用寿命在10000小时以小时以上上除非样本能提供证据表明使用寿命在除非样本能提供证据表明使用寿命在10000小时以下,否则就应认为厂商的声小时以下,否则就应认为厂商的声称是正确的称是正确的建立的原假设与备择假设应为建立的原假设与备择假设应为 H0: m m 10000 H1: m m 10000提出原假设提出原假设: H0: m m 10000选择备择假设选择备择假设: H1: m m 10000 单侧检验单侧检验(例子(例子)提出原假设提出原假设: H0: m m 25选择备择假设选择备择假
33、设: H1: : m m 25 单侧检验单侧检验(例子)(例子)单侧检验单侧检验(显著性水平与拒绝域(显著性水平与拒绝域 ) 左侧检验左侧检验(显著性水平与拒绝域(显著性水平与拒绝域 ) 左侧检验左侧检验(显著性水平与拒绝域(显著性水平与拒绝域 ) 右侧检验右侧检验(显著性水平与拒绝域(显著性水平与拒绝域 ) 右侧检验右侧检验(显著性水平与拒绝域 ) 假设检验中的假设检验中的P值值 假设检验的结论是在给定的显著性水平下假设检验的结论是在给定的显著性水平下作出的。因此,作出的。因此,在不同的显著性水平下,对在不同的显著性水平下,对同一问题所下的结论可能完全相反同一问题所下的结论可能完全相反(下图
34、)。(下图)。红点红点: 在在0.1的显著性水平下,的显著性水平下,拒绝原假设;拒绝原假设; 在在0.050.05的显著性水平的显著性水平下,接受原假设。下,接受原假设。要测量样本数据与原要测量样本数据与原假设的值的偏离程度,假设的值的偏离程度,需要计算需要计算p值。值。什么是什么是P 值值?(P-value)1.在原假设为真的条件下,检验统计量的观察在原假设为真的条件下,检验统计量的观察值的值的概率。概率。双侧检验为分布中两侧面积的总和双侧检验为分布中两侧面积的总和2.反映实际观测到的数据与原假设反映实际观测到的数据与原假设H0之间不一之间不一致的程度致的程度3.被称为被称为观察到的观察到的
35、(或实测的或实测的)显著性水平显著性水平4.决策规则:决策规则:若若p值值 , 拒绝拒绝 H05.拒绝原假设的最小显著性水平拒绝原假设的最小显著性水平”称为称为假设检假设检验的验的P值值P值可以认为是在对一个值可以认为是在对一个总体抽取多个样本的情况总体抽取多个样本的情况下,证明原假设正确的某下,证明原假设正确的某一类数据出现的频数。一类数据出现的频数。 一般地,可通过样本计算检验统计量的值一般地,可通过样本计算检验统计量的值C,根据具体分布求出该根据具体分布求出该C值对应的值对应的P值(为一概率值(为一概率值),然后与给定的显著性水平值),然后与给定的显著性水平 进行比较进行比较:假设检验假
36、设检验P值的应用:值的应用: 如果如果 P ,则在显著性水平,则在显著性水平 下接受原假设下接受原假设 如果如果P ,则在显著性水平,则在显著性水平 下拒绝原假设下拒绝原假设双侧检验的双侧检验的P 值值左侧检验的左侧检验的P 值值右侧检验的右侧检验的P 值值 经典假设检验中一般给出显著性水平经典假设检验中一般给出显著性水平,在给定,在给定的显著性水平下,根据所掌握的信息作出检验的的显著性水平下,根据所掌握的信息作出检验的结论。但不同的样本得出的检验统计量的值不同,结论。但不同的样本得出的检验统计量的值不同,即使落在相同的区域,所下的结论相同,但检验即使落在相同的区域,所下的结论相同,但检验的把
37、握程度也不相同。的把握程度也不相同。 利用计算机软件做假设检验要给出利用计算机软件做假设检验要给出P值,值,用用P值做值做假设检验不需要查表求临界值,只需直接用假设检验不需要查表求临界值,只需直接用P值值与显著性水平与显著性水平相比即可作出判定结论相比即可作出判定结论,知道检,知道检验的显著性,使检验者自己决定在给定的验的显著性,使检验者自己决定在给定的P值水值水平上拒绝或接受原假设。平上拒绝或接受原假设。 因此,用因此,用P值作假设检验与其他方法相比具有明值作假设检验与其他方法相比具有明显的优越性。显的优越性。假设检验步骤的总结假设检验步骤的总结1. 陈述陈述原假设和备择假设原假设和备择假设
38、2. 从所研究的总体中抽出从所研究的总体中抽出一个随机样本一个随机样本3. 确定一个适当的确定一个适当的检验统计量检验统计量,并利用样本,并利用样本数据算出其具体数值数据算出其具体数值4. 确定一个适当的确定一个适当的显著性水平显著性水平,并计算出其,并计算出其临界值,指定拒绝域临界值,指定拒绝域5. 将统计量的值与临界值进行将统计量的值与临界值进行比较,作出决比较,作出决策策统计量的值落在拒绝域,拒绝统计量的值落在拒绝域,拒绝H0,否则不拒,否则不拒绝绝H0也可以直接利用也可以直接利用P值作出决策值作出决策5.2 一个总体参数的检验一个总体参数的检验一、总体均值的检验一、总体均值的检验二、总
39、体比率的检验二、总体比率的检验三、总体方差的检验三、总体方差的检验一个总体参数的检验一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 2 检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比率比率方差方差总体均值的检验总体均值的检验(作出判断作出判断) 是否已是否已知知样本容量样本容量n 是否已是否已知知 t 检验检验z 检验检验z 检验 z 检验检验总体均值的检验总体均值的检验 (大样本大样本)假定条件假定条件正态总体或非正态总体大样本正态总体或非正态总体大样本(n 30)使用使用z检验统计量检验统计量
40、 2 已知:已知: 2 未知:未知: 例例1:消费者协会接到消费者投诉,指控品:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为之嫌。包装上标明的容量为250毫升。消费毫升。消费者协会从市场上随机抽取者协会从市场上随机抽取50盒该品牌纸包装盒该品牌纸包装饮品,测试发现平均含量为饮品,测试发现平均含量为248毫升,小于毫升,小于250毫升。这是生产中正常的波动,还是厂毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?数据
41、,判定饮料厂商欺骗了消费者呢?总体均值的检验总体均值的检验 (例题分析例题分析) 第一步:确定原假设与备择假设第一步:确定原假设与备择假设。 : 250; : 250 以上的备择假设是总体均值小于以上的备择假设是总体均值小于250毫毫升,因为消费者协会希望通过样本数升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为据推断出厂商的欺骗行为(大于大于250毫毫升一般不会发生升一般不会发生)。因此使用左侧检验。因此使用左侧检验。 0Hmm1H 第二步:构造出检验统计量。第二步:构造出检验统计量。 我们知道,如果总体的标准差已知,则正态我们知道,如果总体的标准差已知,则正态总体总体(正常情况下,生
42、产饮料的容量服从正态正常情况下,生产饮料的容量服从正态分布分布)的抽样平均数,也服从正态分布,对它的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:进行标准化变换,可得到: 可用可用z作为检验统计量。作为检验统计量。 )1 ,00NnXzm= 第三步:确定显著性水平,确定拒绝域。第三步:确定显著性水平,确定拒绝域。 通常显著水平由实际问题确定,这里假定取通常显著水平由实际问题确定,这里假定取=0.05,左侧检验,拒绝域安排在左边,查,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:标准正态分布表得临界值: - = -1.645, 拒绝域是拒绝域是z-1.645。z 第四步:计算检
43、验统计量的数值第四步:计算检验统计量的数值。 样本平均数样本平均数 n=50,代入检验统计量得:代入检验统计量得: 248=X645. 154. 35042502480=nXzm 第五步:判断第五步:判断。 检验统计量的样本取值落入拒绝域、检验统计量的样本取值落入拒绝域、 拒绝原假设,接受备择假设拒绝原假设,接受备择假设 认为有足够的证据说明该种纸包饮料的认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的平均容量小于包装盒上注明的250毫升,毫升,厂商有欺诈之嫌。厂商有欺诈之嫌。总体均值的检验总体均值的检验( 2 已知已知)(例题分析例题分析) 【例例】一种罐装饮料采用自动一种罐装饮
44、料采用自动生产线生产,每罐的容量是生产线生产,每罐的容量是255ml255ml,标准差为,标准差为5ml5ml。为检验。为检验每罐容量是否符合要求,质检每罐容量是否符合要求,质检人员在某天生产的饮料中随机人员在某天生产的饮料中随机抽取了抽取了4040罐进行检验,测得每罐进行检验,测得每罐平均容量为罐平均容量为255.8ml255.8ml。取显著。取显著性水平性水平 =0.05 =0.05 ,检验该天生产,检验该天生产的饮料容量是否符合标准要求?的饮料容量是否符合标准要求?总体均值的检验总体均值的检验( 2 已知已知)(例题分析例题分析) H0 :m m = 255 H1 :m m 255 =
45、0.05 n = 40 临界值临界值(c):均值的双尾均值的双尾 Z 检验检验( (练习练习1 1) )【例例】某机床厂加工一种零件,根据经验知道,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总该厂加工零件的椭圆度近似服从正态分布,其总体均值为体均值为m m0=0.081mm,总体标准差为,总体标准差为 = 0.025 0.025 。今换一种新机床进行加工,抽取今换一种新机床进行加工,抽取n=200个零件进个零件进行检验,得到的椭圆度为行检验,得到的椭圆度为0.076mm。试问新机床。试问新机床加工零件的椭圆度的均值与以前有无显著差异?加工零件的椭圆度的均值与以
46、前有无显著差异?( 0.05)均值的双尾均值的双尾 Z 检验检验(计算结果)计算结果)H0: m m = 0.081H1: m m 0.081 = 0.05n = 200临界值临界值(s):总体均值的检验总体均值的检验( 2 未知未知)(例题分析例题分析)【例例】一种机床加工的零件一种机床加工的零件尺寸绝对平均误差为尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机生产厂家现采用一种新的机床进行加工以期进一步降低床进行加工以期进一步降低误差。为检验新机床加工的误差。为检验新机床加工的零件平均误差与旧机床相比零件平均误差与旧机床相比是否有显著降低,从某天生是否有显著降低,从某天生产的零件中
47、随机抽取产的零件中随机抽取50个进个进行检验。利用这些样本数据,行检验。利用这些样本数据,检验新机床加工的零件尺寸检验新机床加工的零件尺寸的平均误差与旧机床相比是的平均误差与旧机床相比是否有显著降低?否有显著降低? ( =0.01) 50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.10
48、1.641.702.371.381.601.261.171.121.230.820.86总体均值的检验总体均值的检验( 2 未知未知)(例题分析例题分析) H0 : m m 1.35 H1 : m m 5200 = 0.05 n = 36 临界值临界值(c):总体均值的检验总体均值的检验(z检验检验) (P 值的图示值的图示)均值的单尾均值的单尾Z检验检验 (练习(练习2)【例例】某批发商欲从生产厂家购进一批灯泡,某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低根据合同规定,灯泡的使用寿命平均不能低于于1000小时。已知灯泡使用寿命服从正态分小时。已知灯泡使用寿命服从正
49、态分布,标准差为布,标准差为20小时。在总体中随机抽取小时。在总体中随机抽取100只灯泡,测得样本均值为只灯泡,测得样本均值为960小时。批发商是小时。批发商是否应该购买这批灯泡?否应该购买这批灯泡? ( 0.05)均值的单尾均值的单尾Z检验检验 (计算结果)(计算结果)H0: m m 1000H1: m m 1020 = 0.05n = 16临界值临界值(s):总体均值的检验总体均值的检验 (大大样本检验方法的总结样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : m m =m m0 0H1 : m m m m0 0H0 : m m m m0
50、 0H1 : m m m m0 0统计量统计量 已知:已知: 未知:未知:拒绝域拒绝域P值决策值决策拒绝拒绝H0nxzm0=nsxz0m=2/zz zzzz P总体均值的检验总体均值的检验 (小样本小样本)1.假定条件假定条件总体服从正态分布总体服从正态分布小样本小样本(n 30)2. 检验统计量检验统计量 2 已知:已知: 2 未知:未知:总体均值的检验总体均值的检验 (小小样本检验方法的总结样本检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量统计量 已知: 未知:拒绝域拒
51、绝域P值决策值决策拒绝H0nxzm0=nsxt0m=) 1(2/ntt) 1( ntt) 1( nttP总体均值的总体均值的t检验检验 (例题分析例题分析) 【例例】一种汽车配件的平均长度要求为一种汽车配件的平均长度要求为12cm,高,高于或低于该标准均被认为是不合格的。汽车生产企于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的现对一个配件提供商提供的10个样本进行了检验。个样本进行了检验。假定该
52、供货商生产的配件长度服从正态分布,在假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是的显著性水平下,检验该供货商提供的配件是否符合要求?否符合要求? 10个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.3总体均值的总体均值的t检验检验 (例题分析例题分析) H0 : m m = 12 H1 : m m 12 = 0.05 df = 10 - 1 = 9 临界值临界值(c):均值的双尾均值的双尾 t 检验检验 (练习)(练习)【例例】某厂采用自动包装机某厂采用自动包装机分装产品,假定
53、每包产品的分装产品,假定每包产品的重量服从正态分布,每包标重量服从正态分布,每包标准重量为准重量为1000克。某日随机克。某日随机抽查抽查9包,测得样本平均重量包,测得样本平均重量为为986克,样本标准差为克,样本标准差为24克。克。试问在试问在0.05的显著性水平上,的显著性水平上,能否认为这天自动包装机工能否认为这天自动包装机工作正常?作正常?均值的双尾均值的双尾 t 检验检验 (计算结果)(计算结果)H0: m m = 1000H1: m m 1000 = 0.05df = 9 - 1 = 8临界值临界值(s):总体均值的检验总体均值的检验( t 检验检验) (P 值的计算与应用值的计算
54、与应用) 第第1步:步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数) 第第2步:步:在函数分类中点击“统计”,并在函数名的 菜单下选择“TDIST”,然后确定 第第3步:步:在出现对话框的X栏中输入计算出的t的绝对值 0.7035,在Deg-freedom(自由度)栏中输入 本例的自由度9,在Tails栏中输入2(表明是双 侧检验,如果是单测检验则在该栏输入1) 第第4步:步:P值= 0.499537958 P值=0.05,故不拒绝H0 总体比率检验总体比率检验1. 假定条件假定条件总体服从二项分布总体服从二项分布可用正态分布来近似可用正态分布来近似(大样本大样本)2. 检验的检
55、验的 z 统计量统计量总体比率的检验总体比率的检验 (检验方法的总结检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0: = 0 0H1: 0 0H0 : 0 0H1 : 0 0统计量统计量拒绝域拒绝域P值决策值决策拒绝拒绝H0P2/zz npz)1(000=zzzz 总体比率的检验总体比率的检验 (例题分析例题分析) 【例例】一种以休闲和娱乐为主题的杂志,声一种以休闲和娱乐为主题的杂志,声称其读者群中有称其读者群中有80%为女性。为验证这一说为女性。为验证这一说法是否属实,某研究部门抽取了由法是否属实,某研究部门抽取了由200人组成人组成的一个随机样
56、本,发现有的一个随机样本,发现有146个女性经常阅读个女性经常阅读该杂志。分别取显著性水平该杂志。分别取显著性水平 =0.05和和 =0.01 ,检验该杂志读者群中女性的比率是否为检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?它们的值各是多少?总体比率的检验总体比率的检验 (例题分析例题分析) H0 : = 80% H1 : 80% = 0.05 n = 200 临界值临界值(c):总体比率的检验总体比率的检验 (例题分析例题分析) H0 : = 80% H1 : 80% = 0.01 n = 200 临界值临界值(c):一个总体比例的一个总体比例的 Z 检验检验 (练习)(练习
57、)【例例】某研究者估计本某研究者估计本市居民家庭的电脑拥有市居民家庭的电脑拥有率为率为30%。现随机抽查。现随机抽查了了200的家庭,其中的家庭,其中68个个家庭拥有电脑。试问研家庭拥有电脑。试问研究者的估计是否可信?究者的估计是否可信? ( = 0.05)一个样本比例的 Z 检验 (结果)(结果)H0: p = 0.3H1: p 0.3 = 0.05n = 200临界值临界值(s):总体方差的检验总体方差的检验 ( 2检验检验) 1. 检验一个总体的方差或标准差检验一个总体的方差或标准差2. 假设假设总体近似服从正态分布总体近似服从正态分布3. 使用使用 2分布分布4. 检验统计量检验统计量
58、参看参看P108总体方差的检验总体方差的检验 (检验方法的总结检验方法的总结)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : 2= 02 H1 : 2 02H0 : 2 02 H1 : 2 02统计量统计量拒绝域拒绝域P值决策值决策 拒绝H0P2022) 1(sn =) 1(2212n) 1(222n) 1(222n) 1(2212nP166总体方差的检验步骤总体方差的检验步骤 ( 2检验检验)总体方差的检验步骤总体方差的检验步骤 ( 2检验检验)总体方差的检验步骤总体方差的检验步骤 ( 2检验检验)总体方差的检验总体方差的检验 ( 2检验检验)222)1(
59、Sn = =1.双边假设检验双边假设检验(1) 提出原假设提出原假设H0: 2 = 02 ,H1: 202.(2) 选择统计量选择统计量(3) 在假设在假设H0成立的条件下,确定该统计量服从成立的条件下,确定该统计量服从的分布:的分布: 2 2(n-1),自由度为自由度为n-1.未知期望未知期望m m, H0: 2 = 02 , H1: 202(4) 选择检验水平选择检验水平 ,查自由度为查自由度为n-1的的 2分布表,分布表,得临界值:得临界值:)1(22211 = = n ) 1(2222 = =n 使得使得22122 = = P2222 = = P时,时,或或当当)1()1(222022
60、120 nn (5) 根据样本值计算统计量的观察值根据样本值计算统计量的观察值 02,给出拒绝给出拒绝或接受或接受H0的判断:的判断:时时,当当)1()1(2220221 nn 则拒绝则拒绝H0 ;则接受则接受H0 .例:某厂生产的某种型号的电池,其寿命长期以来例:某厂生产的某种型号的电池,其寿命长期以来服从方差服从方差 2 =5000(小时小时2)的正态分布。现有一批这的正态分布。现有一批这种电池,从它的生产情况来看,寿命的波动性有所种电池,从它的生产情况来看,寿命的波动性有所改变。现随机取改变。现随机取26只只电池,测得其寿命的样本方差电池,测得其寿命的样本方差s2=9200(小时小时2)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 快消品行业区域经理招聘面试流程
- 销售业务场景标准化话术工具
- 快速消费品行业市场部职位的面试策略
- 团队绩效评估量化评分标准模板
- 零售业人力资源招聘官面试攻略及问题
- 基于大数据分析的智慧医疗系统设计与实现
- 项目成本预算与控制模板行业
- 项目按期交付与成功保障承诺书范文7篇
- 企业团队培训效果评估与反馈模板
- 2025年AI驱动的跨境电商智能选品系统应用
- (正式版)DB41∕T 3018-2025 《氧舱维护保养作业人员考核指南》
- (正式版)DB34∕T 5268-2025 《 600MPa级普通热轧带肋高强钢筋应用技术规程》
- 天府智慧小区建设导则1.0版(校核版)
- 化工企业变更管理制度1209-2
- 2026年消防设施操作员之消防设备基础知识考试题库500道及完整答案(各地真题)
- 《中国成人术后疼痛管理指南》
- 2025年建筑施工高处作业安全培训考试题库(含答案)
- 生产安全事故应急预案执行部门签署页
- 军事体育基础训练大纲
- 2026年鄂尔多斯职业学院单招职业技能考试题库及答案详解一套
- 四川省2025年高职单招职业技能综合测试(中职类) 公共管理与服务类试卷(含答案解析)
评论
0/150
提交评论