第八章-假设检验.ppt_第1页
第八章-假设检验.ppt_第2页
第八章-假设检验.ppt_第3页
第八章-假设检验.ppt_第4页
第八章-假设检验.ppt_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章 假设检验,第一节 假设检验的基本问题,8.1 假设检验的基本概念 对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。,1、什么是假设?,假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。是对总体参数的一种假设。 常见的是对总体均值或比例和方差的检验; 在分析之前,被检验的参数将被假定取一确定值。,我认为到KFC消费的人平均花费2.5美元!,2、市场调研中常见的假设检验问题,一项跟踪调查的结果表明,顾客对产品的了解程度比6个月前所做的类似调查中的显示要低。结果是否明显降低?是否低到需要改变广告策略的程度? 一位产品经理认为其产品购买者的平均年龄为35岁。为检验其假设,他进行了一项调查,调查表明购买者平均年龄为38.5岁。调查结果与其观点的差别是够足以说明此经理里的观点是不正确的?,3、问题在哪里?,某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品。质检人员会是什么反应呢?,什么是假设?,对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述,什么是假设检验?,概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 类型 参数假设检验 非参数假设检验 特点 采用逻辑上的反证法 依据统计上的小概率原理,假设检验的基本思想,4. 小概率原理,小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。当进行假设检验时,先假设H0正确,在此假设下,若小概率事件A出现的概率很小,例如P(A)=0.01,经过取样试验后,A出现了,则违反了上述原理,我们认为这是一个不合理的结果。,这时,我们只能怀疑作为小概率事件A的前提假设H0的正确性,于是否定H0。反之,如果试验中A没有出现,我们就没有理由否定假设H0,从而做出接受H0的结论。下面我们通过实例来说明假设检验的基本思想及推理方法。,5、原假设和备择假设,原假设 是关于总体均值而非样本统计量的假设 总是假设原假设是正确的 原假设可能被接受也可能被拒绝 备择假设 是原假设的对立 备择假设可能被接受也可能被拒绝 备择假设是试图要建立的检验,8.2 假设检验的基本思路与方法,假设检验的步骤 提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,提出原假设和备择假设, 什么是原假设?(Null Hypothesis) 1. 待检验的假设,又称“0假设” 2. 如果错误地作出决策会导致一系列后果 3. 总是有等号 , 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克),为什么叫0假设,什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克),提出原假设和备择假设,什么检验统计量? 用于假设检验问题的统计量 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平,什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值Z或Z/2 将检验统计量的值与 水平的临界值进行比较 得出接受或拒绝原假设的结论,两类错误分析,小概率原理是假设检验的基本依据,然而,对于小概率事件,无论其概率多么小,还是可能发生的,所以,利用小概率原理为基础的假设检验方法进行检验,可能会做出错误的判断,主要有两种形式 (1)原假设H0实际是正确的,但却错误地拒绝了H0,这样就犯了“弃真”的错误,通常称为第一类错误。由于仅当所考虑的小概率事件A发生时才拒绝H0,所以犯第一类错误的概率就是条件概率: (2)原假设H0实际是不正确的,但是却错误地接受了H0,这样就犯了“取伪”的错误,通常称为第二类错误。犯第二类错误的概率记为。,我们自然希望犯这两类错误的概率越小越好。但当样本容量n确定后,犯这两类错误的概率不可能同时被控制,通常在我们根据历史经验选取恰当的显著性水平后,通过扩大样本容量n的方式来使第二类错误的概率减小。,H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程, 错误和 错误的关系,第二节 单一总体参数的假设检验,建立假设的三种情况:,新型汽化器提高燃料效率的评估,检验某项声明的有效性:,制造商对产品质量的承诺,决策情况下的检验:,质量把关的依据,双侧检验与单侧检验 (假设的形式),双侧检验 (原假设与备择假设的确定),双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为 H0: = 10 H1: 10,双侧检验 (确定假设的步骤),1. 例如问题为: 检验该企业生产的零件平均长度为4厘米 2. 步骤 从统计角度陈述问题 ( = 4) 从统计角度提出相反的问题 ( 4) 必需互斥和穷尽 提出原假设 ( = 4) 提出备择假设 ( 4) 有 符号,提出原假设: H0: = 4 提出备择假设: H1: 4,该企业生产的零件平均长度是4厘米吗? (属于决策中的假设),双侧检验 (例子),双侧检验 (显著性水平与拒绝域 ),双侧检验 (显著性水平与拒绝域 ),双侧检验 (显著性水平与拒绝域 ),双侧检验 (显著性水平与拒绝域 ),例1 某车间为了提高零件的强度进行了技改,已知零件强度X(单位:kg/mm2)服从正态分布N(52.8,0.82 ),其中0=52.8kg/mm2 是零件强度,现进行了技改后,抽取n=16的样本,测得强度为:(kg/mm2) 51.9 53.4 52.9 54.3 53.8 52.4 53.7 54.0 52.4 52.5 53.5 51.3 54.9 52.8 54.5 52.9 假设 2=0.82 不变,试问技改后零件强度是否发生了实质性变化?,我们的问题就是: 已知总体 ,且 要求检验下面的假设: 通常把H0称为原假设或零假设,把H1称为备择假设或对立假设。 从取样结果看 ,样本均值 与总体均值 之间存在差异,这种差异是因为抽样的随机性导致的不可避免的误差,还是因为技改而导致的实质性差异?,为了回答这个问题,首先给定一个小概率,称为显著性水平,通常取较小的值,如0.05,0.01。在本例中,我们选取 。 选取统计量,它包含待检验参数,当H0为真时,它的分布是已知的,本例中,选取 于是有,其中,Z/2 为临界值,查表得Z0.025=1.96 。 |z|的拒绝域为:(1.96, ) 将抽样值代入4-1式得: |z| 落入拒绝域中,即小概率事件竟然出现,于是否定假设H0,认为技改后零件强度发生了变化。,应当注意的是,上面例1的结论是在显著性水平 的情况下得出的,如果 ,则 , 代入观察值 ,则会得出,技改后零件强度无实质变化的相反结论。可见,原假设取舍与否与的取值直接相关,当我们倾向于不要轻易否定H0时,可取小一些;反之,取大一些。,某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令=0.05,检验这批产品是否合格。,单侧检验 (原假设与备择假设的确定),检验研究中的假设 将所研究的假设作为备择假设H1 将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设 先确立备择假设H1,单侧检验 (原假设与备择假设的确定),例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 属于研究中的假设 建立的原假设与备择假设应为 H0: 1500 H1: 1500 例如,改进生产工艺后,会使产品的废品率降低到2%以下 属于研究中的假设 建立的原假设与备择假设应为 H0: 2% H1: 2%,单侧检验 (原假设与备择假设的确定),检验某项声明的有效性 将所作出的说明(声明)作为原假设 对该说明的质疑作为备择假设 先确立原假设H0 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的,单侧检验 (原假设与备择假设的确定),例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在10000小时以上 除非样本能提供证据表明使用寿命在10000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为 H0: 10000 H1: 10000,提出原假设: H0: 10000 选择备择假设: H1: 10000,该批产品的平均使用寿命超过10000小时吗? (属于检验声明的有效性,先提出原假设),单侧检验 (例子),单侧检验 (显著性水平与拒绝域 ),左侧检验 (显著性水平与拒绝域 ),左侧检验 (显著性水平与拒绝域 ),均值的单尾Z检验 (实例),【例】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡? (0.05),均值的单尾Z检验 (计算结果),H0: 1000 H1: 1000 = 0.05 n = 100 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命低于1000小时,决策:,结论:,右侧检验 (显著性水平与拒绝域 ),右侧检验 (显著性水平与拒绝域 ),提出原假设: H0: 25 选择备择假设: H1: : 25,学生中经常上网的人数超过25%吗? (属于研究中的假设,先提出备择假设),右侧检验 (例子),均值的单尾Z检验,根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),均值的单尾Z检验 (计算结果),H0: 1020 H1: 1020 = 0.05 n = 16 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,显著性水平与拒绝域,8.3 单个正态总体均值和方差的检验,我们首先讨论单个正态总体 中参数的假设检验问题。设从总体抽取样本容量为n的样本 , 其中,1. 2已知,关于的检验(z检验),z检验法 在上一节例1中,已讨论过正态总体 , 当2已知时,关于=0的检验问题。在这些问题中,我们都是利用H0为真时服从N(0,1)分布的统计量 来确定拒绝域的,这种检验法常称为z检验法。 (利用服从正态分布的统计量z 进行的假设检验称为z检验法) z检验的步骤(同前),z检验的决策准则如下 (1)双侧检验: 当 时,拒绝原假设H0;否则接受原假设H0。 (2)左侧检验: 当 时,拒绝原假设H0;否则接受原假设H0。 (3)右侧检验: 当 时,拒绝原假设H0;否则接受原假设H0。,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),均值的双尾 Z 检验 (计算结果),H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,2. 2未知,关于的 检验(t检验),t检验法 设总体 ,其中 2 未知, 是来自总体x的样本。因为 未知,不能用统计量 进行检验,当H0成立时,我们可以使用此统计量 来进行在 未知的情况下 的检验。 利用服从正态分布的统计量t 进行的假设检验称为t检验法,t检验的决策准则如下 (1)双侧检验: 当 时,拒绝原假设H0;否则接受原假设H0。 (2)左侧检验: 当 时,拒绝原假设H0;否则接受原假设H0。 (3)右侧检验: 当 时,拒绝原假设H0;否则接受原假设H0。,均值的双尾 t 检验 (实例),【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,均值的双尾 t 检验 (计算结果),H0: = 1000 H1: 1000 = 0.05 df = 9 - 1 = 8 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明这天自动包装机工作正常,决策:,结论:,练习,一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下为20000公里,对一个由18个轮胎组成的随机样本作了试验,测得平均值为19000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),均值的单尾 t 检验 (实例),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),均值的单尾 t 检验 (计算结果),H0: 40000 H1: 40000 = 0.05 df = 20 - 1 = 19 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,解:依题意假设:,练习某种电子元件寿命x(以小时计)服从正态分布,2未知,现抽取9只元件测得寿命如下: 105 99 97 100 96,98,103 104 107 问:是否可以认为元件的寿命大于100小时?,选取统计量,对于给定的 ,查表得临界值 ,拒绝域为(1.753, ) 计算 t没有落入拒绝域,故接受H0,认为元件的寿命不超过100小时。,3.单个总体比例的 Z 检验,假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 z 统计量,P0为假设的总体比例,一个总体比例的 Z 检验 (实例),【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信? ( = 0.05),一个样本比例的 Z 检验 (结果),H0: p = 0.3 H1: p 0.3 = 0.05 n = 200 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明研究者的估计可信,决策:,结论:,例8.4 150页练习8,卡方分布 若n个相互独立的随机变量X1,X2,Xn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和X2构成一新的随机变量,其分布规律称为2(n)分布,其中参数 n 称为自由度,自由度不同就是另一个2分布,正如正态分布中均值或方差不同就是另一个正态分布一样。,4. 总体方差的检验( 检验法),设总体 ,其中 未知, 是来自于总体x的样本。 假设 , , 为已知常数 当H0成立时, 统计量,对于给定的显著性水平 ,查表得: 拒绝域为,其单边检验情况如下: 右边检验: 假设 拒绝域: 左边检验: 假设 拒绝域: 计算s代入得 如果落入拒绝域,则否定H0,否则接受H0。,例4 假设钢板重量总体近似服从正态分布,按照规定,这种钢板的方差不得超过0.016kg2,现随机抽取n=25的钢板样本,测得其样本 ,试问:是否可以认为这批钢板不合规格?,解:依题意,假设 选取统计量 对于给定的显著性水平 , 查表 得 将样本值代入得: 落入拒绝域中,拒绝假设H0,即钢板 不合规格。,卡方 (2)检验 练习,【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(=0.05 ),卡方 (2) 检验 计算结果,H0: 2 = 0.0025 H1: 2 0.0025 = 0.05 df = 20 - 1 = 19 临界值(s):,统计量:,在 = 0.05的水平上接受H0,有证据表明该日纤度的波动比平时没有显著差异,决策:,结论:,第三节 两个正态总体的参数检验,两个独立样本的均值检验,两个独立样本之差的抽样分布,两个总体均值之差的Z检验 (12、 22 已知),1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 原假设:H0: 1- 2 =0;备择假设:H1: 1- 2 0 检验统计量为,两个总体均值之差的Z检验 (假设的形式),两个总体均值之差的Z检验 (例子),【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2= 50公斤,x1= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),两个总体均值之差的Z检验 (计算结果),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 32,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体均值之差的 t 检验 (12、 22未知),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 = 22 检验统计量,其中:,两个总体均值之差的 t 检验 (例子),【例】一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12s22 。试问能否认为用第二种方法组装比用第一中方法组装更好?( = 0.05),两个总体均值之差的 t 检验 (计算结果),H0: 1- 2 0 H1: 1- 2 0 = 0.05 n1 = 10,n2 = 8 临界值(s):,检验统计量:,决策:,结论:,接受H0,没有证据表明用第二种方法组装更好,两个总体均值之差的 t 检验 (12、 22未知),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且1222 ,但样本容量n1=n2 检验统计量服从自由度为n1+n2-2的t分布,两个总体均值之差的 t 检验 (12、 22未知),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且1222 ,样本容量n1n2 检验统计量服从自由度为v的t分布,140页例题8.7,两个相关(配对或匹配)样本的均值检验,假设检验中相关样本的利用,两个总体均值之差的检验 (配对样本的 t 检验),1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论