第四章假设检验.doc_第1页
第四章假设检验.doc_第2页
第四章假设检验.doc_第3页
第四章假设检验.doc_第4页
第四章假设检验.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章假设检验参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。共同点:都是利用样本信息对总体数量特征进行推断。 不同点:推断的角度不同4.1 假设检验的基本问题1、假设检验是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程;包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。2、小概率事件若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)0.05。3、原假设又称零假设,是指研究者想收集证据予以反对的假设,表示为 H0。总是有符号 =、 或 备择假设也称研究假设,是指研究者想收集证据予以支持的假设,表示为 H1。总是有符号 、4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立; 先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定; 等号“=”总是放在原假设上; 因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。 假设检验主要是搜集证据来推翻和拒绝原假设。5、双侧检验是指备择假设没有特定的方向性,并含有符号的假设检验,又称为双尾检验。单侧检验是指备择假设具有特定的方向性,并含有符号或的假设检验,又称为单尾检验。 备择假设的方向为,称为右侧检验 假设双侧检验单侧检验左侧检验右侧检验原假设H0 : m = m0H0 : m m0H0 : m m0备择假设H1 : m m0H1 : m m06、 第类错误(弃真错误)原假设为真时拒绝原假设。 第类错误的概率记为,又被称为显著性水平。又称为显著性水平,常被用于检验结论的可靠性度量;既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第类错误概率的最大允许值); 常用的 a 值有0.01,0.05,0.10; 由研究者事先确定。第类错误(取伪错误)原假设为假时未拒绝原假设。 第类错误的概率记为。确定了显著性水平a 就等于控制了第类错误的概率,但犯第类错误概率b的具体数值却很难确定,其受影响因素包括:随假设总体参数的减少而增大;当 a 减少时增大;当 s 增大时增大;当 n 减少时增大。7、检验统计量是指根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。标准化的检验统计量可表示为:8、拒绝域是指能够拒绝原假设的统计量的所有可能取值构成的集合。 大小等于显著性水平a 。 位置取决于检验是单侧还是双侧。双侧拒绝域在分布两侧;单侧拒绝域在左侧或右侧。临界值根据给定的显著性水平确定的拒绝域的边界值。9、决策步骤给定显著性水平a,查表得出相应的临界值za或za/2, ta或ta/2将计算出的检验统计量的值与临界值比较作出决策双侧检验:|统计量| 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H010、利用p值进行决策p值又称为观察到的显著性水平,在原假设为真的条件下,所得到的样本结果会像实际观测结果那么极端或更极端的概率。是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值;p值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,p值表示这样的观测数据会有多么的不可能得到。或是犯错误的实际概率。不论是单侧检验还是双侧检验,用p值进行决策的规则:若p值a,不拒绝 H0p值反映实际观测到的数据与原假设H0之间不一致的程度的一个概率值。p值越小,说明实际观测到的数据与原假设H0之间不一致的程度就越大,检验的结果也就越显著。11、假设检验步骤(1)、提出原假设和备择假设;(2)、确定一个适当的检验统计量,并利用样本数据算出其具体数值;(3)、根据显著性水平,计算出其临界值,指定拒绝域;(4)、将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用p值作出决策4.2 一个正态总体的检验一、总体均值的检验1、总体方差已知的检验当总体方差已知的情况,无论样本是大样本,还是小样本时,都使用z检验统计量。【例1】某厂生产铜丝,其主要质量指标为折断力X,根据历史资料统计,可假定XN(570,82)。今新换材料生产,抽取30个样本值为: 577、578、579、569、565、577、568、587、 578、572、570、568、572、581、582、569、 570、570、572、596、584,598、588、563、 577、587、567、587 欲检验新材料生产的铜丝的折断力X有无明显变化。假定方差2 = 8 2保持不变,=0.05【解】此题为正态总体均值的假设检验 H0: = 570 H1:570由于铜丝折断力X为大样本且总体方差已知,故可以采用Z检验法。依题意,样本均值为:检验统计量=0.05,查表得Z/2=1.96检验统计量|Z|=21.64Z/2=1.96所以应拒绝H0,表明新材料生产的铜丝的折断力X有明显的变化。【练习1】完成生产线上某件工作所需的平均时间不少于15.5分钟,标准差为3分钟,对随机抽选的36名职工讲授一种新方法,训练期结束后这36名职工完成此项工作所需的平均时间为13.5分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设=0.05,并假定完成这件工作的时间服从正态分布。解:H0:15.5 H1:15.5 由于大样本且总体方差已知,故采用Z检验法。依题意已知: 检验统计量 =0.05,临界值Z=1.645Z=-4-Z=-1.645,所以拒绝原假设H0,表明有充分的证据说明用新方法所需的时间更短。总体方差已知,检验方法的总结假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量无论样本容量大小 拒绝域P值决策 拒绝H02、总体方差未知的检验总体服从正态分布,但总体方差未知时,样本容量的大小决定了所用的检验统计量,大样本 小样本 【例2】某车床加工一种零件,要求其长度为150mm,现从一批加工后的这种零件中随机抽取9个,测得其长度为:147、150、149、154、152、153、148、151、155如果零件长度服从正态分布,问这批零件是否合格?(=0.05)【解】所要检验的假设为:H0:=150 H1:150根据题中数据,计算样本均值和样本标准差分别为:又知n=950 依题意: 又知总体服从正态分布,总体方差未知,且n=1630),故采用Z检验法。所要检验的假设为:H0:21 H1:21检验统计量Z的计算如下:当=0.05时,查Z分布表得出临界值为:因为:所以不拒绝H0,可以认为该批罐头中维生素C的含量合乎标准总体方差未知检验方法小结假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量大样本小样本拒绝域P值决策 拒绝H0二、总体比率的检验根据抽样分布知识,在大样本情况下,总体比例可用正态分布来近似。检验可用z统计量【例3】某公司经理希望估计一下其所在城市居民参加财产保险的比例。业务科长认为大约有80%的居民参加了财产保险,而统计科统计人员随机调查了150户居民了解到有70%的居民参加了财产保险。经理希望在=0.05的显著性水平下检验一下业务科长的说法是否可信?依题意,可建立如下假设 H0:=0.8 H1:0.8又知样本比例p=0.7,n=10530,属于大样本,故采用Z检验法。检验统计量为:=0.05,查表得出临界值 因为 所以应拒绝H0,由此可以判定业务科长的说法不可信,即参加保险的户数不足80%。【练习5】某生产商向供应商购一批西红柿,双方规定若优质西红柿的比例在40%及以上按一般市场价格收购,否则按低于市场价格收购。现随机抽取了100个西红柿,只有34个为优质品。于是,生产商欲按低于市场价格收购,而供应商则认为样本比例不足40%是由随机因素引起的。请用=0.05进行检验并加以说明。依题意,可建立如下假设 H0:P0.4 H1:P30,属于大样本,故采用Z检验法。检验统计量为:当=0.05时,查表得出左侧检验临界值:因为:所以不拒绝原假设H0,即根据样本数据还不能认为优质西红柿的比例显著地低于40%,故而生产商仍应按一般市场价格收购。大样本总体比例的检验小结假设双侧检验左侧检验右侧检验假设形式H0: p =p 0H1: p p 0H0 : p p 0H1 : p p 0统计量拒绝域P值决策拒绝H0三、总体方差的检验通常假设总体近似服从正态分布,使用c 2分布。其检验统计量为:【例4】已知某种零件的尺寸服从N(23.02,1.52)现从这批零件中任取7件进行测量,测得尺寸数据(单位:mm)如下:21.00 22.04 22.32 24.01 24.68 25.02 21.63能否认为该批零件的方差是否和以往一样?(=0.05)依题意可归结为以下假设:H0:=1.52 H1:1.52,由于总体服从正态分布,采用检验。又知检验统计量为:=0.05,查分布表得: /2(n-1)=14.449 1-/2(n-1)=1.237因为 1-/2=1.237=6.7549 /2=16.013所以不拒绝原假设H0,可以认为该批零件的方差和以往是一样的。【练习6】某车间生产的金属丝,质量一贯稳定,折断力服从正态分布,方差=64,今从一批金属铜丝中随机抽取10根作折断力试验,结果为:578、572、570、568、572、570、596、584、570、572。样本均值约为575) 问:这批金属丝折断力的方差为64是否可信?(=0.05)解:待检验假设为:H0:=64 H1:64由于总体服从正态分布,故采用检验。又知检验统计量为:当=0.05,查分布表得: /2(n-1)=0.025(9)=19.023 1-/2(n-1)=0.975(9)=2.700因为:1-/2=2.7002=10.65/2=19.023所以不拒绝H0,可以认为这批金属铜丝的折断力的方差为64可信。单个正态总体方差的检验小结假设双侧检验左侧检验右侧检验假设形式H0 : s 2=s 02 H1 : s 2 s 02H0 : s 2 s 02 H1 : s 2 s 02统计量拒绝域或P值决策 拒绝H04.3 两个正态总体参数的检验一、两个正态总体均值差的检验 1、两个独立总体,方差都已知两个样本是独立的随机样本,且两个正态总体的方差均已知时,其检验统计量【例1】某公司对男女职员的平均小时工资进行了调查,独立抽取了男女职员的两个随机样本,并记录两个样本的均值、容量如下表。在显著性水平为0.05的条件下,能否认为男职员与女职员的平均小时工资存在显著差异?已知两总体服从正态分布,且方差分别为64和42.25男性职员女性职员n1=44n1=32x1=75x2=70n H0:m1-m2= 0n H1:m1-m2 0n a=0.05n n1=44,n2=32n 临界值(c):检验统计量:决策:拒绝H0结论:该公司男女职员的平均小时工资之间存在显著异 z01.96-1.960.025拒绝 H0拒绝 H00.025两个独立正态方差已知总体均值差检验假设双侧检验左侧检验右侧检验假设形式H0 :m 1-m 2=0H1 :m 1-m 2 0 H0 :m 1-m 20H1 :m 1-m 20统计量拒绝域P值决策P 拒绝H02、两个独立总体,方差未知但相等当两个独立的正态总体,方差都未知,却相等的情况下,检验统计量用自由度为n1+n2-2的t统计量 3、两个匹配总体,数据的检验两个正态总体成对数据的差值仍服从正态分布,配对差是随机的,故检验统计量为 二、两个总体比例之差的检验1. 假定条件两个总体都服从二项分布可以用正态分布来近似2.检验统计量检验H0:p1-p2=0检验H0:p1-p2=d0【例3】有两种方法生产同一种产品,方法1的生产成本较高而次品率较低,方法2的生产成本较低而次品率则较高。管理人员在选择生产方法时,决定对两种方法的次品率进行比较,如方法1比方法2的次品率低8%以上,则决定采用方法1,否则就采用方法2。管理人员从方法1生产的产品中随机抽取300个,发现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论