




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,第七章,假设检验,.,第七章假设检验,学习目标:1.理解假设检验的基本思想和基本步骤;2.理解假设检验的两类错误及其关系;3.熟练掌握总体平均数、总体成数和总体方差的各种假设检验方法;4.利用P-值进行假设检验。,.,7.1假设检验中的基本问题,7.1.1假设检验中的小概率原理7.1.2假设检验的一些基本概念7.1.3假设检验的步骤,.,7.1.1假设检验中的小概率原理,小概率原理:指发生概率很小的随机事件在一次试验中是几乎不可能发生的。小概率指p5%。假设检验的基本思想是应用小概率原理。例如:某厂产品合格率为99%,从一批(100件)产品中随机抽取一件,恰好是次品的概率为1%。随机抽取一件是次品几乎是不可能的,但是这种情况发生了,我们有理由怀疑该厂的合格率为99%.这时我们犯错误的概率是1%。,.,7.1.2假设检验的一些基本概念,1.原假设和备择假设原假设:用H0表示,即虚无假设、零假设、无差异假设;备择假设:用H1表示,是原假设被拒绝后替换的假设。若证明为H0为真,则H1为假;H0为假,则H1为真。对于任何一个假设检验问题所有可能的结果都应包含在两个假设之内,非此即彼。,.,2.检验统计量用于假设检验问题的统计量称为检验统计量。与参数估计相同,需要考虑:总体是否正态分布;大样本还是小样本;总体方差已知还是未知。,7.1.2假设检验的一些基本概念,.,7.1.2假设检验的一些基本概念,3.显著性水平用样本推断H0是否正确,必有犯错误的可能。原假设H0正确,而被我们拒绝,犯这种错误的概率用表示。把称为假设检验中的显著性水平(Significantlevel),即决策中的风险。显著性水平就是指当原假设正确时人们却把它拒绝了的概率或风险。通常取0.05或=0.01或=0.001,那么,接受原假设时正确的可能性(概率)为:95%,99%,99.9%。,.,7.1.2假设检验的一些基本概念,4.接受域与拒绝域接受域:原假设为真时允许范围内的变动,应该接受原假设。拒绝域:当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域便称作拒绝域。,.,例:0.05时的接受域和拒绝域,.,7.1.2假设检验的一些基本概念,5.双侧检验与单侧检验假设检验根据实际的需要可以分为:双侧检验(双尾):指只强调差异而不强调方向性的检验。单侧检验(单尾):强调某一方向性的检验。左侧检验右侧检验,.,假设检验中的单侧检验示意图,拒绝域拒绝域(a)右侧检验(b)左侧检验,.,7.1.2假设检验的一些基本概念,6.假设检验中的两类错误假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而假设检验不可能绝对准确,是可能犯错误的。两类错误:错误(I型错误):H0为真时却被拒绝,弃真错误;错误(II型错误):H0为假时却被接受,取伪错误。假设检验中各种可能结果的概率:接受H0,拒绝H1拒绝H0,接受H1H0为真1(正确决策)(弃真错误)H0为伪(取伪错误)1-(正确决策),.,.,(1)与是两个前提下的概率。即是拒绝原假设H0时犯错误的概率,这时前提是H0为真;是接受原假设H0时犯错误的概率,这时前提是H0为伪。所以不等于1。(2)对于固定的n,与一般情况下不能同时减小。对于固定的n,越小,Z/2越大,从而接受假设区间(-Z/2,Z/2)越大,H0就越容易被接受,从而“取伪”的概率就越大;反之亦然。即样本容量一定时,“弃真”概率和“取伪”概率不能同时减少,一个减少,另一个就增大。,与,.,(3)要想减少与,一个方法就是要增大样本容量n。,与,.,7.1.3假设检验的步骤,1、建立原假设和备择假设;2、确定适当的检验统计量;3、指定检验中的显著性水平;4、利用显著性水平根据检验统计量的值建立拒绝原假设的规则;5、搜集样本数据,计算检验统计量的值;6、作出统计决策:(两种方法)(1)将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设;(2)由步骤5的检验统计量计算p值,利用p值确定是否拒绝原假设。,.,7.2总体均值的检验,7.2.1Z检验7.2.2T-检验,.,7.2.1Z检验,1、当总体分布为正态分布,总体标准差为已知时,检验原假设。当H0成立时,由于总体N(,);所以样本均值。从而统计量为:,.,例7-2某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异(取0.05)。解:从题意可知,1.36米,1.32米,0.12米。(1)建立假设:H0:1.32,H1:1.32(2)确定统计量:,.,(3)Z的分布:ZN(0,1)(4)对给定的0.05确定临界值。因为是双侧备择假设所以查表时要注意。因概率表是按双侧排列的,所以应查1-0.050.95的值,查得临界值1.96。(5)检验准则。|Z|1.96,落在了拒绝域,因此拒绝零假设。认为甲、乙两城市20岁男青年平均体重有显著差异。,.,7.2.2T-检验,t检验法是使用服从t分布的统计量检验正态总体平均值的方法。1.当正态总体标准差未知时,检验零假设H0:。可以证明,在H0成立的前提下,有:(其中,样本标准差),.,例7-5某制药厂试制某种安定神经的新药,给10个病人试服,结果各病人增加睡眠量如表7-2所示。表7-1病人服用新药增加睡眠量表试判断这种新药对病人有无安定神经的功效(0.05)。解:(1)建立假设H0:(没有功效);H1:(有功效)(单侧备择假设)(2)计算统计量:=1.24=1.45,.,=2.57(3)确定统计量分布。本例中,。(4)对于给定的显著性水平0.05,查自由度为9的t分布表,单侧临界值为1.833。(5)建立检验规则。|t|1.833,接受H0,否则,拒绝H0。(6)结论。因为本例t2.571.833,所以,拒绝H0,即,认为这种新药对病人有安定神经的功效。,.,2.若两个正态总体的标准差未知,但知道其值相等,可用t检验来检验零假设H0:。当H0成立时,可证明统计量:,7.2.2T-检验,.,例7-6某工业管理局在体制改革前后,分别调查了l0个和12个企业的劳动生产率情况,得知改革前、后平均劳动生产率(元人)为2089、2450,劳动生产率的方差分别为7689;6850。又知体制改革前、后企业劳动生产率的标准差相等问:在显著性水平0.05下,改革前、后平均劳动生产率有无显著差异?解:(1)建立假设H0:(没有差别)。H1:(有差别)(左单侧备择假设)(2)计算统计量:=-9.45,.,(3)确定统计量分布。本例中,。(4)对于给定的显著性水平0.05,查自由度为20的t分布表,左单侧临界值为-1.725(5)建立检验规则。t小于-1.725,拒绝H0,否则,接受H0。(6)结论。因为本例t-9.45-1.725,所以,拒绝H0,即,在显著性水平0.05下,改革前、后平均劳动生产率有显著差异,改革后的劳动生产率高于改革前的劳动生产率。,.,7.3总体比例的假设检验,7.3.1单个总体比例检验7.3.2两个总体比例检验,.,7.3.1单个总体比例检验,当样本容量n很大,np和n(1-p)两者都大于5时,二项分布可以用正态分布来逼近。在抽样比例nN小于0.05的情形下,关于单个总体比例的假设的检验统计量为:其中,是假设的总体比例,是样本比例,.,7.3.1单个总体比例检验,这个检验统计量近似服从标准正态分布。如果抽样比例n/N很小时,也可以使用下列形式:,.,例7-7某企业的产品畅销国内市场。据以往调查,购买该产品的顾客有50是30岁以上的男子。该企业负责人关心这个比例是否发生了变化,而无论是增加还是减少。于是,该企业委托了一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平0.05下检验“50的顾客是30岁以上的男子”这个假设。解:(1)建立假设由题意可知,这是双侧检验,故建立假设H0:50H1:50,.,(2)计算统计量由于样本容量40030,40050200,200,皆大于5,所以可以使用正态分布进行检验。(3)ZN(0,1)(4)对应于0.05的显著性水平,双侧检验临界值为1.96。(5)若Z值不大于1.96,则接受原假设,否则,拒绝之。(6)本例中,Z=1,处于接受域,故接受“50的顾客是30岁以上的男子”这个假设。,.,1.检验两个总体比例是否相等的假设建立假设H0:P1=P2(或P1-P2=0);H1:P1P2(或P1P20)适当的检验统计量是:由于假设P1=P2,且真正的P1、P2未知,所以用公共比例的联合估计值来估计:其中,x1和x2分别是在两个样本中具有某种特征单位的个数。,7.3.2两个总体比例检验,.,因此,检验统计量就成为:根据经验,大于5时,统计量Z近似服从标准正态分布。,.,例7-6甲、乙两公司属于同一行业,有人问这两个公司的工人是愿意得到特定增加的福利费,还是愿意得到特定增加的基本工资。在甲公司150名工人的简单随机样本中,有75人愿意增加基本工资;在乙公司200名工人的随机样本中,103人愿意增加基本工资。在每个公司,样本容量占全部工人数的比例都不超过5。试在0.01的显著性水平下,可以判定这两个公司中愿意增加基本工资的工人所占的比例不同吗?解:(1)H0:P1=P2;H1:P1P2(2)p175/1500.50,p2=103/2000.5150.509,.,-0.278(3)ZN(0,1)(4)0.01,2.58(5)由于小于2.58,所以,接受原假设H0,可以判定这两个公司中愿意增加基本工资的工人所占的比例相同。,.,2.检验两个总体比例之差为某一不为零的常数的假设,即P1P2=d0。假设如下:H1:P1-P2=d0;H1:P1-P2d0适当的检验统计量是:Z近似服从标准正态分布。,7.3.2两个总体比例检验,.,例7-10某厂质量检验人员认为该厂1车间的产品一级品的比例比2车间产品一级品的比例至少高5,现从1车间和2车间分别抽取两个独立随机样本,得到如下数据n1150,其中一级品数为113;n2160,其中一级品数为104。试根据这些数据检验质量研究人员的观点。(设0.05)解:(1)H0:P1P25,H1:P1-P25(2)p1113/1500.753;p2=104/1600.650=1.027,.,(3)ZN(0,1)(4)这是右侧检验,对于,1.645(5)若Z小于1.645,则接受原假设,否则,拒绝原假设。(6)由于本例中Z1.027,小于1.645,所以,接受H0。即不认为该厂1车间的产品一级品的比例比2车间产品一级品的比例至少高5。,.,7.4总体方差的显著性检验,7.4.1一个正态总体方差显著检验7.4.2两个独立样本正态总体方差显著检验,.,7.4.1一个正态总体方差显著检验,1.总体均值已知时,检验总体方差是否等于已知常数时检验步骤:建立假设:H0:(已知数),H1:(或、)。计算统计量,.,确定统计量的分布。当H0成立,可证明服从自由度为n的分布。对给定的显著性水平,查分布表,得到检验临界值。确定判别标准。若或(双侧备择假设),或(右单侧)或(左单侧)则拒绝H0;否则,接受H0。进行统计决策。,.,2.总体均值未知时,在检验总体方差是否等于已知常数时,必须通过样本,求得样本平均数,用来代替总体均值,这时统计量服从自由度为n-1的分布。有时候样本平均数未知,但已知样本方差,则可用统计量仍然服从自由度为n-1的分布。,7.4.1一个正态总体方差显著检验,.,例7-11根据过去实验某产品的某种质量指标服从正态分布,其方差7.5。现在,从这种产品中随机抽取25件,测得样本方差10,试判断产品质量变异程度是否增大了(0.05)解:(1)建立假设:H0:(已知数),H1:。(2)计算统计量(3)确定统计量的分布。当H0成立,可证明服从自由度df为25-124的分布。,.,(4)对给定的显著性水平,查分布表,得到检验临界值。因为是右单侧备择假设,对应于0.05,df24,36.415(5)确定判别准则。若36.415,则拒绝H0;否则,接受H0。(6)作结论。因为4436.415,所以,拒绝原假设,接受H1,认为产品质量变异程度增大了。,.,通过比较两个样本方差从而判断两总体方差是否相等的问题,即。自然地,应用它们的估计量和的比值来进行判断。如果比值远大于1或远小于1,说明和之值相差甚大。为了要具体明确“远大于1或小于1”的数值及其意义,就要研究统计量的分布。可以证明,在原假设成立的条件下,F(n1-1,n2-1)即服从第一自由度为n1-1,第二自由度为n2-1的F分布。,7.4.2两个独立样本正态总体方差显著检验,.,例7-12一次英语考试后,从两个学校分别随机抽取试卷n1=10和n2=9,算得的样本修正方差=236.8;=63.36,问两校这次考试离散程度是否有显著性差异?(0.10)解:(1)建立假设。H0:;H1:(2)计算统计量(3)确定统计量的分布。特别注意两个自由度的大小。本例中,FF(9,8)。,.,(4)对于给定的0.05,查F分布表,确定临界值:,(5)确定检验准则。若,则接受H0;否则,拒绝之。(6)因为本例中F=3.7,处在拒绝域,所以拒绝H0,即认为两校这次考试离散程度有显著性差异。,.,例7-13检验两校新生学习成绩情况。从甲校新生中随机抽取11名学生,得知平均成绩78.3分,方差53.14。从乙校新生中抽取11名学生检查,其平均成绩80.0分,方差60.22。在显著水平0.1下,检验这两校新生平均成绩有无显著差异。解:两个总体均值差异的检验是在总体标准差已知和未知两种情况下进行的。本例中,总体标准差未知,那么要看两个总体标准差是否相等,于是先检验两总体的方差有无显著差异,然后检验两总体的均值有无显著差异。首先,检验总体方差是否相等:(1)建立假设。H0:;H1:(2)计算统计量,.,(3)确定统计量的分布。本例中,FF(10,10)。(4)对于给定的0.10,查F分布表,确定临界值:,(5)确定检验准则。若,则接受H0;否则,拒绝之。(6)因为本例中F=0.8824,处在接受域,所以接受H0,即认为两校成绩方差无显著差异。第二步,检验总体均值:(1)建立假设H0:(没有差别)。H1:(有差别)(双侧备择假设),.,(2)计算统计量:=-0.5277(3)确定统计量分布。本例中,。(4)对于给定的显著性水平0.10,查自由度为20的t分布表,临界值为1.725(5)建立检验规则。|t|小于1.725,接受H0,否则,拒绝H0。(6)结论。因为本例|t|0.52771.725,所以,接受H0,即,在显著性水平0.10下,两校新生平均成绩无显著差异。,.,7.5假设检验中的其他问题,7.5.1区间估计与假设检验的关系7.5.2利用P值进行决策,.,参数估计:根据样本所提供的信息,对未知参数进行估计,即求出置信区间,并以一定的概率保证总体参数落在该区间之内。假设检验:由临界值围成的接受域就是以为中心的置信区间。越小,置信区间就越宽,接受域就越大,从而使犯弃真错误的可能性越小(当然,犯纳伪错误的可能性增大)。对同一实例而言,参数估计和假设检验使用的是同一个样本、同一个统计量、同一种分布,因此,二者的原理完全一样,我们可以用构造置信区间的方法解决假设检验问题。,7.5.1区间估计与假设检验的关系,.,例7-14一种电子元件,要求其使用寿命达到1000小时。现从一批元件中随机抽取49件,测得其平均寿命为950小时。已知该元件寿命服从标准差为100小时的正态分布,试在显著性水平0.05下确定在批元件是否合格。解:使用寿命高于规定自然为合格品,所以我们更关心置信区间的下限值。这是一个左单侧检验问题。H0:H1:当0.05时,1.645置信区间的下限为如果样本均值976.5,则接受原假设,可以认为这批元件的平均寿命达到1000小时,否则,应拒绝原假设。本例中,所以,应该拒绝原假设,认为这批元件没有达到合格标准。,.,置信区间的允许误差(单侧检验中为),于是可以把利用置信区间进行假设检验的决策准则概况为:若接受
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家乐福人员管理制度
- 家庭门口树管理制度
- 应急办日常管理制度
- 强电间安全管理制度
- 徐学校电脑管理制度
- 德克士收费管理制度
- 心电图维修管理制度
- 快递员宿舍管理制度
- 急救预案及管理制度
- 恶臭嗅觉室管理制度
- 7数沪科版期末考试卷-2024-2025学年七年级(初一)数学下册期末考试模拟卷04
- 胃管置入术考试题及答案
- 2025年全国统一高考英语试卷(全国一卷)含答案
- 学院就业工作管理制度
- 吉林省吉林市名校2025年七下英语期末考试模拟试题含答案
- 2025年智能科技与数字经济对社会交通出行方式与效率的影响报告
- 2025年机器人技术与应用开发考试试题及答案
- 2025届福建省厦门市名校数学七下期末质量检测试题含解析
- DB62T 3081-2022 绿色建筑工程验收标准
- 河北大学《民法学》2023-2024学年第二学期期末试卷
- 2025年全球视域下的中国文化试题及答案
评论
0/150
提交评论