




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论与数理统计教案 信息与数学学院第八章 假设检验讲授内容:1假设检验教学目的与要求:1、理解显著性检验的基本思想. 2、掌握显著性检验的一般方法步骤.3、了解假设检验可能犯的两类错误.教学重难点:重点假设检验的基本思想和步骤;假设检验拒绝域的确定.难点零假设的确定;假设检验拒绝域的确定.教学方法:课堂讲授教学建议:1、通过例子来讲解方法.2、结合上一章的区间估计,说明其本质上是相同的.3、注意两类错误的区分,这样才能给出正确的假设.学时:2学时教学过程:一、假设检验的基本思想方法1.问题的提出假设检验是统计推断的另一类问题.在总体的分布函数完全未知,或只知其形式但不知其参数的情况下,为了推断总体的某些性质,提出了关于总体的某些假设,根据样本对所提出的假设作出接受或拒绝的决策,假设检验是作出这一决策的过程.它包括:1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验.2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验.假设检验问题举例:例1 某车间用一台包装机包装葡萄糖.包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015公斤.某日开工后为检验包装机是否正常,随机的取它所包装的糖6袋,称得净重为(公斤):0.4970.5060.5180.5240.4980.5110.5200.5150.512问机器是否正常?以,分别表示这一天袋装糖重总体的均值和标准差.可设=0.015.于是,这里未知.问题:根据样本值来判断=0.5还是0.5.(参数的假设检验问题)例2 从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:战争次数X0 1 2 3 4发生 X次战争的年数223 142 48 15 4可以假设每年爆发战争次数分布近似泊松分布.那么上面的数据能否证实具有泊松分布假设?问题:根据样本判断总体是否服从泊松分布?(非参数的假设检验问题)2.小概率原理 它是人们根据长期经验得到的一个信念.小概率事件在一次试验中是不可能发生的若在一次试验中它发生了,人们仍然坚持上述信念,而认为该事件的前提条件起了变化.3.假设检验的基本思想结合例1来说明假设检验的基本思想和做法:(1)提出两个相互对立的假设:=0.5和:.必须在与之间作一选择,如果作出的决策是接受,则认为机器工作是正常的,否则,则认为是不正常的.(2)选取合适的统计量.由于要检验的假设涉及总体均值,故首先想到是否可借助样本均值这一统计量来进行判断上一章已经看到,样本均值是的一个无偏估计,样本均值的观察值的大小在一定程度上反映的大小,因此,如果假设为真,则观察值与的偏差一般不应太大,即太大的可能性很小.若过分大时,我们就怀疑的正确性而拒绝,考虑到当为真时,而衡量的大小可归结为衡量的大小.可适当选择一正数,使当观察值满足时就拒绝,反之,若,就接受.基于上面的想法,我们可选择统计量来对该问题进行判断.(3)构造决策准则.由于作出决策的依据是一个样本,当实际上为真时仍可能作出拒绝的决策,这是一种错误,犯这类错误的概率记为(当为真拒绝)或(拒绝).我们无法排除犯这类错误的可能性,自然希望将犯这类错误的概率控制在一定的限度之内,即给出一个较小的数(),使犯这类错误的概率不超过,即使得(当为真拒绝) (1.1)为了确定常数,我们考虑统计量.令(1.1)式右端取等号,即令P(当为真拒绝)= 当为真时,由标准正态分布分位点的定义得(如图81).因而,若的观察值满足=,即一次试验小概率事件发生,则拒绝,而若=,则接受.(4)作出决策.在本例中取=0.05,则有=1.96,又已知,=0.015,再由样本算得=0.511,即有=2.21.96,于是拒绝,认为这天包装机工作不正常.上例所采用的检验法则是符合实际推断原理(小概率原理)的.4.假设检验的基本概念在检验问题中,数称为显著性水平或检验水平.前面的检验问题通常叙述成:在显著性水平下,检验假设 : m =,: m (1.2)称为原假设或零假设,称为备择假设.统计量Z=称为检验统计量.当检验统计量取某个区域C中的值时,我们拒绝原假设,则称区域C为拒绝域,拒绝域的边界点称为临界点.如在上例中,拒绝域为,而,为临界点.形如(1.2)式中的备择假设,表示m可能大于,也可能小于,称为双边备择假设,而称形如(1.2)的假设检验为双边假设检验.有时,我们只关心总体的期望是否增大,如产品的质量、材料的强度、元件的使用寿命等是否随着工艺改革而比以前提高,此时需检验假设 (1.3)形如(1.3)假设检验称为右边假设检验.类似的,还有一些问题,如新工艺是否降低了产品中的次品数,此时要检验假设 (1.4)形如(1.4)假设检验称为左边假设检验.右边假设检验和左边假设检验统称为单边检验.二、假设检验的方法步骤1.单边检验的拒绝域设总体, 为已知,是来自的样本,给定显著性水平我们来求检验问题 (1.3)的拒绝域.因中的全部都比中的要小,当为真时,观察值往往偏大,因此,拒绝域的形式为(是某一正常数).确定的方法与例1中的做法类似.(当为真拒绝)=,要控制(当为真拒绝),只需令= (1.5)说明:当为真时,的分布未知,而此时.由于,由(1.5)得=(如图82),即得检验问题(1.3)的拒绝域为,即 (1.6)类似的,可得左边检验问题 (1.4)的拒绝域为 . (1.7)例3 : 设某电子产品平均寿命5000小时为达到标准,现从一大批产品中抽出12件试验结果如下:5059,3897,3631,5050,7474,5077,4545,6279,3532,2773,7419,5116假设该产品的寿命,试问此批产品是否合格?(取显著性水平)分析:由题可知,该假设检验问题是单正态总体,已知方差对均值的左边检验问题解: 由题意可知,需要检验假设,这是一个左边检验问题,其拒绝域如(1.7)式所示-1.645.计算知,则,此时-1.296-1.645,故可接受,即认为该批产品合格.2.参数的假设检验问题的步骤(1)由实际问题提出原假设与备选假设,并假设成立;(2)确定显著性水平(一般题目中会给定)以及样本容量;(3)选取适当的统计量,确定其分布;(4)按(当为真拒绝)求出拒绝域;(5)根据样本观察值计算统计量的值,将其与拒绝域进行比较,作出决策.三、假设检验中的两类错误第一类错误(“弃真”): 当本来是正确的,但检验后作出了拒绝的判断,称这类“弃真”的错误为第一类错误犯第一类错误的概率为= (当为真拒绝).第二类错误(“取伪”): 当本来是不正确的,但检验后作出了接受的判断,称这类“取伪”的错误为第二类错误.犯第二类错误的概率为= (当为假接受).任何检验方法都不能完全排除犯错误的可能性理想的检验方法应使犯两类错误的概率都很小,但在样本容量给定的情形下,不可能使两者都很小,降低一个, 往往使另一个增大.假设检验的指导思想是控制犯第一类错误的概率不超过a, 然后,若有必要,通过增大样本容量的方法来减少 b .这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率的检验,称为显著性检验.作业布置P262: 1,2,4,5讲授内容:2正态总体均值的假设检验,3正态总体方差的假设检验教学目的与要求:1、掌握单个及两个正态总体的均值和方差的假设检验方法,并能用来解决相应实际问题. 2、能将检验与检验结合使用解决问题.3、了解假设检验与区间估计的联系.教学重难点:重点检验, 检验,检验,检验.难点检验统计量的选取,单边拒绝域的确定.教学方法:课堂讲授教学建议:1、通过不同分布的特点,掌握什么情况下用什么分布.2、对正态总体的检验与区间估计进行比较,找出其联系,这样更利于理解.3、记住几个公式的特点,来对应解题.学时:2学时教学过程:一、正态总体均值的假设检验1、单个正态总体均值m 的检验1)已知,关于m 的检验(检验)在前一节讨论过此问题,结论如下表:原假设备择假设检验统计量拒绝域m =m 在这些检验问题中,我们都是利用统计量来确定拒绝域的,这种检验法常称为检验法.2)未知,关于m 的检验(检验)设总体,其中未知,要检验假设:(双边检验)或(单边检验).仍以双边检验为例求拒绝域.现在总体方差未知,检验法不能使用,因为此时中含未知参数,它不是一个统计量,所以要选择别的统计量来进行检验.由点估计理论自然会想到用方差的无偏估计去代替总体方差,从而构造出新的统计量作为检验统计量.当观察值过分大时就拒绝,因此拒绝域的形式为.由抽样分布定理知,当原假设成立时,由P(当为真拒绝)=得,即得拒绝域为 . (2.1)类似的可得单边检验的拒绝域:假设,其检验的拒绝域为;假设,其检验的拒绝域为.这种利用t统计量得出的检验法称为检验法.例4:某厂生产小型马达,说明书上写着:这种小型马达在正常负载下平均消耗电流不会超过0.8 安培.现随机抽取16台马达试验,求得平均消耗电流为0.89安培,消耗电流的标准差为0.32安培.假设马达所消耗的电流服从正态分布,取显著性水平为a = 0.05,问根据这个样本,能否接受厂方的断言?解: 根据题意,待检假设可设为:m 0.8 ;:m 0.8由于s 未知, 故采用检验法,选检验统计量.查表得=1.753, 故拒绝域为现在,接受原假设, 即接受厂方平均消耗电流不会超过0.8 安培的断言.2两个正态总体均值差的检验(检验)用检验法还可以检验具有相同方差的两个正态总体均值差的假设.设是来自正态总体的样本,是来自正态总体的样本,其中未知,且设两样本独立.现在来求检验问题:(为已知常数)的拒绝域.取显著性水平为a .构造下述统计量作为检验统计量:,其中.由抽样分布定理知,当原假设成立时,其拒绝域的形式为.由(当为真拒绝)=得,即得拒绝域为 . (2.2)类似的可得关于均值差的两个单边检验的拒绝域:假设,其检验的拒绝域为;假设,其检验的拒绝域为.例5: 某厂使用两种不同的原料生产同一类型产品.各在一周的产品中取样分析.取用原料生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)取用原料生产的样品205件,测得平均重量为2.55(公斤),样本标准差为0.48(公斤).设两样本独立,来自两个方差相同的独立正态总体.问在水平0.05下能否认为用原料的产品平均重量较用原料的为大. 分析: 由题意知,该检验问题是双正态总体在方差未知的情形下均值差的左边检验,应用检验法.解:依提意,需检验假设,若接受,则认为用原料的产品平均重量不比用原料的大,否则,认为用原料的产品平均重量较用原料的为大.其检验的拒绝域为=,这里,计算得,故拒绝原假设,即认为用原料的产品平均重量较用原料的为大.注:上述检验法是两个总体的样本独立,且两总体方差相等情形下作出的,当两个正态总体的方差均已知(不一定相等)时均值差可用检验法来检验.3基于成对数据的检验(检验)为了比较两种产品,或是两种机器、两种方法等的差异,在相同的条件下作对比实验,得到一披成对的观察值(不是两独立总体的观察值),然后分析观察数据作出推断,这种方法称为逐对比较法.设有对相互独立的观察结果:,令,则,相互独立,又由于,是由同一因素所引起的,可认为它们服从同一分布.假设,.这就是说,构成正态总体的一个样本,其中未知,我们需要基于这一样本检验假设:(1):=0,:0; (2):0,:0;(3):0,:0.分别记,的样本均值和样本方差的观察值为,按单个正态总体均值的检验,知检验问题(1),(2),(3)的拒绝域分别是(检验水平为a):, ,.例6: 今有两台仪器,对九件样品测量光谱,观察结果如下: 0.20,0.30,0.40,0.50,0.60,0.70,0.80,0.90,1.00 0.10,0.21,0.52,0.32,0.78,0.59,0.68,0.77,0.89取显著性水平,问这两台仪器测量性能有无显著差异?(测量误差可看成是正态的)分析: 由题意知,这是成对数据检验问题,用检验法.解:用表示两台仪器测量的结果之差,则对可看到9个结果:0.10,0.09,-0.12,0.18,-0.18,0.11,0.12,0.13,0.11可假定未知.由题意,要检验假设.由于未知,可用检验:此时,从而,查分位数表得,显然,即该样本观察结果没有显著性差异,故在显著水平下,不能认为这两台机器性能有显著性差异.二、正态总体方差的假设检验1.单个总体的情况设总体,均未知,是来自的样本,要求检验假设(显著性水平为a):,为已知常数.选取作为检验统计量,原假设成立时,其拒绝域的形式为或,其中由下式确定:P(当为真拒绝)=为计算方便,习惯上取,得,于是拒绝域为或 (2.3)类似的可得关于均值差的两个单边检验的拒绝域:假设,其检验的拒绝域为=;假设,其检验的拒绝域为=.以上检验法称为检验法.例7: 某汽车配件厂在新工艺下对加工好的25个活塞的直径进行测量,得样本方差S2=0.00066.已知老工艺生产的活塞直径的方差为0.00040. 问改革后活塞直径的方差是否不大于改革前的方差?(取显著性水平)分析:问题是在正态总体均值未知的条件下对方差进行右边检验,用检验法.解:设测量值,.待检验假设可设为:.统计量,拒绝域由于,故拒绝,即改革后活塞直径的方差显著大于改革前的方差.思考题:若已知,检验的统计量为何?分布怎样?2.两个总体的情况设是来自正态总体的样本,是来自正态总体的样本,并且两样本独立,其样本方差分别为,且设,均为未知,现需要检验假设(显著性水平为a): 选取作为检验统计量,原假设成立时,其拒绝域的形式为,常数由下式确定:P(当为真拒绝)=.要控制P(当为真拒绝),只需令.得,于是拒绝域为 (2.4)类似的可得关于的另外两个检验问题的拒绝域:假设,其检验的拒绝域为;假设,其检验的拒绝域为或.以上检验法称为检验法.将检验与检验结合使用解决问题:在用检验去检验两个总体的均值是否相等时,作了一个重要的假设就是这两个总体方差是相等的,即,否则我们就不能用检验.如果我们事先不知道方差是否相等,就必须先进行方差是否相等的检验,即检验.例8: 两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这些滚珠的直径(毫米)如下: 甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0设两台机床生产的滚珠直径分别为,且.试问与的均值有没有显著差别.(显著性水平a=0.05)分析: 由题意知,问题是在两正态总体方差未知的条件下,对均值差进行双边检验,应先检验方差齐性, 在方差齐性的条件下采用检验法.解:这里均未知,也不知道,的方差是否相等,判断均值有没有显著差别就必须先进行方差是否相等的检验,如果方差相等,则再用检验法检验假设,.(先作F检验)假设:,其拒绝域为:本题中查表得拒绝域为,计算得没有落入拒绝域,故接受原假设,认为与的方差相等.(再做检验)由1的结论,可令,检验假设:,其拒绝域为:,本题中,查表得,拒绝域为1.354.计算得,没有落入拒绝域,故接受原假设,认为与的均值没有显著差别.三、置信区间与假设检验之间的关系假设检验的接受域恰为参数估计的置信区间.例9 新设计的某种化学天平,其测量误差服从正态分布, 现要求 99.7% 的测量误差不超过 0.1mg ,即要求 3s 0.1.现拿它与标准天平相比,得10个误差数据,其样本方差=0.0009.试问在a = 0.05 的水平上能否认为满足设计要求?解法一 :s 1/30 ;:s 1/30m 未知, 故选检验统计量,拒绝域:现故接受原假设, 即认为满足设计要求.解法二:的单侧置信区间为:,中的,则成立, 从而接受原假设, 即认为满足设计要求.作业布置P264265: 6,8,9,10,12 讲授内容:5样本容量的选取,6分布拟合检验,7秩和检验教学目的与要求:1、了解如何选取样本容量,使得犯第二类错误的概率控制在预先给定的限度内. 2、了解总体分布假设的拟合检验法.3、了解秩和检验法.重难点:重点样本容量选取方法(对检验法).难点拟合检验法中统计量的构造、秩和检验法.教学方法:课堂讲授教学建议:1、拟合检验法中统计量的构造方法的说明.2、分布的定义和性质的回顾对本次课内容的理解有一定的帮助.学时:2学时教学过程:一、样本容量的选取虽然当样本容量固定时,我们不能同时控制犯两类错误的概率, 但可以适当选取的值, 使犯第二类错误的概率控制在预先给定的限度内.1. OC函数、功效函数、功效的概念定义 若C是参数q的某检验问题的一个检验法,称为检验法C的施行特征函数或OC函数,其图形称为OC曲线.称为检验法C的功效函数,当时,值称为检验法C在点的功效.它表示当参数的真值为时,检验法C作出正确判断的概率.2.检验法的OC函数的OC函数.的性质:.给定,无法满足对一切,都有但可以确定使得对一切,有.是的减函数,要使得对一切,只要,即只要满足即可.即.同理可得.例10 (工业产品质量抽验方案)设有一大批产品,产品质量指标X服从.以m小者为佳,厂方要求所确定的验收方案对高质量的产品能以高概率1a为买方所接受.买方则要求低质产品能以高概率1b被拒绝. 有厂方与买方协商给出.并采取一次抽样以确定该批产品是否为买方所接受.问应怎样安排抽样方案.已知且由工厂长期经验知.经商定.解:检验问题,且要求当时,以概率0.95拒绝.由检验,拒绝域为,OC函数=,取,当时,即时买方拒绝这批产品,当时,买方接受这批产品.二、分布拟合检验1. 拟合检验法实际中可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设.例如前面给出的例2就是这种问题.又如,某工厂制造一批骰子,声称它是均匀的.即在投掷中,出现1点,2点,6点的概率都应是1/6.为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.那么得到的数据能否说明“骰子均匀”的假设是可信的?再如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.问该厂生产的钟的误差是否服从正态分布?解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中提出的拟合检验法.它是在总体的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法.2. 应用举例:例11 下面列出了84个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总体(取=0.1)141148132138154142150146155158150140147148144150149145149158143141144144126140144142141140145135147146141136140146142137148154137139143140131143141149148135148152143144141143147146150132142142143153149146149138142149142137134144146147140142140137152145解:为粗略了解数据的分布情况,先画出直方图.步骤如下:1.找出数据的最小值、最大值为126、158,取区间124.5, 159.5,它能覆盖126, 158;2.将区间124.5, 159.5等分为7个小区间,小区间的长度=(159.5-124.5)/7=5, 称为组距,小区间的端点称为组限,建立下表:组 限频数 频率 累计频率124.5-129.5129.5-134.5134.5-139.5139.5-144.5144.5-149.5149.5-154.5154.5-159.514103324930.01190.04760.11910.39290.285
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学生自信心理成长指南
- 健康戴眼镜的小猴
- 烤漆房安全生产管理制度
- 事业人员考核管理办法
- 付款申请审批管理办法
- 企业印章发票管理办法
- 人才引进使用管理办法
- 休闲别墅使用管理办法
- 乡镇建设绿化管理办法
- 代发仓储发货管理办法
- 叠衣服课件小学生
- 【MOOC期末】《电子技术实习SPOC》(北京科技大学)期末慕课答案
- 特征值稳定性证明-洞察分析
- 智慧城市建设投标实施方案
- UL4703标准中文版-2020光伏线UL中文版标准
- 设备部班组安全培训
- 2024安置点生活垃圾清运合同书
- VMware双活数据心解决方案详解
- 管理学说课稿
- 办公用品及耗材采购服务投标方案(技术方案)
- 小学三年级数学下册计算题大全(每日一练共25份)
评论
0/150
提交评论