总体均值的假设检验_第1页
总体均值的假设检验_第2页
总体均值的假设检验_第3页
总体均值的假设检验_第4页
总体均值的假设检验_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、总体均值的假设检验一、正态总体均值的检验 设为总体的一个容量为n的样本1方差已知,的检验u检验法当已知时,假设检验问题:选择检验统计量,当成立时,给定显著性水平,由标准正态分布分位点的定义,有,故拒绝域,这种利用服从正态分布的检验统计量的检验方法称为u检验法有时我们只关心总体的均值是否增大(或减小)比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值是小于等于原来的均值,还是大于,即检验假设 可以证明,在显著性水平下,上述假设检验问题和检验假设有相同的拒绝域,因此,遇到形如的检验问题,可归结为后一个假设检验问题讨论类似地,形如的检验问题,可归结为

2、检验假设 这都是单边检验问题给定显著性水平,求得的临界值点是上分位点或上分位点 例1 某厂生产的某种钢索的断裂强度X服从,其中(kg/cm2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值较以往正常生产的大20(kg/cm2),设总体方差不变,问在下,能否认为这批钢索质量有显著提高? 解 依题意,检验假设,由于已知,选择检验统计量因为中的全部都比中的要小,从直观上看,当成立时,的取值不应比大很多,若偏差过大,则拒绝而接受因为 的拒绝域为,故在显著性水平下原假设的拒绝域为本题中,计算的值因此在显著性水平下不能拒绝,即认为这批钢索质量没有显著提高2方差未知,的检验t检验法检验假设因为未知

3、,而样本方差是总体方差的无偏估计量,用代替选择检验统计量 ,当成立时,给定显著性水平,由t分布分位点的定义,有,故拒绝域,这种利用服从t分布的检验统计量的检验方法称为t检验法例2 某切割机工作正常时,切割每段金属棒的平均长度为10.5cm今在某段时间内随机地抽取15段进行测量,其结果如下(cm):10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.210.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常()?假设金属棒长度服从正态分布 解 依题意,检验假设,由于未知,故选择检验统计量在下,给定显著性水平,查t分布表,得临界值,故

4、拒绝域由已知条件可得故计算统计量的值因为,所以接受,认为切割机工作正常例3 设木材的小头直径,cm为合格,今抽出12根测得小头直径的样本均值为cm,样本方差为cm2,问该批木材是否合格()?解 依题意,检验假设,选择检验统计量在假设下,给定显著性水平,查t分布表,得临界值,故拒绝域,也是假设的拒绝域 由于,计算统计量的值因为,故拒绝,认为该批木材是不合格的 二、正态总体方差的检验检验法设为来自总体的一个样本,检验假设1均值已知因为,则选取检验统计量当成立时,给定显著性水平,由分布表分位点的定义,有,故得拒绝域2均值未知因为是总体均值的无偏估计量,用代替选择检验统计量当成立时,给定显著性水平,由

5、分布表分位点的定义,有故得拒绝域 类似地,在已知和未知时,可以求出检验假设和的拒绝域例如,在未知时,检验假设的拒绝域为 上述检验所用的检验统计量均服从分布,称这种检验方法为检验法例4 某无线电厂生产的一种高频管,其中一指标服从正态分布,今从一批产品中抽取8只管子,测得指标数据:68 43 70 65 55 56 60 72(1) 总体均值时,检验(取);(2) 总体均值未知时,检验(取)解本题是在显著性水平下,检验假设,这里(1) 已知时临界值,而检验统计量的值,由于,故接受(2) 未知时临界值,而,检验统计量的值,由于,故接受§8.3 两个正态总体参数的假设检验 设为总体的一个样本

6、,为总体的一个样本和分别是两个样本的样本均值,和是相应的两个样本方差设这两个样本相互独立一、两个正态总体均值的检验考虑检验假设 1方差与已知u检验法 选取 当成立时,检验统计量给定显著性水平,由标准正态分布表分位点的定义,有,故拒绝域例1 设从甲乙两场所生产的钢丝总体X,Y中各取50束作拉力强度试验,得,已知,请问两厂钢丝的抗拉强度是否有显著差别()?解 本题是在显著性水平下,检验假设,这里选取检验统计量给定显著性水平,查标准正态分布表,得临界值,故拒绝域由于,计算检验统计量的值由于,故拒绝,认为两厂钢丝的抗拉强度有显著差别2方差与未知,但t检验法选取 这里当成立时,检验统计量给定显著性水平,

7、由t分布表分位点的定义,有,故拒绝域 例2 某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平下,判断两种香烟的尼古丁含量有无显著差异?解 检验假设,这里,选取检验统计量给定显著性水平,查t分布表,得临界值,故拒绝域计算统计量的值由于,故接受,认为两种香烟的尼古丁含量无显著差异二、两个正态总体方差的检验F检验法考虑检验假设 1均值与已知因为,选取当成立时,检验统计量给定显著性水平,由F分布分位点的定义,有,故得拒

8、绝域2均值与未知因为,选取当成立时,检验统计量给定显著性水平,由F分布分位点的定义,有,故得拒绝域例3某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平下,判断两种香烟的尼古丁含量的方差是否相等?解考虑检验假设由于两个正态总体的均值都未知,选取检验统计量给定显著性水平,查F分布表,得两个临界值:,故得拒绝域计算统计量的值由于,故接受,认为两种香烟的尼古丁含量的方差也无显著差异§8.4 非正态总体参数的大

9、样本检验本节讨论一般总体参数的检验设总体的均值为,方差为, 为总体的一个样本由中心极限定理可知,当样本容量n足够大时,近似地服从标准正态分布因此,我们可以用正态分布去近似如果对均值进行检验,方差未知时,可以用样本方差代替;如果对方差进行检验,均值未知时,可以用样本均值代替下面举两个例子 例1 设某段高速公路上汽车限速为104.6km/h,现检验85辆汽车的样本,测出的平均车速为106.7km/h,已知总体标准差为 km/h,但不知总体是否服从正态分布在显著性水平下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快? 解 依题意,检验假设,由于已知,n=85足够大,选择检验统计量近

10、似地服从其拒绝域,其中计算的值,由于,因此接受,没有理由认为高速公路上的汽车比限制速度104.6km/h显著地快 例2 为比较甲乙两种小麦植株的高度(单位:cm),分别抽得甲、乙小麦各100穗,在相同条件下进行高度测定,算得甲乙小麦样本均值和样本方差分别为 ,问这两种小麦的株高有无显著差异()?解 依题意,检验假设 ,选取 ,这里两个方差用样本方差代替当成立时,检验统计量 近似地服从给定显著性水平,查附表3,得临界值,得拒绝域计算的值,由于,因此拒绝,认为这两种小麦的株高有显著差异 当总体服从(0-1)分布时,由于只有一个参数p,总体均值p和方差均只与p有关,这时对参数p进行假设检验时,检验统

11、计量可以直接用样本和参数p表示出来 例3 某厂有一批产品须经检验后方可出厂按规定二级品率不得超过10%,从中随机抽取100件产品进行检查,发现有二级品14件,问这批产品是否可以出厂()? 解 这里n=100,检验假设,选取检验统计量 ,U近似地服从由显著性水平,可以得到拒绝域,其中,计算的值,由于,因此接受,认为这批产品二级品率没有超过10%,可以出厂§8.5 分布的拟合检验前几节的检验都是参数的检验实际问题中,有时需要对分布作出假设,进行检验本节只介绍一种分布的检验方法皮尔逊检验法,它只适合于大样本的情形,一般要求样本容量设总体X的分布函数为,为一个已知的分布函数,为总体的一个样本

12、,我们来检验关于总体分布的假设一、基本原理检验法的基本思想是:将随机试验的所有可能结果的全体分成k个两两互不相容的事件,在n次试验中,将发生的次数叫做发生的频数,如果为真,则由大数定律,在n次试验中(n足够大),()出现的实际频率与理论频率(可由分布函数算出)不应相差很大基于这种想法,皮尔逊构造了统计量或,其中是由计算出来的理论频率,是中未知参数估计出后的分布函数,并证明了如下定理:定理1若n足够大,当成立时,统计量总是近似地服从自由度为的分布,其中r是已知的分布函数中未知参数的个数直观上看,值表示实际观测结果与理论期望结果的相对差异的总和,当它的取值大于临界值时,应拒绝 二、检验步骤 如果为

13、不带有未知参数的已知分布,皮尔逊检验法的具体步骤如下: (1) 将总体X的值域划分成k个不交的区间(),使得每个区间包含的理论频数满足,否则将区间适当调整;(2) 在成立时,计算各理论频率即概率的值:,这里与为区间的端点,即;(3) 数出中含有样本值的个数,即的频数,并计算统计量的值;(4) 由分布,对于给定的显著性水平,找出临界值;(5) 判断:若,则拒绝,否则可接受如果总体X是离散型的,则假设相当于假设总体X的概率分布,如果总体X是连续型的,则假设相当于, 这里为总体的概率密度例1 至1984年底,南京市开办有奖储蓄以来,13期兑奖号码中诸数码的频数汇总如表8.1:表8.1数码i0 1 2

14、 3 4 5 6 7 8 9总数频数fi21 28 37 36 31 45 30 37 33 52350试检验器械或操作方法是否有问题()解 设抽取的数码为X,它可能的取值为09,如果检验器械或操作方法没有问题,则09出现是等可能的,即检验假设 ,这里 依题意知k=10,令,n=350,则理论频数给定显著性水平,查分布表,得临界值由于19.675>16.9,故拒绝,即认为器械或操作方法有问题 如果为带有未知参数的已知分布,未知参数为,这时用这r个未知参数的极大似然估计量来代替中的参数,得到分布函数,然后建立统计量,这里是由计算出来的理论频率,再用以上检验步骤进行检验,但此时检验统计量近似

15、服从分布(这里k>r+1)例2 某高校对100名新生的身高(厘米)做了检查,把测得的100个数据按由大到小的顺序排列,相同的数合并得表8.2: 表8.2身高人数153 156 157 159 160 161 162 163 164 1 3 2 1 4 6 7 6 10身高人数165 166 167 168 169 170 171 172 173 8 7 5 7 5 6 3 4 7 身高人数174 176 178 180 181 3 2 1 1 1 试问,在显著性水平下是否可以认为学生身高X服从正态分布? 解 这里n=100,我们来检验假设,这里为正态分布的概率密度,设其分布函数为,与为未知参数 先求与的极大似然估计值,:, 设服从正态分布的随机变量为Y,分布函数为按照分组要求,每个小区间的理论频数不应小于5,因此我们将数据分成了7个组,使得每组的实际频数不小于5,各计算结果如下表8.3所示分组(-, 158.5(158.5,161.5(161.5,164.5(164.5,167.5(167.5,170.5(170.5,173.5 (173.5,+)6112

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论