第七章统计假设检验方法(上)_第1页
第七章统计假设检验方法(上)_第2页
第七章统计假设检验方法(上)_第3页
第七章统计假设检验方法(上)_第4页
第七章统计假设检验方法(上)_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章第七章 统计假设检验方法(上)统计假设检验方法(上)v第一节第一节 统计假设检验的一般原理统计假设检验的一般原理 v第二节第二节 单总体假设检验单总体假设检验v第三节第三节 双总体假设检验双总体假设检验第一节第一节 统计假设检验的一般原理统计假设检验的一般原理 数理统计的主要任务是从样本出发,对总体的分布数理统计的主要任务是从样本出发,对总体的分布作出推断。作推断的方法,主要有两种,一种是上一章作出推断。作推断的方法,主要有两种,一种是上一章讲的参数估计,另一种是假设检验。讲的参数估计,另一种是假设检验。例例7.1 某厂生产合金钢,其抗拉强度某厂生产合金钢,其抗拉强度X(单位:单位:kg

2、/mm2)可以认为服从正态分布可以认为服从正态分布N(,2)。据厂方说,抗拉强度。据厂方说,抗拉强度的平均值的平均值=48。现抽查。现抽查5件样品,测得抗拉强度为件样品,测得抗拉强度为46.8 45.0 48.3 45.1 44.7问厂方的说法是否可信?问厂方的说法是否可信?这相当于先提出了一个假设这相当于先提出了一个假设H0:=48,然后要求从样本观测值出发,然后要求从样本观测值出发,检验它是否成立。检验它是否成立。例例7.2 为了研究饮酒对工作能力的影响,任选为了研究饮酒对工作能力的影响,任选19名工名工人分成两组,一组工人工作前饮一杯酒,一组工人工人分成两组,一组工人工作前饮一杯酒,一组

3、工人工作前不饮酒,让他们每人做一件同样的工作,测得他作前不饮酒,让他们每人做一件同样的工作,测得他们的完工时间们的完工时间(单位:分钟单位:分钟)如下:如下:饮酒者饮酒者 30 46 51 34 48 45 39 61 58 67未饮酒者未饮酒者 28 22 55 45 39 35 42 38 20问饮酒对工作能力是否有显著的影响?问饮酒对工作能力是否有显著的影响?两组工人完成工作的时间,可以分别看作是两个服从两组工人完成工作的时间,可以分别看作是两个服从正态分布的总体正态分布的总体XN(1,12)和和YN(2,22) ,如果饮酒,如果饮酒对工作能力没有影响,两个总体的均值应该相等。所对工作能

4、力没有影响,两个总体的均值应该相等。所以问题相当于要求我们根据实际测得的样本数据,检以问题相当于要求我们根据实际测得的样本数据,检验假设验假设H0:1= 2是否成立。是否成立。 例例7.1-7.2有一个共同的特点,就是先提出有一个共同的特点,就是先提出一个假设,然后要求从样本出发检验它是一个假设,然后要求从样本出发检验它是否成立。我们称这样的问题为假设检验问否成立。我们称这样的问题为假设检验问题。题。在假设检验中,提出要求检验的假设,称在假设检验中,提出要求检验的假设,称为原假设或零假设,记为为原假设或零假设,记为H0,原假设如果,原假设如果不成立,就要接受另一个假设,这另一个不成立,就要接受

5、另一个假设,这另一个假设称为备择假设或对立假设,记为假设称为备择假设或对立假设,记为H1。1.检验方法检验方法 总体总体XN(,2) ,要检验,要检验是否为是否为0,而,而是未知的。我是未知的。我们知道们知道的无偏估计是的无偏估计是 ,X的大小在一定程度上反映了的大小在一定程度上反映了X的大小,因此,当的大小,因此,当H0为真时,即为真时,即=0时,时,X的观察值的观察值x与与0的偏差的偏差|0 x一般不应太大。一般不应太大。如果如果|0 x我们就应怀疑假设我们就应怀疑假设H0的正确性并拒绝的正确性并拒绝H0,而,而|0 x可归结为统计量可归结为统计量nx00|的大小。的大小。当当H0为真时,

6、统计量为真时,统计量) 1 , 0(00NnXZ过分大,过分大,的大小,的大小,由此,我们可选定一正数由此,我们可选定一正数k,使得当,使得当knx00|时,就拒绝时,就拒绝H0,knx00|时,则接受时,则接受H0。2.检验的两类错误检验的两类错误当当H0为真时,作出拒绝为真时,作出拒绝H0的判断,称这类错误为第一类错的判断,称这类错误为第一类错误或弃真错误;误或弃真错误;当当H0不真时,作出接受不真时,作出接受H0的判断,称这类错误为第二类错的判断,称这类错误为第二类错误或取伪错误。误或取伪错误。记记=P拒绝拒绝H0| H0真真;=P接受接受H0| H0假假对于给定的一对对于给定的一对H0

7、和和H1,总可找出许多临界域,总可找出许多临界域W,人们自然希望找到这种临界域人们自然希望找到这种临界域W,使得犯两类错误的概率都,使得犯两类错误的概率都很小。很小。奈曼奈曼皮尔逊提出了一个原则:皮尔逊提出了一个原则:“在控制犯第一类错误的概率不超过指定值在控制犯第一类错误的概率不超过指定值 的条件下,尽的条件下,尽量使犯第二类错误量使犯第二类错误 小小”,按这种法则做出的检验称为,按这种法则做出的检验称为“显显著性检验著性检验”, 称为显著性水平或检验水平。称为显著性水平或检验水平。3.假设检验的步骤假设检验的步骤(1)根据实际问题提出原假设根据实际问题提出原假设H0和备择假设和备择假设H1

8、;(2)选取合适的统计量,当选取合适的统计量,当H0为真时,其分布是为真时,其分布是确定的确定的,由样本观察值计算统计量的值;由样本观察值计算统计量的值;(3)对给定的显著性水平对给定的显著性水平,根据统计量的分布查,根据统计量的分布查表,确定统计量对应于表,确定统计量对应于 的临界值;的临界值;(4) 由统计量的样本值与临界值比较,作出拒绝由统计量的样本值与临界值比较,作出拒绝还是接受还是接受H0的判断。的判断。第二节第二节 单总体假设检验单总体假设检验对单总体平均数对单总体平均数进行检验进行检验统计量H0 = 0H1 0 0 0已已知知2临界值Z/2ZZ接受H0时Z-Z未未知知2临界值t/

9、2tt接受H0时t-tnXZ00nSXt02/tt 2/ZZ 同样对方差同样对方差2进行检验进行检验 第三节第三节 双总体假设检验双总体假设检验1双总体平均值的假设检验双总体平均值的假设检验 对双总体平均值的假设检验,常见的有以对双总体平均值的假设检验,常见的有以下三种类型:下三种类型:(1) H0:1= 2,H1:12;(2) H0:1= 2,H1:12;(3) H0:1= 2,H1:12;通常称为两个正态总体均值差的检验。通常称为两个正态总体均值差的检验。1.总体的方差已知总体的方差已知211设总体设总体XN( ,12),YN( ,22),X、Y相互独立,相互独立,(X1,X2,Xn1)和

10、和(Y1,Y2,Yn2)分别来自总体分别来自总体X、Y的样本。的样本。22221111nnYXZ当当 时,时,ZN(0,1)对于给定的显著性水平对于给定的显著性水平,有,有 H0:1= 2,H1:12 检验规则为检验规则为当当时,拒绝时,拒绝H0222221111|ZnnYXZ当当222221111|ZnnYXZ时,接受时,接受H0构造检验统计量构造检验统计量2例例1 已知某运输公司等待甲、乙船运公司货物的时间均服从正态已知某运输公司等待甲、乙船运公司货物的时间均服从正态分布,其标准差分别为分布,其标准差分别为4.6和和4.9天。现作随机抽样,得到了天。现作随机抽样,得到了35个等个等待甲船运

11、公司的时间,其平均时间为待甲船运公司的时间,其平均时间为14.8天,得到天,得到47个乙船运公个乙船运公司货物的时间,其平均时间为司货物的时间,其平均时间为17.8天。试问:等待甲、乙船运公天。试问:等待甲、乙船运公司货物的时间有无显著差异?司货物的时间有无显著差异?(=0.05) 解解 设等待甲公司货物的时间均值为设等待甲公司货物的时间均值为 1,等待乙公司货物的时间,等待乙公司货物的时间均值为均值为2。由题意建立假设由题意建立假设H0: 1= 2, H1:12由于两个总体都服从正态分布,选取统计量由于两个总体都服从正态分布,选取统计量222121nnYXZ对于给定的显著性水平对于给定的显著

12、性水平=0.05 ,查正态分布表,查正态分布表96. 1025. 02/ ZZ8 .14X4 .17Y2216 . 42229 . 4351n472n计算统计量观察值计算统计量观察值已知已知46. 2479 . 4356 . 44 .178 .1422Z由于由于96. 146. 2|2/ZZ所以拒绝原假设所以拒绝原假设H0,即认为等待甲、乙船运公司货物的时间有显著差异。即认为等待甲、乙船运公司货物的时间有显著差异。 2.总体方差未知,样本容量大于总体方差未知,样本容量大于30 当两个总体的方差未知,但样本容量大于当两个总体的方差未知,但样本容量大于3030,两平均数之差近似正态,因此可用样本标

13、准差直两平均数之差近似正态,因此可用样本标准差直接代替总体标准差,检验统计量为:接代替总体标准差,检验统计量为: 222121nSnSYXZ3.总体方差未知,样本容量小于总体方差未知,样本容量小于30当两个总体的方差未知,但样本容量大于当两个总体的方差未知,但样本容量大于3030,两平均数之差近,两平均数之差近似正态,因此构造检验统计量似正态,因此构造检验统计量 21212221112nnnnSSYXT当当 时,时,Tt(n1+n2-2)对于给定的显著性水平对于给定的显著性水平,有,有H0:1= 2,H1:12 ,检验规则为检验规则为当当拒绝拒绝H0当当接受接受H0 )2(|212nntT)2

14、(|212nntT第四节第四节 用用SPSSSPSS软件进行均值假设检验软件进行均值假设检验 (一)单个样本均值的(一)单个样本均值的T检验检验 (二)独立样本的(二)独立样本的T检验检验 (三)配对样本的(三)配对样本的T检验检验(一)单个样本均值的(一)单个样本均值的T检验检验例1某区初三英语统一测验平均分为65分,现从某中学随机抽取20份试卷。其分数为:72,76,68,78,62,59,64,85,70,75,61,74,87,83,54,76,56,66,68,62。(1)问该校初三英语平均分数与全区是否基本一致(=0.05)。(2)求该校初三英语测验平均分数的95%的置信区间。 1

15、.建立数据文件:定义变量分数,将其相应数据输入并保存。2.选择统计方法:按顺序分析比较均值单样本T检验单击各项,最后弹出对话框,将左边源变量分数送入检验变量右方框中,在底部检验值小框中输入检验值,本例要输入65。点击OK键,输出表1和表2。3.结果说明表1的第2栏是样本个数,第3栏是样本均值,第4栏是样本标准差,第5栏是样本均值标准误差。表2中,检验值= 65表示是检验假设H0:=65,t=2.266,自由度df=19,显著性概率P= Sig.=0.035.由于Sig.0.05,因此结论是两组方差差异不显著,即可以认为两组方差是相等的。在下面的检验结果中应该选择“假设方差相等”一行的数据作为本例的检验结果。(2)均值相等的t检验结果。本例的t值为0.768;自由度为13;t检验的显著概率为P=0.4560.05,可以得出甲乙两班学生的成绩没有显著成绩差异;两组均值之差为3.52;差值的标准误差为4.582;差值的95%置信区间为(-6.38,13.416)。(三)配对样本的T检验例4用某药治疗10名高血压病人,对每一病人治疗前、后的舒张

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论