南京师范大学《统计学》课件-第6章假设检验_第1页
南京师范大学《统计学》课件-第6章假设检验_第2页
南京师范大学《统计学》课件-第6章假设检验_第3页
南京师范大学《统计学》课件-第6章假设检验_第4页
南京师范大学《统计学》课件-第6章假设检验_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学

南京师范大学6第6章假设检验通过本章的学习,我们应该掌握:假设检验的基本思想和步骤对总体均值的假设检验假设检验的统计软件实现现实生活中,我们经常作出的论断:上海2008年毕业生首月平均工资2500元我们学校去年的cet-4合格率为98%上月参与购买彩票的彩民中,80%以上的中奖额在100元以下?上述内容都是关于总体参数的一种陈述;如果根据样本资料得到的样本指标与它不符,是否能够说明假设是错误的假设检验问题的提出假设假设检验的例子[例6.1]可口可乐公司生产的雪碧饮料标签说明其容量为250ml,标准差4ml。现在从市场上随机抽取50瓶,发现饮料平均容量为248ml。能否据此判定可口可乐公司的产品有欺诈行为?问题6.1的分析产品的标签意味着产品总体的平均数为μ=250ml,总体的标准差σ=4ml。调查的样本平均数为=248ml2ml的差距原因可能源于抽样误差厂商不诚信那么,如何区别这两种原因呢?统计上就可以对其进行假设检验假设检验—假定来源于第一种原因因为抽样误差是我们能够计算和控制的,因此假设样本平均数与总体平均数的差距完全是由于抽样误差引起的;根据抽样推断的理论,给定概率保证度,可以确定z的大小,使得下面的式子可以接受:例如,当概率保证度为99%时,zα/2=2.58。小概率事件:在一次试验中,几乎不可能发生的事件。例题的检验与结论由已知,说明,经过一次抽样(试验),小概率事件发生了,这违背了小概率事件的原理。问题出现在哪里?假设不成立,即2ml的差距不仅仅是由于抽样误差引起的,很有可能(99%)是厂商的缺斤少两。假设检验的基本思想事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立采用逻辑上的反证法,依据统计上的小概率原理小概率原理:如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;如果在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。

原假设(nullhypothesis)待检验的假设,又称“0假设”2. 总是有等号

,

3. 表示为H0,如:H0:

0例如,H0:

250ml假设的表达形式

什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”总是有不等号:

,

表示为

H1H1:

<

0

,或

0例如,

H1:

<250ml,或

250ml备择假设假设检验的流程:提出假设确定适当的检验统计量规定显著性水平

计算检验统计量的值;作出统计决策假设检验的流程:第一步1、提出有关总体参数的假设:一般包含两部分:原假设H0和备择假设H1根据问题的不同,假设提出的形式有所不同:对前面的例题分别提出不同的假设:目的不同

双侧检验:H0:μ=μ0

H1:μ≠μ0单侧检验:H0:μ≥μ0

,H1:μ<μ0

H0:μ≤μ0

H1:μ>μ0双侧检验与单侧检验

(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m0双侧检验

(显著性水平与拒绝域)抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域1-

置信水平单侧检验:左侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-

置信水平H0:μ≥μ0

,H1:μ<μ0假设检验的流程:第二步2、设计检验统计量设计要求:所设计的检验统计量应该与总体参数有关当H0为真时,该统计量的真实分布已知假设检验的流程:第三步和第四步3给定显著性水平和相应的临界值显著性水平α的含义是:

H0为真时,拒绝H0的概率α通常的取值α所确定的H0的接收域和拒绝域C注意:相同的α对于单尾检验和双尾检验确定的区域不同4根据样本数据计算统计量,并做出决策假设检验的两类错误和检验规则检验决策H0为真H0非真

拒绝H0

第I类错误(α)正确 接受H0正确第II类错误(β) 第I类错误——弃真错误,发生的概率为α

第II类错误——取伪错误,发生的概率为β真实情况:样本来自μ=μ0的总体真实情况:样本来自μ=μ1的总体接受H0:μ=μ0拒绝H0判断正确判断错误(II)判断错误(I)判断正确专题:假设检验中的两类错误来源于趣味统计案例8问题:

开关厂生产一种小巧但又结构复杂的开关。根据过去的数据资料知道,即使生产过程都正常,也会有20%的产品有问题。如果生产过程中出现了问题,并且当不合格品高达60%时,生产过程必须立即停止,查出问题来源并加以纠正。如何管理生产?主管生产的负责人提出了一个质量控制检验的方案:在每天上班后第一个小时的产品中随机抽出10个开关进行检验,如果有3个或3个以上产品不合格,生产过程应该停下来检查。方案是否可行?考虑第一种情况(没有必要停工检查):即使生产过程完全正常,由于样本的随机性,也可能在10个开关中出现3个或3个以上不合格品的情况。分析:认定原假设和备选假设,这种情况被为第I类错误。这种情况发生的概率为:α。由于n=10,p=0.2(正常工作)故α=P(S>=3)=1-P(S<2)=0.322方案是否可行?考虑第二种情况(需要停工检查):当生产过程已经不正常,即实际不合格品率已达60%左右,但样本中却没有超过2个不合格品。此时需要停工检查,却继续“错误”工作。分析:认定原假设和备选假设,这种情况被为第II类错误。这种情况发生的概率为:β。由于n=10,p=0.6(异常工作)故β=P(S<=2)=0.012试比较α和β6.2一个总体均值的检验6.2.1检验统计量的确定6.2.2总体均值的检验检验统计量的确定假设检验最关键的步骤:设计合适的检验统计量,其一般形式:检验统计量的设计,主要考虑下面的因素:1样本容量n2总体标准差σ一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差总体均值的检验

总体

是否已知?用样本标准差S代替t检验小样本量n否是z检验

z检验大总体均值的检验

(

2

已知或

2未知大样本)1. 假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n

30)2.使用Z-统计量

2

已知:

2

未知:

2

已知均值的检验

(例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为

0=0.081mm,总体标准差为

=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(

=0.05)双侧检验

2

已知均值的检验

(例题分析)H0:

=0.081H1:

0.081

=0.05n=200临界值:检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:

=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异

2

已知均值的检验

(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(

=0.05)单侧检验

2

已知均值的检验

(小样本例题分析)H0:

1020H1:

>1020

=0.05n=16临界值:检验统计量:在

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.645

2

未知大样本均值的检验

(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(

=0.05)单侧检验

2

未知大样本均值的检验

(例题分析)H0:

1200H1:

>1200

=0.05n=100临界值(s):检验统计量:在

=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645总体均值的检验

(

2未知小样本)1. 假定条件总体为正态分布

2未知,且小样本2. 使用t

统计量

2

未知小样本均值的检验

(例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验

2

未知小样本均值的检验

(例题分析)H0:

=5H1:

5

=0.05df=10-1=9临界值(s):检验统计量:在

=0.05的水平上拒绝H0说明该机器的性能不好

决策:结论:t02.262-2.262.025拒绝H0拒绝H0.0256.3两个总体参数的检验6.3.1检验统计量的确定6.3.2两个总体均值之差的检验独立样本总体均值之差的检验两个总体均值之差的检验

(

12、

22

已知)1. 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n1

30和n2

30)检验统计量为两个总体均值之差的检验

(假设的形式)假设研究的问题没有差异有差异均值1

均值2均值1<均值2均值1

均值2均值1>均值2H0

1–

2=0

1–

2

0

1–

2

0H1

1–

2

0

1–

2<0

1–

2>0两个总体均值之差的检验

(例题分析)

双侧检验!【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得

x1=50公斤,

x2=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(

=0.05)两个总体均值之差的检验

(例题分析)H0:

1-

2=0H1:

1-

2

0

=0.05n1=32,n2

=40临界值(s):检验统计量:决策:结论:

=0.05的水平上拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025P-值=?两个总体均值之差的检验

(

12、

22

未知且不相等,小样本)检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且相等

12=

22检验统计量其中:两个总体均值之差的检验

(

12、

22

未知但相等,小样本)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但不等

12

22检验统计量两个总体均值之差的检验

(例题分析)单侧检验

【例】“多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设

(

=0.05)两个总体均值之差的检验

(例题分析—用统计量进行检验)H0:

1-

2

0H1:

1-

2<0

=0.05n1=15,n2

=20临界值(s):检验统计量:决策:结论:

=0.05的水平上拒绝H0没有证据表明多吃谷物

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论