第六章假设检验课件_第1页
第六章假设检验课件_第2页
第六章假设检验课件_第3页
第六章假设检验课件_第4页
第六章假设检验课件_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

……正如一个法庭宣告某一判决为“无罪(notguilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。

——JanKmenta统计名言1

在许多实际研究中,都有需要做出检验的问题.如:某批产品能否出场?某生产线工作是否正常?某人是否患有某种疾病?某种新药的治疗效果是否提高了?发生事故是否与星期几有关?某次水平考试是否正常?等等,都需要做出检验.2第6章假设检验PowerPoint统计学3统计方法描述统计推断统计参数估计假设检验假设检验在统计方法中的地位4§6.1

假设检验的基本问题§6.2

总体均值的检验§6.3总体比例的检验5学习目标了解假设检验的基本思想

掌握假设检验的步骤掌握一个总体参数的假设检验会利用P值进行假设检验6§6.1假设检验的基本问题假设和假设检验假设检验的古典方法假设检验P值方法假设检验的几种情形7假设检验的概念与思想8下面通过引例来说明问题引例1厂家宣称其产品的次品率为4%,现从一万件产品中任意抽查12件发现3件次品,问厂家的说法是否成立?解

假设9

这是小概率事件,一般在一次试验中是不会发生的,现一次试验竟然发生,故可认为原假设不成立,即厂家说法不成立.10什么是假设?

(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区大学毕业生的月收入平均为1500元!11什么是假设检验?

(hypothesistesting)事先对总体参数作出某种假设,然后利用样本信息来判断原假设是否成立采用逻辑上的反证法,依据统计上的小概率原理12概率事件发生,则否认假设H0;否则,不拒绝假设H0.小概率推断原理:小概率事件2.基本思想方法采用概率性质的反证法:

1.基本原理(概率接近0的事件),在一次试验中,实际上可认为不会发生(这是人们长期积累起的普遍经验!).据一次抽样所得到的样本值进行计算.若导致小先假设H0成立,再根13假设检验中的小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定14二.假设检验:古典方法古典方法假设检验的步骤提出假设确定检验统计量,给出拒绝域的形式确定显著性水平确定拒绝域,构造决策准则计算检验统计量的值,作出统计决策回本节目录15提出假设

什么是原假设?(nullhypothesis)1.待检验的假设,又称“零假设”2.研究者想收集证据予以反对的假设3.总是有等号,或4.表示为H0什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号

,

表示为H116双侧检验

(原假设与备择假设的确定)例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为

H0:

=10H1:

10双侧检验17确定假设实例—双侧检验某超市面向等待结账的顾客播放电视广告,每10分钟循环放映一次。为了确定这种安排是否合理,该超市随机抽取了200名购物者,记录其等待时间。(1)不论平均等待时间大于还是小于10分钟,都说明安排不合理。(2)超市想判断是否“安排不合理”。双侧检验18确定假设实例—左侧检验某品牌轮胎的使用说明书中声称,轮胎的平均使用寿命不低于70000公里,质检部门抽取50个轮胎进行测试。(1)使用寿命低于70000公里,则表明产品与说明书不符。(2)质检部门要检验产品是否与说明书不符。左侧检验19确定假设实例—右侧检验一家银行相信,它的信誉卡客户30%以上已经使用该银行所提供的其他服务,随机抽取50个客户进行调查。(1)使用其他服务的客户如果超过30%,证明该银行的研究结论是正确的。

(2)而研究者往往倾向于支持自己的研究结论。右侧检验20假设检验的基本形式假设研究的问题双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m021双侧检验

(原假设与备择假设的确定)例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为

H0:

=10H1:

1022单侧检验

(原假设与备择假设的确定)一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“<”(废品率降低)建立的原假设与备择假设应为

H0:2%H1:

<2%23单侧检验

(原假设与备择假设的确定)某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你是制造商,怎样进行检验作为制造商,你总是想收集证据证明灯泡寿命在1000小时以上是正确的备择假设的方向为“>”建立的原假设与备择假设应为

H0:1000H1:

>10002425回本节目录回上级目录26确定检验统计量,给出拒绝域什么检验统计量?1.用于假设检验决策的统计量2.检验统计量的基本形式为3.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知27拒绝域与临界值拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合临界值:根据给定的显著性水平确定的拒绝域的边界值回本节目录回上级目录28确定显著性水平

1.显著性水平:通过小概率准则来理解

假设检验时事先规定一个小概率的标准,作为判断的界限,这个小概率标准称为显著性水平(significancelevel),用α来表示。

2.显著性水平:通过两类错误来理解显著性水平是假设检验中发生第Ⅰ类错误的概率。

29假设检验中的小概率原理

什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定返回30假设检验中的两类错误决策实际情况原假设为真原假设为假不拒绝原假设正确决策第二类错误(取伪错误)拒绝原假设第一类错误(弃真错误)正确决策概率为α概率为β31H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假不拒绝H0正确决策(1–a)第二类错误(b)拒绝H0第一类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程32错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小回本节目录回上级目录33由标准正态分布分位点的定义得4.确定临界值,给出拒绝域回本节目录回上级目录34于是拒绝假设H0,认为灌装机工作不正常.5.根据样本做出判断回本节目录回上级目录35三、假设检验的一般步骤2.确定检验统计量以及拒绝域形式;363738例题分析【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验392

已知均值的检验

(例题分析)H0:=0.081H1:

0.081=0.05n

=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:

=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异40双侧检验的拒绝域和临界值抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域1-置信水平决策准则:︱样本统计量︱>︱临界值︱,拒绝原假设,否则,不拒绝。回本节目录回上级目录41右侧检验的拒绝域和临界值决策准则:统计量>临界值,拒绝原假设,否则,不拒绝。

H0值临界值a样本统计量拒绝域抽样分布1-置信水平回本节目录回上级目录42左侧检验的拒绝域和临界值H0值临界值a样本统计量拒绝域抽样分布1-置信水平决策准则:统计量<临界值,拒绝原假设,否则,不拒绝。

回本节目录回上级目录43假设检验中的

P值44什么是P值?

(P-value)是一个概率值如果原假设为真,P-值是检验统计量出现实际观测结果那么极端的概率被称为观察到的(或实测的)显著性水平45将P值与给定的显著性水平进行比较。若P值>

,不拒绝H0若P值≤,拒绝H0P值越小,拒绝原假设的理由越充分。

利用P值进行检验(决策准则)46双侧检验的P值/

2/

2Z拒绝拒绝H0值临界值计算出的样本统计量Zc计算出的样本统计量Zc临界值1/2P值1/2P值回本节目录47左侧检验的P值H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值回本节目录48右侧检验的P值H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值回本节目录49假设检验的过程和逻辑1.写出零假设和备选假设;2.确定检验统计量;3.确定显著性水平a;4.根据数据计算检验统计量的实现值;5.根据这个实现值计算p-值;6.进行判断:如果p-值小于或等于a,就拒绝零假设,这时犯(第一类)错误的概率最多为a;如果p-值大于a,就不拒绝零假设,因为证据不足。50例题分析【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验512

已知均值的检验

(例题分析)H0:=0.081H1:

0.081=0.05n

=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025查表得到P值为0.0046决策:结论:

=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异52三、假设检验—P值方法

第1步第2步第3步第4步提出原假设、备择假设识别检验统计量及其分布。由样本数据计算检验统计量值构造决策规则,P<α拒绝原假设,否则不拒绝计算P值,做出决策不拒绝原假设拒绝原假设回本节目录53四、总体参数检验的几种情形回本节目录54第二节一个总体参数的检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差回上级目录55总体均值的检验

(2

已知或2未知大样本)1.假定条件总体服从正态分布,方差已知若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量2

已知:2

未知:56总体均值的检验—大样本方差已知(例解)(古典方法)【例】某商品在一家大型超市的日销售量服从正态分布,其均值是200件,标准差为30件。为应对同类商品的激烈竞争,厂商聘用促销员以增加销售量,在接下来的50天中,日销售量的平均值是212.5。在5%的显著性水平下,能否认为聘用促销员后日销售量发生了显著变化?(1)假设:H0:=200H1:

200(2)检验统计量(3)临界值正态分布,双侧检验,Z01.96-1.960.025拒绝H0拒绝H00.025(4)决策拒绝原假设,销售量发生了显著变化临界值应为回本节目录回上级目录57总体均值的检验—大样本方差已知(例解)(P值方法)【例】某商品在一家大型超市的日销售量服从正态分布,其均值是200件,标准差为30件。为应对同类商品的激烈竞争,厂商聘用促销员以增加销售量,在接下来的50天中,日销售量的平均值是212.5。在5%的显著性水平下,能否认为聘用促销员后日销售量发生了显著变化?(1)假设:H0:=200H1:

200(2)检验统计量(3)P值正态分布,双侧检验,Z02.95-2.950.0016½P值½P值0.0016(4)决策拒绝原假设,销售量发生了显著变化P值=0.0032回本节目录回上级目录58总体均值的检验—大样本方差未知(例解)

(古典方法)【例】某传媒调查公司对某地区的200个家庭进行了收视率调查,发现每个家庭每天看电视时间的均值为4小时,标准差为2.5小时。5年前每个家庭看电视的平均时间是4.5小时。在0.05的显著性水平下,能否认为现在收看电视的时间比以前有了明显的减少?(1)假设:H0:

≥4.5H1:

<4.5(2)检验统计量(3)临界值正态分布,左侧检验,(4)决策拒绝原假设,收看电视的时间比以前有了明显减少。-1.645Z0拒绝H00.05临界值应为回本节目录回上级目录59总体均值的检验—大样本方差未知(例解)

(P值方法)【例】某传媒调查公司对某地区的200个家庭进行了收视率调查,发现每个家庭每天看电视时间的均值为4小时,标准差为2.5小时。5年前每个家庭看电视的平均时间是4.5小时。在0.05的显著性水平下,能否认为现在收看电视的时间比以前有了明显的减少?(1)假设:H0:

≥4.5H1:

<4.5(2)检验统计量(3)P值正态分布,左侧检验,(4)决策拒绝原假设,收看电视的时间比以前有了明显减少。P值=0.0023-2.83Z0P值.0023回本节目录回上级目录60一种新型减肥方法自称其参加者在第一个星期平均能减去至少3.5公斤体重。由40名使用了该种方法的个人组成一个随机样本,其减去的体重的样本均值为3公斤,样本标准差为1.5公斤。你该如何对该减肥方法做出判断呢?(显著性水平0.05)612

未知大样本均值的检验

(例题分析)H0:

3.5H1:<3.5=0.05n=40临界值(s):检验统计量:在

=0.05的水平上拒绝H0拒绝原假设。也就是说该减肥方法自称的可平均减去至少3.5公斤的说法是不真实的。决策:结论:0-1.645拒绝H00.0562几个常用的Excel函数函数函数定义NORMSDIST(z)返回标准正态累积分布函数

:NORMSDIST(Z)=P(Z≤z)TDIST(x,degrees_freedom,tails)

X

为需要计算分布的数字。Degrees_freedom

为表示自由度的整数。Tails

tails=1,单尾,

TDIST=P(X>x);

tails=2,双尾,TDIST=P(|X|>x)CHIDIST(x,degrees_freedom)返回χ2分布的单尾概率:CHIDIST=P(X>x)X

为用来计算分布的数值。Degrees_freedom

自由度。FDIST(x,degrees_freedom1,degrees_freedom2)Degrees_freedom1

分子自由度。Degrees_freedom2

分母自由度。FDIST=P(F>x),

NORMSINV(probability)返回标准正态累积分布函数的反函数。Probability

正态分布的概率值TINV(probability,degrees_freedom)

返回

t值,P(|X|>t)=probabilityProbability

为对应于双尾学生

t分布的概率。CHIINV(probability,degrees_freedom)

CHIINV是满足CHIDIST(x,degrees_freedom)=probability的数值x。Probability

为χ2

分布的单尾概率FINV(probability,degrees_freedom1,degrees_freedom2)返回

F概率分布的反函数值。FINV是满足

FDIST(x,degrees_freedom1,degrees_freedom2)=probability的数值

x。

求P值时使用查临界值时使用回本节目录回上级目录63大样本一个总体均值的检验检验统计量检验类型双侧检验左侧检验右侧检验假设形式拒绝域用Excel求临界值P值

用Excel求P值P值决策准则回本节目录回上级目录64小样本的检验方法652

已知均值的检验

(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验662

已知均值的检验

(小样本例题分析)H0:

1020H1:>1020=0.05n

=16临界值(s):检验统计量:在

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.64567总体均值的检验

(2未知小样本)1. 假定条件总体为正态分布2未知,且小样本2. 使用t

统计量68总体均值的检验—小样本方差未知(例解)(古典方法)【例】一台机器专门向一种小瓶装入9.0g药品。抽取8个小瓶,重量如下:

9.2,8.7,8.9,8.8,8.6,8.5,8.7,9.0

假定装入药品重量服从正态分布,在0.01的显著性水平下,可否认为机器出现了故障?

(1)假设:H0:

=9.0H1:≠9.0(2)检验统计量(3)临界值

t分布,双侧检验,(4)决策不拒绝原假设,不能认为机器出现了故障。临界值应为t03.499-3.4990.025拒绝H0拒绝H00.025回本节目录回上级目录69总体均值的检验—小样本方差未知(例解)

(P值方法)【例】一台机器专门向一种小瓶装入9.0g药品。抽取8个小瓶,重量如下:

9.2,8.7,8.9,8.8,8.6,8.5,8.7,9.0

假定装入药品重量服从正态分布,在0.01的显著性水平下,可否认为机器出现了故障?

(1)假设:H0:

=9.0H1:≠9.0(2)检验统计量(3)P值

t分布,双侧检验,(4)决策不拒绝原假设,不能认为机器出现了故障。t02.494-2.4940.0207½P值½P值0.0207回本节目录回上级目录70电视台广告部称某类企业在该台黄金时段内播放电视广告后的平均收益量(平均利润增加量)至少为15万元。已知这类企业广告播出后的受益量近似服从正态分布,为此,某调查公司对该电视台广告播出后的此类企业进行了随机抽样调查。抽出容量为20的样本,得出收益量为13.2万元,标准差为3.4万元。试在0.05的显著性水平下判断该广告部的说法是否正确?712

未知大样本均值的检验

(例题分析)H0:

15H1:<15=0.05n=20临界值(s):检验统计量:

=0.05的水平上拒绝H0在的水平上认为该广告部的说法不正确。决策:结论:-1.7291t0拒绝域.05722

未知小样本均值的检验

(例题分析)麻省储蓄银行的经理一直很注重为客户提供服务的质量.在旧计算机系统下,应答机每小时平均可服务22名客户.银行管理层注意到如果以这种效率提供服务,客户等待时间将会很长.最近银行管理层更换了计算机系统,期望以此提高服务的效率,缩短客户等待时间,从而提高顾客满意度.为检测新系统是否比旧系统更具效率,银行管理层随机地选取了18个小时作为一个样本,发现这些时间内平均每小时每个应答机服务的顾客人数为28人,而标准差为2.5人.在1%的显著水平下,你能否得出新系统更为有效的结论?假定出纳每小时服务的人数近似服从标准正态分布.73均值的单尾t检验

(计算结果)H0:

=22H1:>22=0.01df=18-1=17临界值(s):检验统计量:

=0.01的水平上拒绝H0新系统有效决策:

结论:

Z0拒绝域0.012.56774小样本方差未知时总体均值的检验检验统计量检验类型双侧检验左侧检验右侧检验假设形式拒绝域用Excel求临界值P值

用Excel求P值P值决策准则回本节目录回上级目录75一、总体均值的检验样本容量n

t检验否方差是否已知小(正态总体)z检验是z检验是z检验

否方差是否已知大回本节目录76二、总体比例的检验1. 分布仅考虑大样本情况样本比例的分布可用正态分布来近似2.使用Z-统计量3.检验过程:古典方法和P值方法回本节目录77总体比例的检验(例解)

(古典方法)【例】许多人在周末睡懒觉以弥补工作日的睡眠不足。某保健协会报告说,上班族中至少有61%的人在周末每天的睡眠多于7小时。在350个上班族构成的一个随机样本中,发现230人在上周末每天睡眠多于7小时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论