社会经济统计学(8章)_第1页
社会经济统计学(8章)_第2页
社会经济统计学(8章)_第3页
社会经济统计学(8章)_第4页
社会经济统计学(8章)_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节假设检验的基本思想第二节总体均值的假设检验第三节总体成数的假设检验第四节总体方差的假设检验(自学)第八章假设检验第三篇统计分析方法第八章第一节假设检验的基本思想学习要点假设检验的基本概念假设检验的基本程序参数假设检验的相关概念一、假设检验基本问题

什么是假设?(hypothesis)第一节假设检验的基本思想第八章

对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区新生婴儿的平均体重为3190克!一、假设检验基本问题什么是假设检验?

事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立有参数假设检验和非参数假设检验采用逻辑上的反证法,依据统计上的小概率原理第一节假设检验的基本思想第八章假设检验,是另一大类统计推断问题。它是先假设总体具有某种特征(例如总体的参数为多少),然后再通过对样本的加工,即构造统计量,推断出假设的结论是否合理。参数估计和假设检验不是简单的“计算”和“验算”的区别,假设检验有它独特的统计思想,也就是说引入假设检验是完全必要的。我们来考虑下面的例子。

第八章第一节假设检验的基本思想教材P248

某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平,定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件检验,发现有次品2件,问应如何处理这批货物?

如果双方商定用点估计方法作为验收方法,显然2/43>3%,这批货物是要被拒收的。但是厂家有理由反对用这种方法验收。他们认为,由于抽样是随机的,在这次抽样中,次品的频率超过3%,不等于说这批产品的次品率(概率)超过了3%.因此需要用别的方法。如果百货商店也希望在维护自己利益的前提下,不轻易地失去一个有信誉的货源,也会同意采用别的更合理的方法。事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率,然后从抽样的结果来说明这一假设是否合理。注意,这里用的是“合理”一词,而不是“正确”。例

某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。是否痊愈服何种药痊愈者未痊愈者合计未服药者4852100服药者5644100合计10496200例问新药是否确有明显疗效?

这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,因此可以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药有明显的疗效。这种提出假设然后做出否定或不否定的判断通常称为显著性检验(Significancetest)。第一节假设检验的基本思想第八章二、假设检验的基本思想...因此我们拒绝假设

=50样本均值抽样分布...如果这是总体的真实均值m

=50H0这个值不像我们应该得到的样本均值...20第一节假设检验的基本思想第八章总体三、假设检验的过程抽取随机样本均值

X=20我认为人口的平均年龄是50岁提出假设拒绝假设!

别无选择.作出决策假设检验的步骤提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策第一节假设检验的基本思想第八章教材P249-251

某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。我们在此并不关心此人是否真正作弊,也不关心官司的最后结果,但从统计的观点看,商店的怀疑是有道理的。第八章第一节假设检验的基本思想如果此人摸球完全是随机的,则要正好在10次摸球中均摸到绿球的概率是一个很小的数,统计的基本原理是在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。上述的这一推断,实际上就是假设检验的全部过程。它一般包含了这么几步:提出假设,抽样,并对样本进行加工(构造统计量),定出一个合理性界限,得出假设是否合理的结论。这里要说明一点的是所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数,认为概率不超过的事件是在一次试验中不会发生的事件,这个称为显著性水平(Levelofsignificance)。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。通常可选取α=0.01,0.05,0.10等。

下面我们用假设检验的语言来模拟商店的推断:

10

提出假设:

H0:此人未作弊;H1:此人作弊。这里H0称为原假设(Nullhypothesis),H1称为备选假设(Alternativehypothesis)或对立假设(Oppositehypothesis),备选假设也可以不写。

20

构造统计量,并由样本算出其具体值:统计量取为10次模球中摸中绿球的个数.由抽样结果算出.30

求出在H0下,统计量N的分布,构造对H0不利的小概率事件:易知,在H0下,即如果此人是完全随机地摸球的话,统计量N服从二项分布B(10,1/2).其分布数列为,

那么此人摸到的绿球数应该在平均数5个附近,所以对不利的小概率事件是:“绿球数大于某个较大的数,或小于某个较小的数。”在此问题中,小于某个较小的数不成立,即此人作弊的话,不可能故意少摸绿球,因此只需考虑事件“大于某个较大的数”,这个数常称为临界值。

40

给定显著性水平,确定临界值:即取一数使得P{N>}=如取=0.01,由分布数列算出:

对于这种离散型概率分布,不一定能取到,取最接近的n,使当H0成立时,,因此.该小概率事件是:

50

得出结论:

已算得,即发生了,而被视为对不利的小概率事件,它在一次试验中是不应该发生的,现在居然发生了,只能认为是不成立的,即:“此人作弊”成立。

四、参数假设检验的有关概念

1、原假设与备择假设

原假设(记作H0):受检验的基本假设,即从原总体没有变化出发,这样就有一个总体参数,而且它的分布是巳知的。

备择假设(记作H1):是原假设的对立假设。▲原假设是决策者有意推翻的假设,备择假设是决策者试图从样本信息中找到“征兆”以支持其真实的一种假设

第八章第一节假设检验的基本思想原假设(nullhypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3. 总是有等号,

或4. 表示为H0H0:

某一数值指定为=号,≦或≧例如,H0:

3190(克)为什么叫0假设?

2、显著性水平

假设检验依据“小概率事件在一次抽样试验中几乎是不可能发生的”这一原理,这个小概率称为显著性水平。

样本统计量与其总体参数之间存在随机误差,是不可避免的,但抽样误差是有一定规律的,它满足于一定的概率分布。这种误差在一定范围内出现的可能性很大,而在这个范围以外出现的可能性很小如果来自样本的信息打破了这个规律,差异过大,就不能把这种差异视为随机误差了。第八章第一节假设检验的基本思想

小概率在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设小概率由研究者事先确定什么是小概率?抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域1-置信水平

3、Z检验与t检验

Z检验:正态分布检验。检验适应在方差已知的情况下,对期望的检验。

易知,在H0

成立的条件下;Z服从正态分布,因此根据正态分布的特点,在H0成立的条件下,Z的值应以较大的概率出现在0的附近,因此对H0不利的小概率事件是:第八章第一节假设检验的基本思想检验统计量

t检验:t分布检验。当总体方差未知,用样本方差代替时,统计量第八章第一节假设检验的基本思想服从t分布。对H0不利的小概率事件是:

4、双侧检验与单侧检验双侧检验:当我们所关心的问题是要检验样本统计量与总体参数有没有显著差异,而不问差异的方向,采用双侧检验。第八章第一节假设检验的基本思想例如:某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为

H0:10H1:10

=

双侧检验

(显著性水平与拒绝域)H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平样本值双侧检验

(显著性水平与拒绝域)H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平样本值双侧检验

(显著性水平与拒绝域)H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-置信水平样本值

单侧检验:当我们关心的问题是检验样本统计量与总体参数有没有显著差的差异,而且追究是否发生预先指定方向的差异,应采用单侧检验。第八章第一节假设检验的基本思想

例如:

一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“>”(寿命延长)建立的原假设与备择假设应为

H0:1500H1:1500

单侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平左侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平样本值左侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平样本值右侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平样本值右侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量抽样分布1-置信水平拒绝域样本值

5、检验中的两类错误(Twotypeserroroftests)

检验可能犯错误,所谓犯错误就是检验的结论与实际情况不符,这里有两种情况:

α错误:是实际情况是成立,而检验的结果表明不成立,即拒绝了,这时称该检验犯了第一类错误(typeIerror)或“弃真”的错误。

Β错误:是实际情况是不成立,而检验的结果表明成立,即接受了,这时称该检验犯了第二类错误(typeIIerror),或称“取伪”的错误。

H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H0正确决策(1–a)第二类错误(b)拒绝H0第一类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程我们来研究一下,对于一个检验,这两类错误有大:

我们知道,一个检验本质上就是一个否定域V,所谓拒绝H0,就是通过构造V的统计量计算,得出样本点落在V内的结论。所以,第一类错误的概率就是在H0成立的条件下V的概率.一般地当时.当形如或时,由此可知,显著性水平α也就是检验犯第一类错误的概率。同样,在成立的情况下接受H0,即是指样本点落在接受域中,因此第二类错误的概率是H1错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小设计一个检验,当然最理想的是犯两类错误的概率都尽可能地小,在样本容量一定的情况下,要使两者都达到最小是不可能的。考虑到H0的提出既然是慎重的,否定它也要比较慎重。因此,在设计检验时,一般采取控制第一类错误的概率在某一显著性水平α内,对于固定的n,使第二类错误尽可能地小,并以此来建立评价检验是否最优的标准。总体参数检验(ParameterTestofNormalCollectivity)

第八章第二节总体均值的假设检验Z检验(单侧和双侧)

t检验(单侧和双侧)Z检验(单侧和双侧)

2检验(自学)(单侧和双侧)教材P261-264均值一个总体比例方差z检验大是z检验

(检验统计量)正态总体是否已知?用样本标准差S代替

t检验小样本容量n否第二节总体均值的假设检验第八章教材P251-256总体均值的检验

(2

已知或2未知大样本)假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量已知:未知:2

2

(1)2

已知均值的检验

(大样本例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验=

(例题分析)H0:=0.081H1:

0.081=0.05n

=200临界值(Z):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:

=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异(1)2

已知均值的检验

(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验

(小样本例题分析)H0:

1020H1:>1020=0.05n

=16临界值(Z):检验统计量:在

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.645(2)2

未知均值的检验

(大样本例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验

(例题分析)H0:1200H1:>1200=0.05n=100临界值(Z):检验统计量:在

=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645(2)2

未知均值的检验

(小样本)假定条件总体为正态分布-2未知,且小样本使用t

统计量(2)2

未知均值的检验

(小样本例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验

(例题分析)H0:=5H1:

5=0.05df=10-1=9临界值(t):检验统计量:在

=0.05的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论