第9章 假设检验_第1页
第9章 假设检验_第2页
第9章 假设检验_第3页
第9章 假设检验_第4页
第9章 假设检验_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第9章假设检验研究内容1

假设检验的基本问题2假设检验的基本步聚3常用参数的假设检验1、假设检验的基本思想和原理2、假设检验的步骤3、一个总体参数的检验4、两个总体参数的检验5、P值的计算与应用6、用Excel进行检验本章重点与难点假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验(一)假设检验问题的提出(二)两类假设(三)统计量与拒绝域(四)利用P值进行决策一、假设检验的基本问题什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等分析之前必须陈述以样本统计量来验证假设的总体参数是否成立,用于判别一个总体是否属于原先已经明确的总体,或者与原先已经明确的总体是否有差异,借以决定采取适当决策的统计方法我认为这种新药的疗效比原有的药物更有效!什么是假设检验?(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的假设均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20总体假设检验的过程抽取随机样本均值

x

=20我认为人口的平均年龄是50岁提出假设

拒绝假设别无选择!

作出决策(二)两类假设:原假设与备择假设

原假设(nullhypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号

,或表示为H0H0:

=某一数值

指定为符号=,或

例如,H0:

10cm研究者想收集证据予以支持的假设也称“研究假设”总是有符号

,

或表示为

H1H1:

<某一数值,或某一数值例如,H1:

<10cm,或

10cm备择假设(alternativehypothesis)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

双侧检验与单侧检验

双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0(三)小概率事件原理与两类错误

假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程

错误和

错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小影响

错误的因素1. 总体参数的真值随着假设的总体参数的减少而增大2. 显著性水平当减少时增大3. 总体标准差当增大时增大4. 样本容量n当n

减少时增大显著性水平(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为

(alpha)常用的

值有0.01,0.05,0.104. 由研究者事先确定假设检验中的小概率原理什么是小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值a/2a/2

样本统计量拒绝H0拒绝H01-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值

a/2a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(单侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(右侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值a样本统计量抽样分布1-置信水平拒绝H0决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0什么是P值?(P-value)在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值<,拒绝H0双侧检验的P值/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值(四)置信区间与假设检验的关系联系1、两者的推断结果都有一定的可信程度,同时具备相应的风险2、对同一问题的参数进行推断,使用同一样本,同一统计量和抽样分布,两者可以互换区别1、区间估计通常求得的是一样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验2、区间估计立足于大概率,而假设检验立足于小概率二、假设检验的基本步聚

假设检验步骤的总结1、提出假设:原假设和备择假设2、选择显著性水平,从而确定拒绝域或临界点3、确定样本的统计量和分布4、计算检验统计量并由此作出决策确定一个适当的检验统计量,并利用样本数据算出其具体数值,将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策(一)总体均值的假设检验(二)两个总体平均数之差的检验(三)总体比率的假设检验(四)总体方差的假设检验三常用参数的假设检验一个总体参数的检验z检验(单尾和双尾)

t检验(单尾和双尾)z

检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比率方差总体均值的检验(作出判断)是否已知小样本容量n大是否已知否

t检验否z检验是z检验

是z检验总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)使用z检验统计量2

已知:2

未知:总体均值的检验(2

未知)(例题分析)【例9-1】现在环境保护已经成为大趋势,生产过程中往往由回收材料制造,然而大部分回收材料制造产品比直接用原材料生产产品更昂贵,只有报纸回收生产新报纸是有利可图的,金融分析师指出,如果从每个家庭平均每周报纸收集超过2磅,则能赚取利润。现随机抽取148户旧报纸的重量,得到如下信息:是否有理由证明金融公司的说法是正确的?(=0.05)【例9-2】某运动鞋制造商声称男运动鞋平均价格小于80美元,为了证实他的想法,有人随机挑选了36双男运动鞋,价格如下表如示:是否有足够的证据证明研究者的声明?取显著性水平=0.1=19.236双男运动鞋数据

604570906555607570755090805095857560957085401108055901207085808560809045110H0

=80H1

<80=0.1;n

=36临界值(c):检验统计量:拒绝H0男运动鞋平均价格小于80美元决策:结论:-1.28z0拒绝H00.1总体均值的检验(z检验)(P值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“NORMSDIST”,然后确定第3步:将z的绝对值1.56录入,得到的函数值为

0.0594

P值远远小于,故拒绝H0总体均值的检验(z检验)(P值的图示)0-2.33a=0.01z拒绝H0抽样分布1-计算出的样本统计量=2.6061P值P=0.004579

总体均值的检验(z检验)(P值的图示)抽样分布P=0.00008801.645a=0.05拒绝H01-计算出的样本统计量=3.75P值总体均值的检验(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0统计量已知:未知:拒绝域P值决策拒绝H0总体均值的检验(小样本)1.假定条件总体服从正态分布小样本(n<

30)检验统计量2

已知:2

未知:总体均值的检验(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

mm0H0:mm0H1:

m<m0H0:

mm0

H1:

m>m0统计量

已知:未知:拒绝域P值决策拒绝H0注:

已知的拒绝域同大样本总体均值的检验【例9-3】某电脑爱好者声称4M宽带的实际网速仅为理论的一半(即256kb/s),某研究者为了检验他的声明是否可靠,随机抽取25台4M宽带的电脑进行测试,测得其平均网速为253kb/s,标准差为10.8kb/s,取显著性水平为0.05,问题否有足够的证据拒绝这个声明?总体均值的检验H0

:≥256H1

<256=0.05df

=25-1=24临界值(c):检验统计量:不拒绝H0即4M宽带的速度只有声称的半

决策:结论:t0-1.713拒绝

H00.025(二)两个总体均值之差的检验(独立大样本)1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)检验统计量12

22

已知:12

,22

未知:两个总体均值之差的检验(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m1-m2=0H1:m1-m20

H0:m1-m20H1:m1-m2<0H0:m1-m20

H1:m1-m2>0统计量12

22

已知12

22

未知拒绝域P值决策拒绝H0两个总体均值之差的检验

【例9-4】美国大学教授协会对大学教授的薪水进行研究,结论认为公立学校和私立学校教授薪水不存在差异,从随机抽取的35名公立机构和30名私立机构教授工资进行了调查,独立抽取了具有同类工作经验的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为教授协会的声明是否正确。

两个样本的有关数据

私立机构公立机构n1=35n1=30x1=88.19x2=73.2S12=687S22=574两个总体均值之差的检验H0

:1-2=0H1

:1-2

0=0.05n1=35,n2

=30临界值(c):检验统计量:决策:结论:

拒绝H0公立学校与私立学校的教授薪水存在显著差异

z01.96-1.960.025拒绝H0拒绝H00.025两个总体均值之差的检验(12,

22

已知)假定条件两个独立的小样本两个总体都是正态分布12,

22已知检验统计量两个总体均值之差的检验(12,22

未知但12=22)假定条件两个独立的小样本两个总体都是正态分布12、

22未知但相等,即12=22检验统计量其中:自由度:两个总体均值之差的检验(12,

22

未知且不相等1222)假定条件两个总体都是正态分布12,

22未知且不相等,即1222样本容量相等,即n1=n2=n检验统计量自由度:两个总体均值之差的检验(12,

22

未知且不相等1222)假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量自由度:两个总体均值之差的检验

【例】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有12=22

。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在=0.05的显著性水平下,样本数据是否提供证据支持

“两台机床加工的零件直径不一致”的看法?两台机床加工零件的样本数据

(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2两个总体均值之差的检验H0

:1-2

=0H1

:1-2

0=0.05n1=8,n2

=7临界值(c):检验统计量:决策:结论:

不拒绝H0没有理由认为甲、乙两台机床加工的零件直径有显著差异

t02.160-2.1600.025拒绝H0拒绝H00.025两个总体均值之差的检验第1步:将原始数据输入到Excel工作表格中第2步:选择“工具”下拉菜单并选择“数据分析”选项第3步:在“数据分析”对话框中选择

“t-检验:双样本等方差假设”第4步:当对话框出现后在“变量1的区域”方框中输入第1个样本的数据区域在“变量2的区域”方框中输入第2个样本的数据区域在“假设平均差”方框中输入假定的总体均值之差在“”方框中输入给定的显著性水平(本例为0.05)

在“输出选项”选择计算结果的输出位置,然后“确定”两个总体均值之差的估计【例9-5】中国男性与女性的看电视时间有差异,一般而言,女性更偏好于看电视,研究人员随机抽取9位男性和女性平均日看电视时间,现根据以下数据说明以上论断是否正确。方差未知且不相等。取显著性水平0.05。男性与女性看电视时间男性女性18216818317717717218017917617118117617117317517917217417618021两个总体均值之差的检验H0

:1-2

≤0H1

:1-2

>0=0.05n1=10,n2

=10临界值(c):检验统计量:决策:结论:

拒绝H0女性看电视时间显著大于男性

t0-1.73拒绝H00.05(三)总体比率假设检验1.假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量0为假设的总体比率总体比率的检验(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:

0H0:0H1:

<0H0

0

H1:

>0统计量拒绝域P值决策拒绝H0总体比率的检验【例9-6】节食者声称,有60%的人通过节食来避免过度肥胖。某人为了验证节食者的论断是否正确,随机选取200人,发现有128人通过节食避免了肥胖,在0.05的显著性水平上,是否有证据拒绝节食者的声明。双侧检验总体比率的检验H0

p=60%H1

p

60%=

0.05n

=

200临界值(c):检验统计量:不拒绝H0节食者的声明是正确的。

决策:结论:z01.96-1.960.025拒绝H0拒绝H00.025假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0:1-2=0检验H0:1-2=d0两个总体比率之差的检验两个总体比率之差的检验假设双侧检验左侧检验右侧检验假设形式H0:1-2=0H1:1-20H0

:1-20

H1:1-2<0

H0:1-20

H1:1-2>0

统计量拒绝域P值决策拒绝H0总体比率的检验【例9-7】某研究机构对托儿所的疫苗接种情况进行调查,发现34所小型托儿所有12家的疫苗接种率小于80%,24家大型托儿所有17家的疫苗接种率小于80%,在显著性水平

=0.05的情况下,检验大型托儿所和小型托儿所的疫苗接种率是否有差异。双侧检验两个总体比率之差的检验H0

:1-2

=0H1

:1-2≠0=0.05n1=34,n2=24临界值(c):检验统计量:决策:结论:

拒绝H0大型托儿所和小型托儿所的疫苗接种率存在显著差异

z01.96-1.960.025拒绝H0拒绝H00.025两个总体比率之差的检验

【例9-8】开车时发短信。2014年一个对1000名司机的调查发现,29%的人在开车时会发短信,2013年对1000名司机调查发现,只有17%的人在开车时发短信,在显著性水平=0.01,能否说明发信息的比例在上升?21netnet两个总体比率之差的检验H0

:1-2

≤0H1

:1-2>0=0.01n1=1000,n2=1000临界值(c):检验统计量:决策:结论:

拒绝H0样本提供的证据支持调查者的看法

2.33Z0拒绝域总体方差的检验(2检验)

检验一个总体的方差或标准差假设总体近似服从正态分布使用2分布检验统计量样本方差假设的总体方差总体方差的检验(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:2=02H1:

202H0:202H1:2<02H0:

202H1:2>02统计量拒绝域P值决策拒绝H0【例9-9】某运动商品制造商声称某种钓鱼线强度的方差为15.9,现随机抽取15个钓鱼线,发现其强度为21.8,是否有足够的证据拒绝制造商的说法?(假设总体服从正态分布)H0

:2=15.9H1

:2

15.9

=0.05df

=

15-1=14临界值(s):2026.1195.629

/2=0.025统计量:不拒绝H0制造商的声明是正确的决策:结论:两个总体方差比的检验(F

检验)假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本检验统计量两个总体方差比的F

检验(临界值)FF1-F拒绝H0方差比F检验示意图拒绝H0两个总体方差比的检验假设双侧检验左侧检验右侧检验假设形式H0:12/22=1H1:

12/221H0:12/221H1:12/22<1

H0:12/221

H1:12/22>1

统计量拒绝域总体方差的检验【例9-10】医疗机构研究吸烟者的心跳频率与不吸烟者的心跳频率是否有差异,随机挑选了两个人群,其中随机抽取26名吸烟者和36名不吸烟者,测得其方差分别为36和10.在0.05的显著性水平下,松验是否有差异。总体方差的检验H0

:12=22

H1

:12

22

=0.05统计量:拒绝H0吸烟者与不吸烟者的心跳频率具有显著性差异

决策:结论:两个总体方差比的检验【例】一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异

(=0.05)两家供货商灯泡使用寿命数据样本1650569622630596637628706617624563580711480688723651569709632样本2568540596555496646607562589636529584681539617两个总体方差比的检验第1步:选择“工具”下拉菜单,并选择“数据分析”选项第3步:在分析工具中选择“F检验-双样本方差”第4步:当出现对话框后

在“

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论