第三讲应用统计_第1页
第三讲应用统计_第2页
第三讲应用统计_第3页
第三讲应用统计_第4页
第三讲应用统计_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲应用统计演示文稿1目前一页\总数七十二页\编于五点2(优选)第三讲应用统计目前二页\总数七十二页\编于五点2.假设检验的过程和思路

概率意义下的反证法—类似于“无罪推定”

总体假设总体的平均年龄是50岁拒绝样本均值是

20样本无效假设不可能!目前三页\总数七十二页\编于五点什么是假设?

(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!目前四页\总数七十二页\编于五点什么是假设检验?

(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理目前五页\总数七十二页\编于五点假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m

=50抽样分布H0这个值不像我们应该得到的样本均值...20目前六页\总数七十二页\编于五点总体假设检验的过程抽取随机样本均值

x

=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策目前七页\总数七十二页\编于五点【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm

目前八页\总数七十二页\编于五点【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g绿叶洗涤剂目前九页\总数七十二页\编于五点【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%目前十页\总数七十二页\编于五点原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)目前十一页\总数七十二页\编于五点双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0目前十二页\总数七十二页\编于五点假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)目前十三页\总数七十二页\编于五点H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–

a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程目前十四页\总数七十二页\编于五点a和

b

呈相反关系

ab降低一类错误的概率另一类错误的概率就会提高目前十五页\总数七十二页\编于五点显著性水平

(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为(alpha)常用的

值有0.01,0.05,0.104. 由研究者事先确定目前十六页\总数七十二页\编于五点拒绝域和显著性水平拒绝域:原假设H0

成立条件下,统计量落入的小概率区域。统计量真的落入拒绝域你会拒绝原假设。显著性水平α:事先给定的形成拒绝域的小概率,通常α=0.01、0.05、0.10。建立拒绝域的根据是什么?根据抽样分布,统计量落入该区域的概率=α。所谓检验就是选择一个拒绝域。目前十七页\总数七十二页\编于五点假设检验中的小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定什么是小概率?目前十八页\总数七十二页\编于五点根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)标准化的检验统计量目前十九页\总数七十二页\编于五点显著性水平和拒绝域

(双侧检验)抽样分布0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H01-置信水平目前二十页\总数七十二页\编于五点显著性水平和拒绝域

(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平目前二十一页\总数七十二页\编于五点显著性水平和拒绝域

(双侧检验)0临界值临界值

a/2a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平目前二十二页\总数七十二页\编于五点显著性水平和拒绝域

(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平目前二十三页\总数七十二页\编于五点显著性水平和拒绝域

(单侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平目前二十四页\总数七十二页\编于五点显著性水平和拒绝域

(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量目前二十五页\总数七十二页\编于五点显著性水平和拒绝域

(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平目前二十六页\总数七十二页\编于五点显著性水平和拒绝域

(右侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量目前二十七页\总数七十二页\编于五点显著性水平和拒绝域

(右侧检验)0临界值a样本统计量抽样分布1-置信水平拒绝H0目前二十八页\总数七十二页\编于五点决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:|统计量|>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0目前二十九页\总数七十二页\编于五点什么是P值?

(P-value)在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值<,拒绝H0目前三十页\总数七十二页\编于五点双侧检验的P值/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值目前三十一页\总数七十二页\编于五点左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值目前三十二页\总数七十二页\编于五点右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值目前三十三页\总数七十二页\编于五点假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策目前三十四页\总数七十二页\编于五点一个总体参数的检验z检验(单尾和双尾)

t检验(单尾和双尾)z

检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差目前三十五页\总数七十二页\编于五点总体均值的检验

(作出判断)是否已知小样本容量n大是否已知否

t检验否z检验是z检验

是z检验目前三十六页\总数七十二页\编于五点总体均值的检验(2

已知)

(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05

,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255目前三十七页\总数七十二页\编于五点总体均值的检验(2

已知)

(例题分析)H0

=255H1

255=0.05n

=40临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

不拒绝H0样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法目前三十八页\总数七十二页\编于五点总体均值的检验(z检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“NORMSDIST”,然后确定第3步:将z的绝对值1.01录入,得到的函数值为0.843752345

P值=2(1-0.843752345)=0.312495

P值远远大于,故不拒绝H0目前三十九页\总数七十二页\编于五点总体均值的检验(2

未知)

(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)

左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86目前四十页\总数七十二页\编于五点总体均值的检验(2

未知)

(例题分析)H0

1.35H1

<1.35=0.01n

=50临界值(c):检验统计量:

拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01目前四十一页\总数七十二页\编于五点总体均值的检验(z检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定第3步:在所出现的对话框Array框中,输入原始数据所在区域;在X后输入参数的某一假定值(这里为1.35);在

Sigma后输入已知的总体标准差(若未总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023

即为P值

P值=1-0.995421023=0.004579

P值<=0.01,拒绝H0用Excel计算P值目前四十二页\总数七十二页\编于五点总体均值的检验(z检验)

(P值的图示)0-2.33a=0.01z拒绝H0抽样分布1-计算出的样本统计量=2.6061P值P=0.004579

目前四十三页\总数七十二页\编于五点总体均值的检验(2

未知)

(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2

。试检验改良后的新品种产量是否有显著提高?(=0.05)

右侧检验目前四十四页\总数七十二页\编于五点总体均值的检验(2

未知)

(例题分析)H0

5200H1

>5200=0.05n

=36临界值(c):检验统计量:

拒绝H0(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645目前四十五页\总数七十二页\编于五点总体均值的检验(z检验)

(P值的图示)抽样分布P=0.00008801.645a=0.05拒绝H01-计算出的样本统计量=3.75P值目前四十六页\总数七十二页\编于五点2.总体均值的单边(单尾)检验

H0:0

或H0:01)是否对Hilltop咖啡投诉?联邦贸易委员会(FTC)意欲对大瓶Hilltop咖啡进行检查,以确定是否符合其标签上注明的“容量至少是3磅”的说法,并由此决定是否因为包装重量的不足而对其提出投诉。假设检验问题H0:3H1:<3.给定显著水平=0.05,给出一个检验方法。请你说出该显著水平在这一问题中有什么实际意义?目前四十七页\总数七十二页\编于五点总体均值的检验

(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0统计量已知:未知:拒绝域P值决策拒绝H0目前四十八页\总数七十二页\编于五点总体均值的检验

(小样本)1. 假定条件总体服从正态分布小样本(n<

30)检验统计量2

已知:2

未知:目前四十九页\总数七十二页\编于五点总体均值的检验

(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:m=m0H1:

mm0H0

:mm0H1:

m<m0H0:

mm0

H1:

m>m0统计量已知:未知:拒绝域P值决策拒绝H0注:

已知的拒绝域同大样本目前五十页\总数七十二页\编于五点总体均值的检验

(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3目前五十一页\总数七十二页\编于五点总体均值的检验

(例题分析)H0

=12H1

12=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0样本提供的证据还不足以推翻“该供货商提供的零件符合要求”的看法决策:结论:t02.262-2.2620.025拒绝

H0拒绝H00.025目前五十二页\总数七十二页\编于五点总体均值的检验(t检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“TDIST”,然后确定第3步:在出现对话框的X栏中输入计算出的t的绝对值

0.7035,在Deg-freedom(自由度)栏中输入本例的自由度9,在Tails栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1)第4步:P值=0.499537958

P值>=0.05,故不拒绝H0

目前五十三页\总数七十二页\编于五点三、总体比率的检验

1.总体比率单边检验

H0:pp0

或H0:p≥

p0例:PineGreek高尔夫球场的性别比率问题。400个运动者中100个女性,能否认为女性比率比过去的20%增加了?解H0:p0.20,H1:p>0.20;

拒绝域的形状:

目前五十四页\总数七十二页\编于五点

当=0.05时,拒绝域为你的结论?=0.25>0.2329拒绝H0利用大样本下样本比率的抽样分布得到拒绝域为:目前五十五页\总数七十二页\编于五点2.总体比率的双边检验

给定显著性水平,大样本情况下你能写出相应的拒绝域吗?目前五十六页\总数七十二页\编于五点总体比例的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:

0H0

:0H1:

<0H0

0

H1:

>0统计量拒绝域P值决策拒绝H0目前五十七页\总数七十二页\编于五点总体比例的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平

=0.05和=0.01

,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?双侧检验目前五十八页\总数七十二页\编于五点总体比例的检验

(例题分析)H0

=80%H1

80%

=0.05n

=200临界值(c):检验统计量:拒绝H0(P=0.013328<

=0.05)该杂志的说法并不属实

决策:结论:z01.96-1.960.025拒绝

H0拒绝

H00.025目前五十九页\总数七十二页\编于五点总体比例的检验

(例题分析)H0

=80%H1

80%=0.01n

=200临界值(c):检验统计量:不拒绝H0(P=0.013328>=0.01)样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法

决策:结论:z02.58-2.580.025拒绝H0拒绝H00.025目前六十页\总数七十二页\编于五点总体方差的检验

(2检验)

检验一个总体的方差或标准差假设总体近似服从正态分布使用2分布检验统计量样本方差假设的总体方差目前六十一页\总数七十二页\编于五点总体方差的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:2=02H1:

202H0

:202H1:2<02H0:

202H1

:2>02统计量拒绝域P值决策拒绝H0目前六十二页\总数七十二页\编于五点总体方差的检验

(例题分析)【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?朝日BEER朝日BEER朝日BEER朝日目前六十三页\总数七十二页\编于五点总体方差的检验

(例题分析)H0

:2=42H1

:2

42=0.10df=10-1=9临界值(s):统计量:不拒绝H0样本提供的证据还不足以推翻“装填量的标准差否符合要求”的看法

2016.91903.32511

/2=0.05决策:结论:目前六十四页\总数七十二页\编于五点四、整理假设检验的思路1.假设检验的过程1)确定适当的原假设和备择假设;2)选择检验统计量;3)指定显著水平,即“允许犯第一类错误的最大概率”;4)根据显著水平和统计量的抽样分布来确定统计量的临界值,从而确定拒绝域;5)根据样本计算统计量的值并与临界值比较看是否落入拒绝域;6)得出结论。目前六十五页\总数七十二页\编于五点2.原假设H0和备择假设H1的选定

1)假设检验是概率意义下的反证法,根据N-P原则,否定H0(即肯定H1)把握更大,犯错误只是事先控制的小概率α,所以把希望得到的结果做为备择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论