程宏2016 2017学年统计学课程 第10-11次-统计学 第8章 假设检验(Grant)_第1页
程宏2016 2017学年统计学课程 第10-11次-统计学 第8章 假设检验(Grant)_第2页
程宏2016 2017学年统计学课程 第10-11次-统计学 第8章 假设检验(Grant)_第3页
程宏2016 2017学年统计学课程 第10-11次-统计学 第8章 假设检验(Grant)_第4页
程宏2016 2017学年统计学课程 第10-11次-统计学 第8章 假设检验(Grant)_第5页
已阅读5页,还剩74页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第八章假设检验

HypothesisTesting课程内容第5章概率与概率分布第6章统计量及其抽样分布第7章参数估计第8章假设检验第11章一元线性回归

第1章导论第2章数据的收集第3章数据的图表展示第4章数据的概括性度量第13章时间序列分析及预测第14章指数假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验例1(a)从纽约旅店中随机抽取了35个旅店对标准房收费进行调查,样本平均收费为$172.50/天,标准差为$15.40。试估计纽约旅店的平均收费的置信区间。(置信水平95%)(b)据某报纸报道,纽约旅店标准房平均收费为$168/天。为检验该报道是否属实,随机抽取了35个旅店进行调查,样本平均收费为$172.50/天,标准差为$15.40。请问该报道是否属实?参数估计和假设检验问题的提法例2(a)某市场调研公司抽取了由500份市场调查问卷组成的一个随机样本,发现其中有25份回复。试以95%的置信度估计该市场调研公司调查问卷回复率的置信区间。(b)某市场调研公司声称其市场调查问卷的回复率为8%。为验证这一说法是否属实,抽取了由500份调查问卷组成的一个随机样本,发现其中有25份回复。检验该说法是否属实。什么是假设?总体均值总体比例假设(hypothesis)是对总体参数的具体数值所作的陈述。例如:纽约旅店标准房平均收费为$168/天。例如:某市场调研公司调查问卷的回复率为8%。什么是假设检验?假设检验(hypothesistest)是先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。

拒绝总体原假设假设检验的过程不太可能,所以

假设样本的平均年龄是20岁:

x=20样本为了检验这一假设,抽取一个随机样本提出假设:

总体的平均年龄是50岁。(假设:=50)如果=50,x=20可能发生吗?原假设(NullHypothesis,H0)原假设,又称零假设,就是想要进行检验的陈述;例如:美国家庭平均拥有的电视机数量至少为3台。原假设的陈述总是关于总体参数的陈述,而不是对样本统计量的陈述。原假设(NullHypothesis,H0)在假设检验开始之前,总是首先假设原假设为真;这类似于法官在审判开始之前总是首先假设犯罪嫌疑人是无辜的;拒绝或者不能拒绝(证明“有”比证明“无”容易)原假设总是包含符号“=”,“≤”或者“”备择假设(AlternativeHypothesis,H1)备择假设是原假设的对立面;接受或者不能接受备择假设总是不能包含符号“=”,“≤”或者“”研究人员想收集证据予以支持的假设例:一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。提出假设(例题1)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm

例:某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。提出假设(例题2)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g例:一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。

解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%提出假设(例题3)备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0拒绝总体原假设假设检验的过程不太可能,所以

假设样本的平均年龄是20岁:

x=20样本为了检验这一假设,抽取一个随机样本提出假设:

总体的平均年龄是50岁。(原假设:

H0:=50)如果=50,x=20可能发生吗?x的抽样分布...因此我们拒绝原假设

=50假设检验的基本思想这个值不像我们应该得到的样本均值...20

=50如果H0

为真...

如果这是总体的真实均值…x假设检验中的小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定。假设检验中的四种可能情况实际情况决策未拒绝H0正确决策

(1-)a第二类错误

(β)拒绝H0第一类错误()a

H0

为假

H0

为真后果(概率)正确决策

(1-β)第一类错误和第二类错误的关系

我们不可能同时犯第一类错误和第二类错误

只有当H0

为真时,才可能犯第一类错误

只有当H0

为假时,才可能犯第二类错误

如果犯第一类错误的概率(),那么

犯第二类错误的概率(

β)H0H1β显著性水平,

用于定义如果原假设为真,样本统计量不太可能的取值范围即用于定义抽样分布的拒绝域rejectionregion用表示(levelofsignificance)常用的α值有0.01,0.05,0.10显著性水平由研究人员事先确定;用于确定检验的临界值;逻辑上运用反证法,统计上依据小概率原理根据参数的点估计量构造得到的,并据以对原假设和备择假设作出决策的某个样本统计量以总体均值的检验为例:检验统计量(teststatistic)显著性水平和拒绝域0aa/2

表示临界值criticalvalue左侧检验(<)显著性水平=a00a/2a右侧检验(>)双侧检验阴影部分表示拒绝域决策规则(以总体均值检验为例)给定显著性水平,查表得出相应的临界值将检验统计量的值与水平的临界值进行比较作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0(临界值法)什么是p值(p-Value)?p值:在原假设为真的条件下,检验统计量的观察值比其计算值更为极端(≤

或计算值)的概率也称为观察到的显著性水平(observedlevelofsignificance)原假设H0能够被拒绝的最小显著性水平左侧检验的p值p值临界值0样本统计量的计算值Zc其中:z表示检验统计量;zc表示根据样本数据计算得到的检验统计量值;表示总体参数;0表示假设的总体参数的取值;拒绝H0不能拒绝H0右侧检验的p值其中:z表示检验统计量;zc表示根据样本数据计算得到的检验统计量值;表示总体参数;0表示假设的总体参数的取值;拒绝H0不能拒绝H0临界值0p值样本统计量的计算值Zc双侧检验的p值其中:z表示检验统计量;zc表示根据样本数据计算得到的检验统计量值;表示总体参数;0表示假设的总体参数的取值;不能拒绝H0临界值0样本统计量的计算值Zc/2临界值拒绝H0(1/2)p值/2(1/2)p值拒绝H0用p值进行假设检验构造检验统计量(Z或者t统计量)查表或者用计算机得到

p值把p值与

相比较如果p值<,拒绝H0如果p值

,不能拒绝H0

假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策检验统计量的确定Z统计量

Z统计量总体标准差样本量

t统计量大小已知未知总体均值的假设检验已知大样本n30未知总体均值的假设检验小样本已知大样本n30未知总体均值的假设检验小样本检验统计量:总体均值的假设检验已知大样本n30未知总体均值的假设检验小样本检验统计量:总体均值的假设检验随着样本容量的增大,t分布趋近于标准正态分布:已知大样本未知总体均值的假设检验小样本检验统计量:总体均值的假设检验(此时,总体必须服从正态分布。如果无法确定总体是否服从正态分布,可以考虑将样本容量增大到30以上,或者采用非参数检验方法。)

例题分析【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验H0:=0.081H1:

0.081=0.05n

=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:

=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异

例题分析第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为

0.997672537

P值=2(1-0.997672537)=0.004654P值远远小于,故拒绝H0

例题分析【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验

例题分析H0:

1020H1:>1020=0.05n

=16临界值(s):检验统计量:在

=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.645

例题分析【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验

例题分析H0:1200H1:>1200=0.05n=100临界值(s):检验统计量:在

=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645

例题分析【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验

例题分析H0:=5H1:

5=0.05df=10-1=9临界值(s):检验统计量:在

=0.05的水平上拒绝H0说明该机器的性能不好

决策:结论:t02.262-2.262.025拒绝H0拒绝H0.025

例题分析第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统计”,然后,在函数名的菜单中选择字符“TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16

在自由度(Deg-freedom)栏中录入9

在Tails栏中录入2,表明是双侧检验(单测检验则在该栏内录入1)P值的结果为0.01155<0.025,拒绝H0

例题分析样本比例p近似服从正态分布,所以检验统计量为:总体比例的假设检验np5且n(1-p)5总体比例的假设检验np<5或者n(1-p)<5本章不加以讨论例题分析【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验H0:=14.7%H1:

14.7%=0.05n

=400临界值(s):检验统计量:在

=0.05的水平上不拒绝H0该市老年人口比重为14.7%决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025例题分析总体方差的假设检验对于多数生产和生活领域而言,仅仅知道所观测到的样本均值维持在特定水平范围之内并不意味着整个过程的运转正常,方差的大小是否适度则是需要考虑的另一个重要因素。我们只考虑正态总体方差的假设检验。通常用字母2

表示总体方差,02表示对总体方差的某一假设值,s2表示样本方差。使用2分布检验统计量假设双侧检验左侧检验右侧检验假设形式H0

:2=02H1:202H0

:202H1:

2<02H0:202H1

:2>02检验统计量拒绝域P值决策拒绝H0总体方差的假设检验【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求

(=0.05)(见教材)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1绿色健康饮品绿色健康饮品例题分析两个总体均值之差的检验

(独立大样本)

假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)检验统计量12,

22

已知:12,22

未知:例题分析

双侧检验!【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得x1=50公斤,x2=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05)H0:1-2=0H1:1-2

0=0.05n1=32,n2

=40临界值(s):检验统计量:决策:结论:

=0.05的水平上拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025例题分析两个总体均值之差的检验

(独立小样本,12,

22

已知)假定条件两个独立的小样本两个总体都是正态分布12,

22已知检验统计量两个总体均值之差的检验

(12,22

未知但12=22)假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22检验统计量其中:自由度:两个总体均值之差的检验

(12,

22

未知且不相等1222)假定条件两个独立的小样本,两个总体都是正态分布12,

22未知且不相等,即1222样本容量相等,即n1=n2=n检验统计量自由度:两个总体均值之差的检验

(12,

22

未知且不相等1222)假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量自由度:单侧检验【例】“多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设(=0.05)例题分析H0:1-2

0H1:1-2<0=0.05n1=15,n2

=20临界值(s):检验统计量:决策:结论:

=0.05的水平上拒绝H0表明多吃谷物将有助于减少午餐中热量的提取-1.694t0拒绝域.05例题分析第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:选择“t检验,双样本异方差假设”第3步:当出现对话框后在“变量1的区域”方框内键入数据区域在“变量2的区域”方框内键入数据区域在“假设平均差”的方框内键入0

在“α(A)”框内键入0.05

在“输出选项”中选择输出区域选择“确定”例题分析两个总体均值之差的检验

(匹配样本的t检验)1. 检验两个总体的均值配对或匹配重复测量(前/后)2. 假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1

30,n230)匹配样本的t检验

(假设的形式)假设研究的问题没有差异有差异总体1总体2总体1<总体2总体1总体2总体1>总体2H0mD=0mD0mD0H1mD0mD<0mD>0注:Di=X1i-X2i

,对第i对观察值匹配样本的t检验

(数据形式)观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n匹配样本的t检验

(检验统计量)样本差值均值样本差值标准差自由度df=nD-1统计量D0:假设的差值【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的t检验

(例题分析)在

=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102单侧检验样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t检验

(例题分析)配对样本的t检验

(例题分析)差值均值差值标准差H0:m1–m2

8.5H1:m1–m2<8.5a=0.05df=10-1=9临界值(s):检验统计量:决策:结论:

=0.05的水平上不拒绝H0不能认为该俱乐部的宣称不可信-1.833t0拒绝域.05配对样本的t检验

(例题分析)配对样本的t检验

(例题分析—用Excel进行检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论