应用统计学 课件 第6、7章 抽样分布与参数估计、假设检验_第1页
应用统计学 课件 第6、7章 抽样分布与参数估计、假设检验_第2页
应用统计学 课件 第6、7章 抽样分布与参数估计、假设检验_第3页
应用统计学 课件 第6、7章 抽样分布与参数估计、假设检验_第4页
应用统计学 课件 第6、7章 抽样分布与参数估计、假设检验_第5页
已阅读5页,还剩137页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章

抽样分布与参数估计第6章6.1抽样理由和抽样方法6.2抽样误差6.3抽样分布6.4参数估计6.5样本容量的确定

抽样分布与参数估计第6章在本章中你将学到:区分不同的抽样方法抽样分布的概念计算样本平均数和样本比例相关的概率中心极限定理的重要性理解点估计与置信区间估计计算均值和比例的置信区间根据所要得到的置信区间确定样本容量。本章教学目的抽样分布与参数估计第6章区分不同的抽样方法理解抽样分布的概念理解中心极限定理的重要性计算均值和比例的置信区间本章重点和难点抽样分布与参数估计第6章6.1.1抽样理由6.1.2抽样方法6.1抽样理由和抽样方法第6章选择样本比总体(人口普查)中的每一项要节省时间。选择样本比总体中的每一项要节省费用。分析样本要比分析整个总体容易且更加实际。6.1.1抽样理由6.1抽样理由和抽样方法第6章抽样过程从抽样框开始抽样框是对组成总体的一系列条目的列举。抽样框是类似总体清单,目录或者地图的数据源。如果抽样框里没有包括总体的某些部分,不准确或者有偏的结果就可能产生。使用不同的抽样框得到数据会得出不同的结论。6.1抽样理由和抽样方法6.1.2抽样方法第6章样本非概率样本判断样本概率样本简单随机样本系统样本群样本便利样本分层样本样本类型6.1抽样理由和抽样方法第6章在非概率样本中,选中的条目不根据他们发生的概率。在便利抽样中,条目的选择简单,便宜,且方便抽样。在判断样本中,我们得到预先选好的专家就主题发表的意见。样本类型:非概率样本6.1抽样理由和抽样方法第6章在概率样本中,样本中条目的选择基于已知的概率。概率样本简单随机样本系统样本分层样本群样本样本类型:概率样本6.1抽样理由和抽样方法第6章架构里的每一个条目都有同等的机会被选中。n代表样本容量,N代表抽样框的大小,对抽样框中的每个条目进行编号为1到N。抽样可以放回(选择了某一个条目之后再把它放回架构里,它再次被选中的概率仍然相同)或者不放回(选择的某一个条目,不能放回架构中)。简单随机样本适用于总体较小,且同质性比较高的情况。样本通过随机数表或随机数产生器取得。概率样本:简单随机样本6.1抽样理由和抽样方法第6章有850条目的总体抽样架构条目名条目号BevR. 001UlanX. 002. .... .. .JoannP. 849PaulF. 850随机数表(部分)492808892435779002838116307275111000234012860746979664489439098932399720048494208887208401简单随机样本前5个条目Item#492Item#808Item#892--不存在所以忽略Item#435Item#779Item#002使用随机数表选择简单随机样本6.1抽样理由和抽样方法取决于样本容量:n抽样框中N个个体分成含k个个体的组:k=N/n从第一组随机选择一个个体接下来,每数到第k个数都依次选取简单易行,但可能带来周期性问题,导致抽样偏差第6章N=40n=4k=10第一组6.1抽样理由和抽样方法概率样本:系统样本第6章根据一些常见的特征,把总体分成两个或两个以上的亚群体,即层(strata)。在每个层中根据层容量相应选择简单随机样本。分层选择的样本然后加以合并。当抽样总体是选民时,根据种族或社会经济层次分层是常用的技术。总体分成4个层6.1抽样理由和抽样方法概率样本:分层样本第6章某公司要从800名全职雇员中选取32名全职雇员作为样本,估计一项公司赞助的牙科保健计划方面的费用。在全职雇员中,25%是经理,75%是非经理。如何选择分层的样本使样本能代表经理雇员和非经理雇员正确的比例?假定回复率为80%。总体800经理200非经理600抽取40*25%=10抽取40*75%=30解:共需发送32/0.8=40份调查问卷。例

选取分层样本6.1抽样理由和抽样方法第6章总体分为若干个“聚类”或者“群”,每个聚类或群代表整个总体。随机选择聚类样本或群样本使用选中的聚类里的所有项目或者从聚类里面选取基于概率的样本。聚类样本的通常应用是选举,其中选择特定选区并抽样。总体分成16个聚类样本。随机选择聚类样本抽样概率样本:聚类样本6.1抽样理由和抽样方法第6章简单随机样本和系统样本使用简单可能不能很好的代表总体的潜在特性分层样本确保代表的个体覆盖整个总体聚类样本成本效率更高有效性较低(需要更大的样本以取得同等程度的精确性)概率样本:比较抽样方法6.1抽样理由和抽样方法第6章样本统计量和对应的总体参数之间的差异,称之为抽样误差。抽样误差的产生是由于抽样的非全面性和随机性所引起的,是偶然性误差。非抽样误差抽样框误差系统性误差测量误差登记误差6.2抽样误差第6章抽样分布就是选出所有可能的样本情况下结果的分布两类统计量的抽样分布:样本均值和样本比例。例如,

假设想知道某学院学生的平均成绩,随机选择50个学生。

如果得到很多不同的50个学生的样本,将计算每个样本不同平均数。我们可以计算对于任意给定的50个学生的样本,我们对所有潜在的平均成绩感兴趣。6.3抽样分布第6章均值的抽样分布是指在给定样本容量的情况下所有可能的样本均值的分布。6.3.1样本均值的抽样分布6.3抽样分布第6章假设总体…总体容量N=4随机样本变量,X,

是个体的年龄X的观测值:24,28,

32,36(岁)ABCD例子1.样本均值的均值6.3抽样分布第6章总体均值总体的均值等于总体的所有数值之和除以总体容量N。总体的标准差6.3抽样分布第6章.3.2.10

24283236

ABCD均匀分布P(x)x总体分布的概括度量:样本均值的均值——例子(续)6.3抽样分布16个可能的样本(有放回的抽样)现在考虑容量n=2的所有可能的样本第6章(续)16个样本平均数第一个观测值第二个

观测值242832362424,2424,2824,3224,362828,2428,2828,3228,363232,2432,2832,3232,363636,2436,2836,3236,36样本均值的均值——例子第一个第二个观测值观测值2428323624242628302826283032322830323436303234366.3抽样分布

第6章

所有样本平均数的抽样分布

X样本平均数的分布16个样本平均数P(X)

0.1.224262830323436.3_(续)(不再是均匀分布)样本均值的均值——例子第一个第二个观测值观测值2428323624242628302826283032322830323436303234366.3抽样分布第6章该抽样分布的概括度量:(续)样本均值的均值——例子6.3抽样分布第6章算术平均数是无偏的,因为所有可能的样本均值(给定样本容量n)的平均值等于总体的均值。样本均值的均值——例子6.3抽样分布第6章242628303234360.1.2.3P(X)X

24

28

32

36AB

C

D0.1.2.3总体N=4P(X)X_样本平均数分布n=2_2.样本均值的标准误差6.3抽样分布第6章同样总体相同容量的不同的样本导致不同的样本平均数样本与样本之间平均数的变动用均值的标准误差来度量:(这假设是有放回的抽样或者无限总体无放回的抽样)均值的标准误差是所有可能的样本均值的标准差。注意平均数的标准差随着样本容量

增加而减少6.3抽样分布第6章总体服从正态分布,平均数μ

且标准差σ,抽样分布

也服从正态分布。

且3、正态分布总体的抽样分布6.3抽样分布第6章

抽样分布的Z值:其中: =样本平均数 =总体平均数 =总体标准差

n=样本容量平均数抽样分布的Z值6.3抽样分布总体正态分布抽样分布也正态分布(有同样的平均数)第6章抽样分布特征6.3抽样分布第6章较大的样本容量较小的

样本容量(续)随着n增加,减少抽样分布特征6.3抽样分布第6章假设每盒麦片的重量服从正态分布,均值为368克,标准差为15克。如果从同一天包装的几万盒麦片中随机抽取25盒作为样本,则该样本均值低于365克的可能性有多大?解:即所有容量为25的样本的均值有15.87%的概率低于365克。例子:麦片包装问题6.3抽样分布第6章假设每盒麦片的重量服从正态分布,均值为368克,标准差为15克。如果从同一天包装的几万盒麦片中随机抽取100盒作为样本,则该样本均值低于365克的可能性有多大?解:即所有容量为100的样本的均值有2.28%的概率低于365克。例子:麦片包装问题6.3抽样分布第6章我们可以使用中心极限定理:即使总体非正态分布,总体的样本平均数

将近似正态分布只要样本容量足够的大.抽样分布的特征:

且6.3.2中心极限定理6.3抽样分布n↑第6章随着样本容量变得足够的大…不管总体的分布如何,抽样分布趋近于正态分布6.3.2中心极限定理6.3抽样分布第6章总体分布抽样分布(随着n的增加服从正态分布)集中趋势变异程度较大的样本容量较小的

样本容量(续)抽样分布特征:6.3抽样分布第6章对于大多数分布,n>30

将导致抽样分布近乎正态分布对于完全对称分布,n>15一般足够导致抽样分布近乎正态分布对正态分布的总体,平均数的抽样分布总是服从正态分布多大是足够的大?6.3抽样分布第6章假设总体的平均数μ=8且标准差σ=3.

假设选中容量n=36随机样本。样本平均数介于7.8和8.2之间的概率是多少?例子6.3抽样分布第6章结论:即使总体非正态分布,中心极限定理可以应用(n>30)…因此抽样分布近乎正态分布…且平均数…且标准差(续)例子6.3抽样分布第6章

结论(续):(续)抽样分布标准正态分布总体

分布样本标准化????????????XZ-0.40.4.1554+.15547.88.2例子6.3抽样分布第6章

π=有着某种特性的总体的比例

样本比例(p)

提供π的估计:0≤p≤1当n比较大时,p近乎正态分布 (假设是有放回的抽样或者无限总体无放回的抽样)

6.3.3比例的抽样分布6.3抽样分布第6章近乎正态分布分布,如果:

其中

且(其中

π=总体比例)抽样分布P(

ps).3.2.100.2.4.681pp的抽样分布6.3抽样分布第6章使用公式将p标准化为Z值:比例的Z值6.3抽样分布

ifπ=0.4且n=200,P(0.40≤p≤0.45)是多少?第6章如果支持A主张的投票者的真正比例是π=0.4,容量200的样本导致样本比例介于0.40与0.45之间的概率是多少?也就是说:例子6.3抽样分布第6章

ifπ=0.4且n=200,P(0.40≤p≤0.45)是多少?(续)转换成标准正态分布:计算:例子6.3抽样分布第6章Z1.440.4251标准化抽样分布标准正态分布

ifπ=0.4且n=200,P(0.40≤p≤0.45)是多少?(续)使用标准正态分布表:

P(0≤Z≤1.44)=0.425100.450.40p例子6.3抽样分布第6章6.4.1点估计

使用单个样本的统计量来估计总体参数的方法。6.4参数估计第6章置信区间估计:是在样本点左右构造的一段区间,从而可以知道总体参数落在特定区间内的概率。对于未知参数

,找到两个数值

,使参数

位于区间

的概率为

,即

式中,区间

表示总体参数的区间估计或置信区间。6.4.2置信区间估计6.4参数估计第6章点估计是单个数值置信区间提供了估计变动的额外信息点估计置信区间下界置信区间上界置信区间宽度点估计和置信区间估计6.4参数估计第6章区间给出了观测值的一个范围:考虑样本统计量随着样本的不同而变化基于一个样本的观测值给出接近未知总体参数的信息以置信度表示例如95%的置信度,99%的置信度不能为100%的置信度6.4.3总体均值的置信区间估计(

已知时)6.4参数估计第6章置信度:置信区间包含未知总体参数的百分比(低于100%)假设置信度=95%,也可写成(1-

)=0.95,(故

=0.05)

为分布中置信区间外的两个尾部的比例。一般的相关解释:构造的所有置信区间95%包含未知的真实参数特别的,区间可以包含也可以不包含真实参数置信度(1-)6.4参数估计第6章

假设总体标准差σ已知总体是正态分布如果总体非正态,则使用大样本置信区间估计:

其中

Zα/2是标准正态分布曲线上上限临界值以上的比例为/2对应的数值;μ的置信区间(σ已知)6.4参数估计第6章考虑置信度是95%的置信区间:置信下限临界值置信上限临界值Z:X:点估计0Zα/2=-1.96Zα/2=1.96寻找临界值,Zα/26.4参数估计第6章通常使用的置信度是90%,95%,和99%置信度置信系数

Zα/2

值1.281.6451.962.332.583.083.270.800.900.950.980.990.9980.99980%90%95%98%99%99.8%99.9%常用置信度6.4参数估计第6章置信区间(1-

)x100%

区间包含μ;(

)x100%

不包含均值的样本分布区间从

扩展到

x1x2置信区间和置信度6.4参数估计第6章一个文具商店想要估计库存中贺卡的平均销售额。随机选择100张贺卡,均值为3.65元,标准差为0.4元。假设服从正态分布,计算该店库存中所有贺卡的均值的95%置信区间估计。

解:95%的置信度对应的临界值即库存中所有贺卡的平均销售额的95%置信区间估计为3.5716~3.7284元。

【例6-1】6.4参数估计第6章如果总体标准差

σ是未知的,我们可以用样本标准差S来替代。这种做法是非常不确定的,因为S随着样本的变化而变化。所以我们用t分布来代替正态分布。6.4.3总体均值的置信区间估计(

未知时)6.4参数估计如果随机变量X服从正态分布,那么下面的统计量服从自由度为n-1的t分布:其中S为样本标准差。第6章1.学生t分布6.4参数估计

第6章t(df=5)

t(df=13)t-分布是钟形的对称的,但其尾部比正态的“胖”标准正态(t有df=∞)t0注意:tZn增加2.t分布的特性6.4参数估计d.f.=n-1第6章t是一个分布集tα/2的值依赖于自由度(d.f.)观察值在样本均值计算后是自由变化的

t分布的特性(续)6.4参数估计如果这三个数的均值是8.0,

那么X3一定是9(即,X3

不是自由变化的)令X1=7令X2=8X3是多少?例子:假设3个数字的均值是8.0第6章这里,n=3,所以自由度=n–1=3–1=2(对于一个给定的均值,2个值可以是任意的数字,但是第三个数是不能自由变化的)思想:观察值在样本均值计算后是自由变化的

3.自由度(df)的概念6.4参数估计当σ未知时,均值的置信区间估计为:(其中tα/2

是具有n-1自由度和α/2的累积面积的t分布的临界值)第6章4.置信区间的表达式(σ未知)6.4参数估计第6章上部的尾部面积df.25.10.0511.0003.0786.31420.8171.8862.92030.7651.6382.353表的主体包含t值,但没有概率令:n=3

df=n-1=2

=0.10

/2=0.05t02.920

/2=0.05t分布表6.4参数估计第6章某医院想估计其急诊室服务的病人的平均等候时间。随机抽取33名急诊室病人进行调查,经计算样本均值为222分钟,样本标准差为76分钟。在95%的置信水平下估计平均等候时间的置信区间。解:由题意知,

95%的置信度,自由度为32时,对应的t分布的临界值为

,应用公式(6-13)可得:即【例6-2】6.4参数估计第6章6.4.4比例的置信区间估计总体比例(π)的区间估计可以通过对样本比例(p)的不确定性增加一个限制来计算。6.4参数估计第6章置信区间上下界通过以下公式来计算其中Zα/2

是所要求的置信度的标准正态值P是样本比例n是样本容量注意:一定要np>5

和n(1-p)>56.4参数估计第6章某网站对1120名全职妈妈进行了调查,其中280位表明她们对工作-生活的平衡并不满意。计算全职妈妈中对工作-生活的平衡并不满意的总体比例的90%置信区间估计。解:置信区间估计可以计算如下:90%的置信度对应的关键值

,则有即【例6-3】6.4参数估计第6章均值样本容量的确定比例6.5样本容量的确定第6章样本容量需要达到置信度(1-

)要求下的误差界限(ME)此误差界限也称为抽样误差总体参数估计时的不精确量点估计生成置信区间时增加减少的量

6.5.1估计总体均值时样本容量的确定6.5样本容量的确定第6章均值样本容量的确定抽样误差(误差界限)6.5样本容量的确定第6章均值样本容量的确定求解n得到6.5样本容量的确定第6章为了确定均值所需的样本容量,必须知道:目标置信度(1-

),其决定了关键值Zα/2可接受的抽样误差标准差σ6.5样本容量的确定第6章如果

=45,在90%的置信度下均值±5的估计所需的样本容量要多大?

(取整)所以目标样本容量n=220求样本容量的例子6.5样本容量的确定第6章如果σ是未知的,其可以通过目标样本容量的公式来进行估计使用的σ值应期望至少与真实的σ值一样大选择一个试验样本并通过样本标准差S来估计σ如果σ未知6.5样本容量的确定第6章样本容量的确定比例求解n得到6.5.2、估计总体比例时样本容量的确定6.5样本容量的确定第6章为了确定比例的目标样本容量,必须知道:目标置信度(1-

),其决定了关键值Zα/2可接受的抽样误差

MEp真实的总体比例ππ可以通过一个试验样本来估计(或者谨慎的使用0.5来估计π)(续)样本容量的确定6.5样本容量的确定第6章在95%的置信度下,多大的样本可以估计真实比例,且其总体误差在±3%以内?(假定一个试验样本p=0.12)求样本容量的例子6.5样本容量的确定第6章解:对于95%的置信度,Zα/2=1.96MEp=0.03p=0.12,用此估计π故n=451(续)求样本容量的例子6.5样本容量的确定第6章讨论了概率与非概率样本叙述了四种常见概率样本讨论了调查价值和调查误差的类型介绍了抽样分布叙述了平均数的抽样分布对于正态分布总体使用中心极限定理叙述了比例的抽样分布使用抽样分布计算概率小结第6章介绍置信区间的概念讨论点估计置信区间的估计均值的置信区间估计(σ已知)均值的置信区间估计(σ未知)比例的置信区间估计目标均值比例的样本容量的确定小结假设检验第七章

第7章

7.1假设检验的概念及分类7.2检验假设的五个步骤7.3几种常见的假设检验7.4假设检验决策的风险假设检验第7章在本章,你将学到:

基本的假设检验原理掌握几种常用的假设检验每种假设检验过程的前提假设,如何评价他们,以及被违反的后果正确理解假设检验的两类错误及其关系。本章教学目的假设检验第7章本章重点和难点基本的假设检验原理,关于总体均值、总体比例的假设检验假设检验的两类错误及其关系。假设检验第7章假设是关于总体参数的声称(断言):总体均值总体比例例:一个城市的每月电话账单均值μ=$42例:一个城市成年人拥有手机的比例π=0.687.1假设检验的概念及分类第7章假设检验单侧检验双侧检验7.1假设检验的概念及分类第7章7.2假设检验的五个步骤7.2.1提出原假设和备择假设7.2.2选择显著性水平7.2.3确定检验统计量7.2.4建立决策准则7.2.5做出决策第7章检验的声称或断言例:在美国每个家庭平均有3台电视机是总体参数,不是样本统计量7.2.1提出原假设和备择假设

原假设,H07.2假设检验的五个步骤第7章首先假设零假设是真的与无罪,被证明有罪的概念是相似的引用现状或历史价值总是包含“=”,“≤”或“”可能被拒绝,也可能不(续)7.2假设检验的五个步骤原假设,H0第7章零假设的对立面例:在美国每个家庭的电视机不是3台(H1:μ≠3)向现状发出挑战不包含“=”,“≤”或“”可能被证明,也可能不一般是研究者试图去证明的备择假设,H17.2假设检验的五个步骤第7章7.2.2选择显著性水平显著性水平是原假设为真时拒绝原假设的概率,通常用希腊字母α表示。把概率小于α的事件称为小概率事件。α越大,样本统计量的值与总体参数假设值之间的差异成为显著性差异的可能性越大;α越小,这种差异成为显著性差异的可能性越小。可以将显著性水平α设定为0.05(通常表示为5%),或0.01,或0.10,或介于0与1之间的任意其他数值。7.2假设检验的五个步骤第7章7.2.3确定检验统计量检验统计量是由样本信息确定的用于决定是否拒绝原假设的一个数值。检验统计量有很多,常用的有Z统计量、t统计量、F统计量和χ2(卡方)统计量,需要根据具体问题和样本情况选择合适的统计量。7.2假设检验的五个步骤第7章7.2.4建立决策准则决策准则是原假设被拒绝或原假设不被拒绝的具体条件。接受或拒绝原假设,最终要以显著性水平为依据确定决策准则。决策准则的制定有两种方法:临界值方法和p值方法。

7.2假设检验的五个步骤第7章1、临界值方法临界值方法,是先把α值转化为一定分布下的临界值(将拒绝原假设和不拒绝原假设的区域的分界点称为临界值),然后计算检验统计量的值,最后把检验统计值与临界值相比较来判断是否拒绝原假设。7.2假设检验的五个步骤第7章检验统计量的抽样分布临界值拒绝域α/2拒绝域α/2接受域1-α正态分布双侧检验接受域与拒绝域示意图7.2假设检验的五个步骤第7章检验统计量的抽样分布临界值拒绝域α接受域1-α正态分布单侧检验接受域与拒绝域示意图-17.2假设检验的五个步骤第7章检验统计量的抽样分布临界值拒绝域α接受域1-α正态分布单侧检验接受域与拒绝域示意图-27.2假设检验的五个步骤第7章2、p值方法P值是在原假设为真的情况下,使得某一检验统计量等于或者大于样本结果的概率。在P值检验中,拒绝的决策准则是:(1)如果P值大于或等于,不拒绝原假设;(2)如果P值小于,拒绝原假设。7.2假设检验的五个步骤第7章将检验统计量的值与临界值进行比较,然后做出是否拒绝原假设的决定。如果计算得到统计量的值落入接受域,则不能拒绝原假设。不拒绝原假设的逻辑是,这样小的值很可能是由偶然性或抽样误差造成的。如果计算得到统计量的值落入拒绝域,则拒绝原假设。拒绝原假设的推理逻辑是,计算出的值如此之大,不大可能是由抽样误差(偶然性)造成的。7.2.5做出决策7.2假设检验的五个步骤第7章7.3.1总体均值的假设检验;7.3.2总体比例的假设检验;7.3.3两个总体均值之差的假设检验;7.3.4两个总体比例之差的假设检验。7.3几种常见的假设检验第7章7.3几种常见的假设检验检验的目的是总体均值μ是否等于(或大于等于,或小于等于)某一特定的数值μ0。我们建立如下假设:7.3.1总体均值的假设检验(双侧检验)(左单侧检验)(右单侧检验)或或第7章已知未知

的假设检验(Z检验)(t检验)7.3几种常见的假设检验Chap9-105

第7章

把样本统计量(x)转换为ZSTAT

检验统计量

检验统计量是:σKnownσUnknown

的假设检验已知未知(Z检验)(t检验)1.总体均值的Z检验(σ

已知)7.3几种常见的假设检验第7章根据抽样分布原理,当总体服从正态分布N(μ,

2)时,那么从中抽取(重复抽样)容量为n的样本,其样本均值

服从正态分布

,而统计量

服从标准正态分布。对于双侧检验,对给定的显著性水平α,当

时,不能拒绝原假设;

时,拒绝原假设而接受备择假设。

7.3几种常见的假设检验第7章【例7-2】一家灯泡厂声称其生产的灯泡的平均寿命为375小时。假定灯泡寿命服从正态分布,总体标准差为25小时。质量控制经理想要确定该厂生产的灯泡寿命是否符合其规定,从中抽取100只灯泡,其平均寿命为379小时。试问在0.05的显著性水平下,灯泡的平均寿命与375小时有无明显差异。解:由题意知,这是双侧检验问题,可建立如下假设:由样本均值

和总体标准差

=25,计算得检验统计量Z值为:在α=0.05显著性水平下,

,由于

,不能拒绝H0,即没有证据表明灯泡的平均寿命与375小时存在显著差异。7.3几种常见的假设检验第7章对于左单侧检验,对给定的显著性水平α,当

时,要拒绝原假设而接受备择假设;当

时,则接受原假设。

对于右单侧检验,对给定的显著性水平α,当

时,要拒绝原假设而接受备择假设;当

时,则接受原假设。

7.3几种常见的假设检验第7章【例7-3】某快餐连锁店的平均服务时间是3分钟。为提高其服务质量,快餐店启动了一项质量提升项目,力求缩短平均服务时间。为测试项目实施效果,随机抽取了50名顾客作为样本,其平均等待时间是2.75分钟。假定顾客等待时间服从正态分布,总体标准差为0.5分钟。试问在0.05的显著性水平下,新项目的实施是否明显缩短了平均服务时间。解:由题意知,这是左单侧检验问题,可建立如下假设:由样本均值和总体标准差

=0.5,计算可得检验统计量Z值为:7.3几种常见的假设检验第7章在

=0.05时,

。由于

,落入了拒绝域,因此要拒绝原假设而接受备择假设,说明新流程明显缩短了服务时间。7.3几种常见的假设检验

第7章把样本统计量()转变为检验统计量tSTAT

X检验统计量是:

的假设检验σKnownσUnknown已知未知(Z检验)(t检验)2.总体均值的t检验(σ未知)7.3几种常见的假设检验第7章在关于均值的假设检验中,当为未知时,检验统计量对于双侧检验,当时,接受H0而拒绝H1;若

或时,则要拒绝H0而接受H1。对于左单侧检验,当

时,拒绝H0;当

时,则接受H0。对于右单侧检验,当

时,拒绝H0;当

时,则接受H0。服从自由度为n-1的t分布。7.3几种常见的假设检验第7章【例7-4】某罐装奶粉的标准重量为900克。现从生产线上抽取16罐为样本,测得平均重量为905克,标准差为20克。试问在0.05的显著性水平下,是否有证据表明每罐奶粉的平均质量不同于900克。解:由题意知,这是双侧检验问题,可建立如下假设:由样本均值和样本标准差S=20,计算可得检验统计量t的值为:查t分布表,在

=0.05,自由度为15时,双侧临界值,由于,落入非拒绝域,因此不能拒绝H0,即没有证据表明每罐奶粉的平均质量不同于900克。7.3几种常见的假设检验第7章【例7-5】引用【例7-4】,试问在相同的显著性水平下,该奶粉生产商生产的罐装奶粉的平均重量是否偏高。解:由题意知,这是右单侧检验问题,可建立如下假设:检验统计量t的值仍为1,查t分布表,在

=0.05,,由于,落入非拒绝域,因此不能拒绝H0,即没有证据表明罐装奶粉的平均重量比规定的重量偏高。自由度为15时,右单侧临界值7.3几种常见的假设检验第7章涉及绝对变量两种可能的结果具有成功的特性不具有成功的特性总体成功数的部分或比例表示成π7.3.2总体比例的假设检验7.3几种常见的假设检验第7章样本的成功数比例表示成p

当nπ和n(1-π)都大于5,p将接近于正态分布,均值和标准差如下:

7.3几种常见的假设检验第7章p的抽样分布接近于正态分布,所以检验统计量是ZSTAT

值:nπ5和n(1-π)5p的假设检验nπ<5或n(1-π)<5本章不讨论7.3几种常见的假设检验第7章关于总体比例,可建立如下假设:(双侧检验)(左单侧检验)(右单侧检验)或或7.3几种常见的假设检验第7章【例7-6】某快餐店承诺,90%的订餐可以在订单被确认后的10分钟内送到。由100份订单组成一个样本,其中有82份订餐在承诺的时间内送到。试问在0.01的显著性水平下,是否可以说在10分钟内送到的订餐比例小于90%。解:由题意知,这是左单侧检验问题,可建立如下假设:样本比例,检验统计量的值为:,落入拒绝域,因此要拒绝H0而接受H1,即有证据表明在10分钟内送到的订餐比例小于90%。7.3几种常见的假设检验第7章7.3.3两个总体均值之差的假设检验设两个总体的均值分别为,两个总体的方差分别为,来自两个总体的样本容量

分别为n1和n2,样本均值分别为。检验的目的是验证两个总体的均值是否相等,或两个总体的均值之差是否为零。7.3几种常见的假设检验第7章关于总体均值之差的检验,可建立如下假设:(双侧检验)(左单侧检验)(右单侧检验)或或7.3几种常见的假设检验第7章1.两个总体均值之差的Z检验

两个总体均值之差的Z检验适用于两个总体服从正态分布且方差已知,或两个总体方差未知但为大样本的情形。此时,统计量为:当原假设H0:成立时,若两总体的方差已知,检验统计量为:7.3几种常见的假设检验

第7章

若两个总体方差未知,当原假设H0:成立时,检验统计量为:则用样本方差若样本容量n1和n2都足够大时,来估计,

对于双侧检验,当

时,拒绝H0;当

时,接受H0.对于左单侧检验,当

时,拒绝H0;当

时,接受H0.对于右单侧检验,当

时,拒绝H0,当

时,接受H0.7.3几种常见的假设检验第7章【例7-7】要比较甲乙两个餐饮店的便利窗口的平均服务时间。甲快餐店随机调查50人,平均服务时间为3.5分钟,标准差为0.5分钟;乙快餐店随机调查40人,平均服务时间为3.6分钟,标准差为0.4分钟。试问在0.05的显著性水平下,甲乙两个快餐店的便利窗口的平均服务时间是否有显著差异。解:由题意知,这是双侧检验问题,可建立如下假设:根据样本均值和样本标准差S1=0.5,S2=0.4计算得检验统计量Z值为:7.3几种常见的假设检验第7章因此,不能拒绝H0,即没有证据表明两个快餐店的便利窗口的平均服务时间存在显著差异。,落入接受域,7.3几种常见的假设检验第7章2.两个总体均值之差的t检验

若两个总体均服从正态分布,方差未知且相等,那么当两个样本容量n1和n2都不够大时,关于两个总体均值之差的假设检验就可以用t检验。此时,下列统计量服从自由度为n1+n2-1的t分布,即:式中,表示混合标准差;来自总体1的样本方差;表示来自总体2的样本方差。7.3几种常见的假设检验第7章当原假设成立时,检验统计量为:

对于双侧检验,当

时,拒绝H0;当

时,接受H0.对于左单侧检验,当时,拒绝H0。当时,接受H0。当时,拒绝H0。当时,接受H0。对于右单侧检验,7.3几种常见的假设检验第7章【例7-8】表7-1给出的是度量AA可充电锂电池和镍氢可充电电池随机样本的单次充电平均持续使用分钟数结果。表7-1不同类型电池的单次充电平均使用分钟数

试问在显著性水平=0.05下,这两种电池的单次充电平均使用分钟数是否不同。假设单次充电使用分钟数总体方差不相等。锂电池镍氢电池样本均值样本标准差样本容量96.56.51482.911.2187.3几种常见的假设检验第7章解:由题意知,这是双侧检验问题,可建立如下假设根据样本均值和样本标准差S1=6.5,S2=11.2计算得检验统计量t的值为:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论