第五章抽样推断二_第1页
第五章抽样推断二_第2页
第五章抽样推断二_第3页
第五章抽样推断二_第4页
第五章抽样推断二_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章抽样推断第一节抽样推断及其特点第二节总体参数估计第三节假设检验概述1/9/20231不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑

——Gudmund

R.Iversen统计名言1/9/20232参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计1/9/20233大学生每周上网花多少时间?为了解学生每周上网花费的时间,中国人民大学公共管理学院的4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发60份问卷,其中男、女生各30份。共收回有效问卷共200份。其中有关上网时间方面的数据经整理如下表所示1/9/20234大学生每周上网花多少时间?回答类别人数(人)频率(%)3小时以下32163~6小时3517.56~9小时3316.59~12小时2914.512小时以上7135.5合计200100平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在12小时以上的学生比例是多少?你做出估计的理论依据是什么?1/9/20235第一节抽样推断及其特点1.1抽样推断的特点1.2总体参数和样本统计量1.3抽样推断的基本条件1.4抽样推断的误差1/9/202361.1

抽样推断及其特点抽样推断(统计推断)—按随机原则从总体中抽取部分单位构成样本,在一定的可靠程度下,根据样本的数量特征对总体的数量特征加以推断的方法。抽样推断的方法:—总体参数的估计—总体参数的假设检验。1/9/202371.1

抽样推断及其特点

抽样推断的特点1.抽样推断必须遵循随机原则。2.对抽样误差可以事先加以计算和控制。3.具有经济性、时效性,应用广泛的特点。4.可对全面调查的结果进行检验和修正。1/9/20238利用样本统计量推断总体参数目的特点易求未知不唯一、随机变量唯一、常量性质样本的指标总体的指标含义1.2

总体参数和样本统计量常见样本统计量总体参数总体参数与样本统计量的比较1/9/202391.2

总体参数和样本统计量样本统计量总体参数和样本统计量的计算公式

总体参数1/9/2023101.3抽样推推断的的基本本条件件抽样推推断的的基本本条件件1.选选择择统计计量——优良估2.合适的允许误差—精确性。3.可接受的置信度—可靠性。精确性和可靠性是一对矛盾。要根据问题的性质和研究的需要在二者间权衡。12/29/2022111.4抽样推推断的的误差差统计计误误差差登记性误差代表性误差系统误差抽样误差可消除可消除可控制统计误误差的的分类类12/29/2022121.4抽样推推断的的误差差抽样误误差1.抽抽样实实际误误差::对某一一样本本而言言,由由随机机因素素引起起的样样本统统计量量与总总体参参数在在数量量上的的差异异就是是抽样样实际际误差差。12/29/2022131.4抽样推断断的误差差2.抽抽样平平均(标标准)误误差:抽样平均均误差是是抽样平平均数的的标准差差,它反反映样本本平均数数(样本本成数))与总体体平均数数(总体体成数))之间的的平均差差异程度度。12/29/2022141.4抽样推断断的误差差总体标准准差和成成数的确确定:总体变化化不大,,采用过过去总体体指标数数值做代代替;用样本标标准差σ(x)或样本成成数p替代;对于成数数,可取取P=0.5;如如果有多多个P值,取其其最接近近0.5的的P做替代。。12/29/2022151.4抽样推断的的误差3.抽样样极限(允允许)误差差是样本统计计量与被估估计的总体体参数之绝绝对离差的的最大允许许值,常用用Δ表示,,可简称为为极限误差或允许误差。12/29/2022161.4抽样样推推断断的的误误差差Δ和μ的关关系系::Z—概率率度度,,Z表示示以抽抽样样平平均均误误差差为为标标准准单单位位对对极极限限误误差差的的度度量量值值。。由由Z确定定的的概概率率保保证证程程度度F(Z)——置信信度度。。12/29/202217极限误差标准准化的意义::Z~N(0,1

)Z

Z0-ΔΔSD+D-X

X

X()2μ

,

X

N~x1.4抽样推断的误误差12/29/202218第二节总体参数的估估计2.1总体参数估计计概述2.2点估计2.3区间估计2.4样本容量的确确定12/29/2022192.1总体参参数估估计概概述总体参参数估估计就就是以以样本本统计计量来来估计计总体体参数数。参数估估计要要求::1.精精确确性——适当当的极极限误误差范范围;;2.可可靠靠性——估计结结果正正确的的概率率。参数估估计——点估计计和区间估估计。12/29/2022202.2点估计计(pointestimate)点估计计就是根根据总总体参参数与与样本本统计计量之之间的的内在在联系系,直直接以以样本本统计计量作作为相相应总总体参参数的的估计计值,,点估估计又又称为为定值估估计。常用的点点估计量量有:12/29/202221参数估计计(parameterestimation)就是是用样本本统计量量去估计计总体的的参数估计量::用于估估计总体体参数的的统计量量的名称称如样本均均值,样样本比例例,样本本方差等等例如:样样本均均值就是是总体均均值的一个估估计量参数用表示,估估计量用表表示示估计值::估计参参数时计计算出来来的统计计量的具具体值如果样本本均值x=80,,则80就是的估计值值估计量与与估计值值(estimator&estimatedvalue)12/29/202222优良估计量的的三个标准::E(统计量)==总体参参数1.无偏性::(unbiasedness)2.2点估计12/29/2022232.一致性::(consistency)优良估计量的的三个标准::2.2点估计12/29/202224xXX优良估计量的的三个标准::2.2点估计12/29/2022253.有有效效性性::(efficiency)优良良估估计计量量的的三三个个标标准准::2.2点估估计计12/29/202226优良估计量总体参数2.2点估估计计12/29/202227推断总体反映样本的离散程度作用公式符号样本方差2.2点估计12/29/202228>总体参数数的点估估计:原则:总体参数数估计值值就取统计量的的值作用:区间估计计的基础础。2.2点估计12/29/2022292.3区间估估计(intervalestimate)一区区间估估计的的含义义:概率P=1--α=?区间大大小—估估计的的精确确性;;概率高高低—估估计的的准确确性。。总体参数θ12/29/202230区间估估计(intervalestimate)在点估估计的的基础础上,,给出出总体体参数数估计计的一一个估估计区区间,,该区区间由由样本本统计计量加加减估估计误误差而而得到到根据样样本统统计量量的抽抽样分分布能能够对对样本本统计计量与与总体体参数数的接接近程程度给给出一一个概概率度度量比如,,某班班级平平均分分数在在75~85之间,,置信信水平平是95%样本统计量

(点估计)置信区间置信下限置信上限12/29/202231区间估估计的的图示示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x12/29/202232将构造置信信区间的步步骤重复很很多次,置置信区间包包含总体参参数真值的的次数所占占的比例,,也称置信信度表示为(1-为是总体体参数未在区间内的比比例常用的置信信水平值有有99%,95%,90%相应的为0.01,,0.05,0.10置信水平(confidencelevel)12/29/202233由样本估计量量构造出的总总体参数在一一定置信水平平下的估计区区间统计学家在某某种程度上确确信这个区间间会包含真正正的总体参数数,所以给它它取名为置信信区间如果用某种方方法构造的所所有区间中有有95%的区区间包含总体体参数的真值值,5%的区区间不包含总总体参数的真真值,那么,,用该方法构构造的区间称称为置信水平平为95%的的置信区间。。同样,其他他置信水平的的区间也可以以用类似的方方式进行表述述置信区间的表表述(confidenceinterval)12/29/202234总体参数的真真值是固定的的,而用样本本构造的区间间则是不固定定的,因此置置信区间是一一个随机区间间,它会因样样本的不同而而变化,而且且不是所有的的区间都包含含总体参数实际估计时往往往只抽取一一个样本,此此时所构造的的是与该样本本相联系的一一定置信水平平(比如95%)下的置置信区间。我我们只能希望望这个区间是是大量包含总总体参数真值值的区间中的的一个,但它它也可能是少少数几个不包包含参数真值值的区间中的的一个置信区间的表表述(confidenceinterval)12/29/202235当抽取了一个个具体的样本本,用该样本本所构造的区区间是一个特特定的常数区区间,我们无无法知道这个个样本所产生生的区间是否否包含总体参参数的真值,,因为它可能能是包含总体体均值的区间间中的一个,,也可能是未未包含总体均均值的那一个个一个特定的区区间总是“包包含”或“绝绝对不包含””参数的真值值,不存在““以多大的概概率包含总体体参数”的问问题置信水平只是是告诉我们在在多次估计得得到的区间中中大概有多少少个区间包含含了参数的真真值,而不是是针对所抽取取的这个样本本所构建的区区间而言的置信区间的表表述(confidenceinterval)12/29/202236置信区间的表表述(95%的置信信区间)从均值为185的总体中中抽出n=10的20个个样本构造出出的20个置信区间我没有抓住参参数!点估计值12/29/202237使用用一一个个较较大大的的置置信信水水平平会会得得到到一一个个比比较较宽宽的的置置信信区区间间,,而而使使用用一一个个较较大大的的样样本本则则会会得得到到一一个个较较准准确确(较较窄窄)的的区区间间。。直直观观地地说说,,较较宽宽的的区区间间会会有有更更大大的的可可能能性性包包含含参参数数但实实际际应应用用中中,,过过宽宽的的区区间间往往往往没没有有实实际际意意义义比如如,,天天气气预预报报说说““在在一一年年内内会会下下一一场场雨雨””,,虽虽然然这这很很有有把把握握,,但但有有什什么么意意义义呢呢??另另一一方方面面,,要要求求过过于于准准确确(过过窄窄)的的区区间间同同样样不不一一定定有有意意义义,,因因为为过过窄窄的的区区间间虽虽然然看看上上去去很很准准确确,,但但把把握握性性就就会会降降低低,,除除非非无无限限制制增增加加样样本本量量,,而而现现实实中中样样本本量量总总是是有有限限的的区间间估估计计总总是是要要给给结结论论留留点点儿儿余余地地置信信区区间间的的表表述述(confidenceinterval)12/29/202238置信区区间与与置信信水平平的关关系均值的抽样分布(1-)%区间包含了%的区间未包含1–aa/2a/212/29/2022391.区区间间的确确定::ΔΔ区间的的中心心—统统计量量的值值,如如:区间的的半径径ΔΔ—允许((极限限)误误差。2.3区间估估计12/29/2022402.概率率的确定::ΔΔX2.3区间估计12/29/202241只要样本平均数在以总体平均数为中心、以Δ为半径的区间内,则总体平均数就会落在以样本平均数为中心、以Δ为半径的区间内。

2.概概率的确确定:2.3区间估计计12/29/202242SΔΔX2.3区间估计12/29/202243ΔΔS极限限误误差差的的标标准准化化::S2.3区间间估估计计12/29/202244标准化的的意义::Z~N(0,1

)Z

Z0-ΔΔSD+D-X

X

X()2μ

,

X

N~x2.3区间估计计12/29/202245二总体平均均数的区区间估计计:ΔΔ2.3区间估计计12/29/2022462.3区间估估计(1)(2)(3)(4)(5)内容步骤12/29/202247【例5-2】某地地区电视台台委托调查查公司估计计该地区居居民平均每每日看电视视时间。调调查公司随随机抽取了了100名居民进行行调查,样样本数据显显示平均每每人每天看看电视时间间为4小时。如果果已知总体体的标准差差σ=1.5小时。试求求该地区内内居民每天天看电视的的平均时间间的置信区区间。(置信度是是95%)2.3区间估计12/29/2022482.3区间间估估计计12/29/2022492.3区间间估估计计(1)(2)(3)(4)内容步骤12/29/202250【例例5-3】】某某地地区区电电视视台台委委托托调调查查公公司司估估计计该该地地区区居居民民平平均均每每日日看看电电视视时时间间。。调调查查公公司司随随机机抽抽取取了了100名居居民民进进行行调调查查,,样样本本数数据据显显示示平平均均每每人人每每天天看看电电视视时时间间为为4小时时。。如如果果已已知知总总体体的的标标准准差差σ=1.5小时时。。试试求求该该地地区区内内居居民民每每天天看看电电视视的的平平均均时时间间的的置置信信区区间间。。(要求估计误误差不超过27分钟)2.3区间估计12/29/2022512.3区间估计12/29/2022522.3区间估估计3.总体方方差未未知,,总体体平均均数的的估计计总体方方差未未知,,可用用样本本标准准差S代替总总体标标准差差σ,计算算抽样样平均均误差差μ。12/29/202253正态分分布与与t分布的的比较较02.3区间估估计12/29/202254【例5-4】从从某校学生生中随机抽抽取25人,调查到到他们平均均每天参加加体育锻炼炼的时间为为25分钟,标准准差为8分钟。试以以95%的置信水平平估计该校校学生平均均每天参加加体育锻炼炼的时间。。2.3区间估计12/29/2022552.3区间估计12/29/202256三总体体成数的的区间估估计成数是一一个特殊殊的平均均数,它它是交替替标志的的平均数数。可以应用用总体平平均数的的估计方方法来对对总体成成数进行行估计。。2.3区间估计计12/29/202257抽样,计算估计区间的中心(1)计算(2)根据(3)计算(4)写出:(5)2.3区间估计内容给定F(Z),总体成数P的区间估计:步骤12/29/202258【例5-5】某工厂厂要估计一一批总数5000件的产品的的废品率,,于是随机机抽出400件产品进行行检测,发发现有32件废品。在在置信度为为90%的要求下,,试给出该该批产品的的废品率的的区间估计计。2.3区间估计12/29/2022592.3区间估计12/29/2022602.3区间估计抽样,计算估计区间的中心(1)计算(2)写出:(4)计算(3)内容给定Δ,总体成数P的区间估计:步骤12/29/202261【例5-6】某某商场场经理理想了了解顾顾客对对他们们服务务的满满意度度,随随机2.3区间估估计12/29/2022622.3区间间估估计计12/29/2022632.4样本容量量的确定定样本必要要单位数数的确定定:12/29/202264样本必要要单位数数的确定定:2.4样本容量量的确定定重置不重置样本平均数样本成数12/29/2022652.4样本容量的确确定应注意的问题题1.σ2或P往往未知,要要用替代值::用历史资料代代替;用试验性调查查中方差最大大值代替;对成数,用σσ2=0.25代替。12/29/2022662.4样本容量的的确定2.对多多主题问题题,可取各各问题样本本容量的最最大值进行行调查,这这样既能满满足各方面面的需要,,还能简化化抽样工作作。3.样本本单位数是是整数,如如计算结果果为小数,,不采用““四舍五入法法”,而采用用“过剩近似法法”取整。12/29/202267【例例5-7】】某某2.4样本本容容量量的的确确定定12/29/2022682.4样本容容量的的确定定12/29/202269【例5-9】高高度度表的2.4样本容量量的确定定12/29/2022702.4样本容量量的确定定12/29/2022711.5总体方方差的的估计计计算方方差要要两步步,先先求平平均数数再求求方差差。1、2、……12/29/2022721.5总体方方差的的估计计因此,,样本本方差差的计计算公公式::P143估计12/29/202273第三三节节3.1假设设检检验验的的基基本本概概念念3.2假设设检检验验中中的的基基本本问问题题3.3总体体平平均均数数的的检检验验3.4总体体成成数数的的检检验验3.5P值检检验验假设设检检验验概概述述12/29/2022743.1假设检检验的的基本本概念念假设检检验—根据样样本数数据,,即统统计量量的取取值,,来检检验事事先对对总体体数量量特征征所作作的假假设是是否可可信的的统计计分析析方法法。总体平平均数数的检检验;;总体成成数的的检验验。12/29/202275假设检验验的思路路:设立假设设—原假假设和备备择假设设;构造统计计量,计计算其取取值;给定α,,确定临临界值;;比较,作作出对原原假设的的决策。。3.2假设检验验的基本本问题12/29/202276设立假设设:原假设—总体体没有发发生显著著性变化化,总体体参数还还是原来来的数值值;对立假设设—原假假设不成成立时,,就选择择该假设设;也就就是说,,总体发发生了显显著性变变化,总总体参数数已不是是原来的的数值。。3.2假设检验验的基本本问题12/29/202277给定α,确确定临界值值:θ^θ

θ的分布^3.2假设检验的的基本问题题12/29/202278给定定αα,,确确定定临临界界值值::2.给给出出显著著性性水水平平α—小小概概率率的的标标准准θ^θ

θ的分布^α

-13.2假设设检检验验的的基基本本问问题题12/29/202279根据临界值—接受域和拒绝域临界值接受域拒绝域拒绝域α

-13.2假设检验验的基本本问题12/29/202280计算统计量量并标准化化:θθ^02σZ-2σZZ3.2假设检验的的基本问题题12/29/202281比较、决策策:3.2假设检验的的基本问题题12/29/202282双侧检验验和单侧侧检验::1.双侧检验验:不考虑差差异的方方向。检验离差的绝绝对值是否偏大大03.2假设检验验的基本本问题12/29/2022832.单侧检验验:要考虑差差异的方方向。检验正离差是否偏大大—右单侧检检验0αZ3.2假设检验验的基本本问题12/29/2022842.单侧检验:要考虑差异方方向。检验负离差是否偏小—左单侧检验检验负离差的绝对值是否偏大00αZ3.2假设检验的基基本问题12/29/202285规定的的标准准水平平;理论计计算的的水平平;历史资资料反反映的的水平平;确定假设的总体平均数X

0

3.3总体平平均数数的检检验12/29/2022863.3总体平平均数数的检检验总体平平均数数假设设检验验的程程序:设立假假设(两两个个)计算统统计量量并标标准化化Z给定α,确确定临临界值值Zα(Zα/2)比较、、决策策12/29/202287总体体平平均均数数假假设设检检验验的的程程序序3.3总体体平平均均数数的的检检验验12/29/202288总体体平平均均数数假假设设检检验验的的程程序序3.3总体体平平均均数数的的检检验验12/29/202289总体平均均数假设设检验的的程序3.3总体平均均数的检检验12/29/202290总体平均均数假设设检验的的程序Z3.3总体平均均数的检检验12/29/202291总体平均数假假设检验的程程序Z3.3总体平均数的的检验12/29/202292总体平均数假假设检验的程程序3.3总体平均数的的检验12/29/202293【例5-9】某企业业用包装机机包装饼干干,标准重重量为500g。假设饼饼干重量服服从正态分分布,且有有长期经验验知道其标标准差为15g。某日开开工后为检检验包装机机工作是否否正常,随随机抽取9包,称得净净重分别为为:497506518524498511520515512(单位:g)试判断机器器工作是否否正常(αα=0.05)。3.3总体平均数数的检验12/29/2022943.3总体平均数数的检验12/29/202295>01.96Z3.3总体体平平均均数数的的检检验验12/29/202296【例5-9】】某企业用包包装机包装饼饼干,标准重重量为500g。假设饼饼干重量服从从正态分布,,且有长期经经验知道其标标准差为15g。某日开开工后为检验验包装机工作作是否正常,,随机抽取9包,称得净净重分别为::497506518524498511520515512(单单位:g)试试判断饼干包包装重量是否否显著超重。(α=0.05))3.3总体平均数的的检验12/29/2022973.3总体平均数的的检验12/29/202298>01.645Z3.3总体平均数的的检验12/29/202299总体平均均数检验验的五个个条件::3.3总体平均均数的检检验12/29/2022100【补充】某电池厂厂生产的的电池,,历史资资料表明明平均发发光时间间为1000小时,标标准差为为80小时,在在最近生生产的产产品中抽抽100个电池,,测得平平均发光光时间为为990小时,给给定显著著性水平平为0.05,问新生生产的电电池的发发光时间间是否有有明显的的降低??3.3总体平均均数的检检验12/29/2022101≥3.3总体平均均数的检检验12/29/2022102<

01.6453.3总体平均均数的检检验12/29/2022103t—分布3.3总体平均数数的检验12/29/2022104Z分布与t分布的比较较03.3总体平均数数的检验12/29/2022105t检验验::正态态总总体体方差差σ2未知知小样样本本(n≤30)t检验验3.3总体体平平均均数数的的检检验验12/29/2022106【例例5-11】】一一种种元元件件要要求求其其平平均均使使用用寿寿命命不不得得低低于于1000小时时,,现现从从这这批批元元件件中中随随机机抽抽取取25只,,测测得得其其平平均均使使用用寿寿命命为为950小时时,,样样本本标标准准差差为为100小时时。。假假定定这这批批元元件件总总体体服服从从正正态态分分布布,,试试在在0.05的显显著著性性水水平平下下判判定定该该批批元元件件是是否否合合格格。。3.3总体体平平均均数数的的检检验验12/29/2022107t3.3总体平均数的的检验12/29/202210801.71>3.3总体平平均数数的检检验12/29/20221093.4总体成成数的的检验验总体成成数假假设检检验的的程序序12/29/2022110总体体成成数数假假设设检检验验的的程程序序3.4总体体成成数数的的检检验验12/29/2022111总体体成成数数假假设设检检验验的的程程序序3.4总体体成成数数的的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论