统计学原理第五版_第1页
统计学原理第五版_第2页
统计学原理第五版_第3页
统计学原理第五版_第4页
统计学原理第五版_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于统计学原理第五版第1页,共72页,2022年,5月20日,19点44分,星期五教学重点与难点:重点:抽样误差的特点及计算,总体参数的区间估计法。难点:抽样平均误差的涵义与计算、区间估计的原理及过程。第2页,共72页,2022年,5月20日,19点44分,星期五教学方式与学时安排内容教学方式学时抽样推断的一般问题

讲授2H抽样误差讲授、讨论2H抽样估计讲授、讨论2H抽样的组织形式,抽样必要数目的确定讲授、讨论2H总学时----8H思考练习题抽样误差的影响因素样本容量的影响因素第3页,共72页,2022年,5月20日,19点44分,星期五§5.1抽样推断的一般问题一、抽样推断的意义概念

抽样推断法又称为抽样调查法,简称抽样法

指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会按照随机原则

从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法第4页,共72页,2022年,5月20日,19点44分,星期五特点

按随机原则抽取样本单位以部分推断总体的数量特征抽样误差可以事先计算并控制抽样法运用概率估计的方法

作用

(见第二章)

第5页,共72页,2022年,5月20日,19点44分,星期五全及总体全及总体即统计总体,所要研究的调查单位的全体,简称总体或母体;分:有限总体和无限总体。用N表示有限总体的单位数,称总体容量。样本总体样本总体或抽样总体,简称样本或子样。用n表示样本容量。

n≥30,为大样本;n<30,为小样本二、抽样估计的基本概念对同一问题,全及总体是唯一的,样本总体不唯一

第6页,共72页,2022年,5月20日,19点44分,星期五总体单位和样本单位

总体单位:组成全及总体的每一个单位或分子样本单位:抽样单位,构成样本的每一个单位或分子

又称为全及指标,用来描述全及总体特征的综合指标。总体指标只有唯一确定的值,也称为参数

总体指标a、总体平均数(又叫总体均值):第7页,共72页,2022年,5月20日,19点44分,星期五b、总体方差,总体标准差

c、总体成数

P对总体中不能用数量表示的单位品质标志,总体参数是以总体中具有某种性质的单位数占总体全部单位数的比重来反映,这种参数称为成数,用P表示,Q表示另一部分成数。

设总体容量N,具有某种性质,不具有某种性质

第8页,共72页,2022年,5月20日,19点44分,星期五具有某种性质的单位数所占的成数不具有某种性质的单位数所占的成数若品质标志表现为“是”、“非”两种,称是非标志,用1表示“是”,用0表示“非”,则是非标志可看成(0,1)分布,P是(0,1)分布的平均数。第9页,共72页,2022年,5月20日,19点44分,星期五分组单位数变量值具有某一性质不具有某一性质N1N210合计—均值第10页,共72页,2022年,5月20日,19点44分,星期五标准差方差当P=1/2时,达最大值

第11页,共72页,2022年,5月20日,19点44分,星期五a、样本平均数(又叫样本均值):用来描述样本特征的综合指标,也叫统计量,又被称为估计量或统计量样本指标样本指标是随机变量,不同样本有不同的样本指标

第12页,共72页,2022年,5月20日,19点44分,星期五b、样本方差、标准差:c、样本成数:第13页,共72页,2022年,5月20日,19点44分,星期五重复抽样又被称作重置抽样、有放回抽样抽出个体登记特征放回总体继续抽取特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行第14页,共72页,2022年,5月20日,19点44分,星期五不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行是最为常用的抽样方法。第15页,共72页,2022年,5月20日,19点44分,星期五样本的可能数目在考虑顺序的抽样条件下,从总体N中随机抽取n个样本单位共有多少种可能的抽选结果⒈重复抽样的可能样本数目:⒉不重复抽样的可能样本数目:共n个第16页,共72页,2022年,5月20日,19点44分,星期五在不考虑顺序的抽样条件下:⒈重复抽样的可能样本数目:⒉不重复抽样的可能样本数目:第17页,共72页,2022年,5月20日,19点44分,星期五抽样单元抽样框将总体划分成互不重叠又穷尽的有限多个部分,每个部分称为抽样单元。抽样单元有若干个体组成,当然也可以只包含一个个体。又叫抽样结构,一份包含所有抽样单元的名单或清册。在抽样框中,每个抽样单元被编上一个号码。抽样框可以多种形式:除名单或清册外,还可以是一张地图或其他适当的形式

第18页,共72页,2022年,5月20日,19点44分,星期五一、抽样误差的概念§5.2抽样误差调查结果与总体真实值之差。抽样调查方式所产生的调查误差调查误差:抽样调查误差:抽样调查误差=登记性误差+系统性误差+用部分推断总体而引起的误差,可控制,不可避免。抽样误差第19页,共72页,2022年,5月20日,19点44分,星期五二、抽样误差的实质1、抽样实际误差

一个总体有多个样本,每一个样本与总体之间有一个离差,叫抽样实际误差。例5.1,设有4个工人,其每周工资分别为70,90,130,150元,从4人中随机抽取2人构成样本:

可能产生的样本如下:第20页,共72页,2022年,5月20日,19点44分,星期五重复抽样

样本变量样本平均平均数离差123456789101112131415167070709070130701509070909090130901501307013090130130130150150701509015013015015070801001108090110120100110130140110120140150-40-30-100-30-20010-10020300103040合计—17600样本平均数的平均数等于总体平均数

抽样实际误差第21页,共72页,2022年,5月20日,19点44分,星期五不重复抽样

样本变量样本平均平均数离差1234567891011127090701307015090709013090150130701309013015015070150901501308010011080110120100110140110120140-30-100-30010-1003001030合计—1320

0抽样实际误差第22页,共72页,2022年,5月20日,19点44分,星期五2、抽样误差不是某个抽样实际误差,而是所有可能的

抽样实际误差的平均值,称抽样平均误差或平均抽样误差。3、抽样平均误差是反映抽样误差一般水平的指标,用

μ表示。简称为抽样误差。

用抽样平均数(或成数)的标准差来表示

令:M为全部样本数,总体平均数,

P总体成数。第23页,共72页,2022年,5月20日,19点44分,星期五抽样成数的平均误差:

抽样平均数的平均误差:

第24页,共72页,2022年,5月20日,19点44分,星期五1、抽样平均数的抽样误差(平均数指标抽样误差)

重复抽样:不重复抽样:三、抽样误差的计算当总体很大,n很小,可代替不重复抽样当N远远大于n时

第25页,共72页,2022年,5月20日,19点44分,星期五➠总体方差

(总体方差不知,用样本方差如果n很大,也可以用)

代替,分析:

*是总体的差异程度,反映总体特征,其大小与样本大小无关;

*

不重复抽样误差小于重复抽样误差;

受样本大小影响,n越大,越小,*第26页,共72页,2022年,5月20日,19点44分,星期五重复抽样

样本变量样本平均平均数离差123456789101112131415167070709070130701509070909090130901501307013090130130130150150701509015013015015070801001108090110120100110130140110120140150-40-30-100-30-20010-10020300103040合计—17600

离差平方1600900100090040001001000400900010090016008000第27页,共72页,2022年,5月20日,19点44分,星期五第28页,共72页,2022年,5月20日,19点44分,星期五不重复抽样

样本变量样本平均平均数离差1234567891011127090701307015090709013090150130701309013015015070150901501308010011080110120100110140110120140-30-100-30010-1003001030合计—1320

0离差平方90010009000100100090001009004000第29页,共72页,2022年,5月20日,19点44分,星期五第30页,共72页,2022年,5月20日,19点44分,星期五2、抽样成数的抽样误差(成数指标抽样误差)

重复抽样:不重复抽样:P:总体成数,可用样本成数代替第31页,共72页,2022年,5月20日,19点44分,星期五例5.2

要估计某地区100000名适龄儿童的入学率,随机从这一地区抽取500名儿童,检查有400

名儿童入学,求抽样误差。或:第32页,共72页,2022年,5月20日,19点44分,星期五例5.3:对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行复测耐用时间(小时)全面检测(件)抽样复测(件)3000以下3000-40004000-50005000以上506009903602305018合计2000100根据规定耐用时间在3000小时以下为不合格品,根据以上资料,计算该电子元件平均耐用时间及合格率的抽样平均误差第33页,共72页,2022年,5月20日,19点44分,星期五平均耐用时间的抽样平均误差第34页,共72页,2022年,5月20日,19点44分,星期五合格率的抽样平均误差第35页,共72页,2022年,5月20日,19点44分,星期五四、影响抽样误差的因素总体各单位的差异程度(即标准差的大小):

越大,抽样误差越大;抽样组织方式:对相同的n,类型抽样和等距抽样小于简单随机抽样,单个抽样小于整群抽样。抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;样本容量:

越大,抽样误差越小;第36页,共72页,2022年,5月20日,19点44分,星期五在进行抽样估计时,根据总体标志变异程度和抽样调查的任务要求确定一个可允许的误差范围,也称作允许误差、误差范围等。五、抽样极限误差设:

——抽样平均数极限误差

——抽样成数极限误差

第37页,共72页,2022年,5月20日,19点44分,星期五或:

第38页,共72页,2022年,5月20日,19点44分,星期五F(t)六、抽样误差的概率度

通常以抽样误差μ为尺度来度量抽样极限误差Δ的大小,它们的数量关系为:

1、t表示误差范围的倍数,称为概率度。

2、调查结果落在一定平均误差范围的概率,称为

把握程度、概率保证程度或置信度。

第39页,共72页,2022年,5月20日,19点44分,星期五3、根据大数定律的正态分布定理,抽样误差范围的大小和概率的关系是:

t值

概率保证程度F(t)

1.000.6827(68.27%)

1.650.9000(90%)

1.960.9500(95%)

2.000.9545(95.45)

2.580.9900(99%)

3.000.9973(99.73%)抽样极限误差与把握程度的大小成正比,但和准确性的要求成反比。

第40页,共72页,2022年,5月20日,19点44分,星期五例5.4,

调查某县的水稻产量,从150个村中抽30个村,若μ=5公斤,若要求调查结果的把握程度在95.45%,则:

若公斤,则:公斤t=2即有95.45%的把握:第41页,共72页,2022年,5月20日,19点44分,星期五§5.3抽样估计1、指直接以样本指标估计总体指标,估计一个确定的值。简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况一、点估计第42页,共72页,2022年,5月20日,19点44分,星期五2、抽样估计量的优良标准设为待估计的总体参数,为样本统计量,则的优良标准为:若,则称为的无偏估计量指样本指标的均值应等于被估计的总体指标无偏性第43页,共72页,2022年,5月20日,19点44分,星期五若,则称为比更有效的估计量作为优良的估计量,除了满足无偏性的要求外,其方差应比较小有效性指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值一致性第44页,共72页,2022年,5月20日,19点44分,星期五

为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量。数理统计证明:第45页,共72页,2022年,5月20日,19点44分,星期五二、区间估计1、在一定误差范围内,估计出一个可能区间2、参数区间估计三要素

①估计值(统计量的值、样本指标值)

②抽样误差

③概率度(置信度)

第46页,共72页,2022年,5月20日,19点44分,星期五例5.5,某灯具厂生产日光灯管100000只,从中随机抽取500只测定其寿命,分组资料如下:按日光灯耐用时间分组(小时)组中值x日光灯只数f850以下850~950950~10501050~11501150~12501250以上8009001000110012001300501001501107020合计—500试根据上述资料,以95.45%的把握程度估计这100000只灯管的平均耐用时间。第47页,共72页,2022年,5月20日,19点44分,星期五解:或:

第48页,共72页,2022年,5月20日,19点44分,星期五区间估计:有95.45%的把握,总体平均数落在估计区间内。置信度为95.45%的置信区间。第49页,共72页,2022年,5月20日,19点44分,星期五例5.6,若灯管寿命低于850小时以下为不合格品,假设用不重复抽样抽取样本,试以68.27%的把握程度,对这批灯管的不合格品率作区间估计。

解:第50页,共72页,2022年,5月20日,19点44分,星期五区间估计:置信度为68.27%的置信区间。第51页,共72页,2022年,5月20日,19点44分,星期五调查对象的性质特点对调查对象的了解程度(抽样框的特点)抽样误差的大小人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方式主要应考虑:§5.4抽样调查的组织方式第52页,共72页,2022年,5月20日,19点44分,星期五一、简单随机抽样——按随机原则直接从总体中抽出若干单位构成样本。是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式又称完全随机抽样或纯随机抽样,适用于均匀总体。

*直接抽选法*抽签法*随机数码表法第53页,共72页,2022年,5月20日,19点44分,星期五二、类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中按水剂随机原则分别抽取样本单位组成样本。——是一种限制随机性抽样方式,适用于情况复杂、各单位之间差异较大、单位数量较多的情况。优越性

*提高样本代表性,提高样本指标对总体指标估计的准确性。*分层抽样不仅可以得到总体指标的估计值,而且可以得到各层子总体指标的估计值。第54页,共72页,2022年,5月20日,19点44分,星期五总体N样本n等额抽取等比例抽取最优抽取······抽取方式

等比例分层抽样:各组应抽取的样本单位数的计算公式为:

第55页,共72页,2022年,5月20日,19点44分,星期五抽样误差的计算

先求出各层的方差(或)

总体方差(或

为各层单位数,第56页,共72页,2022年,5月20日,19点44分,星期五分层抽样的抽样平均误差与组间方差无关,取决于组内方差的平均水平。注意

应扩大组间方差,缩小组内方差∵总方差=组内方差+组间方差∴分层抽样误差小于简单抽样误差第57页,共72页,2022年,5月20日,19点44分,星期五三、等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的顺序和间隔抽取样本单位。······随机起点(总体单位按某一标志排序)无关标志排队等距抽样抽样距离:起点

第58页,共72页,2022年,5月20日,19点44分,星期五······有关标志排队等距抽样中点等距法对称等距法

第59页,共72页,2022年,5月20日,19点44分,星期五抽样误差的计算

先求出各距离的方差总体方差

或第60页,共72页,2022年,5月20日,19点44分,星期五四、整群抽样(集体抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,对被抽中群体的所有单位进行全面调查。群的抽取方法可按前面三种方法。

简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差。当群内差异大、群间差异小,代表性较好

群的划分

自然划分:家庭,学校,村庄。人为划分:一打帽子,一箱钉子。群内单位数可相同,可不同。

第61页,共72页,2022年,5月20日,19点44分,星期五抽样误差的计算

N分为R群,每群M个单位,N=RM,随机抽取r群。

表示群平均数,表示群的方差注整群抽样取决于群间方差,与群内方差无关。

第62页,共72页,2022年,5月20日,19点44分,星期五五、多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程。例:在某省100多万农户抽取1000户调查农户生产性投资情况。

第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡

第三阶段:从被抽中的20个乡中各抽5个村

第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)第63页,共72页,2022

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论