抽样估计一般问题1_第1页
抽样估计一般问题1_第2页
抽样估计一般问题1_第3页
抽样估计一般问题1_第4页
抽样估计一般问题1_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、教学目的:通过对本章的学习,了解教学目的:通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计抽样估计的基本原理,掌握抽样估计的基本方法。的基本方法。教学设计:对主要的知识点进行讲解,通过在线教学设计:对主要的知识点进行讲解,通过在线学习平台的学习平台的“教学辅导教学辅导”与与“参考资料参考资料”栏目获栏目获取相关知识,从而对重要的知识点有进一步的认取相关知识,从而对重要的知识点有进一步的认识,在此基础上通过练习来加深对相关问题的理识,在此基础上通过练习来加深对相关问题的理解,同时通过网上实时与非实时的答疑解决疑难解,同时通过网上实时与非实时的答疑解决疑难问题。问题。本章导学:登陆省电大网站

2、本章导学:登陆省电大网站 在线学习平台在线学习平台 http:/ 教学辅导(三)教学辅导(三) IPIP课件第十讲课件第十讲 参考资料参考资料 中华人民共和国国家统计局中华人民共和国国家统计局 http:/ 中国人口信息网(中国人口信息网(1 1人口抽样调查)人口抽样调查) http:/ 抽样推断的一般问题抽样推断的一般问题第二节第二节 抽样误差抽样误差第三节第三节 抽样估计的方法抽样估计的方法第四节第四节 抽样组织设计抽样组织设计统计调查方法统计调查方法 全面调查全面调查非非全面调查全面调查 普普 查查 抽样调查抽样调查 重点调查重点调查 典型调查典型调查相关知识回顾:相关知识回顾: 统计报

3、表统计报表 抽样调查抽样调查: :按照按照随机原则随机原则,从总体中抽取一部,从总体中抽取一部分样本单位,根据对样本单位的调查结果来推分样本单位,根据对样本单位的调查结果来推断总体的数量特征。断总体的数量特征。 一、抽样推断的意义一、抽样推断的意义 1 1、概念:、概念: 抽样推断是在抽样调查的基础上,利用样抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。相应数量特征的一种统计分析方法。 第一节第一节 抽样推断的一般问题抽样推断的一般问题推断推断 2 2、特点、特点(1 1)由部分推算整体的一种

4、方法;)由部分推算整体的一种方法;(2 2)抽样推断建立在随机抽样的基础上;)抽样推断建立在随机抽样的基础上;(3 3)抽样推断是运用概率估计的方法;)抽样推断是运用概率估计的方法;(4 4)抽样推断的误差可以计算并加以控制。)抽样推断的误差可以计算并加以控制。推断推断二、抽样推断的内容二、抽样推断的内容(一)参数估计(一)参数估计 用样本的观察资料来估计所研究现象总体的用样本的观察资料来估计所研究现象总体的水平、结构、规模等数量特征,这种推断方法称水平、结构、规模等数量特征,这种推断方法称为参数估计。为参数估计。(二)假设检验(二)假设检验 对总体的状况作出某种假设,然后根据样本对总体的状况

5、作出某种假设,然后根据样本所提供的信息来判断总体未知参数事先所作的假所提供的信息来判断总体未知参数事先所作的假设是否成立的统计分析方法称为假设检验。设是否成立的统计分析方法称为假设检验。三三、抽样的几个基本概念、抽样的几个基本概念 1 1、总体、总体 也称全及总体,指所要认识的研究对象全也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,由具有某种共同性质许多单位组成的集合体,一般用体,一般用N N表示。表示。 无限总体、有限总体无限总体、有限总体 2 2、样本、样本 又称子样,是从全及总体中随机抽取出来,又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部

6、分单位组成的集合体,作为代表这一总体的那部分单位组成的集合体,一般用一般用n n表示。表示。 3 3、随机抽样、随机抽样 按随机原则从总体中抽取样本单位。按随机原则从总体中抽取样本单位。 4 4、非随机抽样、非随机抽样 根据市场调查者的主观分析判断来选取样本根据市场调查者的主观分析判断来选取样本单位。包括偶遇抽样、主观抽样、定额抽样。单位。包括偶遇抽样、主观抽样、定额抽样。5 5、参数、参数 根据总体各单位的标志值或标志特征计算根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及的,反映总体数量特征的综合指标,称为全及指标,由总体各单位的标志值或标志特征所决指标,由总体

7、各单位的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,称定,全及指标的指标值是确定的,唯一的,称为参数。为参数。2 和和总总体体方方差差体体均均值值,常常用用的的总总体体参参数数有有总总对对于于总总体体中中的的数数量量标标志志X FXFNXX FFXXNXX222 对于总体中的品质标志:对于总体中的品质标志: 由于不能用数量来表示,总体参数通常用成数由于不能用数量来表示,总体参数通常用成数P P表示。表示。成数:总体中具有某种性质的单位数在总体全部单位数成数:总体中具有某种性质的单位数在总体全部单位数中的比重,用中的比重,用P P表示。总体中不具有某种性质的单位数在表示。总体中不具

8、有某种性质的单位数在总体中所占的比重,用总体中所占的比重,用Q Q表示表示。有有P+Q=1 P+Q=1 X:X:表示总体变量,有表示总体变量,有N N个单位,所以可以表示为个单位,所以可以表示为nXXX,21道道性性质质的的单单位位数数,可可以以知知表表示示总总体体中中不不具具有有某某种种质质的的单单位位数数,表表示示总总体体中中具具有有某某种种性性表表示示总总体体单单位位数数,用用01NNNNNN 01PNN / 当某种标志,它的标志表现只有是非两种,可当某种标志,它的标志表现只有是非两种,可 以用以用“1”1”表示标志表现为表示标志表现为“是是”的标志的标的标志的标志表现,志表现,“0”0

9、”表示标志表现为表示标志表现为“非非”的标志的标志的标志表现,在此情况下的标志表现,在此情况下: : PNNNNNXP 10101 PQQPPQPQQPNNQNPNNPNPP 2212021202210 PQNN 1/ 6 6、统计量、统计量 根据样本各单位标志值或标志属性计算的综根据样本各单位标志值或标志属性计算的综合指标称为统计量。样本统计量是用来估计总合指标称为统计量。样本统计量是用来估计总体参数的。反映样本的数量特征。体参数的。反映样本的数量特征。 fxfnxx222()()xxxxff n npxp 2ppq 参数参数统计量统计量例题:某批产品共例题:某批产品共500500件,合格品

10、件,合格品480480件,件,不合格品不合格品2020件,要求计算成数合格品率、件,要求计算成数合格品率、PXP %96500480 P%96 PX196. 0%4%96 PQP 7 7、样本容量、样本容量 指一个样本所包含的单位数。指一个样本所包含的单位数。8 8、样本个数、样本个数 又称样本可能数目,是指从一个总体中可能又称样本可能数目,是指从一个总体中可能抽取的样本个数。抽取的样本个数。9 9、重复抽样、重复抽样 从总体从总体N N个单位中随机抽取样本容量为个单位中随机抽取样本容量为n n的样的样本,每次从总体中抽取一个,连续进行本,每次从总体中抽取一个,连续进行n n次实验次实验构成抽

11、样样本。每次抽出一个单位把结果登记构成抽样样本。每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。共可抽下来又放回,重新参加下一次的抽选。共可抽取容量为取容量为n n的样本的样本 个。个。nN1010、不重复抽样、不重复抽样 从总体从总体N N个单位中随机抽取容量为个单位中随机抽取容量为n n的样本,的样本,每次从总体中抽取一个,连续进行每次从总体中抽取一个,连续进行n n次实验构次实验构成抽样样本。但每次抽选出的单位就不再放回成抽样样本。但每次抽选出的单位就不再放回参加下一次抽选。共可抽取容量为参加下一次抽选。共可抽取容量为n n的样本的样本N(N-1)(N-2).(N-n+1)N

12、(N-1)(N-2).(N-n+1)个。个。 结论:总体单位数一致,在相同样本容量的情结论:总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的况下,重复抽样的样本个数大于不重复抽样的样本个数。样本个数。 一、抽样误差的概念一、抽样误差的概念概念:概念: 指由于随机抽样的偶然因素使样本各单指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素:影响抽样误差大小的因素:(1 1)总体各单位标志值的差异程度;)总体各单位标志

13、值的差异程度;(2 2)样本单位数;)样本单位数;(3 3)抽样方法;)抽样方法;(4 4)抽样组织形式。)抽样组织形式。二、抽样平均误差二、抽样平均误差( (抽样指标的标准差抽样指标的标准差) ) 反映抽样误差一般水平的指标。是所有可能反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差。出现的样本指标和总体指标的平均离差。1 1、抽样平均数的平均误差,也可称为、抽样平均数的平均误差,也可称为抽样平均抽样平均数的标准差数的标准差( (表明各样本均值与总体均值离差表明各样本均值与总体均值离差的一般水平)的一般水平)(1 1)重复抽样情况下)重复抽样情况下 )(计计算算公公式

14、式n nx x :样本单位数:样本单位数总体标准差总体标准差n: 例:设有三个数例:设有三个数8 8、1010、1212,这一总体的均值、标,这一总体的均值、标准差分别为:准差分别为:10312108 X1.6331.6333 32 210)10)(12(122 210)10)(10(102 210)10)(8(8N N2 2x xx x用重复抽样的方法,从用重复抽样的方法,从8 8、1010、1212三个数中抽两个三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的数构成样本,求样本的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表一般水平,所有可能的样本以及样本的

15、平均值列表如下:如下:10990)( MxxE样样本本平平均均数数的的平平均均数数抽样平均数的标准差:抽样平均数的标准差: 1 1. .1 15 55 5x x9122nxEx现在按重复抽样误差公式计算抽样平均误差现在按重复抽样误差公式计算抽样平均误差1 1. .1 15 55 51 1. .6 63 33 32 2 nx 几个基本关系:几个基本关系: a.a.样本平均数的平均数等于总体平均数;样本平均数的平均数等于总体平均数; b. b.抽样平均误差实质上就是抽样平均数的标准抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;差,也称为抽样标准误差;c.c.抽样平均数的标准差(抽样

16、平均误差)比总体标抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的准差小很多,仅为总体标准差的 。 d.d.可以通过调整样本单位数可以通过调整样本单位数n n来控制抽样平均误差来控制抽样平均误差。(2)(2)在不重复抽样的情况下在不重复抽样的情况下 12NnNnx 1)1(2NNNNnnx很大时当10660)( MxxE样样本本平平均均数数的的平平均均数数 816.6420 0 x xnxEx按不重复抽样误差公式计算抽样平均误差按不重复抽样误差公式计算抽样平均误差816. 0)1323(22633. 112 NnNnx )( (差差重重复复抽抽样样的的抽抽样样平平均均误误

17、nNnNn 12代替代替标准差标准差经常是未知的,用样本经常是未知的,用样本在计算中,总体标准差在计算中,总体标准差s s 12 nxxs )(2nxxs 某工厂有某工厂有15001500个工人,用简单随机重复抽样个工人,用简单随机重复抽样的方法抽取的方法抽取5050个工人作为样本,调查其工资水平,个工人作为样本,调查其工资水平,资料如下:资料如下:计算样本平均数和抽样平均误差。计算样本平均数和抽样平均误差。5 56 60 0( (元元)5 50 03 36 66 60 06 65 53 34 44 45 52 24 4 fxfx 3 32 2. .4 45 5(元元)5 50 03 34 4

18、5 56 60 0) )( (5 52 24 42 2 2)560660(2ffxx )4 4. .5 59 9( (5 50 03 32 2. .4 45 5元元 nx 2 2、抽样成数的平均误差(表明各样本成数与总、抽样成数的平均误差(表明各样本成数与总体成数绝对离差的一般水平)体成数绝对离差的一般水平)(1)(1)在重复抽样下在重复抽样下n nP P) )P P( (1 1P P )(2nx P P:总体成数:总体成数n:n:样本单位数样本单位数(2)(2)在不重复抽样下在不重复抽样下1 1) )- -( (N N n nn n) )- -P P) )( (N NP P( (1 1P P

19、 ) ) )N Nn n( (1 1n np p) )p p( (1 1p p( ( 在实际计算中,用样本成数在实际计算中,用样本成数p p代替总体成数代替总体成数P Pnnp1 从从20002000件产品中抽查件产品中抽查200200件,其中合格品件,其中合格品190190件,件,要求:计算样本合格率及其抽样平均误差。要求:计算样本合格率及其抽样平均误差。 解:在重复抽样下:解:在重复抽样下:95. 0200/190 p0 0. .0 01 15 54 42 20 00 00 0. .0 05 50 0. .9 95 5n np p) )p p( (1 1 p 在不重复抽样下:在不重复抽样下

20、:0 0. .0 01 14 46 6) )N Nn n( (1 1n np p) )p p( (1 1p p 某电子产品使用寿命在某电子产品使用寿命在30003000小时以下为不合格小时以下为不合格品。现在用简单随机抽样方法从品。现在用简单随机抽样方法从50005000个产品中抽取个产品中抽取100100个对其使用寿命进行调查,结果如下表所示个对其使用寿命进行调查,结果如下表所示要求:要求:(1)按重复抽样和不重复抽样计算该产品平均)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差;寿命的抽样平均误差;(2)按重复抽样和不重复抽样计算该产品合格)按重复抽样和不重复抽样计算该产品合格率的

21、抽样平均误差。率的抽样平均误差。解:根据资料可算出解:根据资料可算出)(4340100434000小小时时样样本本均均值值 fxfx)(03.7311001843405500243402500222小时样本标准差ffxx%9810098 p样样本本合合格格品品率率)(.小小时时样样平平均均误误差差重重复复抽抽样样下下平平均均寿寿命命抽)(37.725000100110003.731122小小时时抽抽样样平平均均误误差差不不重重复复抽抽样样下下平平均均寿寿命命 Nnnx 014. 01000196. 010002. 098. 01 nppp 平平均均误误差差重重复复抽抽

22、样样下下合合格格率率抽抽样样 01386. 098. 01000196. 05000100110002. 098. 011 样样平平均均误误差差不不重重复复抽抽样样下下合合格格率率抽抽Nnnppp 三、抽样极限误差三、抽样极限误差 指变动的抽样指标与确定的总体指标之间指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。离差的可能范围,统计上称为抽样极限误差。设设误误差差抽抽样样平平均均数数的的抽抽样样极极限限:x 差差抽抽样样成成数数的的抽抽样样极极限限误误:p Xxx PpP pppPp xxxXx .,),()称称为为置置信信区区间间或或(ppxxppxx 四、抽样

23、误差的概率度四、抽样误差的概率度 xt x xppt 抽抽样样误误差差的的概概率率度度。就就称称为为,得得到到数数值值除除以以或或者者用用除除以以用用ttppxx)( xxt ppt 对某市居民进行生活水平调查,现随机抽取对某市居民进行生活水平调查,现随机抽取100100户,结户,结果户月均收入为果户月均收入为482482元,标准差为元,标准差为5050元,要求该市居民户月元,要求该市居民户月均收入在均收入在472472492492元的范围内,试求抽样极限误差和抽样元的范围内,试求抽样极限误差和抽样概率度。概率度。10482, xxxxxXx解解:根根据据2510510050 xxxtn 又又

24、 第三节第三节 抽样估计的方法抽样估计的方法 一、总体参数的点估计一、总体参数的点估计 根据总体指标的结构形式设计样本指标作为总体参数根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值,即直接以样本平均数、成数推断总体的平均数的估计值,即直接以样本平均数、成数推断总体的平均数和成数。和成数。的的估估计计量量表表示示总总体体成成数数的的估估计计量量,表表示示总总体体平平均均数数设设PPXXPpXx 优良估计的标准:优良估计的标准: 1 1、无偏性:以抽样指标估计总体指标要求抽样指、无偏性:以抽

25、样指标估计总体指标要求抽样指 标值的平均数等于被估计的总体指标值本身。标值的平均数等于被估计的总体指标值本身。 )1(,(npppnx 2 2、一致性:以抽样指标估计总体指标要求当样、一致性:以抽样指标估计总体指标要求当样本容量增大时,抽样指标也充分地靠近总体指标。本容量增大时,抽样指标也充分地靠近总体指标。3 3、有效性:以抽样指标值估计总体指标要求作为、有效性:以抽样指标值估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。优良估计量的方差应该比其他估计量的方差小。二、抽样估计的精度二、抽样估计的精度 估计精度估计精度1 1误差率误差率 xXxx 误误差差率率 KPPPXxP 2

26、1x x三、抽样估计的置信度三、抽样估计的置信度 表明抽样指标和总体指标的误差不超过一定范表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。围的概率保证程度。) )x x( () )f ff f( ( 1 16 61 11 16 62 21 16 61 11 16 62 216164 41 16 62 21 16 61 11 16 62 21 16 61 1根据以上分布写出平均工资落在各种区间范围内的概率根据以上分布写出平均工资落在各种区间范围内的概率P P: 2116216416212001000 xP 851611621641621611300900 xP 871621611621

27、641621611621400800 xP)100100( Xx)200200( Xx)300300( X84)100( XxP87)300( XxP 已经证明,当样本单位数大于或等于已经证明,当样本单位数大于或等于3030的条的条件下,抽样平均数的分布接近与正态分布。件下,抽样平均数的分布接近与正态分布。85)200( XxP 该分布的特点是:该分布的特点是:(1 1)抽样平均数以总体平均数为中心,它大于或小)抽样平均数以总体平均数为中心,它大于或小于总体平均数的概率分布完全呈对称分布;抽样平于总体平均数的概率分布完全呈对称分布;抽样平均数的正误差和负误差的可能性完全相等。均数的正误差和负误

28、差的可能性完全相等。(2 2)抽样平均数越接近总体平均数,其出现的概率)抽样平均数越接近总体平均数,其出现的概率越大;越远离总体平均数,其出现的概率越小。越大;越远离总体平均数,其出现的概率越小。%73.993%45.95227.68 ) )- -P(P() )- -P(P(% %) )P(P( XxXxXx 概率度与概率保证程度之间是函数关系,概概率度与概率保证程度之间是函数关系,概率保证程度是概率度的函数,即:率保证程度是概率度的函数,即:F F( (t t) ) )P P( ( xtXx )1,( ttx )2,( ttx )3,( ttx 9 99 9. .7 73 3% %F F(

29、(t t) ), ,3 3t t9 95 5. .4 45 5% %F F( (t t) ), ,2 2t t9 95 5F F( (t t) )1 1. .9 96 6t t6 68 8. .2 27 7% %F F( (t t) ), ,1 1t t 时时时时时时时时, t与与F(t)之间的关系可以查正态分布概率表,之间的关系可以查正态分布概率表,附录三附录三四、总体参数的区间估计四、总体参数的区间估计 对于总体的被估计值(总体参数)对于总体的被估计值(总体参数)X X,找出两个,找出两个数值数值 使被估计指标使被估计指标X X落在区间落在区间 内的概率内的概率 为已知的。(用一个具有一为

30、已知的。(用一个具有一定可靠程度的区间范围来估计总体参数)定可靠程度的区间范围来估计总体参数))2 21 1, ,x x( (x x)10(1 置信上限置信上限置信下限;置信下限;:21xx 为置信区间为置信区间21, xx为置信水平为置信水平为置信度,为置信度, 1)(21xx 21xx 和和 区间估计的两种方法区间估计的两种方法:1 1、根据已知的抽样误差范围(抽样极限误差)求、根据已知的抽样误差范围(抽样极限误差)求概率保证程度(置信度)。概率保证程度(置信度)。 用用时时数数。估估计计该该批批灯灯泡泡的的平平均均耐耐,试试允允许许误误差差范范围围下下表表,要要求求耐耐用用时时间间的的个

31、个灯灯泡泡的的耐耐用用时时间间见见个个进进行行检检验验,这这随随机机抽抽取取检检查查中中,万万个个灯灯泡泡,在在进进行行质质量量某某灯灯泡泡厂厂某某月月生生产产7 7. .4 40 04 45 50 00 05 50 00 05 50 00 0 x x 并给出相应的概率保证程度并给出相应的概率保证程度 2 2. .4 46 68 8n nx x5 55 5. .1 19 95 50 00 0f f9 92 26 6. .4 45 50 00 08 81 10 07 75 51 12 27 78 87 75 53 35 58 82 25 5f fx xf fx x 50019.5585 .926

32、1075354 .926825222fxx(1 1)样本平均数及抽样平均误差)样本平均数及抽样平均误差( (小小时时)( (小小时时)( (2 2) )9 93 33 3. .8 87 7. .4 40 04 49 92 26 6. .4 49 91 19 97 7. .4 40 04 49 92 26 6. .4 4上上限限下下限限 xxxx3 32 2. .4 46 68 87 7. .4 40 04 4t tx x x x t t( (3 3) ) %73.99)( tF以以99.7399.73的可靠程度推断这批灯泡的耐用时间在(的可靠程度推断这批灯泡的耐用时间在(919919小时,小时

33、,933.8933.8小时)的范围内。小时)的范围内。 若已知样本灯泡的合格率为若已知样本灯泡的合格率为9595,要求合格率的误,要求合格率的误差范围不超过差范围不超过0.970.97,估计该批灯泡的合格率,并给出,估计该批灯泡的合格率,并给出相应的概率保证程度。相应的概率保证程度。 0 0. .0 00 09 97 75 50 00 00 0. .0 04 47 75 5n np p) )p p( (1 1p p )抽抽样样平平均均误误差差( 1(2) 求求总总体体合合格格率率的的上上下下限限下下限限:p p 9 95 5% %0 0. .9 97 7% %9 94 4. .0 03 3p

34、p上上限限:p p 9 95 5% %0 0. .9 97 7% %9 95 5. .9 97 7p 1 10 0. .0 00 09 97 70 0. .9 97 7% %t tp pp pt t( (3 3) ) 2 2、给出置信度,求抽样极限误差的可能范围、给出置信度,求抽样极限误差的可能范围 以以68.2768.27的概率保证程度估计该批灯泡的合格的概率保证程度估计该批灯泡的合格率在(率在(94.03%94.03%,95.97%95.97%)范围内。)范围内。%27.68)( tF 某城市某街道所管辖的某城市某街道所管辖的1000010000户居民中,用户居民中,用单纯随机重复抽样方法

35、抽取单纯随机重复抽样方法抽取200200户,对某种商品户,对某种商品的平均需求量和需求倾向进行调查,调查结的平均需求量和需求倾向进行调查,调查结果表明,每户居民对该商品的月平均需求量为果表明,每户居民对该商品的月平均需求量为500500克,标准差为克,标准差为100100克,表示一年内不选择其克,表示一年内不选择其他替代商品,继续消费该商品的居民户为他替代商品,继续消费该商品的居民户为9090,试对总体平均数,总体成数进行区间估计。试对总体平均数,总体成数进行区间估计。(1 1)当置信度)当置信度8585时时1.441.44t t 90%90%p p 100100 500500 x x 200

36、200n n 克克)克克)(224.101 . 744. 1( 1 . 7200100 xxxtn 为为克,这种估计的置信度克,这种估计的置信度平均需求量为平均需求量为户居民对该商品的月户户居民对该商品的月户即该街道即该街道852 .5108 .489100002 .5108 .489224.10500224.10500 XXxX0 0. .0 02 28 88 80 0. .0 02 21 1. .4 44 4p pt t. .p p0 0. .0 02 22 20 00 00 0. .1 10 0. .9 9n np p) )p p( (1 1p p 0 0. .9 93 3P P0 0.

37、 .8 87 70 0. .0 02 28 88 80 0. .9 9P P0 0. .0 02 28 88 80 0. .9 9p pp pP Pp pp p 该街道该街道1000010000户居民表示继续消费该商品的居民户居民表示继续消费该商品的居民户占户占87879393,估计的置信度为,估计的置信度为(2)(2)当置信度当置信度9595时时,1.961.96t t 90%90%p p 100100 500500 x x 200200n n 克克)(9 .131 . 796. 1 xxt 9 .5131 .4869 .135009 .13500 XXxXxxx 该街道该街道1000010

38、000户居民对该商品需求量为户居民对该商品需求量为486.1486.1513.9513.9克,置信度为克,置信度为9392. 08608. 00392. 09 . 00392. 09 . 00392. 002. 096. 1 PPpPptpppp 总体参数的区间估计的三要素是:估计值、总体参数的区间估计的三要素是:估计值、抽样误差范围、概率保证程度。抽样误差范围、概率保证程度。该街道该街道1000010000户居民表示继续消费该商品的居户居民表示继续消费该商品的居民户占民户占93.9,置信度为,置信度为9595. 例例1 1:某工厂生产一种新型灯泡:某工厂生产一种新型灯

39、泡50005000只,随机只,随机抽取抽取100100只作耐用时间实验,测试结果平均寿只作耐用时间实验,测试结果平均寿命为命为45004500小时,标准差为小时,标准差为300300小时,试在小时,试在95.4595.45概率保证下,估计该新式灯泡平均寿命区概率保证下,估计该新式灯泡平均寿命区间。间。45604440 6030230100300 XxxXxxtxns即即解解:x xx x2 2t t 3 30 00 0 5 50 00 0 x x 1 10 00 0n n 例例2 2:某乡有:某乡有50005000农户,按随机原则重复抽取农户,按随机原则重复抽取100100户调查,得平均每户年

40、纯收入户调查,得平均每户年纯收入1200012000元,标元,标准差准差20002000元,要求元,要求:(1):(1)以以9595的概率估计全乡的概率估计全乡平均每户年纯收入的区间;平均每户年纯收入的区间;(2)(2)以同样概率估以同样概率估计全乡农户年纯收入总额的区间范围。计全乡农户年纯收入总额的区间范围。1239211608(39220096.1)(2001002000196.1,2000,12000,100,5000 XxXxtntsxnNxxxxx元元)元元)(解解: 范围内。范围内。,在在全乡农户年纯收入总额全乡农户年纯收入总额710193. 6710804. 5710193. 6

41、123925000710804. 5116085000 例例3 3:某学校进行一次英语测验,为了了解学生的:某学校进行一次英语测验,为了了解学生的考试情况,随机抽选部分学生进行调查,所得资考试情况,随机抽选部分学生进行调查,所得资料如下:料如下:试以试以95.4595.45的可靠性估计该学校英语考试的平的可靠性估计该学校英语考试的平均成绩的范围及该校学生成绩在均成绩的范围及该校学生成绩在8080分以上的学生分以上的学生所占的比重的范围。所占的比重的范围。解:该校学生英语考试的平均成绩解:该校学生英语考试的平均成绩)(6 .7610076601008954085227520651055分分 fx

42、fx标准差为标准差为 377.111001294410086 .7695106 .7655222 ffxx 平均成绩的抽样平均误差为平均成绩的抽样平均误差为1377. 1100377.11 nx 平均成绩的抽样极限误差为平均成绩的抽样极限误差为2754. 21377. 12 xxt 该校学生考试的平均成绩的区间范围是该校学生考试的平均成绩的区间范围是xxxXx 89.7832.74 X样本中考试成绩在样本中考试成绩在80分以上的学生比重分以上的学生比重48. 010048 p 04996. 010052. 048. 01 nppp 09992. 004996. 02 ppt 考试成绩在考试成绩

43、在80分以上的学生比重分以上的学生比重pppPp 5799.03801.009992.048.009992.048.0 PP在在95.45概率保证程度下,该校学生成绩在概率保证程度下,该校学生成绩在8080分以分以上的学生所占比重的范围在上的学生所占比重的范围在38.0138.0157.9957.99之间之间例例4:外贸公司出口一种茶叶,规定每包毛重不低于:外贸公司出口一种茶叶,规定每包毛重不低于100克,现用不重复抽样的方法抽取其中的克,现用不重复抽样的方法抽取其中的1 1进行进行检验,其结果如下:检验,其结果如下:试以试以99.73(t=3)的概率保证程度估计这批茶叶)的概率保证程度估计这

44、批茶叶合格率范围。合格率范围。解:样本合格率为解:样本合格率为7 . 010070 p 0456. 0002079. 01000010011003 . 07 . 011 Nnnppp 100001100总总体体单单位位数数为为137. 00456. 03 ppt 137. 07 . 0137. 07 . 0即即 PpPppp837. 0563. 0 P以以99.73的概率保证程度保证这批茶叶包装合格率在的概率保证程度保证这批茶叶包装合格率在56.383.7之间。之间。第四节第四节 抽样组织设计抽样组织设计一、抽样组织设计的基本原则一、抽样组织设计的基本原则1 1、保证随机性原则的实现、保证随机

45、性原则的实现(1 1)要有合适的抽样框)要有合适的抽样框 抽样框:指编制抽样单位的目录。抽样框:指编制抽样单位的目录。(2 2)取样的实施问题)取样的实施问题2 2、考虑样本容量问题、考虑样本容量问题3 3、关于抽样的组织形式、关于抽样的组织形式4 4、必须重视调查经费、必须重视调查经费 二、几种常用的抽样组织形式二、几种常用的抽样组织形式 1 1、简单随机抽样(、简单随机抽样(最基本、最简单的抽样组织形式)最基本、最简单的抽样组织形式) 直接从总体直接从总体N N个单位中随机抽取个单位中随机抽取n n个单位作为样本,个单位作为样本,适用于均匀总体。适用于均匀总体。类型类型 (1)(1)抽签法

46、抽签法 (2)(2)随机数表法随机数表法简单随机抽样样本单位数的确定:简单随机抽样样本单位数的确定: a.a.在重复抽样下,由于样本平均数的抽样极限误差公式为:在重复抽样下,由于样本平均数的抽样极限误差公式为: xxxtnntt222 b.b.在不重复抽样下,在不重复抽样下,由于样本平均数的抽样极限误差公式为:由于样本平均数的抽样极限误差公式为:22222)1(22 txNNtnNnntxtx 样样本本单单位位数数c.c.在重复抽样下,由于样本成数的抽样极限误差公式为在重复抽样下,由于样本成数的抽样极限误差公式为ppptppnnpptt2211)()( d.d.在不重复抽样下,由于样本成数的抽

47、样极限误差公式为在不重复抽样下,由于样本成数的抽样极限误差公式为222)1()1()1()1(tppNtpNpnNnnppttppp 调查一批机械零件合格率,根据过去的资料,合格品率调查一批机械零件合格率,根据过去的资料,合格品率曾有过曾有过9999、9797、9595三种情况,现在要求误差不超过三种情况,现在要求误差不超过1 1,要求估计的把握程度为,要求估计的把握程度为9595,问需要抽查多少个零件?,问需要抽查多少个零件?)(.%.)(个个时时,解解:当当合合格格率率为为3810101999611992222 ppptn)(.)(个个时时,当当合合格格率率为为11180100309709

48、611972222 ppptn)(.)(个个时时,当当合合格格率率为为18250100509509611952222 2 2、类型抽样(分层抽样)、类型抽样(分层抽样) 设总体由设总体由N N个单位组成,把总体划分为个单位组成,把总体划分为K K组,每组,每组有组有 个单位个单位, 然后从每组的然后从每组的 个单位中抽取个单位中抽取 个单位构成个单位构成样本容量为样本容量为n n的样本,使的样本,使 , 这种抽这种抽样方法称为类型抽样。样方法称为类型抽样。iNKNNNN 21iNinknnnn 21各组应抽样本单位数的确定:各组应抽样本单位数的确定: 由各组的总体单位数在全部总体单位数中的比重

49、由各组的总体单位数在全部总体单位数中的比重来确定。来确定。从从250250家百货公司中抽取家百货公司中抽取5050家进行本季度销售额的调查家进行本季度销售额的调查NNnnii 各各组组的的样样本本单单位位数数iNNNiinixis2),2,1(1kinxxinjijii 各各组组样样本本均均值值不不重重复复抽抽样样)(重重复复抽抽样样)抽抽样样平平均均误误差差各各层层内内方方差差平平均均数数各各层层内内方方差差(1x(x22)(2222Nnnnniininixijxiiii nxnxkiii 1所所有有样样本本均均值值 以上题为例,求样本平均销售额和抽样平均以上题为例,求样本平均销售额和抽样平

50、均误差。误差。1700580015120301482(50228005698515108503028885.550kin xiiixnniin 所所有有本本均均值值元元)3 .13505 .8885_2 nx 重重复复抽抽样样:92.111_2 Nnnx 不不重重复复抽抽样样: 类型抽样的抽样平均误差只取决于组内方差的类型抽样的抽样平均误差只取决于组内方差的平均水平,不受组间方差的影响。它小于简单随平均水平,不受组间方差的影响。它小于简单随机抽样的抽样平均误差,因此在对总体进行分组机抽样的抽样平均误差,因此在对总体进行分组时,应尽量扩大组间方差,缩小组内方差。(总时,应尽量扩大组间方差,缩小组

51、内方差。(总方差组内方差组间方差)方差组内方差组间方差) 3 3、整群抽样、整群抽样 将总体各单位划分为许多群,然后随机抽取部将总体各单位划分为许多群,然后随机抽取部分群,对中选群的所有单位进行全面调查的抽样分群,对中选群的所有单位进行全面调查的抽样组织形式。组织形式。 将总体的全部单位将总体的全部单位N N划分成划分成R R群,每群包括群,每群包括M M个单个单位位( (假设每群的单位数是相等的假设每群的单位数是相等的) ),有,有RM=NRM=N,从总体,从总体R R群中随机抽取群中随机抽取r r群组成样本,并对中选的群组成样本,并对中选的r r群的所群的所有有M M单位进行调查。单位进行

52、调查。 第第i i群样本平均数群样本平均数 rxxriMxxriiMjiji 11)2 , 1(全全体体样样本本平平均均数数rRrRx21 抽抽样样)抽抽样样平平均均误误差差(不不重重复复 整群抽样对群而言是非全面调查,对被抽中的群内单位整群抽样对群而言是非全面调查,对被抽中的群内单位而言是全面调查,因此,整群抽样的误差取决于群间差异,而言是全面调查,因此,整群抽样的误差取决于群间差异,不受群内单位之间差异的影响,这就要求总体不受群内单位之间差异的影响,这就要求总体N个单位所形个单位所形成的各个群,尽量有相同或相近的群内结构;也就是说要尽成的各个群,尽量有相同或相近的群内结构;也就是说要尽量把

53、总体方程转化为群内方差,缩小群间方差。量把总体方程转化为群内方差,缩小群间方差。22iXXR例:某工厂生产某种灯泡,在连续生产例:某工厂生产某种灯泡,在连续生产720720小小时中,每隔时中,每隔2424小时抽取小时抽取1 1小时的全部产品加以小时的全部产品加以检查,根据抽样资料计算结果,灯泡平均使用检查,根据抽样资料计算结果,灯泡平均使用寿命寿命12001200小时,群间方差为小时,群间方差为6060小时,计算样本小时,计算样本平均数的抽样误差,并以平均数的抽样误差,并以9595的可靠程度推算的可靠程度推算该批灯泡的平均使用寿命。该批灯泡的平均使用寿命。27201200,60,30,1.96

54、,72024xrtR解:272030 60()()1.3851720130 xRrRr(小时)72.120229.1197175. 21200175. 21200715. 296. 1385. 1 XXtxx 即该批灯泡的平均使用寿命在即该批灯泡的平均使用寿命在1197.291197.291202.721202.72小时之间。小时之间。 4 4、等距抽样、等距抽样 也称机械抽样或系统抽样。将总体各单位按某一标志进也称机械抽样或系统抽样。将总体各单位按某一标志进行排队,然后依一定顺序和间隔抽取样本单位的一种抽样组行排队,然后依一定顺序和间隔抽取样本单位的一种抽样组织形式。织形式。 在总体在总体N N个单位按某一标志排队后,从头到尾编上个单位按某一标志排队后,从头到尾编上1 1至至N N的的号码,并等分成号码,并等分成n n断,每段含断,每段含K K个单位,个单位,N=nKN=nK,然后在第一段,然后在第一段的的K K个单位中个单位中随机抽取一个单位随机抽取一个单位(设为第设为第i i号号, )以后每隔以后每隔k k抽取下一个单位(如抽取下一个单位(如i+Ki+K号,号,i+2Ki+2K号,直至号,直至i+(n-i+(n-1)K1)K号号), ), 共共n n个单位构成样本。一共可抽取个单位构成样本。一共可抽取K K套样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论