




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第七章第七章抽样调查抽样调查2第一节第一节 抽样调查的基本概念抽样调查的基本概念及理论依据及理论依据一、估计量和估计值一、估计量和估计值二、全及总体和抽样总体二、全及总体和抽样总体三、全及指标和样本指标三、全及指标和样本指标四、抽样方式和样本可能数目四、抽样方式和样本可能数目五、抽样理论依据五、抽样理论依据3一、估计量和估计值一、估计量和估计值v1. 估计量估计量:是指用于估计相关的总体参数的:是指用于估计相关的总体参数的统计量。样本均值、样本比例(样本成数)统计量。样本均值、样本比例(样本成数)和样本方差都是估计量,估计量是随机的。和样本方差都是估计量,估计量是随机的。v2. 估计值估计值
2、:是指估计量的具体数值。根据具:是指估计量的具体数值。根据具体样本数据,按照估计量的计算公式,计算体样本数据,按照估计量的计算公式,计算出的样本均值、样本比例和样本方差的具体出的样本均值、样本比例和样本方差的具体数值就是估计值。是抽样推断的基础。数值就是估计值。是抽样推断的基础。4二、全及总体和抽样总体二、全及总体和抽样总体v1. 全及总体全及总体(总体总体):是指所要认识对象的):是指所要认识对象的全体,是同一性质的许多个体的集合体。有全体,是同一性质的许多个体的集合体。有变量总体与属性总体之分,全及总体是惟一变量总体与属性总体之分,全及总体是惟一的、确定的但却是未知的,常用的、确定的但却是
3、未知的,常用“N”表示。表示。v2. 抽样总体抽样总体(样本样本):是从全及总体中随机):是从全及总体中随机抽取出来一部分单位的集合体。有大样本和抽取出来一部分单位的集合体。有大样本和小样本之分,以小样本之分,以30个样本单位为划分依据。个样本单位为划分依据。v样本总体是随机的、已知的,常用样本总体是随机的、已知的,常用“n”表示。表示。5三、全及指标和样本指标三、全及指标和样本指标v(一)(一) 全及指标全及指标v根据全体总体各个单位的标志值或标志根据全体总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合特征计算的、反映总体某种属性的综合指标。全及指标也是惟一确定的,但也指标。全及
4、指标也是惟一确定的,但也是未知的。是未知的。v1. 总体平均数总体平均数:根据变量总体的标志值:根据变量总体的标志值计算的。计算的。NNX XX X62. 总体成数总体成数(总体比例总体比例):):常用常用“P”表示表示v是指总体中具有某种标志的单位数在总体中是指总体中具有某种标志的单位数在总体中所占的比重。变量总体也可以计算成数。所占的比重。变量总体也可以计算成数。NNP1P1NNNNNQ107 3. 总体标准差总体标准差和总体方差和总体方差2 2v都是测量总体标志值分散程度的指标。都是测量总体标志值分散程度的指标。NXX22)(NXX2)(v(二)抽样指标(二)抽样指标v是指根据抽样总体各
5、个标志值或标志特征计是指根据抽样总体各个标志值或标志特征计算的综合指标。与全及指标相对应也有抽样算的综合指标。与全及指标相对应也有抽样平均数、抽样成数、样本标准差和样本方差平均数、抽样成数、样本标准差和样本方差等估计量。抽样指标是随机的。等估计量。抽样指标是随机的。8 1. 样本平均数:样本平均数:nxx 2. 样本成数数:样本成数数:nnp1pnnnnnq1103. 样本标准差样本标准差 和样本方差:和样本方差:nxx2)(nxx22)(9四、抽样方式和样本可能数目四、抽样方式和样本可能数目v(一)抽样方式(一)抽样方式v1. 重复抽样(放回抽样):从总体重复抽样(放回抽样):从总体N中随机
6、中随机抽取抽取n个单位,每次抽取均为独立试验。个单位,每次抽取均为独立试验。v2. 不重复抽样(不放回抽样):每次抽中的不重复抽样(不放回抽样):每次抽中的单位不再放回总体中,为不独立试验。单位不再放回总体中,为不独立试验。v3. 考虑顺序抽样:即考虑总体单位的性质,考虑顺序抽样:即考虑总体单位的性质,还考虑各单位排序的抽样。还考虑各单位排序的抽样。v4. 不考虑顺序抽样:只考虑总体单位的性质不考虑顺序抽样:只考虑总体单位的性质差异,而不考虑其排序的抽样。差异,而不考虑其排序的抽样。10(二)样本可能数目(二)样本可能数目v是指从既定的总体中可以抽取多少个样本,是指从既定的总体中可以抽取多少个
7、样本,即样本总体的数量有多少。即样本总体的数量有多少。v1. 考虑顺序的不重复抽样可能数目考虑顺序的不重复抽样可能数目v即不重复排列的可能样本数目。计算公式:即不重复排列的可能样本数目。计算公式:)() 1()2)(1(nNNnNNNNAnN!设:设:N=10,n=5,则:,则:ANn =109876=30240个可能样本数目个可能样本数目112. 考虑顺序的重复抽样可能数目考虑顺序的重复抽样可能数目v即可重复排列的可能样本数目。公式:即可重复排列的可能样本数目。公式:vBNn=Nn =105 =100000个可能样本数目个可能样本数目v3. 不考虑顺序的不重复抽样可能数目不考虑顺序的不重复抽
8、样可能数目v即不重复组合。计算公式:即不重复组合。计算公式:nnNNNNCnN) 1()2)(1(!2521203024012345678910nNC124. 不考虑顺序的重复抽样可能数目不考虑顺序的重复抽样可能数目v即可重复组合。计算公式:即可重复组合。计算公式: DNn=CnN+n-1 v对于同一总体,采用四种不同的抽样组织形对于同一总体,采用四种不同的抽样组织形式,其样本可能数目也是不同的。按样本可式,其样本可能数目也是不同的。按样本可能数目的多少排序依次是:考虑顺序的重复能数目的多少排序依次是:考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序抽样考虑顺序的不重复抽样不考虑顺序的重复抽样
9、不考虑顺序的不重复抽样的重复抽样不考虑顺序的不重复抽样13五、抽样理论依据五、抽样理论依据v抽样调查的理论依据是概率论的大数定律。抽样调查的理论依据是概率论的大数定律。v(一)大数定律(一)大数定律v1. 独立同分布大数定律独立同分布大数定律:证明当:证明当n足够大时,足够大时,平均数具有稳定性,为用样本平均数估计总平均数具有稳定性,为用样本平均数估计总体平均数提供了理论依据。体平均数提供了理论依据。v2. 贝努力大数定律贝努力大数定律:证明当:证明当n足够大时,频足够大时,频率具有稳定性,为用频率代替概率提供了理率具有稳定性,为用频率代替概率提供了理论依据。大数的重要意义论依据。大数的重要意
10、义P25314 (二)中心极限定律(二)中心极限定律v1. 独立同分布中心极限定理独立同分布中心极限定理:证明不论变量:证明不论变量总体服从何种分布,只要它的数学期望和方总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为差存在,从中抽取容量为n 的样本,则这个的样本,则这个样本的总和或平均数是个随机变量,当样本的总和或平均数是个随机变量,当n 充充分大时,样本的总和或平均数趋于正态分布分大时,样本的总和或平均数趋于正态分布.v2. 德莫佛德莫佛-拉普拉斯中心极限定理拉普拉斯中心极限定理:证明属性:证明属性总体的样本成数和样本方差,在总体的样本成数和样本方差,在n足够大时,足够大时,同
11、样趋于正态分布。同样趋于正态分布。15第二节第二节 抽样平均误差抽样平均误差一、抽样平均误差的概念一、抽样平均误差的概念二、影响抽样平均误差的因素二、影响抽样平均误差的因素三、抽样平均误差的意义三、抽样平均误差的意义四、抽样平均误差的计算四、抽样平均误差的计算16一、抽样平均误差的概念一、抽样平均误差的概念v(一)抽样误差(一)抽样误差v是指样本指标和总体指标之间在数量上的差是指样本指标和总体指标之间在数量上的差别,是随机性的代表性误差。是抽样推断的别,是随机性的代表性误差。是抽样推断的依据,不包括登记误差和可能产生的偏差。依据,不包括登记误差和可能产生的偏差。v(二)抽样平均误差(二)抽样平
12、均误差v是指所有可能出现的样本指标的标准差,即是指所有可能出现的样本指标的标准差,即所有可能出现的样本指标和总体指标的平均所有可能出现的样本指标和总体指标的平均离差。抽样实际误差无法知道,而平均误差离差。抽样实际误差无法知道,而平均误差是可能计算的。是可能计算的。17二、影响抽样平均误差的因素二、影响抽样平均误差的因素v(一)总体标志的变动程度(一)总体标志的变动程度(x )v总体标志的变动程度与抽样平均误差总体标志的变动程度与抽样平均误差成同成同向变动关系。向变动关系。v(二)抽样单位数(二)抽样单位数(n)的多少)的多少v在其他条件不变的情况下,抽样单位数与抽在其他条件不变的情况下,抽样单
13、位数与抽样平均误差样平均误差成反向变动关系。成反向变动关系。v(三)抽样组织方式(三)抽样组织方式v重复抽样方式的重复抽样方式的高于不重复抽样,分类抽高于不重复抽样,分类抽样的样的低于机械抽样或整群抽样。低于机械抽样或整群抽样。18三、抽样平均误差的意义三、抽样平均误差的意义v抽样平均误差是一种标准差的概念,是所有抽样平均误差是一种标准差的概念,是所有可能样本指标与总体指标之间离差平方的平可能样本指标与总体指标之间离差平方的平均数的平方根。它概括了一系列抽样可能结均数的平方根。它概括了一系列抽样可能结果所产生的所有抽样误差。它有三点意义:果所产生的所有抽样误差。它有三点意义:v1. 是衡量抽样
14、指标对于总体指标代表性程是衡量抽样指标对于总体指标代表性程度的一个尺度;度的一个尺度;v2. 是计算极限误差的依据;是计算极限误差的依据;v3. 是确定抽样单位数多少的计算依据之一是确定抽样单位数多少的计算依据之一19 四、抽样平均误差的计算四、抽样平均误差的计算v(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差xv是是变量总体变量总体一系列抽样平均数对总体平均数一系列抽样平均数对总体平均数的标准差。其理论计算公式:的标准差。其理论计算公式:KxXx2)(201. 重复抽样抽样平均数的抽样平均误差重复抽样抽样平均数的抽样平均误差xv根据数理统计理论,在重复抽样方式下,抽根据数理统计
15、理论,在重复抽样方式下,抽样平均误差与全及总体的标准差成正比关系,样平均误差与全及总体的标准差成正比关系,而与抽样总体单位数的平方根成反比关系,而与抽样总体单位数的平方根成反比关系,可推导出如下公式:可推导出如下公式:nn2xn1212. 不重复抽样抽样平均数的抽样平均误差不重复抽样抽样平均数的抽样平均误差xv不重复抽样与重复抽样相比,样本可能数目不重复抽样与重复抽样相比,样本可能数目减少,且样本变量之间不是互相独立的。因减少,且样本变量之间不是互相独立的。因此,在重复抽样的基础上考虑一个修正系数此,在重复抽样的基础上考虑一个修正系数即可。证明过程见即可。证明过程见P261-262)1(NnN
16、n2x)1 (Nnn2x22(一)抽样成数的抽样平均误差(一)抽样成数的抽样平均误差pv属性总体属性总体的标志值是用文字表示的,且标志的标志值是用文字表示的,且标志只有两个取值,非此即彼,故将属性总体的只有两个取值,非此即彼,故将属性总体的标志称为标志称为“交替标志交替标志”或或“是非标志是非标志”。v交替标志也可以计算平均数交替标志也可以计算平均数(即(即成数成数)和)和标标准差准差。为了计算交替标志的平均数和标准差。为了计算交替标志的平均数和标准差必须将交替变异的标志过渡到数量标志。必须将交替变异的标志过渡到数量标志。v交替标志仍以交替标志仍以x表示,设:表示,设:x =1表示单位具有表示
17、单位具有某一标志,某一标志, x = 0表示单位不具有某一标志。表示单位不具有某一标志。具有某一标志的单位数用具有某一标志的单位数用N1表示;表示;23不具有某不具有某一标志的单位数用一标志的单位数用N0表示。表示。v总体成数和标准差与样本成数和标准差的计总体成数和标准差与样本成数和标准差的计算方法相同。只是总体指标用大写字母表示,算方法相同。只是总体指标用大写字母表示,样本指标用小写字母表示。例如:样本指标用小写字母表示。例如:v具有某一标志的单位数占总体的比重具有某一标志的单位数占总体的比重:NNP1nnp1PNNQ10pnnq101qp1QP24交替标志的平均数和标准差计算表交替标志的平
18、均数和标准差计算表P265ppqpqpfxfx101qpqpppffxxp222)0()1 ()()1 (1)(22pppqpqpqqpqppqp 属性总体属性总体抽样平均误差的计算也有重复抽抽样平均误差的计算也有重复抽样和不重复抽样之分:样和不重复抽样之分:251. 重复抽样抽样成数的抽样平均误差重复抽样抽样成数的抽样平均误差nppp)1 ( 2. 不重复抽样抽样成数的抽样平均误差不重复抽样抽样成数的抽样平均误差)1 ()1 ()1()1 (NnnppNnNnppp26v1. 用过去调查所得到的资料用过去调查所得到的资料。如果有几个。如果有几个不同的总体方差,应该用数值较大的。不同的总体方差
19、,应该用数值较大的。v谨慎性要求。谨慎性要求。2越大,说明总体的离散程越大,说明总体的离散程度越高,要抽取更多的样本单位度越高,要抽取更多的样本单位(n)才才具有代表性。具有代表性。v2. 用样本方差代替总体方差用样本方差代替总体方差2()v3. 用小规模调查资料计算的方差代替用小规模调查资料计算的方差代替2v4. 用估计材料计算的方差代替用估计材料计算的方差代替227(三)抽样平均误差计算实例(三)抽样平均误差计算实例P266使用时间使用时间(小时)(小时)抽取灯泡个抽取灯泡个数(个)数(个)组中值(组中值(x)xf900以下以下2875175090095049253700950100011
20、97510725100010507110257277510501100841075903001100115018112520250115012007117582251200以上以上312253675合合 计计200211400281057200211400fxfx%5 .9120018320017200P灯灯泡泡合合格格率率样本平均数样本平均数样本成数样本成数29使用时间使用时间(小时)(小时)抽取灯泡抽取灯泡个数个数(个个)组中值组中值(x)900以下以下2875-8(-4)329009504925-12(-3)36950100011975-22(-2)4410001050711025-71
21、(-1)71105011008410750(0)01100115018112518(1)18115012007117514(2)281200以上以上312259(3)27合合 计计200- -7225630df)fdAx(ff)dAx(2253.6350115045020072200256231第三节第三节 全及指标的推断全及指标的推断一、全及指标的点估计一、全及指标的点估计二、全及指标的区间估计二、全及指标的区间估计32一、全及指标的点估计一、全及指标的点估计v(一)点估计的概念(一)点估计的概念v点估计又称定值估计,它是直接以样本点估计又称定值估计,它是直接以样本指标作为相应总体指标的估计
22、量。指标作为相应总体指标的估计量。v例如,以样本平均数直接估计总体平均例如,以样本平均数直接估计总体平均数,即数,即:x=X。例如,某地区根据样本例如,某地区根据样本资料计算的粮食亩产量为资料计算的粮食亩产量为600公斤,就公斤,就以以600公斤作为全地区粮食亩产水平的公斤作为全地区粮食亩产水平的估计值。估计值。33(二)点估计的优缺点(二)点估计的优缺点v1. 优点优点:点估计能够提供总体指标的具:点估计能够提供总体指标的具体数值,可以作为行动决策的数量依据。体数值,可以作为行动决策的数量依据。例如,企业的市场部门对产品销量的预例如,企业的市场部门对产品销量的预测直接决定着生产部门和采购部门
23、的作测直接决定着生产部门和采购部门的作业计划。业计划。v2. 缺点缺点:任何点估计的结果不是对就是:任何点估计的结果不是对就是错,并不能提供误差情况和误差程度等错,并不能提供误差情况和误差程度等相关的信息。相关的信息。34(三)点估计量的评价标准(三)点估计量的评价标准v估计一个总体指标可以用多种样本统计估计一个总体指标可以用多种样本统计量,例如估计总体平均数,可以用样本量,例如估计总体平均数,可以用样本平均数,也可以用样本中位数、样本众平均数,也可以用样本中位数、样本众数等。具体应以哪一个统计量来估计总数等。具体应以哪一个统计量来估计总体平均数才是最优的,就涉及估计量的体平均数才是最优的,就
24、涉及估计量的评价标准问题。评价标准问题。v一个优良的估计量应该符合以下三个标一个优良的估计量应该符合以下三个标准:准:35v1. 无偏性。即样本统计量的期望值(平无偏性。即样本统计量的期望值(平均数)等于被估计的总体平均数。均数)等于被估计的总体平均数。v2. 一致性。即当样本单位数一致性。即当样本单位数n充分大时,充分大时,样本统计量也充分靠近总体参数(指样本统计量也充分靠近总体参数(指标)。标)。v3. 有效性。即作为优良估计量的方差应有效性。即作为优良估计量的方差应该比其他估计量的方差小。该比其他估计量的方差小。v同时具备上述条件的估计量就是优良的同时具备上述条件的估计量就是优良的36
25、二、全及指标的区间估计二、全及指标的区间估计v(一)区间估计的概念(一)区间估计的概念v区间估计是在点估计的基础上,给出在区间估计是在点估计的基础上,给出在一定的置信程度下,确定总体指标取值一定的置信程度下,确定总体指标取值区间的方法和过程。区间的方法和过程。v(二)置信区间(抽样极限误差)(二)置信区间(抽样极限误差)v是根据概率理论,以一定的可靠程度保是根据概率理论,以一定的可靠程度保证抽样误差不超过某一事先给定的范围。证抽样误差不超过某一事先给定的范围。这一范围是抽样指标与全及指标之间离这一范围是抽样指标与全及指标之间离差的可能范围。差的可能范围。37v设:设:x 与与p分别表示抽样平均
26、数与抽样成分别表示抽样平均数与抽样成数的置信区间(抽样极限误差),则:数的置信区间(抽样极限误差),则:x= x- -X将上式中的绝对值符合去掉并进行变换:将上式中的绝对值符合去掉并进行变换:xxXxXppPpP抽样调查的目的是用样本指标来估计总体抽样调查的目的是用样本指标来估计总体指标,而不是用总体指标来估计样本指标指标,而不是用总体指标来估计样本指标xxxXxpppPpp p= p - - P38全及指标全及指标X、P的区间估计公式:的区间估计公式:v(三)置信程度(三)置信程度(可信赖程度可信赖程度或或把握程度把握程度)v置信程度是用概率来表示的。极限误差与抽置信程度是用概率来表示的。极
27、限误差与抽样平均误差是什么关系?样平均误差是什么关系?是单位误差,极是单位误差,极限误差是限误差是的若干倍。这里的倍数通常用的若干倍。这里的倍数通常用 t t来表示。来表示。t t称概率度,它是以称概率度,它是以为尺度来衡量为尺度来衡量的相对误差范围,在数理统计中称为置信度的相对误差范围,在数理统计中称为置信度xxXppPxxtXxpptPp39置信程度(概率)与概率度是什么关系?置信程度(概率)与概率度是什么关系?v数理统计证明,概率与概率度是一种函数关数理统计证明,概率与概率度是一种函数关系,即概率是概率度的函数。用系,即概率是概率度的函数。用P表示概率用表示概率用以说明抽样估计的可靠程度
28、,其函数关系式以说明抽样估计的可靠程度,其函数关系式:)(tFP x40概率与概率度对照表概率与概率度对照表v举例:教材举例:教材P321,第,第1题。题。v(1)计算该厂全部灯泡平均耐用时间的取)计算该厂全部灯泡平均耐用时间的取值范围(概率保证程度值范围(概率保证程度0.9973)。)。概率度(概率度(t)误差范围(误差范围()概率概率F(t) 1.001.000.68271.961.960.95002.002.000.95453.003.000.997341耐用时间耐用时间(小时小时)灯泡数灯泡数(个)(个)组中值组中值(x) xf80085035825288758509001278751
29、111259009501859251711259501000103975100425100010504210254305010501100810758600合合 计计500463200小时4 .926500463200fxfx42使用时间使用时间(小时)(小时)抽取灯泡抽取灯泡个数个数(个个)组中值组中值(x)80085035825- -70(- -2)140850900127875- -127(- -1)1279009501859250 (0)09501000103975103 (1)1031000105042102584 (2)168105011008107524 (3)72合合 计计50
30、0146104321.55502192. 15050014500610247. 236.2221.5550021.55nn2x47. 2)1000011 (50021.55)1 (22Nnnxdf)fdAx(ff)dAx(2244v(2)检查)检查500个灯泡中不合格产品占个灯泡中不合格产品占0.4%试在试在0.6827概率保证下,估计全部产品不合概率保证下,估计全部产品不合格率的取值范围。格率的取值范围。v已知:已知:p = 0.4% , t = 1nppp)1 ( 41.747.23xxtxxxXx41.74 .92641.74 .926X81.93399.918 X%28.0500%)4
31、 .01%(4 .0p45%28.0%28.01pptpppPp%28. 0%4 . 0%28. 0%4 . 0P%68. 0%12. 0 P46教材教材P323,第,第3题题v不合格率不合格率=15250=6%,t=1,t=2%5 .1250%)61 (%6)1 (nppp%5 .1%5 .11ppt%5 . 1%6%5 . 1%6P%5 . 7%5 . 4 Pv(1)t=1时,时,v(2)t=2时,时,%3%5 .12ppt%3%6%3%6P%9%3 P47第四节第四节 抽样组织形式抽样组织形式一、简单随机抽样一、简单随机抽样二、类型抽样二、类型抽样三、机械抽样三、机械抽样四、整群抽样四、
32、整群抽样48一、简单随机抽样(纯随机抽样)一、简单随机抽样(纯随机抽样)v是指对总体不作任何分类、排队处理,从总是指对总体不作任何分类、排队处理,从总体的全部单位中随机抽选样本单位的方法。体的全部单位中随机抽选样本单位的方法。v抽样方法抽样方法:1. 直接抽选法;直接抽选法;v 2. 抽签法;抽签法;v 3. 随机数码表法(乱码表法)。随机数码表法(乱码表法)。v适用范围适用范围:1. 对调查对象了解很少;对调查对象了解很少;v 2. 总体单位的排列没有秩序;总体单位的排列没有秩序;v 3. 抽到的单位比较分散时也不影抽到的单位比较分散时也不影 v 响调查工作。响调查工作。49二、类型抽样(分
33、类抽样)二、类型抽样(分类抽样)v是先对总体单位按一定标志进行分类,然后是先对总体单位按一定标志进行分类,然后再从各类别中按照随机原则抽取一定比例的再从各类别中按照随机原则抽取一定比例的样本,由各类样本组成一个总样本的方法。样本,由各类样本组成一个总样本的方法。v类型抽样有类型抽样有3方面作用:方面作用:v1. 利用已知的信息提高抽样效率,增强样本利用已知的信息提高抽样效率,增强样本对总体的代表性。对总体的代表性。v2. 便于组织、开展抽样工作。便于组织、开展抽样工作。v3. 便于掌握总体中各个组成部分的情况。便于掌握总体中各个组成部分的情况。50(一)类型比例抽样法抽样单位数的确定一)类型比
34、例抽样法抽样单位数的确定v不考虑各类别间标志的差异程度,按照统一不考虑各类别间标志的差异程度,按照统一的抽样比例确定各类别要抽取的单位数。通的抽样比例确定各类别要抽取的单位数。通常用各类别的单位数占总体单位数的比例来常用各类别的单位数占总体单位数的比例来确定各类别应抽取的单位数。计算公式:确定各类别应抽取的单位数。计算公式:nNNnii51(二)类型适宜抽样法抽样单位数的确定(二)类型适宜抽样法抽样单位数的确定v对于标志变动程度大的类别,抽取样本单位对于标志变动程度大的类别,抽取样本单位数的比例相应要大一些,反之,对于标志变数的比例相应要大一些,反之,对于标志变动程度小的类别,抽取样本单位数的
35、比例相动程度小的类别,抽取样本单位数的比例相应要小一些。具体计算公式:应要小一些。具体计算公式:nNNniiiii各类别各类别标准差标准差nRNRNniiiii52(三)类型比例抽样抽样误差的计算三)类型比例抽样抽样误差的计算v类型比例抽样的方差由各类类型比例抽样的方差由各类内部方差内部方差和和类间类间方差方差构成,由于类型抽样的代表性很高,类构成,由于类型抽样的代表性很高,类间方差很小,可以忽略,因此,类型比例抽间方差很小,可以忽略,因此,类型比例抽样的误差主要取决于各类内部方差的平均数样的误差主要取决于各类内部方差的平均数的大小。的大小。v各类平均数内部方差的平均数各类平均数内部方差的平均
36、数 2inni2i2i53 各类成数内部方差的平均数各类成数内部方差的平均数 p)p(1 n)np(1pp)p(1iii 1. 重复抽样方式下类型抽样平均误差的计算重复抽样方式下类型抽样平均误差的计算 nn2i2ixnp)p(1p54 2. 不重复抽样方式下类型抽样平均误差的计算不重复抽样方式下类型抽样平均误差的计算 )Nn(1n2ix)Nn(1np)p(1p55 举例:教材举例:教材P322,第,第5题。题。33.333006003630032600nnxxii566.673006003030020600nn22i2i2i0.7935900566.67n2ix56因为因为 P = 0.954
37、5,所以,所以 t = 21.5870.79352txxxxxXx1.58733.33X1.58733.3334.917X31.74357三、机械抽样(等距抽样或系统抽样)三、机械抽样(等距抽样或系统抽样)v是对研究的总体按照一定的顺序排列,每隔是对研究的总体按照一定的顺序排列,每隔一定的距离抽取一个或若干个单位数,并把一定的距离抽取一个或若干个单位数,并把这些单位数组成样本的一种抽样方法。这些单位数组成样本的一种抽样方法。v抽样间隔或抽样距离抽样间隔或抽样距离=N/nv(一)机械抽样的种类(按排列依据划分)(一)机械抽样的种类(按排列依据划分)v1. 按无关标志排列的机械抽样按无关标志排列的
38、机械抽样:即排列标志:即排列标志与调查内容无关,原理同简单随机抽样。与调查内容无关,原理同简单随机抽样。v2. 按有关标准排列的机械抽样按有关标准排列的机械抽样:抽样原理同:抽样原理同类型抽样。类型抽样。58四、整群抽样四、整群抽样v是先将总体划分为若干个群,然后,以群为是先将总体划分为若干个群,然后,以群为抽样单位,从总体中抽取若干个群体作为样抽样单位,从总体中抽取若干个群体作为样本,并对中选群内的所有单位进行全面调查本,并对中选群内的所有单位进行全面调查的一种抽样方式。的一种抽样方式。v(一)适用范围(一)适用范围v当总体缺乏包括全部总体单位的抽样框,无当总体缺乏包括全部总体单位的抽样框,
39、无法进行样本抽选时,须采用整群抽样方式;法进行样本抽选时,须采用整群抽样方式;或总体虽然存在抽样框,但总体单位数过多或总体虽然存在抽样框,但总体单位数过多分布太广,采用其他抽样方法不经济时。分布太广,采用其他抽样方法不经济时。59(二)整群抽样的优缺点(二)整群抽样的优缺点v1. 优点:简便、经济,节约费用。优点:简便、经济,节约费用。v2. 缺点:抽取的样本单位比较集中,在一缺点:抽取的样本单位比较集中,在一个群内各单位之间的差异程度较小,但不个群内各单位之间的差异程度较小,但不同群之间的差异较大。整群抽样的误差是同群之间的差异较大。整群抽样的误差是各种抽样方式中最大的一种。各种抽样方式中最
40、大的一种。v(三)(三)“群群”的划分方法的划分方法v1. 按照行政、地域及自然形成的群体划分按照行政、地域及自然形成的群体划分v2. 对于连续总体,可由调查者根据需要来对于连续总体,可由调查者根据需要来适当确定群的大小。适当确定群的大小。60(四)影响整群抽样误差的因素(四)影响整群抽样误差的因素v1. 抽取抽取“群群”数的多少数的多少。(反向变动关系)。(反向变动关系)v2. 群间方差群间方差。群与群之间的差异程度。(同。群与群之间的差异程度。(同向变动关系)在整群抽样时,群内方差无论向变动关系)在整群抽样时,群内方差无论多大都不影响抽样误差。因为对每一群来讲多大都不影响抽样误差。因为对每
41、一群来讲进行的都是全面调查,不存在抽样误差问题进行的都是全面调查,不存在抽样误差问题.v(1)平均数群间方差平均数群间方差的计算公式:的计算公式:r)xx(2i2xrxxi61 (2)成数群间方差成数群间方差的计算公式:的计算公式:rp)(p2i2prppi 3. 抽样方法抽样方法。整群抽样都采用不重复抽样。整群抽样都采用不重复抽样。(1)平均数的抽样平均误差的计算公式:)平均数的抽样平均误差的计算公式:)1(RrRr2xx62 (2)成数的抽样平均误差的计算公式:)成数的抽样平均误差的计算公式:)1(RrRr2pp当当R的数目很大时,修正系数:的数目很大时,修正系数:1RrR可以用可以用 来
42、替代。来替代。)1 (Rr63批号(批号(r)xi(千克)(千克)pi (%)xi- - xpi p (%)14998-1.110.44251990.891.4435097-0.11-0.56451990.891.44548.598-1.610.4465099-0.111.4475098-0.110.44849.598-0.610.44949.597-0.61-0.56105099-0.111.441151.5961.39-1.56125298.51.890.9464批号(批号(r)xi(千克)(千克)pi (%)xi- - xpi p (%)1350.6990.491.441449.598-
43、0.610.441550.5980.390.441649.595-0.61-2.56174998-1.110.441851970.89-0.56195098-0.110.44205095-0.11-2.562150.5950.39-2.562250.5970.39-0.56235097-0.11-0.562449.598-0.610.4465已知:已知:R=2460=1440,r =24千克11.50246 .1202rxxi千克6491.0245784.15r)xx(2i2x1631.0)11440241440(246491.0 x3262.0163102.txx663262.011.503
44、262.011.50X(千克)44.5078.49 XxxxXx%56.97%10024415.23rppi%0153. 0%1002400366564. 0rp)(p2i2p67%25.0)11440241440(24%0153.0p%5 .0%25.02pptpppPp%5 .0%56.97%5 .0%56.97P%06.98%06.97 P68第五节第五节 必要抽样单位数的确定必要抽样单位数的确定一、确定抽样单位数的原则一、确定抽样单位数的原则二、确定抽样单位数的依据二、确定抽样单位数的依据三、计算抽样单位数的公式三、计算抽样单位数的公式69一、确定抽样单位数的原则一、确定抽样单位数的原则v在保证抽样推断达到预期的可靠程度在保证抽样推断达到预期的可靠程度和精确程度的要求下,确定一个恰当和精确程度的要求下,确定一个恰当的抽样单位数目。抽样推断的可靠程的抽样单位数目。抽样推断的可靠程度与精
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论