版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节抽样推断的意义一、抽样推断的含义(一)抽样推断的特点抽样推断又称为抽样估计,是在抽样调查的基础上,根据样本的实际资料推断总体数量特征的一种统计方法。它是按照随机原则从全部研究对象中抽取一部分单位进行观察,并依据获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计和判断,以达到对现象总体认识的一种方法。例如,从全国所有股份制企业中,抽取一部分企业,详细调查其生产经营状况,根据这一部分企业的调查资料,推算所有股份制企业的生产经营状况,就属于抽样推断。下一页返回第一节抽样推断的意义(二)抽样推断的作用抽样推断主要有如下作用:(1)对某些不可能进行全面调查而又需要了解全面情况的社会经济现象,可以采用抽样推断方式。例如,对产品的质量进行检验,其中对某些物品的质量检验是属于破坏性或消耗性的,譬如对灯泡使用寿命的检验,对材料抗拉强度的检验,对饮料、罐头等食品的质量检验等,一经检验就将消耗或破坏它们的使用价值。在这种情况下,只能采用抽样推断方式。另外,对于无限总体也不可能进行全面调查,只能采用抽样推断方式。(2)对于某些不必要或在经济上不允许经常采用全面调查的社会经济现象,最适宜采用抽样推断方式。上一页下一页返回第一节抽样推断的意义例如,对于人口数量的调查,对于城乡居民的家计调查,对于旅游客源的调查,对于水、森林、矿藏等资源的调查等。虽然有些调查理论上可以采用全面调查,但由于总体涉及的范围较大,采用全面调查要花费大量的人力、物力、财力和时间,所以有时没有必要,有时条件也不允许。这时采用抽样推断方式,便可以同时达到节省人力、物力、财力和时间,并获得全面调查效果的目的。(3)对于需要及时了解情况的现象,也经常采用抽样推断方式。因为全面调查浪费人力、物力和财力,资料也不易及时取得,而抽样推断方式不仅节省人力、资金,而且需要的时间短,方式灵活,能够及时满足了解情况的需要。例如,为了及时对旅游者的旅游目的、停留天数、购物等情况进行调查,需在旅游者启程之前和旅游过程中进行调查,就应采用抽样推断方式,以便及时获取所需的统计资料。上一页下一页返回第一节抽样推断的意义(4)对全面调查的资料进行评价和修正。由于全面调查范围广、工作量大、参加的人员多,所以发生登记性误差的可能性大。因此,为了保证全面调查资料的准确性,检验全面调查资料的质量,在全面调查之后,一般都要进行抽样推断。在总体中再抽取一部分单位重新调查,然后将两次调查的资料进行比较,计算出差错率,并据此对全面调查的资料加以修正。例如,我国人口普查规定,在人口普查工作完毕后,还要按照规定的调查方案抽取若干个地区进行复查,根据抽样调查的资料,计算人口普查的重复和遗漏的差错率,根据这个比率修正普查资料,从而保证人口普查数据的质量。(5)抽样推断还可以用于工业生产过程中的质量控制。上一页下一页返回第一节抽样推断的意义对于成批或大量连续生产的工业产品,在其生产过程中采用抽样推断,可以检查生产过程是否有异常情况,并及时提供有关信息,有效地实施产品质量控制。这种质量控制在产品质量检验中的作用比事后检验要优越得多,可以通过随时跟踪、抽查保证质量。二、抽样推断的基本概念(一)总体和样本总体又称全及总体。它是根据研究目的,由全部调查单位组成的集合体。总体的单位数通常都是很大的,甚至是无限的,这样才有必要组织抽样调查,进行抽样推断。总体单位数一般用符号N表示。样本又称子样。它是从总体中随机抽取出来的部分调查单位组成的集合体。上一页下一页返回第一节抽样推断的意义样本的单位数是有限的。样本单位数一般用符号n表示,也称样本容量。对于某一特定研究问题来说,作为推断对象的总体是确定的,而且是唯一的,所以又称为参数。但由于从一个总体中可以抽取许多个样本,所以作为观察对象的样本,不是唯一的,而是可变的。明白这一点对于理解抽样推断原理是很重要的。(二)总体指标和样本指标总体指标又称参数。它是根据总体各单位的标志值或属性计算的综合指标,反映总体数量特征的综合指标为全及指标。全及指标是总体变量的函数,其数值是由总体各单位的标志值或标志属性决定的;一个全及指标的指标值是确定的、唯一的,所以称为参数。上一页下一页返回第一节抽样推断的意义对于总体中的数量标志,可以计算的总体指标(总体参数)有总体平均数X、总体方差σ2(或总体标准差σ)。(三)样本容量和样本个数样本容量和样本个数是两个有联系但完全不同的概念。样本容量是一个样本所包含的单位数。一个样本应该包含多少单位最合适,是抽样设计必须认真考虑的问题,必须结合调查任务的要求以及总体标志值的变异情况来考虑。样本容量的大小不但关系到抽样调查的效果,而且关系到抽样方法的应用。通常将样本单位数不少于30个的样本称为大样本,单位数不及30个的样本称为小样本。社会经济统计的抽样调查多属于大样本调查。样本个数又称样本可能数目,是指从一个总体中可能抽取的样本个数。上一页下一页返回第一节抽样推断的意义一个总体可能抽取多少样本和样本容量以及抽样方法等因素都有关系,是一个比较复杂的问题。一个总体有多少样本,则样本统计量就有多少种取值,从而形成该统计量的分布。而统计量的分布又是抽样推断的基础。虽然在实践上只抽取个别或少数样本,但要判断所取样本的可能性就必须联系到全部可能样本数目所形成的分布。(四)重复抽样和不重复抽样从抽样的方法方面来看,抽样可以有重复抽样和不重复抽样两种。重复抽样也称重置抽样。它是这样安排的,要从总体N个单位中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,并把它看作一次试验,连续进行n次试验构成一个样本。每次抽出一个单位把结果登记下来,又重新放回,参加下一次抽选。上一页下一页返回第一节抽样推断的意义因而重复抽样的样本是由n次相互独立的连续试验构成的,每次试验是在完全相同的条件下进行,每个单位中选的机会在各次中都完全相等。从总体N个单位中,用重复抽样的方法,随机抽取n个单位构成一个样本,则共可抽取Nn个样本。二、抽样推断的理论基础抽样推断是建立在概率论大数定律基础上的。大数定律的一系列定理为抽样推断提供了数学依据。大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。上一页下一页返回第一节抽样推断的意义它说明如果被研究的总体是由大量的相互独立的随机因素构成的,而且每个因素对总体的影响都相对小,那么对这些大量因素加以综合平均的结果,因素的个别影响将相互抵消,呈现出共同作用的影响,使总体具有稳定的性质。这种规律性可通俗地从下面四个方面加以描述。(1)只有在掌握足够多的单位数目的情况时,大量现象规律性及大量过程倾向性才能充分显示出来,因此只有在大量现象的总体中,才能研究这些现象的规律性。(2)现象的总体规律性,通常以平均数的形式表现出来。(3)当所研究的现象总体包含的单位越多时,平均数也就越能够正确地反映出这些现象的规律性。上一页下一页返回第一节抽样推断的意义(4)各单位的共同倾向(它表现为主要的、基本的因素)决定着平均数的水平。而各单位对平均数的离差(它表现为次要的、偶然的因素),则会由于综合汇总的结果而相互抵消,趋于消失。联系抽样推断来看,大数法则证明:如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单位数n,可以几乎趋近于1的概率,来期望抽样平均数和总体平均数的绝对离差为任意小。即随着抽样单位数n的增加,抽样平均数在概率上收敛于总体平均数。大数法则论证了抽样平均数趋于总体平均数的趋势,这为抽样推断提供了重要的依据。上一页下一页返回第一节抽样推断的意义但是,抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布怎样?大数法则并没有在这方面给出什么信息。研究这个问题要利用另一个重要的定理,即中心极限定理。中心极限定理是研究变量和分布序列的极限原理,论证:如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋近于正态分布。在现实生活中,一个随机变量服从于正态分布未必很多。但多个随机变量和分布趋近于正态分布则是普遍存在的。抽样平均数也是一种随机变量的分布,因此在抽样单位数n充分大的条件下,抽样平均数也趋近于正态分布,这为抽样误差的概率估计提供了理论基础。上一页返回第二节抽样误差用抽样指标估计全及指标是否可行,关键问题在于抽样误差,抽样误差大小表明抽样效果好坏。如果误差超过了允许的限度,抽样推断也就失去了价值,所以有必要加以专门讨论。一、抽样误差的概念抽样误差是指样本指标与被它估计的总体相应指标的差数。具体指样本平均数x与总体平均数X的差,样本成数p与总体成数P的差。在抽样推断中,用样本指标推断总体指标,总会存在一定的误差,其误差来源主要有两个方面:一是登记性误差,即在调查和整理资料的过程中,由于主、客观因素的影响而引起的误差,如在登记、汇总、计算、过录的过程中由于疏忽而产生的差错等。下一页返回第二节抽样误差登记性误差不论全面调查或非全面调查都可能产生;二是代表性误差,即由于样本的结构情况不足以代表总体特征而导致的误差。代表性误差的产生又有两种情况:一种是违反抽样推断的随机原则,如调查者有意地多选较好的单位或多选较差的单位进行调查,这样计算出来的样本指标必然出现偏高或偏低的情况,造成系统性误差,也称为偏差。另一种情况是遵守抽样推断的随机原则,但由于从总体中抽取样本时有多种多样的可能,所以当取得一个样本时,只要被抽中样本的内部结构与被研究总体的结构有所出入,就会出现或大或小的偶然性的代表性误差,也称为随机误差。系统性误差和登记性误差都是抽样工作组织不好导致的,应该采取预防措施避免发生。而偶然性的代表性误差是无法消除的。上一页下一页返回第二节抽样误差抽样误差就是指这种偶然性的代表性误差,即按随机原则抽样时,单纯由于不同的随机样本得出不同的估计量而产生的误差。抽样误差是抽样推断固有的,虽然无法避免,但可以运用大数定律的数学公式加以精确地计算,确定其具体的数量界限,并通过抽样设计加以控制。所以,这种抽样误差也称为可控制误差。二、抽样平均误差(一)抽样平均误差的概念抽样平均误差就是所有可能出现的样本指标的平均离差,即抽样平均数或抽样成数的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。上一页下一页返回第二节抽样误差由于样本是按随机原则抽取的,所以从同一总体抽取同样单位数的样本可以有多种不同取法。每个样本都有自己的抽样平均数和抽样成数。根据一系列的抽样平均数和一系列的抽样成数可以计算抽样平均数(或抽样成数)的标准差。又因为抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体成数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。因此,在抽样估计中,总是以平均误差作为计算误差范围的衡量尺度。下面分别讨论抽样平均数平均误差和抽样成数平均误差的计算问题。(二)抽样平均误差的计算在一般情况下,总体平均数是未知的。当样本较多时,样本平均数可代替总体平均数(这已经得到证明)。上一页下一页返回第二节抽样误差而在实际工作中,通常只需从总体中抽取一个样本,这样就可以根据总体标准差和样本单位数的关系计算。(三)抽样平均数的平均误差抽样平均误差的计算,与抽样方法和抽样组织形式有直接关系,不同的抽样方法和抽样组织形式计算抽样平均误差的公式是不同的。(四)抽样成数的平均误差总体成数P可以表现为总体是非标志的平均数,即E(X)=P,它的标准差是σ=p(1-p)。根据抽样平均数和总体平均数的关系,有E(p)=P,即抽样成数的平均数等于总体成数。根据抽样平均误差和总体误差的关系,可以得到抽样成数的平均误差的计算公式。上一页下一页返回第二节抽样误差三、影响抽样平均误差的因素从以上计算可以看出,影响抽样平均误差大小的因素主要有以下四个因素。(一)样本单位数的多少在其他条件不变的情况下,样本单位数越多,抽样误差就越小;反之,样本单位数越少,抽样误差就越大。样本单位数越大,样本就越能反映总体的数量特征,如果样本单位数扩大到接近总体单位数时,抽样调查也就接近于全面调查,抽样误差就缩小到几乎完全消失的程度。上一页下一页返回第二节抽样误差(二)总体被研究标志值的变异程度在其他条件不变的情况下,总体各单位标志值变异程度越小,抽样误差也越小,抽样误差和总体变异程度成正比变化。这是因为总体变异程度小,表示总体各单位标志值之间的差异小,则样本指标与总体指标之间的差异也就小。如果总体各单位标志值相等,则标志变异程度等于0,样本指标完全等于总体指标,抽样误差也就不存在了。(三)抽样方法抽样方法不同,抽样误差也不同。在其他条件不变的情况下,不重复抽样下的样本比重复抽样下的样本代表性强,其抽样误差相应也要小。上一页下一页返回第二节抽样误差(四)抽样的组织形式在不同的抽样组织形式下,抽样误差也不同。一般来说,简单随机抽样和整群抽样的误差比机械抽样(有关标志排队法)和分类抽样的误差要大。了解影响抽样误差的因素,对于控制和分析抽样误差十分重要。在上述影响抽样误差的四个因素中,标志变异程度是客观存在的因素,是调查者无法控制的,但样本单位数、抽样方法及抽样的组织形式却是调查者能够选择和控制的。因此,在实际工作中,应当根据研究的目的和具体情况,做好抽样设计和实施工作,以获得经济有效的抽样效果。上一页下一页返回第二节抽样误差四、抽样平均误差计算实例五、抽样极限误差(一)抽样极限误差的概念抽样极限误差是从另一个角度考虑抽样误差问题的。用样本指标推断总体指标时,要想达到完全准确和毫无误差,几乎是不可能的。样本指标和总体指标之间总会有一定的差距,所以,在估计总体指标时必须同时考虑误差的大小。我们不希望误差太大,因为这会影响样本资料的价值。误差越大,样本资料的价值便越小,当误差超过一定限度时,样本资料就毫无价值了。所以,在进行抽样推断时,应该根据所研究对象的变异程度和分析任务的需要确定允许的误差范围,在这个范围内的数字是有效的。上一页下一页返回第二节抽样误差这就是抽样极限误差的问题。抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。由于总体指标是一个确定的数,而样本指标是围绕着总体指标左右变动的量,与总体指标可能产生正离差,也可能产生负离差,所以样本指标变动的上限或下限与总体指标之差的绝对值可以表示抽样误差的可能范围。我们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。(二)抽样极限误差的计算基于概率估计的要求,抽样极限误差通常需要以抽样平均误差μx或μp为标准单位衡量。把抽样极限误差△x或△p分别除以μx或μp得相对数t,表示误差范围为抽样平均误差的若干倍,t是测量估计可靠程度的一个参数,称为抽样误差的概率度。上一页返回第三节抽样估计抽样估计是指利用实际调查的样本指标的数值估计相应的总体指标的数值的方法。由于总体指标是表明总体数量特征的参数,例如总体平均数、总体成数等,所以抽样估计也称为参数估计。一、抽样估计的特点(一)在逻辑上运用归纳推理,而不是演绎推理演绎推理是从一般命题导出特殊结论的逻辑方法。归纳推理是从研究个别命题出发达到一般性的认识。结论的内容大于前提,所以前提正确未必导致结论正确,前提正确也可能有错误结论。因为抽样估计运用归纳推理,从局部的前提达到对总体的认识,所以不能保证绝对正确。下一页返回第三节抽样估计(二)在方法上运用不确定的概率估计法,而不是运用确定的数学分析方法抽样估计虽然也是利用样本数据推断总体数量特征,但由于样本数据和总体数量特征之间并不存在严格对应的自变量和因变量的关系,因此不可能运用数学函数关系建立一定的数学模型,自变量代入样本数据推算因变量的总体特征值。抽样估计在实际工作中,首先抽取一个样本,计算相应的样本指标,然后要解决的问题是用样本指标代替相应的总体指标,计算其可靠程度即概率有多大。这就是概率估计法。(三)抽样估计存在抽样误差抽样误差总是和抽样估计的可靠程度联系在一起的。上一页下一页返回第三节抽样估计抽样误差和抽样估计的可靠程度即概率的关系是:允许的误差范围越大,概率保证程度也越大;反之,允许误差范围越小,概率保证程度也越小。二、抽样估计的优良标准用样本指标估计总体指标,我们总希望估计得好一点,但应该满足什么要求呢?一般有三个要求或标准,满足了这三个要求就可以认为是合格的优良的估计。(一)无偏性无偏性的直观意义是没有系统性误差,无偏性要求用样本指标估计总体指标时达到:抽样指标的平均数等于被估计的总体指标。上一页下一页返回第三节抽样估计数理统计可以证明,样本平均数的平均数等于总体平均数,即x=X;样本成数的平均数等于总体成数,即p=P,所以,样本平均数x和样本成数p是总体平均数和总体成数的无偏估计量。另外,数理统计证明,样本方差s2不是总体方差σ2的无偏估计量,样本修正方差s2n-1才是总体方差σ2的无偏估计量。在样本容量n不大时,应用s2n-1估计σ2更为准确。当n很大时,因为n-1≈n,所以也可用s2估计σ2。(二)一致性一致性又称为相合性。它要求用样本指标估计总体指标时要达到:当样本容量n充分大时,样本指标充分靠近总体指标,即随着n的无限增大,样本指标与未知的总量指标之间的绝对离差任意小的可能性趋于实际。数理统计证明样本平均数和样本成数都满足这个条件。上一页下一页返回第三节抽样估计(三)有效性有效性要求样本指标估计总体指标时,作为估计量的方差比其他估计量的方差小。数理统计证明样本平均数更靠近总体平均数,样本成数也满足这个条件。总之,样本平均数和样本成数估计总体平均数和总体成数均能满足优良估计的三条标准。三、参数估计的精度、置信度(一)参数估计的精度由于根据实际调查的样本指标的具体数值估计相应的总体指标做到完全没有误差,实在是难以完成的,因此在进行抽样估计时总要计算误差率和提出估计精度的要求,以便作为评价估计好坏的标准。上一页下一页返回第三节抽样估计(二)参数估计的置信度我们已经学习了确定允许的抽样误差范围,但抽样调查的结果、样本指标的估计值并非都能够落在允许的误差范围。由于抽样指标值随着样本的变动而变动,它本身是个随机变量,因而抽样指标与总体指标的误差仍然是个随机变量,并不能保证误差不超过一定的范围,而只能给以一定程度的概率保证F(t)。抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度F(t)。所谓概率F(t),就是指在随机事件进行大量试验中,某种事件出现的可能性大小,通常可以用某种事件出现的频率表示。上一页下一页返回第三节抽样估计参数估计的概率保证程度F(t)就是指抽样误差不超过一定范围的概率大小。四、抽样估计方法参数估计有点估计和区间估计两种方法。上一页返回第四节必要样本单位数的确定一、样本单位数的确定科学地组织抽样调查,保证随机抽样条件的实现,并合理有效地取得各项数据,是抽样设计中一个至关重要的问题。首先,在抽样设计中,要保证随机原则的实现。随机抽样是抽样推断的前提,失去这个前提,抽样推断的理论和方法也就失去了存在的意义。从理论上说,随机原则就是保证总体中的每一个单位都有同等的中选机会。但在实践中,要保证这个原则的实现,就需要考虑许多因素和可能采用的方法。其次,样本单位数究竟多大才算适度?例如在民意测验中,一般要调查多少人才能反映全国十几亿人口的态度和意见;下一页返回第四节必要样本单位数的确定商家需要调查多少消费者才能了解人们对于该商店所提供服务的满意程度等。样本单位数太大会增加调查费用,造成不必要的浪费;样本单位数太少又不能有效地反映真实情况,直接影响推断的效果。因此,在抽样设计中应该重视研究现象变异程度、估计误差的要求和样本单位数之间的关系,做出科学的抉择。最后,要认识到不同的抽样组织形式,会有不同的抽样误差,因而推断的效果也是不同的。一种科学的组织形式应该是以尽可能少的样本单位数取得尽可能好的推断效果。因此,抽样设计必须选择合适的组织形式,并对所用形式的抽样误差做出正确的估计,进一步和其他组织形式的抽样误差进行对比,做出必要的效果分析。上一页下一页返回第四节必要样本单位数的确定在抽样设计中还必须重视调查费用这个基本因素。实际上,任何一项抽样调查都是在一定费用的限制下进行的。抽样设计应该力求采用调查费用最省的方案。一般地说,提高精确度的要求与节省费用的要求往往是矛盾的,抽样误差要求越小,调查费用需要越多。因此,抽样误差最小的方案并非是最好的方案,在许多情况下,一定范围的误差仍能够满足分析的要求。我们的任务就是在允许的误差要求下,选择费用最少的抽样设计方案。(一)根据平均数的抽样极限误差确定样本单位数影响抽样误差的因素之一,是样本单位数的多少。在抽样调查中,事先确定必要的样本单位数,是一项重要的工作。由于样本单位数n是抽样极限误差公式的组成部分,所以可以根据抽样极限误差公式推导出样本单位数。上一页下一页返回第四节必要样本单位数的确定以简单随机抽样为例,测定总体平均数所必要的样本单位数n。(二)根据成均数的抽样极限误差确定样本单位数样本单位数是指在抽样误差不超过预先规定的数值,即满足抽样极限误差小于或等于△的条件下,至少应抽取的样本单位数。(三)确定必要样本单位数应注意的问题在确定必要样本单位数的过程中,可能会遇到一些应用性问题,主要应注意以下三个方面:(1)总体指标未知的问题。当公式中涉及总体标准差与总体成数资料时,一般可利用以前的经验数据或样本数据来代替。当遇到有不止一个的经验数据或样本数据时,宜选择最大的一个。上一页下一页返回第四节必要样本单位数的确定若总体成数未知,可选取使成数方差达到最大(0.25)或接近最大的P值代入。(2)估计对象导致数目不相等的问题。当对同一资料既要估计平均数又要估计成数时,若这两种估计所求的必要样本单位数可能不相等,则应选择其中样本单位数较大的进行抽样,以保证抽样推断的精确性和可靠性。(3)抽样方式导致数目不相等的问题。按重复抽样公式计算的必要样本单位数要比按不重复抽样公式确定的必要样本单位数大。在条件允许的情况下,为保证抽样推断的精确度和可靠程度,原则上,一切抽样调查在计算必要样本单位数时,都可采用重复抽样公式计算。上一页下一页返回第四节必要样本单位数的确定二、影响样本单位数的因素影响样本单位数的因素主要有以下三个。(一)总体标准差在其他条件不变的情况下,总体标准差与样本单位数成正比。总体标准差大,说明总体差异程度高,总体各单位标志值较平均数的离散程度高,则样本单位数多;反之,总体标准差小,则样本单位数少。(二)抽样极限误差在其他条件不变的情况下,抽样极限误差与样本单位数成反比。如果允许的误差范围越大,对抽样估计的精确度要求越低,则样本单位数越少;上一页下一页返回第四节必要样本单位数的确定反之,若允许的误差范围越小,对精确度的要求越高,则样本单位数越多。(三)抽样方法及抽样的组织形式抽样方法和抽样组织形式不同,样本单位数的多少也不同。在其他条件不变的情况下,重复抽样条件下的样本单位数多于不重复抽样条件下的样本单位数;在适宜的条件下,类型抽样比简单重复抽样的样本单位数少。此外,样本单位数的多少,一方面要考虑耗费的人力、财力、物力和时间条件的允许;另一方面要考虑能否达到研究的预期目的。一般而言,样本单位数越多,抽样误差越小,样本的代表性越大。上一页下一页返回第四节必要样本单位数的确定但是,样本单位数越多,耗费的人力、物力、财力和时间也越多,从而又导致研究结果的时效性差。因此,在确定样本单位数时,还要考虑到这个方面的需要与可能。上一页返回第五节抽样的组织形式一、简单随机抽样简单随机抽样又称纯随机抽样。它对总体中的所有单位不进行任何分组、排队,而是完全随机地直接从总体N个单位中抽取n个单位作为一个样本进行调查,在抽样中保证总体中每个单位都有同等被抽中的机会。简单随机抽样是抽样中最基本、最单纯的组织形式,适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分,使总体的各个部分都是同等分布的。获得简单随机样本的具体方法主要有抽签法和查随机数表法两种。下一页返回第五节抽样的组织形式二、类型抽样(一)类型抽样的概念和特点类型抽样亦称分类抽样或分层抽样。它是先将总体各单位按主要相关标志分组(或分类),然后在各组(或各类)中再按随机原则抽取样本单位的组织形式。例如,在进行城市职工家庭旅游消费支出抽样调查时,首先把职工按所属国民经济部门分类,然后再在各部门中抽取若干个调查户;再如,进行星级宾馆入住情况调查时,先将各宾馆按星级标准分为五星、四星、三星、二星和一星五类,然后再在各类宾馆中抽取若干个调查单位。设总体由N个单位组成,把总体划分为K组,使N=N1+N2+…+NK。上一页下一页返回第五节抽样的组织形式然后从每组的Ni中抽取ni单位构成样本容量为n的抽样总体,使n=n1+n2+…+ni。这种抽样方法称为类型抽样。类型抽样实质上是分组法和抽样原理结合运用。先将全及总体出性质不同的各个组,以减少组内标志值之间的变异程度;然后按照随机原则,从各组中抽取调查单位。此方法可以避免标志值比较接近的单位同时被抽中,使样本单位的分布更接近总体分布。这样,可以提高样本的代表性。类型抽样对每个组都要抽取样本单位,因此对于所有组来说,实际上是全面调查。所以,类型抽样所抽取的样本代表性较高,抽样误差小,能够以较少的样本单位数获得比较准确的推断结果。特别是当总体各单位标志值相差很大,各组间标志值变异程度很大时,类型抽样则更为优越。上一页下一页返回第五节抽样的组织形式类型抽样的特点是,样本单位数不是从整个总体,而是从各类中分别抽取,且彼此独立。(二)类型抽样的方法类型抽样的样本单位数在各组之间的分配一般有不等比例抽样和等比例抽样两种方法。1.不等比例抽样不等比例抽样即各类型组所抽取的单位数,按各类型组标志值的变异程度确定,变异程度大则多抽一些单位,变异程度小则少抽一些单位。各组的抽样比例与对应的总体中各组单位数所占的比例是不相等的。这种方法又称为类型适宜抽样或称一般抽样。上一页下一页返回第五节抽样的组织形式2.等比例抽样等比例抽样即按各类型组的单位数占总体单位数的比重进行抽样。在实际工作中,由于事先很难了解各组的标志变异程度,因此大多数类型抽样采用等比例抽样法。(三)类型抽样的抽样误差的计算以等比例抽样中的重复抽样为例,先求各类的方差σ2,然后以其加权算术平均数作为总体方差。三、等距抽样(一)等距抽样的概念和特点等距抽样亦称机械抽样或系统抽样。它是先把总体各单位按照某一标志排队,然后按相等的距离抽取样本单位的组织形式。上一页下一页返回第五节抽样的组织形式设总体单位数为N,样本容量为n,且Nn=K,把依次排列的每K个总体单位称为一个“抽样间隔”。抽取的方法是在第一抽样间隔,即第1至第k个总体单位中,随机抽取一个单位作为起点,假定为第i个单位。然后依次每隔k个单位抽取一个样本,于是得:i,i+k,i+2k,…,i+(n-1)k共n个单位组成样本。(二)等距抽样的方法按照总体单位的排列顺序,等距抽样可分为无序等距抽样和有序等距抽样。上一页下一页返回第五节抽样的组织形式如果总体单位的排列顺序与所要调查的主要标志无关,则称为无序等距抽样。如居民家庭生活调查中,将居民按姓氏笔画、人名册、户口簿及按地图上的地理位置排列,而居民的生活水平,是与姓氏笔画无关的。又如,在产品质量的抽样检查中,每隔一定时间抽取一次产品,而产品质量通常是与时间无关的。在无序等距抽样中,虽然当第一个样本确定后,整个样本便随之确定,但由于总体单位的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 长春中医药大学《融合新闻学》2025-2026学年期末试卷
- 120米烟囱施工组织设计
- 2024年高中学生的班主任评语(共13篇)
- 2024年质检员考试题库
- 2024年管理人员发言稿
- 2024年高考语文仿真模拟试卷
- 安康吊装房施工方案(3篇)
- 山东工业照明施工方案(3篇)
- 批发化肥营销方案(3篇)
- 施工方案及培训讲解(3篇)
- 正念减压疗法详解课件
- 22G101 三维彩色立体图集
- 盘扣式脚手架监理实施细则
- 白鹤滩500千伏配套工程温升改造工程对四川螺髻山省级自然保护区影响评价报告
- 烟草、烟草种子及烟草制品 DNA 鉴别检测方法技术报告
- (高清版)WST 311-2023 医院隔离技术标准
- 外科学教学课件:颈、腰椎退行性疾病
- JCT 871-2023 镀银玻璃镜 (正式版)
- 新生儿危重患者的抢救配合课件
- 2024年山东省青岛海检集团有限公司招聘笔试参考题库含答案解析
- 石油化工行业新工艺、新技术与新产品
评论
0/150
提交评论