版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目七抽样推断任务一抽样推断概述任务二抽样误差任务三抽样推断的方法任务四抽样的组织形式返回任务一抽样推断概述一、抽样推断的意义1.抽样推断的概念抽样推断是根据随机原则,从调查总体中抽取部分单位组成样本进行调查,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。2.抽样推断的特点抽样推断的特点归纳起来有以下几点:第一,抽样推断是一种由部分推算整体的研究方法。第二,抽样推断建立在随机抽样的基础上。第三,抽样推断运用概率估计的方法。下一页返回任务一抽样推断概述第四,抽样推断的误差可以事先计算并加以控制。3.抽样推断的作用随着抽样理论和技术的不断发展,抽样推断发挥着日益重要的作用,具体表现在以下几个方面:(1)对那些不可能进行全面调查或很难进行全面调查的问题,应该采用抽样推断的方法。(2)对那些不便于、不需要采用全面调查的问题可以采用抽样推断的方法。(3)抽样推断可以用来检验和修正全面调查资料。(4)抽样推断方法可以用于工业生产过程中的质量控制。上一页下一页返回任务一抽样推断概述(5)利用抽样推断的方法,可以对某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。总之,抽样推断是一种科学实用的统计方法,在自然科学与社会科学领域都有着广泛的应用。二、抽样推断的内容抽样推断的目的并不在于了解样本的数量特征,而是借助样本的数量特征,来估计和检验总体分布的数量特征及某些未知因素。抽样推断的主要内容包括两个方面:参数估计和假设检验。两者的基础是共同的,即都是利用样本观察值所提供的信息,对总体做出估计或判断,但两者应用的角度有所不同,解决问题的着重点也有所区别。上一页下一页返回任务一抽样推断概述1.参数估计根据所获得的样本资料,对所研究现象总体的数量特征(如总体的水平、结构、规模等数量特征)进行估计,这种推断方法称为总体参数的估计。总体参数的估计是统计推断的中心内容,其基本思想是对不同的估计问题构造不同的函数,来反映部分单位与总体之间的主要关系信息,并舍弃无关的次要部分,利用其主要关系来对总体做出推算和分析。由于社会经济统计在绝大多数场合都要求对总体的各项综合指标做出客观的估计,而参数估计恰好能满足这一方面的要求,所以参数估计推断方法在实际工作中被广泛采用。上一页下一页返回任务一抽样推断概述参数估计包括许多内容:如确定估计值,确定估计的优良标准并加以判别,求估计值和被估计参数之间的误差范围,计算在一定误差范围内所作推断的可靠程度,等等。2.假设检验假设检验是指根据经验或不成熟的认识,在对总体的有关分布函数、分布参数或数字特征等信息做出某种假设的前提下,为了确定该假设的正确性,而从总体中随机抽取部分单位,利用部分与总体之间的关系来对所提出的假设做出判断,以决定是否接受该假设的过程。三、抽样推断中的基本概念1.全及总体和样本总体上一页下一页返回任务一抽样推断概述全及总体又称母体,简称总体,它是指所要认识的、具有某种共同性质的许多单位的集合体。全及总体的单位数反映为总体容量,用符号N来表示。样本总体又称子样,简称样本,是指从全及总体中按照随机原则抽取一部分单位构成的集合体。样本总体的单位数称为样本容量,通常用小写英文字母n来表示。根据样本容量n的多少,可以划分大样本和小样本。当n≥30时,称为大样本,在社会经济现象的抽样调查中,绝大多数采取大样本;当n<30时,称为小样本。样本总体的单位数远比全及总体的单位数少,n/N称为抽样比例,通常是一个很小的数,要根据被研究对象的性质和具体的任务来确定抽样比例。上一页下一页返回任务一抽样推断概述随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数越接近总体平均数。如果说对于一次抽样调查,全及总体是唯一确定的,那么样本总体就不是这样。样本是不确定的,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。2.变量总体和属性总体根据研究内容不同,总体有变量总体和属性总体之分。如果每一个总体单位就所研究的标志可以取不同的量,则此时的研究总体称为变量总体。如果有些现象总体就所研究的标志只表现为两种性质上的差异.上一页下一页返回任务一抽样推断概述3.全及指标和样本指标(1)全及指标。无论对于总体还是样本都可以使用平均数、中位数、众数与标准差等量来描述它们的特征。在统计学中,当用它们来描述总体的特征时,称为全及指标。由于全及总体是唯一确定的,因此全及指标的数值是确定的,也是唯一的,它反映总体的某种属性或特征,也称为总体参数。参数是总体的数量特征。对于某个总体来说,其参数是定值。但是在某一实际问题中,总体参数通常是未知的,这就需要通过样本数据所提供的总体的有关信息对参数进行推断。上一页下一页返回任务一抽样推断概述一个总体常常有多个参数,这些参数从各个不同的角度反映总体分布的基本情况和特征。通常人们最关心的就是表示总体分布集中趋势和离散趋势的两个参数,即总体的均值、方差和标准差。总体参数由于标志的性质不同计算方法也不同。①在变量总体条件下:平均数:或上一页下一页返回任务一抽样推断概述方差:或标准差:②在属性总体条件下:上一页下一页返回任务一抽样推断概述对于总体中的属性标志,由于各单位标志表现不能用数量来表示,因此总体参数常以成数P来表示总体中具有某种性质的单位数在总体全部单位数中所占的比重,以Q表示总体中不具有某种性质的单位数在总体中所占的比重。设在N个单位中,具有某种属性的总体单位数为N1,不具有某种属性的总体单位数为N0,N1+N0=N,则有:(2)样本指标。上一页下一页返回任务一抽样推断概述根据样本总体各单位标志值或属性特征计算的指标称为样本指标,也称样本统计量。由于样本是随机变量,而统计量是样本变量的函数,所以统计量也是随机变量。统计量与总体参数相对应,有样本平均数(或样本成数)、样本标准差(或样本方差)。统计量一方面表示样本本身的分布状况和特征,另一方面也是总体参数的估计量。①在变量总体条件下:平均数:或上一页下一页返回任务一抽样推断概述方差:或标准差:或上一页下一页返回任务一抽样推断概述②在属性总体条件下:由于样本各单位的标志表现不能用数量表示,因此样本统计量通常以成数p来表示样本中具有某种性质的单位数在样本单位数中所占的比重,以q表示样本中不具有某种性质的单位数在样本中所占的比重。设在样本n个单位中,具有某种属性的样本单位数为n1,不具有某种属性的样本单位数为n0,n1+n0=n,则有:现将上述基本概念及其代表符号归纳于表7-1。上一页下一页返回任务一抽样推断概述4.重复抽样和不重复抽样从抽样方法来看,抽样可以有重复抽样和不重复抽样两种。(1)重复抽样。重复抽样是指从总体N个单位中,随机抽取一个样本,登记之后又放回总体,第二次再从全部N个单位中抽取第二个样本,登记之后再放回去,依此类推,直到抽够样本容量n为止。因此,重复抽样的样本是由n次相互独立的连续试验构成的,每次试验在完全相同的条件下进行,每个单位中选的机会在各次都完全相等。可见,在重复抽样时:①总体单位数在抽选过程中始终不变;上一页下一页返回任务一抽样推断概述②总体中各单位被抽中的可能性前后相同;③总体中各单位有被重复抽中的可能。(2)不重复抽样。不重复抽样是从总体N个单位中,随机抽取一个样本,登记之后不再放回总体,而是从剩下的总体单位(N-1)中抽取第二个样本,依此类推,最后从剩下的(N-n+1)个单位中抽取第n个样本数为止。因此,不重复抽样的样本也由n次连续抽选的结果构成,但连续n次抽选的结果不是相互独立的,每次抽取的结果都影响下一次抽取,因而每个单位的中选机会在各次是不相同的。上一页下一页返回任务一抽样推断概述在不重复抽样时:①总体单位数在抽选过程中逐渐减少;②总体中各单位被抽中的可能性前后不断变化;③总体中各单位没有被重复抽中的可能。四、抽样推断的理论基础从数量方法来说,抽样推断是以概率论的基本理论之一的极限定理为基础的,极限定理是指采用极限的方法得出随机变量概率分布一系列定理的总称,内容广泛,其中的大数定律和中心极限定理为抽样推断提供了主要的数学依据。上一页下一页返回任务一抽样推断概述1.大数定律大数定律也叫大数法则,它是阐明大量随机现象平均结果稳定性的一系列定理的总称。它说明:如果被研究的总体由大量的相互独立的随机因素构成,而且每个因素对总体的影响都相对的小,那么对这些大量因素加以综合平均的结果,因素的个别影响将相互抵消,而呈现出其共同作用的影响,使总体具有稳定的性质。2.中心极限定理在社会经济现象中,有些随机变量表现为大量独立的随机变量之和。中心极限定理是指在一定条件下,大量相互独立的随机现象的概率分布以正态分布为极限的定理,即研究随机变量之和在什么条件下渐近地服从正态分布。上一页下一页返回任务一抽样推断概述因正态分布在概率论中占有中心地位,所以把以正态分布为极限的定理叫作中心极限定理。中心极限定理是大样本统计推断的理论基础。样本平均数也是一种随机变量之和的分布,根据中心极限定理,只要在样本容量n充分大时,不论全及总体的变量分布是否属于正态分布,其抽样平均数总趋近于正态分布,这就为抽样推断提供了重要的理论依据。上一页返回任务二抽样误差一、抽样误差的概念1.抽样误差的概念及种类抽样误差是指由于随机抽样的偶然因素使样本结构不足以代表总体结构而引起的抽样指标与全及指标之间的离差,具体表现为样本平均数与总体平均数的绝对离差、样本成数与总体成数之间的绝对离差等。在统计调查过程中所得出的统计数字与客观实际数量之间存在一定的差别,统称为统计误差。由于造成统计误差的原因不同,它可以分为登记性误差和代表性误差。登记性误差是指在调查过程中,由于主客观原因的影响而引起的诸如测量错误、记录错误、计算错误、抄录错误以及被调查者所报不实、遗漏或重复调查等原因而造成的误差。下一页返回任务二抽样误差在一切调查中,都可能产生登记性误差。登记性误差可以通过提高调查人员的思想素质和业务水平,改进调查方法和组织工作,建立严格的工作责任制加以避免,使这类误差降到最低限度。代表性误差是由于样本各单位的结构不足以代表总体而引起的误差。代表性误差的发生有两种情况:一种是由于违反抽样调查的随机原则,如有意多选较好的单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然会出现偏高或偏低的现象,造成系统性误差。系统性误差和登记性误差都属于思想、作风、技术问题,可以防止和避免,也可以采取措施将其减小到最小限度。另一种情况是,即使遵守随机原则,但由于调查范围的非全面性及样本的随机性而产生的样本指标与总体指标之间的误差。上一页下一页返回任务二抽样误差抽样误差就是指这种偶然性的代表性误差,也称为随机误差。抽样误差是抽样调查所固有的,无法避免与消除,但可以运用数学方法计算其数量界限,并通过抽样设计程序控制其范围。用抽样指标来估计全及指标是否可行,关键问题在于抽样误差。抽样误差的大小表明抽样效果的好坏,如果误差超过了允许的限度,抽样调查也就失去了意义。2.抽样误差的影响因素(1)样本单位数的多少。(2)总体被研究标志的变异程度。(3)抽样方法。上一页下一页返回任务二抽样误差(4)抽样调查的组织形式。二、抽样平均误差1.抽样平均误差的含义抽样平均误差就是样本平均数或样本成数的标准差,它反映样本平均数(或样本成数)与总体平均数(或总体成数)的平均误差程度,通常用μ表示。由于样本是按随机原则抽取的,故在同一总体中,按相同的抽样数目,可以抽出许多样本,而每次抽出的样本都可以计算出相应的样本平均数、样本成数和抽样误差。上一页下一页返回任务二抽样误差也就是说,理论上可以计算出很多个抽样误差,它们带有偶然性,有的可能是正误差,有的可能是负误差,有的绝对值可能大些,有的绝对值可能小些。为了用样本指标去推算总体指标,就需要计算这些抽样误差的平均数,这就是抽样平均误差,用以反映抽样误差的一般水平。抽样的组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样及多阶段抽样等,不同的抽样组织形式,计算抽样平均误差的方法也不同。2.抽样平均误差的计算上一页下一页返回任务二抽样误差设以μx表示抽样平均数的抽样平均误差,μp表示抽样成数的抽样平均误差,M表示样本的可能数目,则:数理统计证明,抽样平均误差和全及总体的标准差之间有密切关系,并能够推导出计算抽样平均误差的公式。(1)抽样平均数的抽样平均误差。上一页下一页返回任务二抽样误差①重复抽样:在重复抽样的条件下,抽样平均数的平均误差与总体的变异程度和样本容量大小两个因素有关。它们的具体关系如下:②不重复抽样:在不重复抽样条件下,抽样平均数的平均误差不但与总体的变异程度、样本容量有关,而且与总体单位数的多少有关。它们的关系如下:上一页下一页返回任务二抽样误差实际中常用以下几种办法解决这个问题:第一,用历史资料代替。如果历史上做过同类型的全面调查或抽样调查,就用过去所掌握的总体标准差或样本标准差。第二,用样本标准差代替总体标准差,即用s代替σ。只要抽样总体分布接近总体分布,样本标准差就相当接近总体标准差,不过样本标准差只能在抽样调查之后方能计算。第三,进行试验性抽样,取得估计材料。如果既没有历史资料,又需要在调查之前就计算抽样平均误差,则可组织一次小规模的试验性抽样调查,计算出抽样标准差作为总体标准差的估计值。上一页下一页返回任务二抽样误差(2)抽样成数的抽样平均误差。抽样成数的平均误差表明各样本成数和总体成数绝对离差的一般水平。由于总体成数可以表现为总体是非标志(0,1)分布的平均数,而且它的标准差也可以从总体成数推算出来,前面已论证过:因此,从抽样平均数的抽样平均误差和总体标准差的关系中很容易推算出抽样成数平均误差的计算公式。①在重复抽样条件下:上一页下一页返回任务二抽样误差②在不重复抽样条件下:在总体单位数N很大的情况下,μp近似为:三、抽样极限误差1.抽样极限误差的概念抽样极限误差是从另一个角度考虑抽样误差问题。上一页下一页返回任务二抽样误差以样本的抽样指标来估计总体指标,要达到完全准确、毫无误差,几乎是不可能的事情。所以,估计总体指标的同时就必须考虑估计误差的大小。如果误差太大,样本的价值就越小,但也不是误差越小越好,因为在一定限度之后减少抽样误差势必增加很多费用。因此,在进行抽样估计时,应该根据所研究对象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算是有效的。通常把这种可允许的误差范围称为抽样极限误差,它是抽样指标和总体指标之间抽样误差的可能范围。设
分别表示抽样平均数的极限误差和抽样成数的极限误差,则有:上一页下一页返回任务二抽样误差上面等式可以变换为下列的不等式关系:2.抽样极限误差的计算方法基于概率估计的要求,抽样极限误差通常需要以抽样平均误差或μp为标准单位来衡量。把抽样极限误差或Δp分别除以或μp,得相对数t,它表示误差范围为抽样平均误差的若干倍。上一页下一页返回任务二抽样误差t是测量估计可靠程度的一个参数,称为抽样平均误差的概率度。四、抽样估计的置信度从主观上说,人们总希望样本指标的估计值都能够落在允许的误差范围内,但这并非易事。上一页下一页返回任务二抽样误差由于抽样指标值随着样本的变动而变动,它本身是个随机变量,因而抽样指标和总体指标的误差仍然是个随机变量,并不能保证误差必然不超过一定范围,而只能给以一定程度的概率保证。抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度,它是概率度t的函数,通常用F(t)表示。通过《正态分布概率表》便可以查找抽样误差的概率。现在举例说明抽样估计置信度的计算方法。上一页返回任务三抽样推断的方法抽样推断就是利用实际调查计算的样本指标值来估计相应的总体指标的数值。由于总体指标是表明总体数量特征的参数,所以抽样推断也称为参数估计。总体参数估计有点估计和区间估计两种,以下分别加以介绍。一、总体参数点估计1.点估计点估计也叫定值估计,其基本特点是,根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值作为相应总体参数的估计值。2.抽样估计的优良估计标准下一页返回任务三抽样推断的方法要估计总体指标,并非只能用一个样本指标,而可能有多个样本指标可供选择,即对于同一总体参数可能会有不同的估计量,究竟其中哪个估计量是总体参数的最优估计量呢?评价估计量的优劣常用以下三个标准:(1)无偏性。无偏性即以抽样指标估计总体指标时要求抽样指标值的平均数等于被估计的总体指标值本身。这就是说,虽然每一次的抽样指标和总体指标值之间都可能有误差,但在多次反复的估计中,各个抽样指标值的平均数应该等于所估计的总体指标值本身,即抽样指标的估计,平均来说是没有偏误的。上一页下一页返回任务三抽样推断的方法(2)一致性。一致性也称相合性,是指以抽样指标估计总体指标时要求当样本的单位数充分大时,抽样指标也充分地靠近总体指标。这就是说,随着样本单位数n的无限增加,抽样指标和未知的总体指标之差的绝对值小于任意小的数,它的可能性也趋近于必然性。(3)有效性。有效性即以抽样指标估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。点估计的方法简便易行,原理直观,常为实际工作所采用。但不足之处是没有表明抽样估计的误差,更没有表明误差在一定范围内的概率保证程度有多大。要解决这个问题,就必须采用区间估计方法。上一页下一页返回任务三抽样推断的方法二、区间估计1.区间估计的概念区间估计是以一定的概率保证,根据样本指标估计总体指标的可能范围的一种估计方法。由于点估计量与总体的未知参数并不完全相等,故它们之间必然存在着一定的误差,并且不能确知误差的大小、估计精度的高低,以及估计的可信程度等信息。为此,统计区间估计将考虑这些因素,即根据样本统计量及估计的可能误差,找出在一定保证程度下的估计区间。由此可见,总体参数的区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素。上一页下一页返回任务三抽样推断的方法通俗地理解,抽样误差范围Δ表示区间估计范围的大小,决定估计的准确性。区间范围大,说明估计精度低;区间范围小,说明估计精度高。t决定区间估计的可靠程度F(t),t值大表示估计的可靠程度高;t值小表示估计的可靠程度低。因此,当抽样平均误差μ一定时,随着区间估计可靠程度的提高,t值越来越大,而估计的区间范围也随之增大,则估计的精度随之降低;反之,随着区间估计可靠程度的降低,t值越来越小,而估计的区间范围也随之缩小,则估计的精度随之提高。所以,对于一个样本,提高了估计准确性的要求,伴随的必然降低了估计的可靠性;同样,提高了估计可靠性的要求,也必然降低了估计的准确性。上一页下一页返回任务三抽样推断的方法区间估计的可靠程度和精度之间是矛盾的,因此在抽样估计的时候,只能对其中的一个提出要求,以推求另一个要素的变动情况。2.区间估计的模式总体参数的区间估计根据所给定的条件不同,总体平均数和总体成数有两种估计方法。下面分别举例说明。(1)在允许误差条件下的区间估计模式。第一步,抽取样本,计算抽样指标,如计算抽样平均数x或抽样成数p作为相应总体指标的估计值,并计算样本标准差s以推算抽样平均误差。上一页下一页返回任务三抽样推断的方法第二步,根据给定的抽样极限误差范围Δ,估计总体指标的上限和下限。第三步,将抽样极限误差Δ除以抽样平均误差μ,求出概率度t,再根据t值查《正态分布概率表》求出相应的概率保证程度F(t),并对总体参数做区间估计。(2)在概率保证程度下的区间估计模式。第一步,抽取样本,计算抽样指标,如计算抽样平均数x和抽样成数p,作为总体指标的估计值,并计算样本标准差s以推算抽样平均误差。第二步,根据给定的置信度F(t)的要求,查正态分布概率表求得概率度t值。上一页下一页返回任务三抽样推断的方法第三步,根据概率度t和抽样平均误差μ推算抽样极限误差Δ,并根据抽样极限误差求出被估计总体指标的上下限。3.区间估计与点估计的区别(1)区间估计不像点估计那样用一个数值对总体指标进行估计,而是用一个范围对总体指标进行估计。(2)点估计是一个确切的估计值;而区间估计是区间,根据概率度的要求可宽可窄。(3)点估计无法回答估计值的把握程度;而区间估计可以回答估计区间的把握程度。上一页下一页返回任务三抽样推断的方法三、必要抽样数目的确定1.确定必要抽样数目的意义和原则必要抽样数目是指为了完成抽样调查任务,满足抽样调查的各项要求而科学计算的需要抽取的样本单位数,即样本单位数“n”的具体数值。抽样推断的目的是用样本资料推断总体。抽样推断的基础是样本,而样本是按随机原则从全及总体中抽取一部分单位来组成的集合体。在遵从随机原则的条件下,样本容量究竟应该多大才合适呢?这是抽样调查中的一个至关重要的问题。上一页下一页返回任务三抽样推断的方法抽样单位数目太多会增加抽样组织的困难,造成人力、物力的浪费;抽样单位数目太少又会使误差增大,不能有效地反映总体情况,直接影响到抽样推断结果的准确性。其次,抽样推断的一个重要方面则是要求推断的结果能满足在一定可靠性的条件下,保证抽样误差不超过事先规定的范围。当可靠性要求已确定时,抽样误差的控制尤为重要。抽样单位数目是影响抽样误差大小的重要因素,在其他条件相同时,可以用增加或减少抽样单位数目的方法来控制抽样误差的大小,以达到用最合适的抽样单位数满足抽样调查任务的要求。如何确定必要的抽样单位数n,是抽样设计中必须考虑的问题。一般原则是在保证达到预期的可靠程度和精度的要求下,抽取必要的抽样单位数。上一页下一页返回任务三抽样推断的方法2.影响必要抽样数目的因素(1)总体各单位间的标志变异程度。总体方差越大,总体各单位的标志值相对比较分散,在其他条件不变的情况下,为了提高样本的代表性,就要多抽一些样本单位。当总体单位标志值相对比较集中时,就可以少抽一些单位。(2)抽样极限误差的大小。抽样极限误差增大,意味着推断的精确性要求降低,在其他条件不变的情况下,可以少抽些样本单位;反之,缩小抽样极限误差,就要增加必要的抽样数目。(3)调查结果的概率保证程度。上一页下一页返回任务三抽样推断的方法在其他条件不变的情况下,对调查结果的概率保证程度要求越高,必要抽样数目应当越多;相反,概率保证程度要求越低,必要抽样数目相对可以少些。(4)抽取样本单位的方法。在其他条件不变的情况下,抽取样本的方法不同,必要抽样数目也就不同。一般地讲,在同样的条件下,重复抽样比不重复抽样所需要的样本单位数要多些。不过,总体单位数N很大时,二者的差异很小。所以为简便起见,实际中当总体单位数很大时,一般都按重复抽样公式计算必要的抽样数目。此外,必要的抽样数目还要受抽样组织方式的影响。上一页下一页返回任务三抽样推断的方法由于不同的抽样组织方式有不同的抽样误差,所以,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同。以下介绍的公式是简单随机抽样下确定必要抽样数目的公式,其他抽样组织方式下必要抽样数目的计算公式也可根据相应的误差公式来推导。3.必要抽样数目的计算公式(1)变量总体条件下的计算公式。①重复抽样:由于,且
,得:上一页下一页返回任务三抽样推断的方法②不重复抽样:由于,且,得:(2)属性总体条件下的计算公式。①重复抽样:由于Δp=tμp,且,得上一页下一页返回任务三抽样推断的方法4.确定必要抽样数目应该注意的问题以上公式中的各因素一般都是在调查之前预先确定的,因此计算的必要抽样数目仅仅是一个参考数据,还需要结合实际情况和调查经验,适当调整必要抽样数目。在确定必要抽样数目时应注意以下几个问题:(1)必要抽样数目应大于30。(2)在同样条件下,不重复抽样比重复抽样要求的抽样单位数目少。(3)实际调查时可对计算的必要抽样数目进行调整。上一页下一页返回任务三抽样推断的方法(4)当总体单位数不大时,如果采用不重复抽样的方法抽取样本,必须运用不重复抽样的计算公式计算必要抽样数目;当总体单位数很大时,虽然采用不重复抽样方法,亦可采用重复抽样的计算公式计算必要抽样数目。(5)当抽样调查是为了检验全面统计数字的质量时,全及总体的标志变异指标σ2或P(1-P)是有实际资料的,可以直接代入公式计算必要抽样数目。(6)如有几个方差可以选用时,宜选择最大数值。对于成数方差P(1-P),如果没有资料时,可取成数方差的最大值0.25。上一页下一页返回任务三抽样推断的方法(7)一个总体往往同时计算抽样平均数和抽样成数。它们的方差和允许误差范围不同,因此,需要的必要抽样数目也不相同。为了防止由于样本单位数不足而扩大抽样误差,在实际工作中往往根据比较大的必要抽样数目进行抽样,以满足共同的需要。上一页返回任务四抽样的组织形式常用的抽样组织形式有简单随机抽样、分层抽样、等距抽样、整群抽样、多阶段抽样等。一、简单随机抽样1.简单随机抽样的概念和特点简单随机抽样又称纯随机抽样,它是不对总体做任何加工整理,按随机原则直接从总体中抽取样本,保证总体中每个单位被抽中的机会都相等的一种抽样方法。简单随机抽样在抽取样本时完全不受主观意志的支配,从理论上说最符合抽样调查的随机原则,是抽样调查的最基本形式。但简单随机抽样必须满足下列两项要求:一是代表性,即要求样本分布与总体分布相同;二是独立性,即要求样本各单位相互独立。下一页返回任务四抽样的组织形式简单随机抽样在实践中的操作方便简单,易于掌握。当总体单位数较少且标志变异程度不大,或具有某种特征的单位均匀地分布在总体各个部分,或对总体了解很少时,适合采用这种组织形式。但如果总体标志变异程度较大时,这种方法所抽的样本可能缺乏代表性,抽样误差就会较大。为减少抽样误差,保证抽样结果的精确性,就需要抽取较多的样本数。所以这种方法在实践中有很大的局限性,如果总体单位的数量较多且分布又分散时,实施起来就很困难。2.简单随机抽样的方法简单随机抽样的具体方法有直接抽选法、抽签法、随机数字表法。(1)直接抽选法。上一页下一页返回任务四抽样的组织形式这种方法就是直接从调查对象中随机抽选。这种方法一般适用于小型总体,对于大型总体很难实施此法。(2)抽签法。它适用于总体单位数较少的总体。首先将总体单位进行编号,通常对总体中的每个单位按自然数的顺序编为1,2,3,…,N,另制N个与总体各单位对应的号签。然后将全部号签充分摇匀,根据需要按重复抽样或不重复抽样方法,从中随机抽取n个号签,与之对应的总体单位,即为抽中的样本单位。在理论上此法简单,但在实践中,对于总体单位数目很多的情况下,编码工作量过大,另外也很难掺和均匀,因此这种方法也有其局限性。上一页下一页返回任务四抽样的组织形式(3)随机数字表法。在大规模的社会经济调查中,由于总体单位数目很大,使用抽签法的工作量相当大,所以通常利用随机数字表来确定样本单位。该表是从0,1,2,3,…,9中,按随机原则编排的数字表,利用随机数字表抽选样本单位。这种方法首先要对总体各单位进行编号,然后在随机数字表中任选一数字开始向任何方向数,遇到属于总体单位编号范围内的数字号码就确定为样本单位,一直到抽够预定的单位数为止。若是不重复抽样,则碰上重复的数字就舍去,并继续往下数。二、分层抽样1.分层抽样的概念上一页下一页返回任务四抽样的组织形式分层抽样又称分类抽样或类型抽样。它是先将总体各单位按照其属性特征分成若干个组(层次或类型),然后在各层或类中按随机原则抽取若干个样本单位,由各层的样本单位组成一个样本。分层抽样的目的在于使样本的构成充分接近总体构成,减小各组内的差异程度,所抽取出的单位对于该层的其他单位有较好的代表性,从而增大样本的代表性。由于各层都有一定的单位选入样本,因此,用较少的单位就可以取得较好的抽样效果。分层抽样的主要原则是:分组时应使组内差异尽可能小,使组间差异尽可能大。该方法最适宜于总体情况比较复杂,各层次或类型之间的差异较大,而总体单位数又较多的情形。上一页下一页返回任务四抽样的组织形式2.分层抽样的特点分层抽样实质上就是统计分组法与随机抽样原理的结合运用,它具有如下特点。(1)能提高样本的代表性。(2)能降低总体方差对抽样误差的影响。3.分层抽样的类型按样本单位在各组中的分配状况,分层抽样可分为以下三种类型。(1)等比例抽样。等比例抽样就是从各层中按相同的比例抽取样本单位数。上一页下一页返回任务四抽样的组织形式样本单位在各层的分配比例同总体单位在各层的分配比例相同,这样可以保证样本的结构与总体的结构保持一致,使样本具有更大的代表性。等比例分层抽样法比较简便,而且抽样误差的计算、总体指标的推断等都比较简单,因此这种方法用得比较多。(2)不等比例抽样。不等比例抽样是从各类型组中按不同的比例抽取样本单位数。当总体中各层的层内方差相差比较大时,为了减少抽样误差,提高样本指标的代表性,对方差较大的组,其抽取的比例可以高一些,抽取的样本单位数应多一些;对方差较小的组,其抽取的比例可以小一些,少抽一些单位。上一页下一页返回任务四抽样的组织形式(3)等数分层抽样法。等数分层抽样法是在每一层中都抽取相同单位的样本数的抽样方法。对于总体中各层的单位数基本相等或差异不大的情形,用这种方法分配样本数比较简单,否则用这种方法所产生的抽样误差就较大。三、等距抽样1.等距抽样的概念和作用等距抽样又称系统抽样或机械抽样。它是先按某一标志对总体各单位进行排队,然后每隔一定的间隔抽取一个样本,直至抽够所要求的样本单位为止。等距抽样的目的是将样本均匀地分布在总体中,以提高样本的代表性。上一页下一页返回任务四抽样的组织形式设总体有N个单位,要抽容量为n的样本,则在一定顺序下抽样距离K=N/n,即把总体分成n段,每隔K个单位抽取一个样本单位。若第一个抽中第一段的I号,则样本顺序号依次是:I,I+K,I+2K,…,I+(n-1)K。等距抽样均为不重复抽样,它的最大优点在于抽样组织形式简便,易于实施。目前,我国在农村经济抽样调查、城市住户抽样调查、人口抽样调查和产品质量抽样检验等方面广泛地采用了等距抽样。另外,在已知总体某些有关信息的情况下,采用等距抽样能保证样本单位在总体中均匀地分布,从而提高了样本对总体的代表性,有利于降低抽样误差。上一页下一页返回任务四抽样的组织形式2.等距抽样的分类总体的排列顺序是针对总体单位的某一标志而言的。等距抽样按照排队时所依据的标志不同,可以有以下两种抽样方法。(1)无关标志排队法。当总体排队时所依据的标志不是所要调查的标志,或者跟所要调查的标志无关或基本无关时,这种排队方法称为无关标志排队法。无关标志排队法可以保证抽样的随机性,实质上相当于简单随机抽样,其具体工作比较简便,所以它是实际工作中常用的一种方法。(2)有关标志排队法。上一页下一页返回任务四抽样的组织形式当总体排队时所依据的标志就是所要调查的标志,或虽不是所要调查的标志,但与所要调查的标志有密切关系或有一定关系时,这种排队方法称为有关标志排队法。在等距抽样中,不管是无关标志排队还是有关标志排队,都要注意避免由抽样间隔与现象本身
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年海上风电平台防海盗措施设计
- 2026年北京市政工职评考试(思想政治工作)综合练习题及答案
- 2025年度北京市职称题库(通信技术)复习题库及答案
- 江苏省张家港市外国语学校2026届高三第一次模拟考试(化学试题含解析)含解析
- 2025年中国编带轻触开关市场调查研究报告
- 2025年中国紫外灯耐气候试验机市场调查研究报告
- 2025年中国磨粉机组市场调查研究报告
- 2025年中国真空吸风烫台市场调查研究报告
- 2025年中国电脑多元素联测分析仪市场调查研究报告
- 2026届湖南省岳阳县一中高三下学期第5周考试化学试题含解析
- 2025宁夏旅游投资集团有限公司招聘16人(第二批)笔试备考题库及答案解析
- 市政管网施工安全培训课件
- 四新安全技能培训内容课件
- 医疗器械生产企业洁净区工作服管理规定
- 物业品质现场培训课件
- 第六单元大单元教学课件(共41张) 2024-2025学年统编版语文七年级下册
- SL3000变频恒压供水控制系统
- 消防设施评估报告范本
- 2025年广东省中考地理试题卷(标准含答案)
- 劳务合同培训课件
- 辽宁省文体旅集团所属企业招聘笔试题库2025
评论
0/150
提交评论