第3章抽样与抽样调查_第1页
第3章抽样与抽样调查_第2页
第3章抽样与抽样调查_第3页
第3章抽样与抽样调查_第4页
第3章抽样与抽样调查_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第三章 抽样与抽样调查抽样调查作为一种现代调查技术,在社会调查研究中有特殊的地位。抽样调查不仅有其他非全面调查省时间与经费的优点,同时又有普查能够了解总体的优点。因而,抽样调查被公认为是一种最完善、最有科学根据的调查方法,在现代社会调查中被越来越广泛地应用。3.1 抽样调查的涵义及原理一、抽样与抽样调查抽样调查为科学研究方法中重要的技术之一,是指按照科学的原理和计算从所要研究的现象的全部分析单位中按随机原则,抽取部分单位进行调查,取得资料后,再根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断的方法。抽样调查旨在以样本的资料来推断调查对象总体的相关统计数据。抽样调查的特点之一:抽取样本时要遵循“随机原则” ,即产生样本时,调查对象总体中的所有单位都有同等被抽中的机会。抽样调查的特点之二:大数规律起作用的条件是样本容量足够大,如此样本对总体才有充分的代表性。抽样调查的特点之三:抽样误差可以事先经过计算而控制在一定范围内,并且能采取一定的组织措施来控制这个误差。二、抽样的术语 抽样单位。在社会调查研究中,分析单位是我们进行信息收集和分析的基本单位。而当我们确定采用抽样调查进行社会调查时,习惯于把分析单位称为抽样单位。 总体。总体就是抽样调查中所有调查对象的集合体,也称母体。总体中含有的分析单位的数目,叫总体规模或总体单位数(一般用英文字母 N 表示) 。 样本。样本是指从总体中抽取出来的那一部分进行调查的分析单位的集合体。样本中含有的分析单位的数目,叫样本容量(一般用英文字母 n 表示) ,也称样本大小。如上例中,500 就是样本容量。 抽样。抽样特指从总体中抽取部分单位(即从总体中获得样本)的过程。 抽样框。抽样框就是抽样单位的具体化的实际名单。 随机原则。随机原则是指抽样时,在完全排除主观上人为选择的前提下,使总体中每一个单位有相同的被抽中的机会。所谓随机原则,也叫机会均等原则(或等概率原则) 。2遵循随机原则的抽样,叫做随机抽样或概率抽样,否则叫做非随机抽样或非概率抽样。 总体参数和样本统计量。总体参数是关于总体中某一变量取值的综合描述,即根据总体中各单位的已知量计算出来的关于总体的统计指标。在抽样调查时,这个量一般是未知的(但是唯一的) 。因为如果这个量已知,就不必进行抽样调查了。样本统计量是关于调查样本中某一变量取值的综合描述,即根据样本中各单位的已知量计算出来的关于样本的统计指标。样本统计量,当抽样调查完成后即可计算出来,但它不具有唯一性。抽样调查就是运用样本统计量去推断总体参数,而这种推断误差总是难免的。 抽样误差。抽样误差是指样本统计量和总体参数之间的差异。随机原则本身就决定概率抽样不可能为总体参数提供一个唯一的估计值,所以用样本统计量去推断总体参数时,误差总是不可会避免的。科学的抽样设计其目的在于尽可能减少这种误差。 置信度和置信区间。置信水平指总体参数值落在样本统计值某一区间的概率,它用于反映样本统计量估计总体参数的可靠性(信度) 。置信区间指在一定置信水平下,样本统计量与总体参数偏差的最大允许范围。三、大数规律那些事先不好确定其结果的现象,被称为随机现象。但是随机现象也是有规律可循的,关键是要大量观察,看少了不行。大数规律是随机现象出现的基本规律,它的一般意义是,尽管观察过程中每次取得的结果不同(因为具有随机性) ,但大量重复观察结果的平均数却几乎接近某个确定的数值。抽样调查的重要意义,就在于用样本统计量来推断总体参数。虽然用前者来推断后者误差总是在所难免。但由于大数规律,只要样本容量足够大,计算出来的样本统计量就和总体参数非常接近。这样一来,总体参数虽然一般是未知的,却可以用样本统计量来推断。这就是抽样调查的魅力所在。3.2 概率抽样一、概率抽样的地位概率抽样是按“随机原则”产生样本的抽样。同为抽样,凡是那些没有严格遵循随机原则的抽样统称为非概率抽样。在抽样调查中,概率抽样最严格,也最有说服力,故据于主导地位。概率抽样又称随机抽样,即在抽样时,母群体中每一个抽样单位被选为样本的机率相同。随机抽样具有健全的统计理论基础,可用机率理论加以解释,是一种客观而科学的抽样方法。 一般而言,概率抽样调查的基本组织形式分为单阶段抽样和多阶段抽样两大类(参见。3单阶段抽样是指只需一次抽样过程,它有以下四种:简单随机抽样、等距抽样、分层抽样、整群抽样。二、简单随机抽样简单随机抽样,又称纯随机抽样,它适用于调查总体内单位不多的情况。简单随机抽样按对抽取到的单位是否回置,可分为回置抽样和不回置抽样。回置抽样是从总体中抽取一个单位,登记后又放回总体中去,然后再抽下一个单位。回置抽样可以保证每一个总体单位有相同被抽到的机会。不回置抽样由于被抽中的单位不回置,总体单位被抽到的机会逐渐有些增加。但不回置抽样操作起来比较方便,且在总体相对于样本规模较大时,其结果与回置抽样的结果差别很小,故平常用得很多。三、等距抽样等距抽样,又称系统抽样。将总体各单位按某种顺序排列、编号,而后从随机选择的第一个单位开始,按照相等的间距抽取样本单位。等距抽样又称为“随机起始的抽样” ,其随机程度没有简单随机抽样的随机程度那样高。但只要总体单位有某种自然顺序,等距抽样做起来比较方便,特别适合用于像生产流水线上抽检产品质量这种情况。四、分层抽样分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。分层抽样的基本步骤是:总体分层层中抽样子样本集合。比如说,我们要在学生中进行抽样时,可以先将学校按大学、中学、小学分层,然后随机抽样在各个层中分别地进行,最后把从各层中抽取的学生合并起来构成总体样本。科学原理业已证明,对于层间差异大,层内差异小的总体,比较适合于用分层抽样。分层抽样相对于简单随机抽样,在相同的调查单位之下,抽样误差较小。分层的具体做法又可以分为分层定比抽样和分层异比抽样。五、整群抽样整群抽样与前几种抽样的最大差别在于,它的抽样单位不是单个的个体,而是成群的个体,所以它并不以抽样框的获得为前提。所谓整群抽样,就是从总体中成群地抽取调查单位。也就是说,要先将总体单位分为若干群,再在其中随机地抽取部分群,最后对抽中所有的单位一一进行调查。分层抽样和整群抽样在适用上的基本差别是:分层抽样时,层间差异尽可能大,层内差异尽可能小;整群抽样时,群间差异尽可能小,群内差异尽可能大。4总的说来,整群抽样的操作、组织便利,当总体庞大时,可以节省调查费用和时间。但是,整群抽样相对于简单随机抽样,在相同的调查单位之下,抽样误差较大。六、多段抽样如果总体过于庞大,在整群抽样的基础上可以发展出一种多段整群抽样。其实,多段抽样并不限于多段整群抽样。在实际工作中,往往可以灵活地把简单随机抽样、系统抽样、分层抽样和整群抽样这几种抽样方法结合起来使用,以解决更复杂的问题。3.3 抽样设计一、抽样设计的一般程序抽样调查实施前必须做抽样设计,抽样设计告诉我们要抽哪些人(或分析单位)以及如何抽。抽样调查的本质是要保证样本对总体的近似,即样本在多大程度上可以代表总体,不同的抽样方法将导致样本对总体不同程度的代表性。因此,设计一个科学合理的抽样方案就显得十分必要。作为整个抽样调查的基础,成功的抽样设计在很大程度上能决定调查的结果。抽样设计的一般程序是: 界定总体; 制定抽样框; 选择抽样方法; 决定样本大小; 实际抽取样本。二、样本的产生样本质量决定了调查研究结论的适用性,以及能否进行推论,所以样本选择是抽样设计中的一个重要环节。如果抽样调查最后得出的结论的适用范围很小,缺乏“共性” ,也就意味着不能用样本有效推断总体,调查在一定程度上就是失败的,对调查过程中的各种资源投入而言也是一种浪费,做无用功。样本的最主要特点是其对总体的近似,即样本在多大程度上可以代表总体。三、样本的大小抽样调查必须在一个科学制订的抽样方案的指导下进行。按国际惯例,判断一个抽样方案的优劣,主要从抽样效果和研究代价这两个因素考虑。为了抽样效果,我们常常希望样本越大越好。可是当我们准备选取大样本时,立即发现这需要大量的人力、物力、财力,所以我们有希望样本能小则小。而抽样的样本容量过小,又势必影响抽样精度,达不到调查目的之要求。由此可见,如果说最优的抽样设计方案应当是在既定调查费用的范围内达到最高精度的抽样方案,或者是在既定要求的抽样精度内所耗费用最少的抽样方案。一般来说,样本大小主要受以下四个因素的影响:(1)样本的代表性要求;(2)总5体的性质,包括总体规模和总体的同一性程度;(3)抽样方法;(4)研究代价,特别是费用。3.4 非概率抽样在社会调查中,除运用概率抽样之外,还运用非概率抽样。非概率抽样更多的建立在调查者对总体有所了解的基础上,是不严格遵循随机原则的抽样调查。用非概率抽样的调查结果来推论总体,其可靠性不能正确估计,所以要十分谨慎。但由于它做起来方便,省时省力省钱,故在探索性研究中常为调查者所使用。非概率抽样不考虑机会均等原则,而根据调查者的主观判断或是否方便等因素来抽取对象,在实践中我们常用以下几种: 偶遇抽样偶遇抽样是对应于简单随机抽样的非随机抽样,又称方便抽样、便利抽样。偶遇抽样要求调查者根据实际情况,以自己方便的形式遇到谁就调查谁,即在样本的选择只考虑到接近样本或衡量便利,离得最近的、最容易找到的人就是调查对象。对于偶遇抽样,样本是随便产生的,而不是随机产生的,所以它是否是总体的近似不好判断。 判断抽样判断抽样又称立意抽样,是调查者根据研究目的和自己主观经验,来选择和确定调查对象的一种方法。 配额抽样配额抽样是对应于分层抽样的非随机抽样。与分层抽样不同之处在于,配额抽样将预定的样本容量按各层单位在总体中的比例分配到各层,然后按这些比例从各层中非随机地抽取样本。配额抽样要预先精确了解总体的结构比例特征。 滚雪球抽样滚雪球抽样指利用随机方法或初步调查选出原始的样本。再根据原始样本提供的信息去找到其它样本。应用这种抽样方法的前提是,总体单位之间具有一定的联系。如果总体单位间缺乏联系,那么就失去了“滚雪球”的依据。3.5 抽样调查误差及其控制一、误差及其分类任何调查所获数据都存在误差,误差控制在评估调查质量时是十分必要的,研究者在调查设计阶段就要考虑到所使用的调查方法可能导致的误差类型。抽样调查中的误差分为抽样误差和非抽样误差。具体说来,一项完整的抽样调查,调查总体误差表现为如下图的6各个方面: 二、系统误差及其控制1、系统误差及其种类系统误差可以归纳为两大类:抽样设计误差;测量误差。2、系统误差的控制对调查中可能出现的各种误差,即质量问题,要采取相应措施加以控制,把误差降到最低限度。系统误差的控制具有全程性、全员性、全局性和超前性的特点。全程性,指对整个调查各阶段实施有效控制;全员性指对与调查有关的人员,特别是访问员和被访人都要纳入控制范围;全局性指与调查活动相关的所有环节,包括组织管理、技术方法、经费下达都必须围绕调查质量这个中心统筹安排;超前性指误差控制应该以事前控制为主,事后控制为辅。三、抽样误差及其控制抽样误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差。抽样误差也称为代表性误差。那么我们怎么控制抽样误差呢?常识和科学原理都告诉我们,抽样误差是与样本容量呈反向关系的,抽样误差随样本容量的增加而减小。因而,样本容量 n 是我们手中握有的控制抽样误差的“王牌” 。每当我们感到抽样调查的代表性不够时,我们就把样本容量加大一些。进一步研究还表明,对于小总体,样本容量的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论