抽样的基本概念.doc_第1页
抽样的基本概念.doc_第2页
抽样的基本概念.doc_第3页
抽样的基本概念.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、抽样的宜义 抽样(sampling)就是从研究总休中选取一部分代表性样本的方法。例如我们要研究某城市居民的生活方式问题.那么核个城市居民都是我们的研究对象。但限于研究条件等原因,我们难以对每一个居民进行调查研究,而只能采用一定的方法选取其中的部分居民作为调查研究的对象。这种选择调查研究对象的过程就是抽样。采用抽样法进行的调查就称为抽样调查。抽样调查是最常用的调查研究方法之一,它已被广泛应用到社会调查、市场调查和舆论调查等多个领域。 20世纪以来.抽样方法由于在民意侧验中的广泛应用而得到了很大发展,特别是运用抽样法可较为准确地预侧总统选举。例如,早在TLT年,美国文摘(literary Digest)杂志向6个州的选民邮寄了明信片,询问他们在即将来临的总统大选中,会投华伦哈丁的票还是投詹姆斯考克斯的票。被选做民意测验的人(样本)是从电话簿和车牌登记名单中选出的。根据反馈回的明信片,文摘正确地预测了哈丁将在选举中获胜。在这之后的1924, 1928和1932年的大选中,文摘)扩大了其调查的样本数量,也都做出了准确的预侧。 但也有例外,文摘在1936年进行的总统选举的民意测验中,预测阿尔夫兰登将会获胜,但实际上是富兰克林罗斯福获得连任。这次调查失败的原因.一方面是调查问卷的回收率低,只有刀%。另一原因是他们所采用的抽样框有问题,即他们通过电话用户和汽车拥有者选择的样本,包含了不成比例的富人样本,而穷人的样本比例较小。在当时美国最严重的经济萧条后期,恰恰是穷人支持罗斯福的新经济政策。 对1936年的这次总统大选,乔治盖洛普(George Gallup)却采用配额抽样(quota sampling)的方法准确地预侧了罗斯福将获胜。而且盖洛普和美国民愈测验中心(American Institute of Public饰inion)利用配额抽样方法在1936, 1940与14“年也成功地预侧了当年的总统当选人。但在1948年的总统大选预测中,盖洛普与其他许多大选民意调查者一样,错误地预侧杜威能击败当时在位的哈利杜鲁门而当选总统。他们失败的原因是多方面的,但从方法七说.盖洛普的失败在于他的样本不具代表性,因为配额抽样是一种非概率抽样,有明显的局限性。 现在,随着抽样方法的改进,民意测验的结果越来越准确了。如对1996年的美国总统大选,多家民意调查机构都预测到了克林顿的胜利。 二、抽样的甚本术语 抽样已发展出了自己的一套专门术语,主要包括如下一些: I.抽样单位或抽样元素(二叫ing unit/element)。抽样单位或抽样元素是指收集信息的纂本单位和进行分析的元素。在社会科学研究中,常用的抽样单位是个体的人,它也可以是一定类型的群体或组织,如家庭、公司、居委会、社区等。抽样单位与抽样元家有时是一致的,有时是不一致的。如在简单抽样中,它们是一致的,但在整群或多阶段抽样中,抽样单位是群体,而每个群体单位中又包含许多抽样元素。 2.总体或抽样总体(population)。总体是指研究元家的集合。例如我们要研究某地青少年的犯罪状况,那么从理论上说这一地区符合一定条件的所有的青少年就组成了我们的抽样总体。但实际上调查研究的总体不等于理论上设定的总体,通常所说的抽样总体是指实际调查的总体。 3.抽样框(sampling frame)。抽样框是指所有抽样单位的名单,如花名册、电话号码簿、户口登记册等都可以作为选取样本的抽样框。由于抽样单位有不同的层次,故在实际操作中,抽样框是不同的。如进行复杂得多阶段抽样调查,在不同阶段使用不同的抽样框。从大的抽样单位开始,逐级选择.直到最4本的抽样单位。 4.样本(sample)。样本与总体相对应,是指用来代表总体的单位。故样本实际上是总体中某些单位的子集。样本不是总体,但它应代表总体。所以抽样的标准就是让所选择的样本最大程度地代表总体。 5.参数旋与统计值(parameter and statistic).参数值是指反映总体中某变量的特征值。例如某地所有职工的平均收入水平和总体收人等都是参数值。但参数值多是理论值,难以具体确定。通常是根据样本的统计值来推论总体的参数值。统计值就是对样本中某变盆特征的描述。它通常是实际统计分析的数值。例如,根据某一样本资料可计算其平均收人水平、构成比例等。用样本统计值去推论参数值时.二者是一一对应的。 6.抽徉误差(sa ml吨error)。样本统计值与所要推论的总体参数值之间的平均差位就称为抽样误差。这是由抽样本身产生的误差,它反映的是样本对总体的代表性程度,故又称代表性误差。我们在下面将结合样本数的确定再做具体讨论。 7.置信水平与置信区间(confidence level and interval),置信水平和置信区间是与抽样误差密切相关的两个概念。置信水平,又称置f言度,是指总体参数值落在某一区间内的概率。而置信区间是指在某一置信水平下,用样本统计值推论总体参数值的范围。其大小与误差密切相关,置信区间越大,误差也越大。 三、抽样设计与程序 在社会科学研究过程中,抽样是必不可少的重要环节。这就要求必须做好抽样设计,使所选择的样本具有代表性。抽样设计就是确定抽样的原理与形式、程序和方法等。其基本原则是:第一,目的性,即根据研究目的进行抽样设i卜第二,可度量性,即根据样本统计值能做出有效的估计;第兰,可行性,即在实际操作中能按预定的设计完成任务;第四,经济性,即以最小的代价去实现抽样的目的。 (一)抽样的原理与形式 抽样通常分为概率抽样和非概率抽样两大类,但以概率抽样为主。概率抽样的基本原理首先是概率论的随机原理。所谓随机原理,是指抽取样本时必须严格遵循一定方法和规则.使得总体中每一个对象都有相同的机会被选入样本。这又称为等概率抽样。因为只有按照随机原则进行抽样,所抽出的徉本才有充分的代表性.也才可以对抽样误差做出准确的计算,以估计它的可信度。 概率抽样的理论基础就是概率论。我们通常把因果关系分为两种:一种是必然性的因果关系,即若A,则必然B;另一种是随机性的因果关系,即若A,则可能B。大童的社会现象都是随机现象。研究随机现象的数学分支学科是概率论。概率是事物发生的可能性大小的量度。在概率论中,把不可能发牛的事件的概率称为最小概书,定为0,而把必然发生的事件的概率称为最大概率,定为I。那么事件A出现的概率P (A)在0与1之间,即随机事件发生的可能性在0到1之间,是个非负数。 (二)抽样的基本程序 按照一定原则进行抽样时,大致可包括如下几个步骤: 第一界定总体,包括明确总体的范围、内容和时间。实际调查的总体与理论上设定的总体会有所不同,总体越复杂,二者的差别越大。例如,要研究某地青少年的犯罪状况.理论上的总体是这一地区符合一定条件的所有的青少年,但实际上我们能够抽样的总体并不能全部包括,也就是说只能根据我们所能够掌握的这一地区符合一定条件的青少年进行抽样。因此,抽样总体有时不等于理论上的研究总体,样本所代表的也只是明确界定的抽样总体。此外,由于调查研究内容的不同,对总体的限定也会有所不同。 第二,确定抽样框.即根据研究日的和内容确定抽样总体的范围与单位。抽样框来自抽样总体,也就是采用一定的方法把总休中的甸一单位组合成一种可供选择的形式,如名单、代码、符号等。抽样框的形式受总体类型的影响:简单的总体可直接根据其组成名单形成抽样框;但对构成复杂的总体.常常根据调查研究的需要,制定不同的抽样框,分级选择样本。例如,进行全国人口抽样调查,先以全国的省市为抽样框选部分省、市为调查单位,然后再以这些省、市中的各县、区为抽样框选部分县、区为调查单位.这样依次到村或居委会。 在概率抽样中,抽样框的确定非常重要,它会直接影响到样本的代表性。因此,抽样框要力争全面、准确。 第三.样本设计,包括确定样本规模和选择抽样的具体方式。抽样的目的是用样本来代表总体,自然样本数越大.其代表性越高。但样本数越大,调查研究的成本也越大。因此,确定合适的样本规模和抽样方式是抽样设计中的一项重要内容。我们在第三节中将详细讨论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论