《基本抽样方法》PPT课件.ppt_第1页
《基本抽样方法》PPT课件.ppt_第2页
《基本抽样方法》PPT课件.ppt_第3页
《基本抽样方法》PPT课件.ppt_第4页
《基本抽样方法》PPT课件.ppt_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 基本抽样方法,基本抽样技术是指调查研究中,设计抽样方案所依赖的一些基本设计要素。具体说来,这些基本抽样技术包括抽样框的制定、一阶段抽样、多阶段抽样、估计抽样误差和确定样本规模。,第一节 调查总体与抽样框,抽样一般包括以下几个步骤: 确定总体(population) 抽样框(sampling frame) 制定抽样方案 实际抽取样本 评估样本质量。,第二节 一阶段抽样,在抽样中,如果样本是一次直接从抽样框中抽出的,则称之为一阶段抽样。它是最基本的抽样方法,其他形式的抽样方法都是在此基础上发展出来的。,一、简单随机抽样 简单随机抽样(simple random sampling)也称纯随机抽样,是严格按照随机原则从含有N个单位的总体中抽取n个单位组成样本(Nn),在抽样过程中总体的每个单位都有同等的机会入选样本,而且每个单位的抽取都是相互独立的。,主要方法: 抽签法 随机数法,二、系统抽样 实际抽样中经常采用的是系统抽样(systematic sampling),又称机械抽样,即将N个总体单位按一定顺序排列,然后先随机抽取一个单位作为起始单位,再按某种确定的规则抽取其他n-1个样本单位。,(一)整数抽样间距 (二)非整数抽样间距 (三)总体单位的排列,三、分层抽样 分层抽样(stratified sampling)也称类型抽样,是先将总体N个单位,按某种特征划分成若干个子总体,称为层,然后在每个层中分别独立地进行抽样,最后,将抽出的子样本合起来构成总体的样本。,(一)样本量在各层的分配 最常见的样本量分配方式是按比例分配(proportional allocation),即各层的子样本单位在总样本中所占的比例,与各层单位在总体中所占的比例完全相同。,(二)层的划分 理论上,按调查目标变量进行分层是最好的,但在调查之前目标变量的值是不知道的,因此只能是根据与目标变量最相关的辅助变量进行分层,常用的辅助变量包括性别、年龄、职业、教育程度、收入、地域、民族和宗教等。,(三)分层抽取样本的方法 在分层抽样中,有两种常见的样本抽取方法。 一种方法是先将所有总体元素按分层变量进行分层,并计算各层在总体中的比例。接着如果采用等比例分层抽样,则直接将总体比例视为样本比例;如果采用不等比例分层抽样,则需要对样本比例做一定的调整。最后,再按确定的样本比例,用简单随机或系统抽样方法,抽出适量的样本元素。,另一种方法适用于等比例分层抽样。先将所有总体元素按分层变量进行分层,然后将各层的总体元素一层一层连续排列,最后对连续排列的总体元素进行等距抽样。,四、整群抽样 整群抽样(c1uster sampling)是先将总体划分成若干个群(视为初级单位),每个群包含若干个次级单位,然后以一定方式从总体中抽取一部分群,并由中选群中的所有次级单位构成总体的样本。,(一)群的性质 群的划分可以遵循以下原则:群内方差尽可能大,群间方差尽可能小,即群内各单位的差异尽可能大,群与群之间的差异尽可能小。这个原则与分层原则恰好相反,简言之,异质的群,同质的层。,(二)规模不等的群 为了保证样本单位满足等概率原则,可以采取相应措施来控制样本规模的变动。一方面可以按群的大小进行分层,然后对各个层使用相同的抽样比。,第三节 多阶段抽样,一、按规模分层抽样 在多阶段抽样中,最初从总体中抽出的群被称为初级抽样单位(primary sampling unit,PSU),如果PSU的规模相等,用简单随机抽样或等距抽样方法,直接进行第二阶段的抽样,这时第二级单位是等概率入样的,而且样本规模是常数。这个原则也适用于更多阶段的抽样。,二、PPS抽样 在PPS抽样中,第一阶段抽样即抽取PSU的阶段,要先放弃等概率抽样条件,采用“概率与规模成比例”(probability proportional to size,PPS)的方法,即赋予规模不等的群与其规模(或辅助变量)成比例的入样概率。,这样一来,规模大的群以大概率入样,规模小的群以小概率入样。由于抽取PSU的过程是不等概率抽样,因此如果要保证总抽样比不变,就需要以一个固定的样本规模从抽中的PSU内抽取样本单位。 因为如果抽取的单位规模对每个PSU都一样,那单位入样的概率就会与群的规模成反比。这样大概率抽取群,小概率抽取样本单位,一大一小相互抵消,就保证了总体单位抽取的等概率性。与此同时,由于不论PSU大小,都抽取固定规模的样本单位,于是也控制了样本规模的变动。,三、规模测量值 进行PPS抽样的一个前提条件是要在具体抽样前,知道各级抽样单位的规模。可是在抽样前一般无法确切知道抽样单位的实际规模,为了能使用PPS方法,只能代之以各级抽样单位规模的估计值M,称为规模测量值(measure of size)。估计值可以从离调查时点最近的一次普查资料或其他统计资料中查找到。,第四节 抽样误差与样本规模,实际抽样中,影响样本代表性的有两类误差:抽样误差和非抽样误差。其中抽样误差是一种随机误差。 抽样中的随机误差并非都是抽样误差,有些可能是由于调查人员的失误引起的非抽样误差。它是由于样本范围与总体范围的差异而引起的误差,无论抽样设计多么精致,都会产生抽样误差。不过在概率抽样中,抽样误差是可以估算出来的。,一、简单随机抽样的抽样误差 放回简单随机抽样 不放回简单随机抽样 标准误差的意义,二、简单随机抽样的样本规模 样本规模又称样本容量,是指样本中所包含元素的数量。样本规模一方面会影响到样本的代表性,另一方面,则直接影响到调查成本的大小。太小的样本其代表性可能较差,但太大的样本又会增加不必要的成本。因此,在实际抽样中,选择合适的样本规模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论