分层抽样与系统抽样_第1页
分层抽样与系统抽样_第2页
分层抽样与系统抽样_第3页
分层抽样与系统抽样_第4页
分层抽样与系统抽样_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1分层抽样与系统抽样分层抽样与系统抽样21 1、什么是简单随机抽样?、什么是简单随机抽样?2 2、什么样的总体适宜简单随机抽样?、什么样的总体适宜简单随机抽样? 3 3、随机数表法的步骤如何?、随机数表法的步骤如何? 设一个总体的个数为设一个总体的个数为N N。如果通过逐个抽取的方法从中抽取一个样本,。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。随机抽样。 适用范围:总体的个体数不多时。适用范围:总体的个体数不多时。1 1、给总体中各个个体编号;(起始号码选、给总体中各个个

2、体编号;(起始号码选0000,而不选,而不选0101,可使,可使100100个个体都可用个个体都可用2 2位数表示)位数表示)2 2、选定开始的数字;(随机)、选定开始的数字;(随机)3 3、获取样本号码。(按顺序列出,以免重复)、获取样本号码。(按顺序列出,以免重复) 3简单随机抽样和产生随机数只适合总体个数简单随机抽样和产生随机数只适合总体个数较少时使用,较少时使用,4问题问题一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个人。为了

3、了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容单位职工与身体状况有关的某项指标,要从中抽取一个容量为量为100100的样本。由于职工年龄与这项指标有关,试问:的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在应用什么方法抽取?能在500500人中任意取人中任意取100100个吗?能将个吗?能将100100个份额均分到这三部分中吗?个份额均分到这三部分中吗? 分析:考察对象的特点是由具有明显差异的几部分组成。分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比

4、例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。5解:(1)确定样本容量与总体的个体数之比100:500=1:5。(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56。19人,然后合在一起,就是所抽取的样本。59552805125,(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即25,56,19。6例例为了解参加某种知识竞赛的为了解参加某种知识竞赛的10001000名学生的名学生的成绩,打算抽取容量为成绩,打算抽取容量为5050的一个样本进行了解。的一个样本进行了解。过程如下:过程如下:(1 1)随机将这)随机将这10001000名学生编号为名学生编号

5、为1 1,2 2,3 3,10001000;(2 2)将总体按编号顺序平均分成)将总体按编号顺序平均分成5050部分,每部分包含部分,每部分包含2020个个体;个个体;(3 3)在第一部分的个体编号)在第一部分的个体编号1 1,2 2,2020中,利用简单随机中,利用简单随机抽样抽取一个号码,比如抽样抽取一个号码,比如1313;(4 4)以)以1313为起始号,每间隔为起始号,每间隔2020抽取一个号码,这样就得到一个抽取一个号码,这样就得到一个容量为容量为5050的样本:的样本:1313,3333,5353,973973,993993。 7(2 2)分层抽样是建立在简单随机抽样或系统抽样)分

6、层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。它获取的样本更具代表性,在实用中更为广泛。(1 1)分层抽样是等概率抽样,它也是公平的。用)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为分层抽样从个体为N N的总体中抽取一个容量为的总体中抽取一个容量为n n的的样本时,在整个抽样过程中每个个体被抽到的概样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于率相等,都等于 。Nn8 将总体分成均衡的几个部分,然后按照预先定出将总体分成均衡的几个部分,然后按照预先定出的规则,

7、从每一部分抽取一个个体,得到所需要的样的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做本,这种抽样叫做系统抽样系统抽样(也称为机械抽样)。(也称为机械抽样)。 问题一问题一 系统抽样中,每个个体被抽中的概率是否一样?系统抽样中,每个个体被抽中的概率是否一样?答:在上面的抽样中,由于在第一部分(编号为答:在上面的抽样中,由于在第一部分(编号为120120)中的起始号码是随机确定的,每个号码被抽取的概率都中的起始号码是随机确定的,每个号码被抽取的概率都等于等于 ,所以在抽取第,所以在抽取第1 1部分的个体前,其他各部分中部分的个体前,其他各部分中每个号码被抽取的概率也都是每个号码被抽

8、取的概率也都是 。就是说,在这个系统。就是说,在这个系统抽样中,每个个体被抽取的概率都是抽样中,每个个体被抽取的概率都是 。2012012019例例2 2为了了解参加某种知识竞赛的为了了解参加某种知识竞赛的10031003名学生的成绩,名学生的成绩,应采用什么样的抽样方法恰当?应采用什么样的抽样方法恰当? 。问题问题2 2 如果个体总数不能被样本容量整除时该怎么办?如果个体总数不能被样本容量整除时该怎么办?10讨论:在这整个抽样过程中每个个体被抽取的概率是否相等?讨论:在这整个抽样过程中每个个体被抽取的概率是否相等? 1 1、总体中的每个个体被剔除的概率是相等的、总体中的每个个体被剔除的概率是

9、相等的 ,100332 2、也就是每个个体不被剔除的概率相等、也就是每个个体不被剔除的概率相等 ;100310003 3、采用系统抽样时每个个体被抽取的概率都是、采用系统抽样时每个个体被抽取的概率都是 ;1000504 4、在整个抽样过程中每个个体被抽取的概率仍、在整个抽样过程中每个个体被抽取的概率仍相等,都是相等,都是 。1003501000501003100011系统抽样的步骤:系统抽样的步骤:采用随机的方式将总体中的个体编号。为简便起见,有采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街时可直接采用个体所带有的号码,如考生的准考证号、街道

10、上各户的门牌号,等等道上各户的门牌号,等等 ;在第一段用简单随机抽样确定起始的个体编号在第一段用简单随机抽样确定起始的个体编号l l;按照事先确定的规则抽取样本(通常是将按照事先确定的规则抽取样本(通常是将l l加上间隔加上间隔k k,得到第得到第2 2个编号个编号l l+k,+k,第第3 3个编号个编号l l+2k+2k,这样继续下去,直到,这样继续下去,直到获取整个样本)。获取整个样本)。 整个的编号分段(即分成几个部分),要确定分段的间整个的编号分段(即分成几个部分),要确定分段的间隔隔k k。当。当 (N N为总体中的个体的个数,为总体中的个体的个数,n n为样本容量)是为样本容量)是整数时,整数时,k= k= ;当;当 不是整数时,通过从总体中剔除一不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数些个体使剩下的总体中个体的个数N N,能被能被n n整除,这时整除,这时k= k= ;NnNnNnNn12类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围简单随机简单随机抽样抽样抽样过程抽样过程中每个个中每个个体被抽取体被抽取的概率相的概率相等等从总体中逐个抽从总体中逐个抽取取总体中个数较总体中个数较少少分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论