随机抽样课时PPT课件_第1页
随机抽样课时PPT课件_第2页
随机抽样课时PPT课件_第3页
随机抽样课时PPT课件_第4页
随机抽样课时PPT课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学中的几个概念统计学中的几个概念所要考察对象的全体所要考察对象的全体总体中的每一个对象总体中的每一个对象从总体中抽取的一个部分从总体中抽取的一个部分样本中个体的个数样本中个体的个数总体总体个体个体样本样本样本容量样本容量 这里面总体、个体、样本、样本容量分别是这里面总体、个体、样本、样本容量分别是什么?什么? 为了了解高一(为了了解高一(4 4)班)班5353名同学的视力情况,名同学的视力情况,从中抽取从中抽取1010名同学进行检查。名同学进行检查。第1页/共47页问题问题1 :1 :为了了解全国高中生的视为了了解全国高中生的视力情况,需要将全中国所有高中生力情况,需要将全中国所有高中生逐

2、一进行检查吗?逐一进行检查吗?问题问题2 :2 :要检查某超市销售的牛奶要检查某超市销售的牛奶含菌量是否合格,需要将该超市含菌量是否合格,需要将该超市的所有牛奶的包装袋都打开逐一的所有牛奶的包装袋都打开逐一检查吗?检查吗?容量大!容量大!有破坏性!有破坏性!第2页/共47页1 1、如何设计抽样方法,使抽取的样、如何设计抽样方法,使抽取的样本能真正代表总体?本能真正代表总体?如怎么判断一锅汤的味道如何?如怎么判断一锅汤的味道如何?高质量的数据来自高质量的数据来自“搅拌均匀搅拌均匀”的总的总体,使每个个体有同样的机会被抽中。体,使每个个体有同样的机会被抽中。第3页/共47页 在抽样调查中,样本的选

3、择是至关重要在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结的,样本能否代表总体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败果的可靠性。下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件。的统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一个好的样本如它可以帮助我们理解为什么一个好的样本如此重要。此重要。阅读阅读一个著名的案例一个著名的案例第4页/共47页在在19361936年美国总统选举前,一份颇有名气的杂志的工年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州作人员做了一次民意调查。调查

4、兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在年电话和汽车单给一大批人发了调查表(注意在年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下

5、:其数据如下:兰顿罗斯福选举结果预测结果候选人00000000第5页/共47页思考思考问题问题 : 你认为预期结果出错的原因你认为预期结果出错的原因是什么?是什么?原因是:用于统计推断的样本来自少数富人,原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。(样本不具有代表性)。第6页/共47页2.1.1 简单随机抽样简单随机抽样 第7页/共47页问题问题3:假设你作为一名食品卫生工作人员,:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生要对某食品店内的一批小包装饼干进行卫生达标

6、检验,你准备怎么做?达标检验,你准备怎么做? 将这批小包装饼干放入一个不透明的袋子将这批小包装饼干放入一个不透明的袋子中,搅拌均匀,然后不放回的摸取(这样可中,搅拌均匀,然后不放回的摸取(这样可以保证每一袋饼干被抽取的机会相等),这以保证每一袋饼干被抽取的机会相等),这样我们就可以得到一个简单随机样本,相应样我们就可以得到一个简单随机样本,相应的抽样方法就是简单随机抽样的抽样方法就是简单随机抽样第8页/共47页 一般地,设一个总体的个体数为N,从中逐个不放回地抽取n个个体作为一个样本,如果每次抽取时总体内的各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样。简单随机抽样简单随机抽样第9页/

7、共47页说明: (1)被抽取样本的总体的个体数有限; (2)从总体中逐个进行抽取; (3)一种不放回抽样;(4)每个个体能被选入样本的可能性是相同的。简单随机抽样简单随机抽样 简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。第10页/共47页判断:下列抽取样本的方式是否属于判断:下列抽取样本的方式是否属于简单随机抽样?简单随机抽样?(1)从无限多个个体中抽取从无限多个个体中抽取100个个体作为样本个个体作为样本(2)盒子里共有盒子里共有80个零件,从中选出个零件,从中选出5个零件进个零件进行质量检验,在抽取操作时,从中任意拿出

8、一行质量检验,在抽取操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里。个零件进行质量检验后再把它放回盒子里。(3)从从20件玩具中一次性抽取件玩具中一次性抽取3件进行质量检验。件进行质量检验。第11页/共47页1.1.抽签法抽签法( (抓阄法抓阄法) ) 把总体中的把总体中的N N个个体编号,并把号码写个个体编号,并把号码写在在形状、大小相同形状、大小相同的号签上,将号签放在的号签上,将号签放在同一个容器里,同一个容器里,搅拌均匀搅拌均匀后,每次从中抽后,每次从中抽出出1 1 个号签,连续抽取个号签,连续抽取n n次,得到一个容量次,得到一个容量为为n n的样本。的样本。简单随机抽样

9、简单随机抽样第12页/共47页抽签法开始53名同学从1到53编号制作1到53个号签将53个号签搅拌均匀随机从中抽出10个签对号码一致的学生检查结束例1.1.为了了解高一(4 4)班5353名同学的视力情况,从中抽取1010名同学进行检查。第13页/共47页53名同学从1到53编号将53个号签搅拌均匀对号码一致的学生检查开始制作1到53个号签随机从中抽出10个签结束抽签法的一般步骤:抽签法的一般步骤:(1)将总体中的)将总体中的N个个体编号个个体编号(号码从号码从1到到N);(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,并记录其

10、编号,连续抽出n次;(5)将总体中与抽到的号签编号一致的n个个体取出。(总体个数N,样本容量n)第14页/共47页抽签法的一般步骤:抽签法的一般步骤:(1)将总体中的)将总体中的N个个体编号个个体编号(号码从号码从1到到N);(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;(5)将总体中与抽到的号签编号一致的n个个体取出。(总体个数N,样本容量n)开始编号制签搅匀抽签取出个体结束第15页/共47页思考思考:你认为抽签法有什么优点和缺点?你认为抽签法有什么优点和缺点?优点:抽签法能够保证每个个体入选优点

11、:抽签法能够保证每个个体入选样本的机会都相等样本的机会都相等缺点缺点:(:(1 1)当总体的个数较多时,制当总体的个数较多时,制作号签的成本将会增加作号签的成本将会增加(2 2)号签很多时,)号签很多时,“搅拌均匀搅拌均匀”比较比较困难,结果很难保证每个个体入选样困难,结果很难保证每个个体入选样本的可能性相同本的可能性相同第16页/共47页用随机数表法抽取样本的步骤:用随机数表法抽取样本的步骤:将总体中的所有个体将总体中的所有个体编号编号(每个号码位数一致每个号码位数一致);在随机数表中在随机数表中选定开始的数字选定开始的数字(确定行数列数确定行数列数);从选定的数开始从选定的数开始按一定方向

12、读数按一定方向读数,若得到的,若得到的或与或与的去的去掉,如此进行下去,直到取满为止掉,如此进行下去,直到取满为止;根据选定的号码根据选定的号码抽取样本抽取样本。简单随机抽样2.2.随机数法随机数法随机数表、随机数骰子、计算机产生的随机数随机数表、随机数骰子、计算机产生的随机数第17页/共47页例2:假设我们要考察某公司生产的袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行:先将800800袋牛奶编号,可以编为000,001000,001,799799;在随机数表中任选一个数;从选定的数开始向右( (读数的方向可以是向左,向上,向下等

13、) ),得到满足的数将它取出,继续向右读,直到样本的6060个号码全部取出。第18页/共47页 例例3 3 利用随机数表法从利用随机数表法从500500件产品件产品中抽取中抽取4040件进行质检件进行质检. .(1 1)这)这500500件产品可以怎样编号?件产品可以怎样编号?(2 2)如果从随机数表第)如果从随机数表第1010行第行第8 8列的数列的数开始往左读数,则最先抽取的开始往左读数,则最先抽取的5 5件产品件产品的编号依次是什么?的编号依次是什么?第19页/共47页随机数表法随机数表法1、随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。2、用随机

14、数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的.3、由于随机数表是等可能的,因此利用随机数表抽取样本保证了被抽取个体的可能性是相等的。第20页/共47页巩固练习巩固练习1、对于简单随机抽样,个体被抽到的机会(、对于简单随机抽样,个体被抽到的机会( ) A. 相等相等 B. 不相等不相等 C. 与抽取的次数有关与抽取的次数有关 D. 不确定不确定3、高一(、高一(1)班有)班有49名学生,学号从名学生,学号从01到到49,数,数学老师在上统计课的时候,运用随机数表法选学老师在上统计课的时候,运用随机数表法选6名同学,老师首先选定随机数表法从

15、第名同学,老师首先选定随机数表法从第21行第行第29列开始,依次向右读取,这列开始,依次向右读取,这5位同学的号码依次位同学的号码依次为为_A26、04、33、46、09、07第21页/共47页2.1.2 系统抽样系统抽样第22页/共47页问题问题: 某学校为了了解高一年级学生对教师教某学校为了了解高一年级学生对教师教学的意见,打算从高一年级学的意见,打算从高一年级500名学生中抽取名学生中抽取50名进行调查。除了用简单随机抽样获取样本名进行调查。除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?外,你能否设计其他抽取样本的方法?简单随机抽样适用于个体数不太多的总体。那么当总体个体数

16、较多时,宜采用什么抽样方法呢?第23页/共47页分析:分析:我们按这样的方法来抽样:首先将这我们按这样的方法来抽样:首先将这名学生从开始进行编号,然后按号码顺序以一定名学生从开始进行编号,然后按号码顺序以一定的间隔进行抽取。由于的间隔进行抽取。由于,这个间隔可以,这个间隔可以定为,即从号码为的第一个间隔中随定为,即从号码为的第一个间隔中随机地抽取一个号码,假如抽到的是号,然后从机地抽取一个号码,假如抽到的是号,然后从第号开始,每隔第号开始,每隔个号码抽取一个,得到个号码抽取一个,得到,。,。这样就得到一个容量为的样本这样就得到一个容量为的样本50050这种抽取方法是系统抽样。第24页/共47页

17、系统抽样系统抽样 现将总体中的个体逐一编号,然后按号现将总体中的个体逐一编号,然后按号码顺序以一定的码顺序以一定的间隔间隔k进行抽取,先从第一进行抽取,先从第一个间隔中个间隔中随机地随机地抽取一个号码,然后抽取一个号码,然后逐个逐个抽抽取的号码依次增加间隔数即得到所求样本。取的号码依次增加间隔数即得到所求样本。当总体不能被样本容量整除时怎么办当总体不能被样本容量整除时怎么办第25页/共47页 例2 2 某中学有高一学生322322名,为了了解学生的身体状况,要抽取一个容量为4040的样本,用系统抽样法如何抽样?先用简单随机抽样的方法先用简单随机抽样的方法,剔除其中剔除其中2名学生名学生第26页

18、/共47页第二步,随机剔除第二步,随机剔除2 2名学生,再把余下的名学生,再把余下的320320名学生随机编号为名学生随机编号为1 1,2 2,3 3,320.320.第五步,从该号码起,每间隔第五步,从该号码起,每间隔8 8个号码抽取个号码抽取1 1个号码,就可得到一个容量为个号码,就可得到一个容量为4040的样本的样本. .第四步,在第第四步,在第1 1部分用抽签法确定起始编部分用抽签法确定起始编号号. . 第三步,把总体分成第三步,把总体分成4040个部分,每个部个部分,每个部分有分有8 8个个体个个体. . 第一步,采用随机的方式给个体编号,第一步,采用随机的方式给个体编号,1,21,

19、2,322322第27页/共47页系统抽样的特点:系统抽样的特点:(1 1)用系统抽样抽取样本时,每个个体被抽到)用系统抽样抽取样本时,每个个体被抽到 的可能性是相等的的可能性是相等的(2 2)系统抽样适用于总体中个体数较多,抽取)系统抽样适用于总体中个体数较多,抽取样本容量也较大时;样本容量也较大时;(3 3)系统抽样是不放回抽样。)系统抽样是不放回抽样。第28页/共47页 用简单随机抽样抽取第1 1段的个体编号. .在抽取第1 1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1 1段抽取的号码依次累加间隔k.k.思考6 6:用系统抽样抽取样本时,每段各取一个号码,其中第1 1段

20、的个体编号怎样抽取?以后各段的个体编号怎样抽取?第29页/共47页一般地,用系统抽样从含有N N个个体的总体中抽取一个容量为n n的样本,其操作步骤如何?第30页/共47页系统抽样的步骤系统抽样的步骤:(1)采用随机的方式将总体中的个体)采用随机的方式将总体中的个体编号编号;(2)将整个的编号按一定的间隔)将整个的编号按一定的间隔(设为设为K)分段分段,当当(N为总体中的个体数为总体中的个体数,n为样本容量为样本容量)是整数是整数时,时,;当不是整数时当不是整数时,从总体中剔除一些从总体中剔除一些个体个体,使剩下的总体中个体的个数使剩下的总体中个体的个数 能被能被n整除整除,这这时时,,并将剩

21、下的总体重新编号;,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样)在第一段中用简单随机抽样确定起始的个体编号确定起始的个体编号;(4)将编号为的个体抽出。)将编号为的个体抽出。NnNknNnNNkn,2 ,.,(1)l lk lklnkl第31页/共47页例1.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是 A . 5,10,15,20,25 B.3,13,23,33,43C. 1,2,3,4,5 D.2,4,6,16,32B第32页/共47页抽样抽样方法方法简单随简单随机抽样机抽

22、样抽签法抽签法 系统抽样系统抽样随机数表法随机数表法共同共同点点(1)抽样过程中每个个体被抽到的概率相等;)抽样过程中每个个体被抽到的概率相等;(2)都要先编号)都要先编号各自各自特点特点从总体中逐一抽取从总体中逐一抽取先均分,再按事先确定的先均分,再按事先确定的规则在各部分抽取规则在各部分抽取相互相互联系联系在起始部分抽样时采用简在起始部分抽样时采用简单随机抽样单随机抽样适用范围总体中的个体数较少总体中的个体数较少 总体中的个体数较多总体中的个体数较多两种抽样方法比较两种抽样方法比较第33页/共47页思考:思考:系统抽样与简单随机抽样比较系统抽样与简单随机抽样比较, ,有何优、缺点?有何优、

23、缺点? 点评点评: :(1)(1)系统抽样比简单随机抽样更容易实施系统抽样比简单随机抽样更容易实施, ,可节约抽可节约抽样成本。样成本。(2)(2)系统抽样的效果会受个体编号的影响,而简单系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;随机抽样的效果不受个体编号的影响;系统抽样所系统抽样所得样本的代表性和具体的编号有关得样本的代表性和具体的编号有关, ,而简单随机抽而简单随机抽样所得样本的代表性与个体的编号无关样所得样本的代表性与个体的编号无关. .(3)(3)系统抽样比简单随机抽样的应用范围更广系统抽样比简单随机抽样的应用范围更广. .第34页/共47页2.1.3

24、分层抽样第35页/共47页例3:某班有男生36人,女生24人,从全班抽取一个容量为10的样本,分析某种身体素质指标,已知这种身体素质指标与性别有关. 问应采取什么样抽样方法?并写出抽样过程.第36页/共47页解:因为这种身体素质指标与性别有关,所以男生, ,女生身体素质指标差异明显,因而采用分层抽样的方法. .具体过程如下:(1 1)将6060人分为2 2层,其中男, ,女生各为一层. .(2 2)确定抽样比为10/(36+24)=1/610/(36+24)=1/6(3 3)按照样本容量的比例随机抽取各层应抽取的样本. . 36 361/6=61/6=6(人),24241/6=41/6=4(人

25、)因此男, ,女生各抽取人数分别为6 6人和4 4人. .(4 4)利用简单随机抽样方法分别在3636名男生中抽取6 6人, 24, 24名女生中抽取4 4人. . (5) (5)将这1010人组到一起,即得到一个样本. .第37页/共47页(1)分层:按某种特征将总体分为若干部分。 (注:一般不写。) (2)确定抽样比例。抽样比=样本容量/总体容量(3)按比例确定每层抽取个体的个数。 (注:各层的抽取数之和应等于样本容量)。(4)各层分别按简单随机抽样或系统抽样的方法抽取。(5 5)综合每层抽样,组成样本。)综合每层抽样,组成样本。第38页/共47页注意注意:1 1 、分层抽样适用于总体由差

26、异明显的几部分、分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行组成的情况,每一部分称为层,在每一层中实行简单随机抽样。简单随机抽样。2 2 、分层抽样中分多少层,要视具体情况而定。总、分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。差异尽可能地大,否则将失去分层的意义。第39页/共47页强调两点:强调两点:(1 1)分层抽样是等概率抽样,它也是公平的。用分)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为层抽样从个体为N N的总体中抽取一个

27、容量为的总体中抽取一个容量为n n的样本的样本时,在整个抽样过程中每个个体被抽到的概率相等时,在整个抽样过程中每个个体被抽到的概率相等 为为n/Nn/N。(2)(2)、分层抽样是建立在简单随机抽样或系统抽样、分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。获取的样本更具代表性,在实用中更为广泛。第40页/共47页问题问题5:假设某地区有高中生假设某地区有高中生2400人,初中生人,初中生10900人,小学生人,小学生11000人人.此地区教育部门为了了此地区教育部门为了了解本地

28、区中小学生的近视情况及其形成原因,要从解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取本地区的中小学生中抽取1%的学生进行调查的学生进行调查.你认你认为应当怎样抽取样本?为应当怎样抽取样本?解解:(1):(1)确定样本容量与总体的个体数之比确定样本容量与总体的个体数之比1%1%。(3 3)利用简单随机抽样或系统抽样的方法,)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取从各年龄段分别抽取2424,109,110109,110人,然后合人,然后合在一起,就是所抽取的样本。在一起,就是所抽取的样本。(2 2)利用抽样比确定各年龄段应抽取的个体)利用抽样比确定各年龄段应抽取的个体数,依次为数,依次为 , ,即即2424,109109,110110。%111000%110900%12400,第41页/共47页(1)(1)某校有10001000名学生,其中O O型血的有400400人,A A型血的人有250250人,B B型血的有250250人,ABAB型血的有100100人,为了研究血型与色弱的关系,要从中抽取一个4040人的样本,按分层抽样,O O型血应抽取的人数为_人,A A型血应抽取的人数为_人,B B型血应抽取的人数为_人,ABAB型血应抽取的人数为_人。目标检测目标检测第42页/共4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论