




已阅读5页,还剩73页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.1随机抽样,统计学:,研究客观事物的数量特征和数量关系,它是关于数据的搜集、整理、归纳和分析方法的科学。,统计的基本思想:,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。,统计学中的几个概念,所要考察对象的全体,总体中的每一个对象,从总体中抽取的一个部分,样本中个体的个数,总体,个体,样本,样本容量,这里面总体、个体、样本、样本容量分别是什么?,为了了解高一(1)班49名同学的视力情况,从中抽取10名同学进行检查。,问题1:为了了解全国高中生的视力情况,需要将全中国所有高中生逐一进行检查吗?,问题2:要检查某超市销售的牛奶含菌量是否合格,需要将该超市的所有牛奶的包装袋都打开逐一检查吗?,容量大!,有破坏性!,1、如何设计抽样方法,使抽取的样本能真正代表总体?,如怎么判断一锅汤的味道如何?,高质量的数据来自“搅拌均匀”的总体,使每个个体有同样的机会被抽中。,在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:,?,思考,问题:你认为预期结果出错的原因是什么?,原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。,2.1.1简单随机抽样,2.1.2系统抽样,2.1.3分层抽样,2.1随机抽样,2.1.1简单随机抽样,问题提出,生活中的很多问题,必须收集相关数据.你知道这些数据是怎么来的吗?,这些数据常常是通过调查而获得的.,首先,我们通常只考察总体中的一个样本,通过样本来了解总体的情况.,进一步,从节约费用的角度考虑,在保证样本估计总体达到一定精度的前提下,样本中包含的个体数越少越好.,所以,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.,要解决的问题:,怎样从总体中抽取样本?,如何表示样本数据?,如何从样本数据中提取基本信息,推断总体的情况呢?,从节约费用等方面考虑,一般是从总体中收集部分个体的数据来得出结论,就是要通过样本去推断总体.,首先,必须清楚知道要收集的数据是什么.,其次,收集的样本数据应该能够很好地反映总体.,再次,要知道如何才能收集到高质量的样本数据.,问题:食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,你准备怎样做?,从中抽取一定数量的饼干作为检验的样本.,其抽样方法是,将这批小包装饼干放在一个不透明的袋中搅拌均匀,然后逐个不放回抽取若干包.,这种抽样方法就是简单随机抽样.,简单随机抽样的含义如何?,一般地,设一个总体有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样.,简单随机抽样的含义:,简单随机抽样,思考1:从6件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少?,思考2:从6件产品中随机抽取一个容量为3的样本,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?,思考3:一般地,从N个个体中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?,问题:简单随机抽样有哪些主要特点?,(4)是一种不放回的抽样;,(3)随机样本是从总体中逐个抽取的;,(2)样本数n小于等于样本总体的个数N;,(1)被抽取的样本的总体个数N是有限的;,简单随机抽样主要特点:,(5)每个个体被抽到的机会都相等,抽样具有公平性.,下列抽样的方式是否属于简单随机抽样?为什么?,(1)从无限多个个体中抽取50个个体作为样本.,(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.,1.抽签法(抓阄法),把总体中的N个个体编号,并把号码写在形状、大小相同的号签上,将号签放在同一个容器里,搅拌均匀后,每次从中抽出1个号签,连续抽取n次,得到一个容量为n的样本。,简单随机抽样,抽签法,开始,49名同学从1到49编号,制作1到49个号签,将49个号签搅拌均匀,随机从中抽出10个签,对号码一致的学生检查,结束,例1.为了了解高一(1)班49名同学的视力情况,从中抽取10名同学进行检查。,49名同学从1到49编号,将49个号签搅拌均匀,对号码一致的学生检查,抽签法的一般步骤:,(1)将总体中的N个个体编号(号码从1到N);,(2)将这N个号码写在形状、大小相同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;,(5)将总体中与抽到的号签编号一致的n个个体取出。,(总体个数N,样本容量n),抽签法的一般步骤:,(1)将总体中的N个个体编号(号码从1到N);,(2)将这N个号码写在形状、大小相同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;,(5)将总体中与抽到的号签编号一致的n个个体取出。,(总体个数N,样本容量n),开始,编号,制签,搅匀,抽签,取出个体,结束,思考:,你认为抽签法有什么优点和缺点?,优点:抽签法能够保证每个个体入选样本的机会都相等,缺点:(1)当总体的个数较多时,制作号签的成本将会增加(2)号签很多时,“搅拌均匀”比较困难,结果很难保证每个个体入选样本的可能性相同,从0,1,2,9十个数中每次随机抽取一个数,依次排列成一个数表称为随机数表(见教材P103-105页),每个数每次被抽取的概率是多少?,例2:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,可以怎样操作?,随机抽样中,另一个常被采用的方法是随机数法.即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.,随机数表由数字0,1,2,9组成,并且每个数字在表中各个位置出现的机会都是一样的.,随机数表,教材103页,第一步,先将800袋牛奶编号,可以编为000,001,799.,第二步,在随机数表中任选一个数,例如选出第8行第7列的数7.,(为了便于说明,下面摘取了附表1的第6行至第10行).,第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916799,将它去掉,按照这种方法继续向右读,又取出567,199,507,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本.,一般地,利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?,第一步,将总体中的所有个体编号.,第二步,在随机数表中任选一个数作为起始数.,第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.,练习1:为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,试利用简单随机抽样法抽取样本,并简述其抽样过程.,方法一:抽签法;,方法二:随机数表法.,练习2:利用随机数表法从450名学生中抽出50人参加活动.(1)这450名学生可以怎样编号?(2)如果从随机数表第10行第8列的数开始往左读数,则最先抽取的5人的编号依次是什么?,随机数表法,1、随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。,2、用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的.,3、由于随机数表是等可能的,因此利用随机数表抽取样本保证了被抽取个体的可能性是相等的。,巩固练习,1、对于简单随机抽样,个体被抽到的机会(),A.相等B.不相等C.与抽取的次数有关D.不确定,2、从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25,则N=_,3、高一(1)班有49名学生,学号从01到49,数学老师在上统计课的时候,运用随机数表法选6名同学,老师首先选定随机数表法从第21行第29列开始,依次向右读取,这5位同学的号码依次为_,A,120,26、04、33、46、09、07,1、简单随机抽样包括抽签法和随机数表法,它们都是等概率抽样,从而保证了抽样的公平性.,2、简单随机抽样有操作简便易行的优点,在总体个数较小的情况下是行之有效的抽样方法.,小结,3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.,布置作业:,2.1.2系统抽样,简单随机抽样的概念,适用范围:总体中个体数较少的情况,抽取的样本容量也较小时。,复习回顾:,一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。,用抽签法抽取样本的步骤:,简记为:编号;制签;搅匀;抽签;取个体。,用随机数表法抽取样本的步骤:,简记为:编号;选数;读数;取个体。,问题4:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查。除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?,简单随机抽样适用于个体数不太多的总体。那么当总体个体数较多时,宜采用什么抽样方法呢?,分析:我们按这样的方法来抽样:首先将这名学生从开始进行编号,然后按号码顺序以一定的间隔进行抽取。由于,这个间隔可以定为,即从号码为的第一个间隔中随机地抽取一个号码,假如抽到的是号,然后从第号开始,每隔个号码抽取一个,得到,。这样就得到一个容量为的样本,这种抽取方法是系统抽样。,系统抽样,现将总体中的个体逐一编号,然后按号码顺序以一定的间隔k进行抽取,先从第一个间隔中随机地抽取一个号码,然后逐个抽取的号码依次增加间隔数即得到所求样本。,系统抽样的特点:,(1)用系统抽样抽取样本时,每个个体被抽到的可能性是相等的,,(2)系统抽样适用于总体中个体数较多,抽取样本容量也较大时;,(3)系统抽样是不放回抽样。,个体被抽取的概率等于,知识探究(二):系统抽样的操作步骤,思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?,将总体中的所有个体编号.,思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?,先从总体中随机剔除5个个体,再均衡分成60部分.,思考3:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段,每段各有多少个号码?,思考4:如果N不能被n整除怎么办?,从总体中随机剔除N除以n的余数个个体后再分段.,思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?,总体中的个体数N除以样本容量n所得的商.,用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.,思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?,思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?,系统抽样的步骤:,(1)采用随机的方式将总体中的个体编号;(2)将整个的编号按一定的间隔(设为K)分段,当(N为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被n整除,这时,,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号;(4)将编号为的个体抽出。,简记为:编号;分段;在第一段确定起始号;加间隔获取样本。,思考8:系统抽样与简单随机抽样比较,有何优、缺点?点评:(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;(2)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.(3)系统抽样比简单随机抽样的应用范围更广.,例1.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32分析用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B.,练习:,简单随机抽样,5,20,理论迁移,例2某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?,第二步,随机剔除2名学生,再把余下的320名学生随机编号为1,2,3,320.,第五步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.,第四步,在第1部分用抽签法确定起始编号.,第三步,把总体分成40个部分,每个部分有8个个体.,第一步,采用随机的方式给个体编号,1,2,322,练习1:某校共有118名老师,为了支持西部的教育事业,现要从中随机抽取16名老师到西部任教,用系统抽样选取支援西部的教师团合适吗?应该怎样抽样?,“现代研究证明,99%以上的人皮肤感染有螨虫.”,“某化妆品,可以彻底清除脸部皱纹,只需10天,就能让你的肌肤得到改善.”,“某减肥药真的灵,其减肥的有效率为75%.”,练习2:在数字化时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观、具体,所以让数据说话是许多广告的常用手法.下列广告中的数据可靠吗?,练习3:一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10组,组号依次为1,2,3,10,现用系统抽样抽取一个容量为10的样本,并规定:如果在第一组随机抽取的号码为m,那么在第k(k=2,3,10)组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,求该样本的全部号码.,6,18,29,30,41,52,63,74,85,96.,2.系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、方便.,小结,1.系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性.,两种抽样方法比较,2.1.3分层抽样,复习,1、我们学了哪些常用的收集相关数据的方法?,抽签法,随机数法,2、简单随机抽样有哪些常用方法?,简单随机抽样,系统抽样,3、系统抽样的基本含义如何?,将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.,第二步,确定分段间隔k,对编号进行分段.,第四步,按照一定的规则抽取样本.,第三步,在第1段用简单随机抽样确定起始个体编号l.,第一步,将总体的所有个体编号.,4、系统抽样的操作步骤是什么?,探究:某地区有高中生2400人,初中生10900人,小学生11000人.当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性.影响学生视力的因素是很复杂的,例如,不同年龄段的学生的近视情况可能存在明显差异.故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性.对于此类抽样问题,我们需要一个更好的抽样方法来解决.,探究:某地区有高中生2400人,初中生10900人,小学生11000人.当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,样本容量与总体个数的比例为1:100,则,高中应抽取人数为2400*1/100=24人,初中应抽取人数为10900*1/100=109人,,小学应抽取人数为11000*1/100=110人.,问题2:具体在三类学生中抽取样本时(如在10900名初中生中抽取109人),可以用哪种抽样方法进行抽样?,问题3:在上述抽样过程中,每个学生被抽到的概率相等吗?,问题1:在此,总体的个体数为24300,抽取1%的学生,样本容量为243,具体每个层次抽取的个体数是如何计算的?,上述抽样方法从学生人数这个角度来看,获得的样本结构与这一地区全体中小学生的结构是基本相同的.不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.,一般地,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这种抽样的方法是一种分层抽样.,高中生8人,初中生36人,小学生37人.,练习:某地区有高中生2400人,初中生10900人,小学生11000人.若用分层抽样从该地区抽取81名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?,练习:某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本.,思考1:该项调查应采用哪种抽样方法进行?,思考3:在各血型具体如何抽样?,思考2:按比例,各血型分别抽取多少人?,讨论:一般地,分层抽样的操作步骤如何?,第一步,计算样本容量与总体的个体数之比.,第四步,将各层抽取的个体合在一起,就得到所取样本.,第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.,第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.,调节样本容量,剔除个体.,讨论:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?,讨论:简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,请你对三种抽样方法作一个比较.,共同特点:抽样过程中每个个体被抽取的概率相等.,将总体分成均衡几部分,按规
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 班会课件-倾听
- 《污水处理厂设计与运行》课件
- 《流体动力学图像处理》课件
- 药用植物与生药学练习题含答案(附解析)
- 北欧简约风格室内设计解析
- 2024年8月工程安全管理基础测试题与答案(附解析)
- 7月兽医微生物学习题库及参考答案解析
- 搪瓷装饰制品在校园文化墙的设计考核试卷
- 公路几何设计案例分析
- 服装设计企划全案
- 《飞越疯人院》电影赏析
- 《建筑结构抗震设计》全套课件
- 农业综合执法大比武测试题
- 2024年高考历史复习试题汇编:材料分析题汇编(中国史+世界史)(教师卷)
- 厂区围墙翻新施工方案
- 山东省青岛市2024年小升初语文真题试卷及答案
- 农村房修建合同范本
- JT-T-1230-2018机动车发动机冷却液无机阴离子测定法离子色谱法
- GB/T 2039-2024金属材料单轴拉伸蠕变试验方法
- 跨界产品研发与实战智慧树知到期末考试答案章节答案2024年深圳职业技术大学
- 任务三 撰写直播脚本-活动2 商品直播脚本
评论
0/150
提交评论