抽样方法(一)――简单随机抽样_第1页
抽样方法(一)――简单随机抽样_第2页
抽样方法(一)――简单随机抽样_第3页
抽样方法(一)――简单随机抽样_第4页
抽样方法(一)――简单随机抽样_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 / 30 抽样方法(一)简单随机抽样 莲 山课件 m 抽样方法(一) 简单随机抽样 教学目的: 1.理解简单随机抽样的概念 会用简单随机抽样 (抽签法、随机数表法 )从总体中抽取样本 教学重点:简单随机抽样的概念抽签法、随机数表法 教学难点:进行简单随机抽样时, “ 每次抽取一个个体时任一个体 a被抽到的概率 ” 与 “ 在整个抽样过程中个体 a被抽到的概率 ” 的不同 教学过程: 一、复习回顾、创设情境: 在一次考试中,考生有 2 万名,为了得到这些考生的数学平均成绩,将他们的成绩全部相加再除以考生总数,那将是十分麻烦的,怎样才能了解到这些考生的数学平均成绩呢 ? 现有某灯泡厂生产的灯泡 10000只,怎样才能了解到这批灯泡的使用寿命呢? 要解决这两个问题,就需要掌握一些统计学知识在初中阶段,我们学习过一些统计学初步知识,了解了统计学的一些基本概念学习了总体、个体、样本、样本的容量、总体平均数、样本平均数的意义: 2 / 30 在统计学里,我们把所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取 的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数 统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况因此,样本的抽去是否得当,对于研究总体来说就十分关键究竟怎样从总体中抽取样本?怎样抽取的样本更能充分地反映总体的情况?本节课开始,我们就来学习几种常用的抽样方法 二、基础知识学习与研究: 假定一个小组有 6 个学生,要通过逐个抽取的方法从中 取 3个学生参加一项活动,第 1 次抽取时每个被抽到的概率是?(),第 2 次抽取时,余下的每个被抽到的概率都是?(),第 3 次抽取时,余下的每个被抽到的概率都是?()。这样的抽样就是简单随机抽样。 一般地,设一个总体的个体总数为 N,如果通过逐个抽取的方法从中抽取样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。 每次抽取时各个个体被抽到的概率是相等的,那么在整个抽样过程中每个个体被抽到的概率是否确实相等? 3 / 30 例如,从含有 6 个体的总体中抽取一个容量为 2 的样本,在整个抽 样过程中,总体中的任意一个个体,在第一次抽取时,它被抽到的概率是?();若它第 1 次未被抽到而第 2 次被抽到的概率是?()。 由于个体第 1 次被抽到与第 2 次被抽到是?(填互斥,独立)事件,根据互斥事件的概率加法公式,在整个抽样过程中,个体被抽到的概率 P?()。又由于个体的任意性,说明在抽样过程中每个体被抽到的概率相等,都是?()。 事实上:用简单随机抽样的方法从个体数为 N 的总体中逐次抽取一个容量为的样本,那么每个个体被抽到概率都等于。 由于简单随机抽样体现了抽样的客观性 和公平性,且这种抽样方法比较简单,所以成为一种基本的抽样方法。 如何实施简单抽样呢?下面介绍两种常用方法 ( 1)抽签法 先将总体中的所有个体编号(号码可以从 1 到 N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出 1 个号签,连续抽取次,就得到一个容量为的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等。 4 / 30 抽签法简便易行,当总体的个体 数不多时,适宜采用这种方法。 ( 2)随机数表法 下面举例说明如何用随机数表来抽取样本。 为了检验某种产品的质量,决定从 40件产品中抽取 10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行: 第一步,先将 40件产品编号,可以编为 00,01,02, 38,39。 第二步,在附录 1 随机数表中任选一个数作为开始,例如从第 8 行第 5 列的数 59 开始,为便于说明,我们将附录 1 中的第 6 行至第 10 行摘录如下。 16227794394954435482173793237887352096438426349164 84421753315724550688770474476721763350258392120676 63016378591695556719981050717512867358074439523879 33211234297864560782524207443815510013429966027954 57608632440947279654491746096290528477270802734328 第三步,从选定的数 59 开始向右读下去,得到一个两位数字号码 59,由于 59 39,将它去掉;继续向右读,得到 16,将它取出;继续下去,又得到 19,10,12,07,39,38,33,21,随后的两位数字号码是 12,由于它在前面已经取出,将它去掉,再继续下去,得到 34。至此, 10个样本号码已经取满,于是,所要抽取的样本号码是 5 / 30 16 19 10 12 07 39 38 33 21 34 注 将总体中的 N个个体编号时可以从 0开始,例如 N 100时编号可以是 00,01,02, 99,这样总体中的所 有个体均可用两位数字号码表示,便于运用随机数表。 当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。 在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。 三、知识应用与解 题研究: 例 1 对总数为 N 的一批零件抽取一个容量为 30 的样本,若每个零件被抽到的概率为,则 N 的值为() ( A) 120(B)200(c)150(D)100 解:因为从含有 N 个个体的总体中抽取一个容量为 30 的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;所以,从而有N=120.故选 A 四、巩固练习: P7练习 1、 2 6 / 30 五、总结提炼:统计的基本思想,简单随机抽样,什么样的总体适宜用简单随机抽样,如何用抽签法或随机数表法获取样本简 单随机抽样的常用方法: 抽签法、 随机数表法简单随机抽样是不放回抽样,是一种等概率抽样方法 六、课后作业: P9习题 1 3 七、检验反馈: 1.下列说法正确的是: (A)甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样 (B)期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好 (c)期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好 (D)期末考试数学平均成绩甲、乙两班相同 ,方差甲班比乙班小,则数学学习甲班比乙班好 2.一组数据的方差是,将这组数据中的每一个数据都乘以 2,所得到的一组数据的方差是() .; .; 3.从某鱼池中捕得 1200条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得 1000 条鱼,计算其中有记号的鱼为 100条,试估计鱼池中共有鱼的条数为 () 7 / 30 4.(1)已知一组数据 1, 2, 1, 0, 1, 2, 0, 1,则这组数数据的平均数为;方差为; (2)若 5, 1, 2, x 的平均数为 1,则 x=; (3)已知 n 个数据的和为 56,平均数为 8,则 n=; (4)某商场 4 月份随机抽查了 6 天的营业额,结果分别如下(单位:万元):,试估算该商场 4 月份的总营业额,大约是 _万元。 答案: (1)0,12(2)2(3)7(4)96 抽样方法(二) 分层抽样 教学目的: 1 理解分层抽样的概念; 2会用分层抽样从总体中抽取样本 教学重点:分层抽样概念的理解及实施步骤 教学难点:分层抽样从总体中抽取样本 教学 过程: 一、复习回顾:简单随机抽样、系统抽样。 二、基础知识学习与研究: 一个单位的职工有 500 人,其中不到 35 岁的有 125 人, 35岁至 49岁的有 280 人, 50岁以上的有 95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取 100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取? 为了使抽出的 100 名职工更充分地反映单位职工的整体情况,在各个年龄段可按这部分职工人数与职工总数的比进行8 / 30 抽样。 因为抽取人数与职工总数的比为 100: 500=1: 5 所以在各年龄段抽取的职工人数依次是即 25,56,19 在各个年龄段分别抽取时,可采用前面介绍的简单随机抽样的方法,将各年龄段抽取的职工合在一起,就是所要抽取的100名职工。 像这样当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽取叫做分层抽样,其中所分成的各部分叫做层。 可以看到,由于各部分抽取的个体数与这一部分个体数的比等于样本容量与总体的个体数的比,分层抽样时,每一个个体被抽到的概率都是 相等的。 由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着广泛的应用。 以上我们简单介绍了简单随机抽样和分层抽样,这两种抽样方法的共同特点是:在整个抽样过程中每个个体被抽取的概率相等。简单随机抽样是最基本的抽样方法,当总体由差异明显的几部分组成,采取分层抽样时,其中各层的抽样常采用简单随机抽样。 三、知识应用与解题研究: 9 / 30 例 1 某单位有老年人 28人 ,中年人 54人 ,青年人 81人 ,为了调 查他们的身体状况的某项指标 ,需从他们中间抽取一个容量为 36样本 ,适合的抽取样本的方法是 () A.简单的随机抽样 B.系统抽样 c.先从老年中排除一人 ,再用分层抽样 D.分层抽样 答案: c 例 2 一个单位有 500名职工,其中不到 35岁的有 125人,35岁 49岁的有 280人, 50岁以上的有 95人为了了解这个单位职工与身体状况有关的某项指标,如何从中抽取一个容量为 100的样本? 解:由于职工年龄与这项指标有关,故适于用分层抽样,抽样过程如下: 确 定样本容量与总体的个体数之比 100:500=1:5; 利用抽样比确定各年龄段应抽取的个体数,依次为 ,即 25, 56, 19 利用简单随机抽样或系统抽样的方法,在各年龄段分别抽取 25, 56, 19人,然后合在一起,就是所要抽取的样本 说明: 分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等概率抽样,它也是客观的、公平的; 分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以 根据情况采用不同的抽样方法,因此在10 / 30 实践中有着非常广泛的应用 例 3 某学校有职工 140 人,其中教师 91 人,教辅行政人员 28 人,总务后勤人员 21 人 .为了解职工的某种情况,要从中抽取一个容量为 20 的样本以下的抽样方法中,依简单随机抽样、系统抽样、分层抽样顺序的是 () 方法 1:将 140人从 1 140编号,然后制作出有编号 1 140的 140个形状、大小相同的号签,并将号签放人同一箱子里进行均匀搅拌,然后从中抽取 20 个号签,编号与签号相同的 20个人被选出; 方法 2:将 140人分成 20组 ,每组 7人,并将每组 7人按 1 7编号,在第一组采用抽签法抽出号 (17) ,则其余各组尾号也被抽到, 20 个人被选出; 方法 3:按 20:140=1:7 的比例,从教师中抽取 13 人,从教辅行政人员中抽取 4 人,从总务后勤人员中抽取 3 人从各类人员中抽取所需人员时,均采用随机数表法,可抽到 20个人 A方法 2,方法 1,方法 3B方法 2,方法 3,方法 1 c方法 1,方法 2,方法 3D方法 3,方法 1,方法 2 答案: c 四、巩固练习: P8练习: 1 3 1.统计某 区的高考成绩,在总数为 3000 人的考生中,省重点中学毕业生有 300人,区重点中学毕业生有 900人,普11 / 30 通中学毕业生有 1700 人,其他考生有 100 人从中抽取一个容量为 300的样本进行分析,各类考生要分别抽取多少人 ? 2.某农场在三块地种植某种试验作物,其中平地种有 150亩,河沟地种有 30亩,坡地种有 90亩现从中抽取一个容量为 18的样本,各类地要分别抽取多少亩 ? 3.一个工厂有若干车间,今采用分层抽样方法从全厂某天的2048件产品中抽取一个容量为 128 的样本进行质量检查若一车间这一天生产 256件产品,则从该车间抽取的产品件数为 _ 答案: 1.省重点中学抽取 30人,区重点中学抽取 90人,普通中学抽取 170人,其他考生抽取 10人 2.平地抽取 10亩,河沟地抽取 2 亩,坡地抽取 6 亩。 五、总结提炼:了解分层抽样的概率,会用分层抽样从总体中抽取样本。 六、课后作业: P9: 4、 5 总体分布的估计 教学目的: 1 了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布; 了 解当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布,并会用这两种方式估计总体分布 12 / 30 教学重点:用样本的频率分布估计总体分布 教学难点:频率分布表和频率分布直方图的绘制 教学过程: 一、复习回顾:频率分布 二、探索研究: 阅读 P9倒 1 段后的例 1,思考怎样进行总体分布的估计。 例 1 为了了解某地区高三学生的身体发育情况,抽查了地区内 100名年龄为岁 18岁的男生的体重情况 ,结果如下 (单位 :kg) 65 64 76 72 56 13 / 30 67 70 68 71 75 62 66 73 68 55 72 74 63 14 / 30 60 70 58 64 57 65 69 73 62 58 76 71 66 56 15 / 30 65 70 64 68 76 60 57 74 59 67 68 16 / 30 58 59 72 64 62 65 66 70 63 试根据上述数据画出样本的频率分布直方图 ,并对相应的总17 / 30 体分布作出估计。 解 :按照下列步骤获得样本的频率分布 . (1)求最大值与最小值的差 . 在上述数据中,最大值是 76,最小值是 55,它们的差 (又称为极差 )是 76 55=21)所得的差告诉我们,这组数据的变动范围有多大 . (2)确定组距与组数 . 如 果将组距定为 2,那么由 212= ,组数为 11,这个组数适合的 .于是组距为 2,组数为 11. ( 3)决定分点 . 根据本例中数据的特点,第 1 小组的起点可取为,第 1 小组的终点可取为,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是 “ 左闭右开 ” 的 .这样,所得到的分组是 ,),), ,) . ( 4)列频率分布表 分组 频数累计 频数 频率 ,) 18 / 30 2 ,) 6 ,) 10 ,) 10 ,) 14 ,) 16 19 / 30 ,) 13 ,) 11 ,) 8 ,) 7 ,) 3 合计 20 / 30 100 ( 5)绘制频率分布直方图 . 体重 频率 /组距 由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小 . 在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用 . 在得到了样本的频率后,就可以对相应的总体情况作出估计 .例如可以估计,体重在(,) kg 的学生最多,约占学生总数21 / 30 的 16%;体重小于的学生较少,约占 8%;等等 . 四、巩固练习: P12练习 1、 2 五、总结提炼:用样本的频率分布估计总体分布,可以分成两种情况讨论: 当总体中的个体取不同数值很少(并不是总体中的个数很少)时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图; 当总体中的个体取不同值较多、甚至无限时,对其频率分布的研究要用到初中学过的整理样本数据的知识 它们的不同之处在于:前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示取各个值的频率;后者的频率分布 表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率 六、课后作业: P12习题: 1、 2 七、检验反馈: 1.为检测某种产品的质量,抽取了一个容量为 30 的样本,检测结果为一级品 5 件,二级品 8 件,三级品 13 件,次品14件 列出样本频率分布表; 画出表示样本频率分布的条形图; 根据上述结果,估计此种商品为二级品或三级品的概率约22 / 30 是多少? 解: 样本的频率分布表为 产品 频数 频 率 一级品 5 二级品 8 三级品 13 次品 4 样本频率分布的条形图如右: 此种产品为二极品或三极品的概率为 += 2.如下表: 分组 频数 23 / 30 频率 分组 频数 频率 , ) 3 , ) 20 , ) 9 , ) 7 , ) 13 , ) 4 , ) 16 , ) 2 , ) 26 24 / 30 合计 100 完成上面的频率分布表 根据上表,画出频率分布直方图 根据上表,估计数据落在 , 范围内的概率约为多少 ? 答案: 1、 数据落在 , )范围的频率为 += 总体期望值的估计 教学目标: 1、使学生掌握用样本的平均数去估计总体期望值。 2、培养学生分析数据的能力。 教学重点:计算样本 (总体 )的平均数。 教学难点:适当抽样提高样本的代表性。 教学过程: 一、复习回顾: 在初中,总体平均数 (又称为总体期望值 )描述了一个总体的平均水平。对很多总体来说,它的平均数不易求得,常用容易求得的样本平均数:对它进行估计,而且常用两个样本平均数的大小去近似地比较相应的两个总体的平均数的大小。 二、探索研究: 例 1 在一批试验田里对某早稻品种进行丰产栽培试验,抽测了其中 15 块试验田的单位面 积 (单位面积的大小为 hm2)的产量如下 :(单位: kg) 25 / 30 504402492495500501405409 460486460371420456395 这批试验田的平均单位面积产量约是多少? 例 2 某校高二年级进行一次数学测试,抽取 40 人,算出其平均成绩为 80 分,为准确起见,后来又抽取 50 人,算出其平均成绩为 83 分,通过两次抽样的结果,估计这次数学测试的平均成绩。 例 3 被誉为 “ 杂交水稻之父 ” 的中国科学院院士袁隆平,为了得到良种水稻,进行了大量试验,下表是在 10 个试验点对 A、 B 两个品种的对比试验结果: 品种 各试验点亩产量 (kG) 1 2 3 4 5 6 7 8 9 10 26 / 30 A 490 509 527 497 520 582 497 489 538 532 B 504 486 463 475 530 473 470 475 453 512 27 / 30 试估计哪个品种的平均产量更高一些? 三、巩固练习: P15: 1、 2 四、总结提炼:用样本的平均数去估计总体平均数 (总体期望值 )简单易行,因而用途十分广泛,但估计的结果具有一定的近似性,甚至可能出现较大的偏差与疏误,这与确定性数学中通过逻辑推理得到肯定的结论的情况有所不同,学习中要注意体会。为了使样本更充分地反映总体的情况,可在条件许可的情况下,适当增加样 本容量,并力求使抽样方法更加合理,以提高样本的代表性。 四、课外作业: P17习题 1、 2 五、检验反馈: 1、已知 10个数据: 12031XX194120012041XX199120411951199 它们的平均数是 () A1300B1200c1100D1400 2、若 m 个数的平均数是 X,N个数的平均数是 y,则这 m+N个数的平均数是 () ABcD 3、某工厂研制 A、 B 两种灯泡,为了比较这两种灯泡的平均使用寿命,从这两种灯 泡中各抽 10只进行的使用寿命试验,得到如下数据 (单位:小时 ) A。 1000120016501342167999913XX4012761342 28 / 30 B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论