高中数学第二章2.2.1用样本的频率分布估计总体分布课件新人教版必修3【精品打包】
收藏
资源目录
压缩包内文档预览:
编号:1184566
类型:共享资源
大小:1.70MB
格式:RAR
上传时间:2017-05-01
上传人:me****88
IP属地:江西
3.6
积分
- 关 键 词:
-
高中数学
第二
样本
频率
分布
散布
估计
估量
总体
整体
课件
新人
必修
精品
打包
- 资源描述:
-
高中数学第二章2.2.1用样本的频率分布估计总体分布课件新人教版必修3【精品打包】,高中数学,第二,样本,频率,分布,散布,估计,估量,总体,整体,课件,新人,必修,精品,打包
- 内容简介:
-
复习回顾 1 你学过哪几种随机抽样方法? 简单随机抽样 系统抽样 分层抽样 抽签法 随机数法 2 三种抽样方法的比较 类别 各自特点 相互联系 适用范围 简单随机 抽样 系统 抽样 分层 抽样 从总体中 逐个抽取 将总体均分成几部分,按事先确定的规则在各部分抽取 将总体分成几层,分层进行抽取 在起始部分抽样时采用简单随机抽样 各层抽样时采用简单随机抽样或系统抽样 总体中的个体数较少 总体中的个体数较多 总体由差异明显的几部分组成 应用举例 例 1 填空 : 为了了解某地区参加数学竞赛的 1005名学生的数学成绩 ,打算从中抽取一个容量为 50的样本 ,现用系统抽样的方法 ,需要用 方法先从总体中剔除 个个体 ,然后按编号顺序每间隔 _个号码抽取一个 . 简单随机抽样 5 20 请归纳系统抽样方法的步骤: 1 编号 ; 2 确定组距 k; 3 在第一组用简单随机抽样方法确定第一个编号 x; 4 编号为 x 、 x+k、 x+2k、 、 x +( 应用举例 例 2 某校小礼堂举行心理讲座 ,有 500人参加听课 ,坐满小礼堂,现从中选取 25名同学了解有关情况 ,选取怎样的抽样方式更为合适 . 分析:宜采用系统抽样的方法,请写出具体的操作步骤。 2 把第一组的 1 20号写成标签 ,用抽签的方法从中 抽出第一个号码 x 3 号码为 x 、 x+10、 x+20、 、 x +490作为样本 1 把 500人的座位号按从小到大的顺序平均分成 25组 , 组距为 20 应用举例 例 3 某科研单位有科研人员 160人 ,其中具有高级以上职称的 24人 ,中级职称 48人 ,其余均为初级以下职称 ,现要抽取一个容量为 20的样本 ,试确定抽样方法 ,并写出抽样过程 . 宜采用分层抽样的抽取方法 ( 1) 按总体与样本容量确定抽取的比例 。 ( 2) 由分层情况 , 确定各层抽取的样本数 。 ( 4) 对于不能取整的数 , 求其近似值 。 ( 3) 各层的抽取数之和应等于样本容量 。 每个个体在整个抽样过程中被抽取的机会是否相等? 思考 分析: 每部分抽取的个体数 样本容量该部分的个体总数 总体中的个体数注意 : 1 、分层抽样适用于总体由差异明显的几部分组成的情 况,每一部分称为层,在每一层中实行简单随机抽样。 2 、分层抽样中分多少层,要视具体情况而定。总的原 则是:层内样本的差异要小,而层与层之间的差异尽可能地 大,否则将失去分层的意义。 练 习 1. 某公司在甲乙丙丁死各地区分别有 150个、 120个、180个、 150个销售点,公司为了调查产品销售情况,需从这 600个销售点抽取一个容量为 100的样本,记这项调查为;在丙地区中有 20个特大型销售点中抽取 7个调查其销售收入售后服务等情况,记这项调查为,则完成这两项调查采用的方法依次是( ) 统抽样 单随机抽样 层抽样 层抽样 B 练 习 2. 南京市的某 3个区共有高中学生 20000人,且 3个区的高中学生人数之比为 2: 3: 5,现在要用分层抽样的方法从所有学生中抽取一个容量为 200的样本,写出据体的抽样方法与操作步骤。 小 结 1 抽样时如何能保证抽取的样本代表性? 2 简单随机抽样是最基本的抽样方法,其它的抽样方法要用到简单随机抽样 随机抽样 假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做? 引例 : 1、简单随机抽样 显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢? 注意以下点: ( 1)它要求被抽取样本的总体的个体数有限; ( 2)它是从总体中逐个进行抽取; ( 3)它是一种不放回抽样; ( 4) 它是一种等可能性抽样 。 简单随机抽样是在特定总体中抽取样本 , 总体中每一个体被抽取的可能性是等同的 , 而且任何个体之间彼此被抽取的机会是独立的 。 如果用从个体数为 那么每个个体被抽取的概率等于 . N n 一般地 , 设一个总体的个体数为 N, 如果通过逐个 不放回 地抽取的方法从中抽取一个样本 , 且每次抽取时各个个体被抽到的机会 相等 , 就称这样的抽样为 简单随机抽样 。 简单随机抽样 思考? 下列抽样的方式是否属于简单随机抽样?为什么? ( 1)从无限多个个体中抽取 50个个体作为样本。 ( 2)箱子里共有 100个零件,从中选出 10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。 1、抽签法 (抓阄法 ) 一般地,抽签法就是把总体中的 号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取 得到一个容量为 抽签法的步骤 : 1、把总体中的 2、 把号码写在号签上,将号签放在一个容器中搅拌均匀; 3、每次从中抽取一个号签,连续抽取 得到一个容量为 你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗? 思考? 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平 2、用随机数法 定义:利用随机数表 、 随机数骰子或计算机产生的随机数进行抽样 , 叫随机数表法 , 这里仅介绍随机数表法 。 第一步 , 先将 800袋牛奶编号 , 可以编为 000, 001, , 799。 怎样利用随机数表产生样本呢 ? 下面通过例子来说明 , 假设我们要考察某公司生产的 500克袋装牛奶的质量是否达标 , 现从 800袋牛奶中抽取 60袋进行检验 , 利用随机数表抽取样本时 , 可以按照下面的步骤进行 。 第二步 , 在随机数表中任选一个数 , 例如选出第 8行第 7列的数 7( 为了便于说明 , 下面摘取了附表 1的第 6行至第 10行 ) 。 16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 87 35 20 96 43 84 26 34 91 64 21 76 33 50 25 83 92 12 06 76 12 86 73 58 07 44 39 52 38 79 15 51 00 13 42 99 66 02 79 54 90 52 84 77 27 08 02 73 43 28 上述问题中抽取样本的方法用 随机数表法来进行! 随机数表法的步骤: 第三步,从选定的数 7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数 785,由于 785 799,说明号码 785在总体内,将它取出;继续向右读,得到 916,由于 916 799,将它去掉,按照这种方法继续向右读,又取出 567, 199, 507, ,依次下去,直到样本的 60个号码全部取出,这样我们就得到一个容量为 60的样本。 ( 1)将总体的个体编号。 ( 2)在随机数表中选择开始数字。 ( 3)读数获取样本号码 。 【 例题精析 】 例 1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从 52张牌中抽取 13张牌,问这种抽样方法是否是简单随机抽样? 分析 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。 例 2:某车间工人加工一种轴 100件,为了了解这种轴的直径,要从中抽取 10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本? 解法 1:(抽签法)将 100件轴编号为 1, 2, , 100,并做好大小、形状相同的号签,分别写上这 100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个 10个号签对应的轴的直径。 解法 2:(随机数表法)将 100件轴编号为 00,01, 99 ,在随机数表中选定一个起始位置,如取第21行第 1个数开始,选取 10个为 68, 34, 30, 13, 70,55, 74, 77, 40, 44,这 10件即为所要抽取的样本。 系统抽样的定义: 一般地,要从容量为 将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样有以下特征: ( 1)当总体容量 用系统抽样。 ( 2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为 k ( 3)预先制定的规则指的是:在第 1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号。 思考? ( 1)你能举几个系统抽样的例子吗? ( 2)下列抽样中不是系统抽样的是 ( ) A、从标有 115号的 15个小球中任选 3个作为样本,按从小号到大号排序,随机确定起点 i,以后为 i+5, i+10(超过15则从 1再数起 )号入样 传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验 C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止 D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为 14的观众留下来座谈 点拨 :( 2) 为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。 系统抽样的一般步骤: ( 1)采用随机抽样的方法将总体中的 ( 2)将整体按编号进行分段,确定分段间隔 k(k N,Lk). ( 3)在第一段用简单随机抽样确定起始个体的编号 L( L N,Lk)。 ( 4)按照一定的规则抽取样本,通常是将起始编号 个个体编号 L+K,再加上个个体编号 L+2K,这样继续下去,直到获取整个样本。 【 说明 】 从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。 【 例题精析 】 例 3、某校高中三年级的 295名学生已经编号为 1, 2, , 295,为了了解学生的学习情况,要按 1: 5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。 分析 按 1: 5分段,每段 5人,共分 59段,每段抽取一人,关键是确定第 1段的编号。 解:按照 1: 5的比例,应该抽取的样本容量为 295 5=59,我们把 259名同学分成 59组,每组 5人,第一组是编号为 1 5的 5名学生,第 2组是编号为 6 10的 5名学生,依次下去,59组是编号为 291 295的 5名学生。采用简单随机抽样的方法,从第一组 5名学生中抽出一名学生,不妨设编号为 k(1k5),那么抽取的学生编号为 k+5L(L=0,1,2, , 58),得到 59个个体作为样本,如当 k=3时的样本编号为 3, 8, 13, , 288, 293。 例 4、从忆编号为 1 50的 50枚最新研制的某种型号的导弹中随机抽取 5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取 5枚导弹的编号可能是 A 5, 10, 15, 20, 25 B、 3, 13, 23, 33, 43 C 1, 2, 3, 4, 5 D、 2, 4, 6, 16, 32 分析 用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中 d=50/5=10,到 10中用简单随机抽样方法得到的数,因此只有选项 选 B。 练习: 1、从 2005个编号中抽取 20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( ) A 99 B、 C 100 D、 2、采用系统抽样从个体数为 83的总体中抽取一个样本容量为 10的样本,那么每个个体抽到的可能性为 ( ) A 8 C 3、某小礼堂有 25排座位,每排 20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是 15的所有 25名学生进行测试,这里运用的是 抽样方法。 3 分层抽样 当已知总体由差异明显的几部分组成时 , 为了使样本充分地反映总体的情况 , 常将总体分成几部分 , 然后按照各部分所占的比例进行抽样 。 其中所分成的各部分叫做层 。 由于分层抽样的要求不同 , 各层的抽样的样本容量也不相同 ,所以 , 应当按照实际情况 , 合理地将样本容量分配到各个层 ,以确保抽样的合理性 , 研究时可以根据不同的要求来分层抽样 。 分层抽样适用于总体由差异明显的几部分组成的情况 ,每一部分称为层 , 在每一层中实行简单随机抽样 。 这种方法较充分地利用了总体己有信息 , 是一种实用 、 操作性强的方法 。 分层抽样的一个重要问题是一个总体如何分层 。 分层抽样中分多少层 , 要视具体情况而定 。 总的原则是:层内样本的差异要小 , 而层与层之间的差异尽可能地大 , 否则将失去分层的意义 。 分层抽样的实施步骤: ( 2) 根据总体中的个体数 k= ( 3) 确定各层应该抽取的个体数 。 各层的抽取数之和应等于样本容量 。 对于不能取整的数 , 求其近似值 。 ( 4) 按 (3)中确定的数目在各层中随机抽取个体 ,合在一起得到容量为 ) 根据已有信息 ,将总体分成互不相交的层 ; (1)分层抽样适用于总体由差异明显的几部分组成的情况 , 每一部分称为层 , 在每一层中实行简单随机抽样 。 这种方法较充分地利用了总体己有信息 , 是一种实用 、 操作性强的方法 。 而且更具代表性 。 (2)分层抽样的一个重要问题是总体如何分层 ,分多少层 , 这要视具体情况而定 。 总的原则是:层内样本的差异要小 , 而层与层之间的差异尽可能地大 , 否则将失去分层的意义 。 注 : 例 2、 一个单位的职工有 500人 , 其中不到 35岁的有 125人 ,35 49岁的有 280人 , 50岁以上的有 95人 。 为了了解该单位职工年龄与身体状况的有关指标 , 从中抽取 100名职工作为样本 , 应该怎样抽取 ? 分析:这总体具有某些特征 , 它可以分成几个不同的部分:不到 35岁; 35 49岁; 50岁以上 , 把每一部分称为一个层 , 因此该总体可以分为 3个层 。 由于抽取的样本为 100, 所以必须确定每一层的比例 , 在每一个层中实行简单随机抽样 。 解:抽取人数与职工总数的比是 100: 500 1: 5, 则各年龄段 ( 层 ) 的职工人数依次是 125: 280: 95 25: 56: 19,然后分别在各年龄段 ( 层 ) 运用简单随机抽样方法抽取 。 答:在分层抽样时 , 不到 35岁 、 35 49岁 、 50岁以上的三个年龄段分别抽取 25人 、 56人和 19人 。 分层抽样的抽取步骤: ( 1) 总体与样本容量确定抽取的比例 。 ( 2) 由分层情况 , 确定各层抽取的样本数 。 ( 3) 各层的抽取数之和应等于样本容量 。 ( 4) 对于不能取整的数 , 求其近似值 。 4三种抽样方法的比较 一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为 12000人,其中持各种态度的人数如下所示: 很喜爱 喜爱 一般 不喜爱 2400 4200 3800 1600 打算从中抽取 60人进行详细调查,如何抽取? 5课堂练习 抽签法 随机数表法 注 :随机抽样并不是随意或随便抽取 , 因为随意或随便抽取都会带有主观或客观的影响因素 . 小结 一般地 , 设一个总体的个体数为 N, 如果通过逐个抽取的方法从中抽取一个样本 , 且每次抽取时各个个体被抽到的概率相等 , 就称这样的抽样为简单随机抽样 。 3、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为: ( 1)采用随机的方法将总体中个体编号; ( 2)将整体编号进行分段,确定分段间隔 k(k N); ( 3)在第一段内采用简单随机抽样的方法确定起始个体编号 L; ( 4)按照事先预定的规则抽取样本。 4、在确定分段间隔 段间隔 不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔 k。 量间的相关关系 . 自主学习: 关关系 ( 1)概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。 ( 2)相关关系与函数关系的异同点。 相同点:两者均是指两个变量间的关系。 不同点:函数关系是一种确定关系,是一种因果系;相关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。 ( 3)相关关系的分析方向。 在收集 大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。 探究 : . 年龄 脂肪 23 7 9 1 5 49 0 3 4 6 7 龄 脂肪 58 0 1 上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗? 练习 下列两个变量之间的关系 ,哪个不是函数关系 ( ). C.正 从上表发现,对某个人不一定有此规律,但对很多个体放在一起,就体现出“人体脂肪随年龄增长而增加” 这一规律 我们也可以对它们作统计图、表,对这两个变量有一个直观上的印象和判断 . 下面我们以年龄为横轴, 脂肪含量为纵轴建立直 角坐标系,作出各个点, 称该图为 散点图 。 65 10 15 20 25 30 O 20 25 30 35 40 45 50 55 60 年龄 脂肪含量 5 35 40 从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成 正相关 。 但有的两个变量的相关,如下图所示: 如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗 1升汽油所行使的 平均路程,称它们成 负相关 . O 我们再观察它的图像发现这些点大致分布在一条直线附 近 ,像这样,如果散点图中点的分布从整体上看大致在 一条直线附近,我们就称这两个变量之间具有线性相 关关系 ,这条直线叫做回归直线,该直线叫 回归方程 。 那么,我们该怎样来求出这个回归方程? 请同学们展开讨论,能得出哪些具体的方案? 20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量 0 5 10 15 20 25 30 35 40 . 方案 1、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的和最小时,测出它的斜率和截距,得回归方程。 20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量 0 5 10 15 20 25 30 35 40 . 方案 2、 在图中选两点作直线,使直线两侧 的点的个数基本相同。 20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量 0 5 10 15 20 25 30 35 40 方案 3、 如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距。而得回归方程。 如图 : 我们还可以找到 更多的方法,但 这些方法都可行 吗 ?科学吗? 准确吗?怎样的 方法是最好的? 20 25 30 35 40 45 50 55 60 65 年龄 脂肪含量 0 5 10 15 20 25 30 35 40 我们把由一个变量的变化 去推测另一个变量的方法 称为 回归方法。 我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式 : y,)()(1221121以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫 最小二乘法 。(参看课本 一、求线性回归方程 例 1:观察两相关变量得如下表: x 2 4 3 4 2 1 y 7 3 5 3 7 9 求两变量间的回归方程 解: 列表: i 1 2 3 4 5 6 7 8 9 10 2 4 3 4 2 1 7 3 5 3 7 9 9 14 15 12 5 5 15 12 14 9 0,0 101011012 00101 1 0101010122101 所求回归直线方程为 y=x 小结:求线性回归直线方程的步骤: 第一步:列表 ; 第二步:计算 ; 第三步:代入公式计算 b, 第四步:写出直线方程。 , 112 ,例 2:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 摄氏温度 0 4 7 12 15 19 23 27 31 36 热饮杯数 156 150 132 128 130 116 104 89 93 76 54 (1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的一 般规律; (3)求回归方程; (4)如果某天的气温是 C,预测这天卖出的热饮杯数。 20二、利用线性回归方程对总体进行估计 解 : (1)散点图 (2)气温与热饮杯数成负相关 ,即气温越高, 卖出去的热饮杯数越少。 405060708090100110120130140150160 10 20 30 40温度 热饮杯数 (3)从散点图可以看出,这些点大致分布在一条直线附近。 405060708090100110120130140150160 10 20 30 40Y= ( 4)当 x=2时, y=此,这天大约可以卖出 143杯热饮。 5个学生的数学和物理成绩如下表: A B C D E 数学 80 75 70 65 60 物理 70 68 65 64 62 (1)画出散点图 ; (2)是否线性相关?若是则求出线性回归方程 ; 练习: 小结: ( 1)判断变量之间有无相关关系,简便方法就是画散点图。 ( 2)当数字少时,可用人工或计算器,求回归方程;当数字多时,用 ( 3)利用回归方程,可以进行预测。 某商场一年内前五月的销售收入 x(万元 )与销售费用 y(万元 )统计如下表 : 收入 x 100 120 140 160 180 费用 y 45 54 62 75 92 (1)画出散点图 ; (2)是否线性相关?若是则求出线性回归方程 ; 作业: 年龄 脂肪含量23 0 40 60脂肪含量年龄 脂肪含量 60 80脂肪含量 数学成绩 物理成绩8070i123457568xi80757065607065yi70686564626564640056254900422536006062xi*yi5600510045504160372090807060504050556065707580y = 0.4x + 37.8数学成绩物理成绩2( )ix摄氏温度 ( ) 热饮杯数560 1504 1327 12812 13015 11619 10423 8927 9331 7636 54画散点图 5060708090100110120130140150160170 10 20杯数温度 30 40摄氏温度 ( ) 热饮杯数 准预测值 差的平方 粗预测值 差的平方56 35 4410 150 40 1004 132 44 1447 128 47 36112 130 52 48415 116 55 152119 104 59 302523 89 63 547627 93 67 547631 76 71 902536 54 76 0937比较大小 取小 050100150200250300350400 10 20 30 40实际准预测粗预测标准 3:样本数据的点到它的距离的平方和最小 . 探究 3 a 40.= 3与 实际 准预测 粗预测 变 ) 热饮杯数 预测值 预测 56 50 32 28 30 16 04 9 3 6 4 上方点数 方点数 7探究 1 050100150200250杯数变 改变 A进行观察分析 20 40温度 标准 1:使直线两侧点数相同 摄氏温度 ( ) 热饮杯数 A 56 50 32 507 128 30 16 04 9 4627 9331 76 4 50随机选取直线条数 2 146A B 2 50 20 40杯数温度 标准 2:直线的平均值 种类数 海拔/25030 115837 106711 45711 70113 73117 61013 67029 14934 776215 549y = 0 40海拔/鸟的种类数与海拔高度的关系 系列 1线性 列 1 线性 (系列 1) 热量的百分比 口味纪录25 8934 8920 8019 7826 7520 7119 6524 6219 6013 52 y = 204060801000 10 20 30 40口味的评价食品所含的热量的百分比 不同种类的食品的口味评价 系列 1 线性 (系列 1) 零件个数 加工时间10 6220 6830 7540 8150 8960 9570 10280 10890 115100 122平均工资 消费水平14054 704011056 73467022 50336065 39326347 37657895 63667158 52167094 563216641 119439171 623911201 79856516 49859490 62556749 34827656 60606494 42146991 52959269 529012245 89876776 49876865 47007182 61907249 48766595 43348276 493312962 46856931 45207427 46159081 43847392 38137611 3988020004000600080001000012000140000 5000 10000 15000居民消费水平职工平均工资 职工工资与消费水平的关系 系列 1 20000用样本的频率分布 估计总体分布 目标导学 1、通过实例体会分布的意义和作用。学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。 2、会解决一些简单的实际问题。 主体自学 看书: 6 统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过 从总体中抽取一个样本 , 根据样本的情况去估计总体的相应情况 . 统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断 . 这里包括两类问题: 一类是如何从总体中抽取样本 ? 另一类是如何根据对样本的整理、计算、分析 , 对总体的情况作出推断 . 用样本的有关情况去估计总体的相应情况 , 这种估计大体分为两类, 一类是用样本频率分 布估计总体分布, 一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。 整体介绍: 将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的 频数 。 频率:每组数据的个数除以全体数据个数的商叫做该组的 频率 。 根据随机抽取样本的大小, 分别计算某一事件出现的频率 , 这些频率的分布规律 (取值状况),就叫做 样本的频率分布 。 说明 :样本频率分布与总体频率分布有什么关系 ? 通过样本的 频数分布 、 频率分布 可以估计总体的频率分布 . 如何用样本的频率分布估计总体分布? 例: 某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准 a , 用水量不超过 过 如果希望大部分居民的日常生活不受影响,那 么标准 为了较合理地确定这个标准, 你认为 需要做 哪些工作? 2000年全国主要城市中缺水情况排在前 10位的城市 思考: 由上表,大家可以得到什么信息? 通过抽样,我们获得了 100位居民某年的月平均用 水量 (单位:t) ,如下表: 步骤: 频率分布直方图 组数 = = 距 极差 = 0, , 1 ), , 4, 100位居民月平均用水量的频率分布表 频率 /组距 月平均用水量 /t 1 2 3 4 一 、 求 极差, 即数据中最大值与最小值的差 二、决定 组距 与组数 :组距 =极差 /组数 三、分组 ,通常对组内数值所在区间, 取 左闭右开 区间 , 最后一组取闭区间 四、登记 频数 ,计算 频率 ,列出 频率分布表 画一组数据的频率分布直方图 ,可以按以下的步骤进行 : 五、画出 频率分布直方图 (纵轴表示 频率组距 ) 频率分布直方图如下 : 月均用水量/t 频率 组距 接频率分布直方图中各小长方形上端的中点 ,得到 频率分布折线图 利用样本频分布对总体分布进行相应估计 ( 3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线 总体密度曲线 。 ( 2) 样本容量越大 , 这种估计越精确 。 ( 1) 上例的样本容量为 100, 如果增至 1000,其频率分布直方图的情况会有什么变化 ? 假如增至 10000呢 ? 总体密度曲线 频率 组距 月均用水量 /t a b (图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。 总体密度曲线反映了总体在各个范围内取值的百分比 ,精确地反映了总体的分布规律 。 是研究总体分布的工具 . 用样本分布直方图去估计相应的总体分布时 , 一般样本容量越大 , 频率分布直方图 就会无限接近 总体密度曲线 , 就越精确地反映了总体的分布规律 , 即越精确地反映了总体在各个范围内取值百分比 。 探究: 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以 1和 后谈谈你对图的印象。 练 习 0的样本数据的分组的频数如下: 3 8 9 11 10 5 4 (1)列出样本的频率分布表 ; (2)画出频率分布直方图 ; (3)根据频率分布直方图估计 ,数据落在 百分比是多少 ? 解 :组距为 3 分组 频数 频率 频率 / 组距 3 8 9 11 10 5 4 率分布直方图如下 : 频率 组距 堂练习: 1、 为检测某种产品的质量 , 抽取了一个容量为 30的样本 , 检测结果为一级品 5件 , 二级品 8件 , 三级品 13件 , 次品 4件 (1) 列出样本的频率分布表; (2)根据上述结果 , 估计此种产品为二级品或三级品的概率约是多少 解: ( 1)样本的频率分布表为: 次品 3 三级品 二级品 一级品 频率 频数 产品 (2)此种产品为二级品或三级品的概率约为 00的样本 ,数据的分组和各组的相关信息如下表 ,试完成表中每一行的两个空格 . 分组 频数 频率 频率累计 12,15) 6 15,18) 18,21) 21,24) 21 24,27) 27,30) 16 30,33) 33,36 计 100 16 8 0 茎叶图 某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下: (1)甲运动员得分: 13,51,23,8,26,38,16,33,14,28,39 (1)乙运动员得分 : 49,24,12,31,50,31,44,36,15,37,25,36,39 茎叶图 甲 乙 0 1 2 3 4 5 2 5 5 4 1 6 1 6 7 9 4 9 0 8 4 6 3 3 6 8 3 8 9 1 叶就是从茎的旁边生长出来的数,表示得分的个位数。 茎是指中间的一列数,表示得分的十位数 茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。 课堂小结 编制频率分布直方图的步骤 : 找最大值与最小值。 决定组距与组数 决定分点 登记频数,计算频率,列表,画直方图 说明 :(1)确定分点时 ,使分点比数据多一位小数 ,并且把第 1小组的起点稍微再小一点 . 对某电子元件进行寿命跟踪调查,情况如下: 1)、列出频率分布表 ,画频率分布直方图。 2)、估计电子元件寿命在 100h4003)、估计电子元件寿命在 400寿命 ( h ) 1 0 0 2 0 0 2 0 0 3 0 0 3 0 0 4 0 0 4 0 0 5 0 0 5 0 0 6 0 0个数 20 30 80 40 30作业: 用样本的数字特征估计总体的数字特征 一、 众数、中位数、平均数的概念 中位数 :将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数 众数 :在一组数据中,出现次数最多的数据叫做这组数据的众数 众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛 . 平均数 : 一组数据的算术平均数 ,即 x= )练习 : 在一次中学生田径运动会上,参加男子跳高的 17名运动员的成绩如下表所示: 成绩 (单位:米 ) 1 50 1 60 1 65 1 70 1 75 1 80 1 85 1 90 人数 2 3 2 3 4 1 1 1 分别求这些运动员成绩的众数,中位数与平均数 一组数据的算术平均数 即 解:在 17个数据中, 次,出现的次数最多,即这组数据的众数是 上面表里的 17个数据可看成是按从小到大的顺序排列的,其中第 9个数据 这组数据的中位数是 这组数据的平均数是 答: 17名运动员成绩的众数、中位数、平均数依次是 )、 )、 ) . 频率 组距 1 2 3 4 月平均用水量 (t) 二 、众数、中位数、平均数与频率分布直方图的关系 1、 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 例如,在上一节调查的 100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是 频率 组距 1 2 3 4 月平均用水量 (t) 2、 在样本中,有 50的个体小于或等于中位数,也有 50的个体大于或等于中位数 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为 说明 : 与样本的中位数值 这是因为样本数据的频率分布直方图 ,只是直观地表明分布的形状 ,但是从直方图本身得不出原始的数据内容 ,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致 . 3、 平均数是频率分布直方图的“重心” . 是直方图的平衡点 . 等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 三 三种数字特征的优缺点 1、 众数 体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征 告诉我们 ,月均用水量为 但它并没有告诉我们多多少 . 2、 中位数 是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为 10t,那么它所占频率为 乎不影响中位数 ,但显然这一极端值是不能忽视的。 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 四 众数、中位数、平均数的简单应用 例 某工厂人员及工资构成如下: 人员 经理 管理人员 高级技工 工人 学徒 合计 周工资 2200 250 220 200 100 人数 1 6 5 10 1 23 合计 2200 1500 1100 2000 100 6900 ( 1)指出这个问题中周工资的众数、中位数、平均数 ( 2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么? 分析 :众数为 200,中位数为 220,平均数为 300。 因平均数为 300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。 平均数向我们提供了样本数据的重要信息 ,但是平均有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的实际状态 如:有两位射击运动员在一次射击测试中各射靶 10次,每次命中的环数如下: 甲: 乙: 如果你是教练 ,你应当如何对这次射击作出评价 ? 如果看两人本次射击的平均成绩 ,由于 77 乙甲 x,的平均成绩是一样的 五 4 5 6 7 8 9 10 环数 频率 甲 ) 4 5 6 7 8 9 10 数 频率 (乙 ) 直观上看 ,还是有差异的 甲成绩比较分散 ,
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。