




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 2 1用样本的频率分布估计总体分布 我们用简单随机抽样 系统抽样 分层抽样的方法收集样本数据后 就可以通过样本研究总体 用样本估计总体的两种情况 用样本的频率分布估计总体分布 用样本的数字特征 平均数 标准差等 估计总体的数字特征 复习回顾 频数 不分组时 数据中某个数据出现的次数分组时 一个组内的数据的个数 频率 极差 最大数 最小数 频率分布表 知识探究 一 频率分布表 某市政府为了节约生活用水 计划在本市试行居民生活用水定额管理 即确定一个居民月用水量标准a 用水量不超过a的部分按平价收费 超出a的部分按议价收费 问题1 如果希望大部分居民的日常生活不受影响 那么标准a定为多少比较合理 问题2 为了较为合理的确定标准a 需要做哪些工作 通过抽样调查 获得100位居民2007年的月均用水量如下表 单位 t 3 12 52 02 01 51 01 61 81 91 63 42 62 22 21 51 20 20 40 30 43 22 72 32 11 61 23 71 50 53 83 32 82 32 21 71 33 61 70 64 13 22 92 42 31 81 43 51 90 84 33 02 92 42 41 91 31 41 80 72 02 52 82 32 31 81 31 31 60 92 32 62 72 42 11 71 41 21 50 52 42 52 62 32 11 61 01 01 70 82 42 82 52 22 01 51 01 21 80 62 2 问题3 这些数字告诉了我们什么信息 我们可以看出 样本数据中的最大值4 3和最小值 其他数据在0 2 4 3之间 分析数据的基本方法 用图画出来用表格重新排列 1 借助于图 频率分布直方图 频率分布折线图 茎叶图两个目的 从数据中提取信息 利用图形传递信息 2 借助于表格 频率分布表两个目的 改变数据的排列方式 提供解释数据的新方式 第二步 确定组距 组数组距 每个小组两个端点的差 组数 极差 组距 取整数 探究一频率分布表 4 1 0 5 8 2将8 2取整 组数 9 组距 0 5 思考1 上述100个数据的最小值和最大值分别是多少 第一步 求极差 思考2 分成多少组合适 如果将上述100个数据按组距为0 5进行分组 那么这些数据共分为多少组 极差 4 3 0 2 4 1 5 12组 第四步 列频率分布表 探究一频率分布表 思考3 各组数据的取值范围如何设定 第三步 确定端点 将数据分组各组均为左开右闭区间 最后一个闭区间 思考4 如何统计各族中的频数 频率 0 0 5 0 5 1 1 1 5 4 4 5 分组频数频率频率 组距 0 0 5 40 040 08 0 5 1 80 080 16 1 1 5 150 150 30 1 5 2 220 220 44 2 2 5 250 250 50 2 5 3 140 140 28 3 3 5 60 060 12 3 5 4 40 040 08 4 4 5 20 020 04合计1001 002 探究 二 画频率分布直方图 第一步 画直角坐标系 x轴为数据单位 y轴为频率 组距 第二步 在x轴上均匀标出各组分点 在y轴上标出单位长度 第三步 以组距为宽 各组的频率 组距为高 分别画出各组对应的长方形 问题1 频率分布直方图中各小长方形的宽度和高度在数量上有何特点 宽度 组距 2频率分布直方图的意义 问题2 频率分布直方图中各小长方形的面积表示什么 各小长方形的面积之和为多少 各小长方形的面积 各小组的频率 各小长方形的面积之和 1 宽度 组距 3分析例题 频率分布直方图非常直观地表明了样本数据的分布情况 使我们能够看到频率分布表中看不太清楚的数据模式 但原始数据不能在图中表示出来 你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗 1 居民月均用水量的分布是 山峰 状的 而且是 单峰 的 2 大部分居民的月均用水量集中在一个中间值附近 只有少数居民的月均用水量很多或很少 3 居民月均用水量的分布有一定的对称性等 思考 对一组给定的样本数据 频率分布直方图的外观形状与哪些因素有关 在居民月均用水量样本中 你能以1为组距画频率分布直方图吗 与分组数 或组距 及坐标系的单位长度有关 1 求极差 即一组数据中最大值与最小值的差 知道这组数据的变动范围4 3 0 2 4 1 2 决定组距与组数 将数据分组 3 将数据分组 8 2取整 分为9组 画频率分布直方图的步骤 4 列出频率分布表 填写频率 组距一栏 5 画出频率分布直方图 组距 指每个小组的两个端点的距离 组距组数 将数据分组 当数据在100个以内时 按数据多少常分5 12组 小结 理论迁移 例1某地区为了了解知识分子的年龄结构 随机抽样50名 其年龄分别如下 42 38 29 36 41 43 54 43 34 44 40 59 39 42 44 50 37 44 45 29 48 45 53 48 37 28 46 50 37 44 42 39 51 52 62 47 59 46 45 67 53 49 65 47 54 63 57 43 46 58 1 列出样本频率分布表 2 画出频率分布直方图 3 估计年龄在32 52岁的知识分子所占的比例约是多少 1 极差为67 28 39 取组距为5 分为8组 分组频数频率频率 组距 27 32 30 060 012 32 37 30 060 012 37 42 90 180 036 42 47 160 320 064 47 52 70 140 028 52 57 50 100 020 57 62 40 080 016 62 67 30 060 012合计501 000 200 样本频率分布表 2 样本频率分布直方图 3 因为0 06 0 18 0 32 0 14 0 7 故年龄在32 52岁的知识分子约占70 例2 为了了解高一学生的体能情况 某校抽取部分学生进行一分钟跳绳次数次测试 将所得数据整理后 画出频率分布直方图 如图 图中从左到右各小长方形面积之比为2 4 17 15 9 3 第二小组频数为12 第二小组的频率是多少 样本容量是多少 若次数在110以上 含110次 为达标 试估计该学校全体高一学生的达标率是多少 练习巩固 1 有一个容量为50的样本数据的分组及各组的频数如下 12 5 15 5 3 24 5 27 5 10 15 5 18 5 8 27 5 30 5 5 18 5 21 5 9 30 5 33 5 4 21 5 24 5 11 列出样本的频率分布表和画出频率分布直方图 根据样本的频率分布估计 小于30 5的数据约占多少 解 组距为3 分组频数频率频率 组距 12 5 15 5 3 15 5 18 5 8 18 5 21 5 9 21 5 24 5 11 24 5 27 5 10 27 5 30 5 5 30 5 33 5 4 0 060 160 180 220 200 100 08 0 0200 0530 0600 0730 0670 0330 027 频率分布直方图如下 0 010 0 020 0 030 0 040 0 050 12 5 15 5 0 060 0 070 课堂练习 2 2006年全国卷II 一个社会调查机构就某地居民的月收入调查了10000人 并根据所得数据画了样本的频率分布直方图 如下图 为了分析居民的收入与年龄 学历 职业等方面的关系 要从这10000人中再用分层抽样方法抽出100人作进一步调查 则在 2500 3000 元 月收入段应抽出 人 0 0001 0 0002 0 0003 0 0004 0 0005 1000150020002500300035004000 月收入 元 频率 组距 课堂练习 2 一个社会调查机构就某地居民的月收入调查了10000人 并根据所得数据画了样本的频率分布直方图 如下图 为了分析居民的收入与年龄 学历 职业等方面的关系 要从这10000人中再用分层抽样方法抽出100人作进一步调查 则在 2500 3000 元 月收入段应抽出 人 0 0001 0 0002 0 0003 0 0004 0 0005 月收入 元 频率 组距 25 1000150020002500300035004000 课堂练习 3 某班50名学生在一次百米测试中 成绩全部介于13秒与19秒之间 将测试结果按如下方式分成六组 第一组 成绩大于等于13秒且小于14秒 第二组 成绩大于等于14秒且小于15秒 第六组 成绩大于等于18秒且小于等于19秒 右图是按上述分组方法得到的频率分布直方图 设成绩小于17秒的学生人数占全班总人数的百分比为x 成绩大于等于15秒且小于17秒的学生人数为y 则从频率分布直方图中可分析出x和y分别为 A 0 9 35B 0 9 45C 0 1 35D 0 1 45 课堂练习 3 某班50名学生在一次百米测试中 成绩全部介于13秒与19秒之间 将测试结果按如下方式分成六组 第一组 成绩大于等于13秒且小于14秒 第二组 成绩大于等于14秒且小于15秒 第六组 成绩大于等于18秒且小于等于19秒 右图是按上述分组方法得到的频率分布直方图 设成绩小于17秒的学生人数占全班总人数的百分比为x 成绩大于等于15秒且小于17秒的学生人数为y 则从频率分布直方图中可分析出x和y分别为 A 0 9 35B 0 9 45C 0 1 35D 0 1 45 A 课堂练习 4 为了了解某地区高三学生的身体发育情况 抽查了该地区100名年龄为17 5岁 18岁的男生体重 kg 得到频率分布直方图如下 根据上图可得这100名学生中体重在 56 5 64 5 的学生人数是 A 20B 30C 40D 50 0 03 0 05 0 07 54 5 58 5 62 5 66 5 70 5 74 5 课堂练习 4 为了了解某地区高三学生的身体发育情况 抽查了该地区100名年龄为17 5岁 18岁的男生体重 kg 得到频率分布直方图如下 C 0 03 0 05 0 07 54 5 58 5 62 5 66 5 70 5 74 5 根据上图可得这100名学生中体重在 56 5 64 5 的学生人数是 A 20B 30C 40D 50 课堂练习 输入A1 A2 An a 0i 4 输出s 是 否 开始 结束 课堂练习 B 输入A1 A2 An a 0i 4 输出s 是 否 开始 结束 小结 画频率分布直方图的步骤 第一步 求极差 数据组中最大值与最小值的差距 第二步 决定组距与组数 强调取整 第三步 将数据分组 给出组的界限 第四步 列频率分布表 包括分组 频数 频率 频率 组距 第五步 画频率分布直方图 在频率分布表的基础上绘制 横坐标为样本数据尺寸 纵坐标为频率 组距 组距 指每个小组的两个端点的距离 组距组数 将数据分组 当数据在100个以内时 按数据多少常分5 12组 注意 2 纵坐标为 第二节 3分析例题 频率分布直方图非常直观地表明了样本数据的分布情况 使我们能够看到频率分布表中看不太清楚的数据模式 但原始数据不能在图中表示出来 你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗 1 居民月均用水量的分布是 山峰 状的 而且是 单峰 的 2 大部分居民的月均用水量集中在一个中间值附近 只有少数居民的月均用水量很多或很少 3 居民月均用水量的分布有一定的对称性等 频率分布直方图如下 在频率分布直方图中 取各小长方形上端的中点 用折线依次连接各中点得到频率分布折线图 用样本频分布估计总体分布 上例的样本容量为100 如果增至1000 其频率分布直方图的情况会有什么变化 假如增至10000呢 总体密度曲线 月均用水量 t a b 图中阴影部分的面积 表示总体在某个区间 a b 内取值的百分比 当样本容量无限增大 分组的组距无限缩小 那么频率分布折线图就会无限接近一条光滑曲线 总体密度曲线 总体密度曲线 用样本分布直方图去估计相应的总体分布时 一般样本容量越大 频率分布直方图就会无限接近总体密度曲线 就越精确地反映了总体的分布规律 即越精确地反映了总体在各个范围内取值百分比 总体密度曲线反映了总体在各个范围内取值的百分比 精确地反映了总体的分布规律 是研究总体分布的工具 总体密度曲线 茎叶图 某赛季甲 乙两名篮球运动员每场比赛得分的原始记录如下 1 甲运动员得分 13 51 23 8 26 38 16 33 14 28 39 2 乙运动员得分 49 24 12 31 50 31 44 36 15 37 25 36 39 1 甲 8 13 16 14 23 26 28 38 33 39 51 2 乙 12 15 24 25 31 36 31 36 37 39 44 49 50 茎叶图 当样本数据较少时 用茎叶图表示数据的效果较好 它不但可以保留所有的信息 而且可以随时记录 给数据的记录和表示都方便 小结图形优点缺点频率分布1 易表示大量数据丢失一些直方图2 直观地表明分布地情况信息1 无信息损失只能处理样本茎叶图2 随时记录方便记录和表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论