




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2 用样本估计总体 .2.1用样本的频率分布估计总体分布 第一课时 问题提出 1.随机抽样有哪几种基本的抽样方法? 2.随机抽样是收集数据的方法,如何通 过样本数据所包含的信息,估计总体的 基本特征,即用样本估计总体,是我们 需要进一步学习的内容. 简单随机抽样、系统抽样、分层抽样. 3.高一某班有50名学生,在数学必 修结业考试后随机抽取10名,其考试 成绩如下: 82, 75, 61, 93, 62, 55, 70, 68, 85, 78. 如果要求我们根据上述抽样数据, 估计该班对数学模块的总体学习水平 ,就需要有相应的数学方法作为理论指 导,本节课我们将学习用样本的频率分 布估计总体分布. 知识探究(一):频率分布表 【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费 . 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么? 思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组? 0.24.3 (4.3-0.2)0.5=8.2 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定? 思考4:如何统计上述100个数据在各组 中的频数?如何计算样本数据在各组中 的频率?你能将这些数据用表格反映出 来吗? 0,0.5),0.5,1),1,1.5), ,4,4.5. 分 组组 频频数累计计 频频数 频频率 0,0.5) 4 0.04 0.5,1) 正 8 0.08 1,1.5) 正 正 正 15 0.15 1.5,2) 正 正 正 正 22 0.22 2,2.5) 正 正 正 正 正 25 0.25 2.5,3) 正 正 14 0.14 3,3.5) 正 一 6 0.06 3.5,4) 4 0.04 4,4.5 2 0.02 合计计 100 1.00 思考5:上表称为样本数据的频率分布表 ,由此可以推测该市全体居民月均用水 量分布的大致情况,给市政府确定居民 月用水量标准提供参考依据,这里体现 了一种什么统计思想? 用样本的频率分布估计总体分布. 思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表 ,你对制定居民月用水量标准(即a的取值 )有何建议? 88%的居民月用水量在3t以下,可建议取a=3. 思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差? 分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的. 思考8:对样本数据进行分组,其组数 是由哪些因素确定的? 思考9:对样本数据进行分组,组距的确定没 有固定的标准,组数太多或太少,都会影响 我们了解数据的分布情况.数据分组的组数与 样本容量有关,一般样本容量越大,所分组 数越多. 当样本容量不超过100时,按照数据 的多少,常分成512组.若以1或0.1为组距 对上述100个样本数据分组合适吗? 样本容量和组距 思考10:一般地,列出一组样本数据的频率 分布表可以分哪几个步骤进行? 第一步,求极差. (极差=样本数据中最大值与最小值的差) 第二步,决定组距与组数. (设k=极差组距,若k为整数,则组 数=k,否则,组数=k+1) 第三步,确定分点,将数据分组. 第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数样本容量) 知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中 的分布情况,我们将上述频率分布表中 的有关信息用下面的图形表示: 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 上图称为频率分布直方图,其中横轴表 示月均用水量,纵轴表示频率/组距. 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 宽度:组距 高度: 频率 组距 思考2:频率分布直方图中各小长方形的 面积表示什么?各小长方形的面积之和 为多少? 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 各小长方形的面积=频率 各小长方形的面积之和=1 思考3:频率分布直方图非常直观地表明 了样本数据的分布情况,使我们能够看 到频率分布表中看不太清楚的数据模式 ,但原始数据不能在图中表示出来.你能 根据上述频率分布直方图指出居民月均 用水量的一些数据特点吗? 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O (1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的; 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O (2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等. 思考4:样本数据的频率分布直方图是根 据频率分布表画出来的,一般地,频率 分布直方图的作图步骤如何? 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点 ,在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与 组距的商为高,分别画出各组对应的 小长方形. 思考5:对一组给定的样本数据,频率分 布直方图的外观形状与哪些因素有关? 在居民月均用水量样本中,你能以1为组 距画频率分布直方图吗? 与分组数(或组距)及坐标系的单位长 度有关. 月均用水量/t 频率 组距 0.4 0.3 0.2 0.1 1 2 3 4 5 O 已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9, 11,12,9,10,11,11, 那么频率为0.2范围的是( ) A. 5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5 分组组 频频数 频频率 5.57.5 2 0.1 7.59.5 6 0.3 9.511.5 8 0.4 11.513.5 4 0.2 合计计 20 1.0 练习1: D 理论迁移 例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在3252岁的知识分子所占的比例 约是多少. 练习2: (1)极差为67-28=39,取组距为5,分为8组 . 分 组 频数 频率 27,32) 3 0.06 32,37) 3 0.06 37,42) 9 0.18 42,47) 16 0.32 47,52) 7 0.14 52,57) 5 0.10 57,62) 4 0.08 62,67) 3 0.06 合 计 50 1.00 样本频率分布表: (2)样本频率分布直方图: 年龄 0.06 0.05 0.04 0.03 0.02 0.01 27 32 37 42 47 52 57 62 67 频率 组距 O (3)因为0.06+0.18+0.32+0.14=0.7, 故 年龄在3252岁的知识分子约占70%. 小结作业 1.频率分布是指一个样本数据在各个小范围 内所占比例的大小,总体分布是指总体取值 的频率分布规律.我们通常用样本的频率分 布表或频率分布直方图去估计总体的分布. 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南省梁河县2025年上半年事业单位公开遴选试题含答案分析
- 云南省澄江县2025年上半年事业单位公开遴选试题含答案分析
- 七年级下册英语人教版第四单元
- 2025年房屋购买税费筹划与法律服务合同
- 2025房地产抵押贷款评估与风险评估委托协议模板
- 2025版事业单位网络管理员岗位续聘合同
- 2025版数字图书授权销售合同范本细则
- 2025版碎石产品绿色环保认证合同范本
- 2025年度池塘水产养殖技术培训及推广合同
- 2025东莞离婚协议书范本:离婚后共同财产分割与保险理赔合同
- 机械识图基础知识重点课件
- 2023年版人教版高一必修第一册物理测试题(含答案)
- 家长陪读承诺书【模板】
- 健康安全危险源识别、风险评估和风险控制表
- GB 4234.1-2017外科植入物金属材料第1部分:锻造不锈钢
- GB 19522-2004车辆驾驶人员血液、呼气酒精含量阈值与检验
- 深圳市失业人员停止领取失业保险待遇申请表样表
- 三年级上册音乐全册教材分析
- 提高输液执行单签字规范率品管圈汇报书模板课件
- SAP Analytics Cloud分析云解决方案
- 员工自愿放弃社保公积金协议、自愿放弃社保协议书、自愿放弃社保声明书
评论
0/150
提交评论