已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2.1 用样本的频率分 布估计总体分布 学习目标 1 通过实例体会分布的意义和作用。 在表示样本数据的过程中,学会列频率分 布表,画频率分布直方图,频率分布折线 图 能通过样本的频率分布估计总体的分布。 统计学中有两个核心问题,一是如何从整体 中抽取样本?二是如何用样本估计总体? 本节课,我们在初中学过样本的频率分布 的基础上,研究总体的分布及其估计. 简单随机抽样、系统抽样和分层抽样 . 经过前面的学习,我们已经了解了一些常用 的抽样方法: 政府为了节约生活用水,计划在本市试行居民生活 用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按 议价收费。 如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做 哪些工作? 3.12.52.02.01.51.01.61.81.91.6 3.42.62.22.21.51.20.20.40.30.4 3.22.72.32.11.6.1.23.71.50.53.8 3.32.82.32.21.71.23.61.70.64.1 3.22.92.42.31.81.33.51.90.84.3 3.02.92.42.41.91.41.41.80.72.0 2.52.82.32.31.81.31.31.60.92.3 2.62.72.42.11.71.31.21.50.52.4 2.52.62.32.11.61.41.01.70.82.4 2.82.52.22.01.51.01.21.80.62.2 100位居民的月均用水量(单位:t) 从表中只能看出:最小值是0.2t,最大值是4.3t,其他的在0.2-4.3t之间. 分析数据的基本方法: 1.图(频率分布直方图 ) 2.表(频率分布表) 1.求极差 : 4.3-0.2=4.1 这说明样本数据的变化范围是:4.1t. 2.定组距 : 当样本容量不超过100时,常分成512组. 取组距为0.5(t),则 组数= 极差 组距 4.1 0.5 =8.2 由于组数必须取整,故将数据分为9组. 3.适当分组 : 为将最小值包含在第一组内,常将第一 组的区间的左端点适当缩小. 0,0.5),0.5,1),1,1.5),4,4.5). 画频率分布直方图的一般步骤: 4.列频率分布表 分组组频频数累计计频频数频频率 0,0.5) 0.5,1) 1,1.5) 1.5,2) 2,2.5) 2.5,3) 3,3.5) 3.5,4) 4,4.5 合计计 4 8 15 22 25 14 6 4 2 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 1001.00 频率= 样本容量 频数 频率分布表一般分“分 组”,“频数累计”( 可省),“频数”,“ 频率”, “频率/组距 ”五列,最后一行是 合计 注意频数的合计应是 样本容量,频率合计 应是1 0.02 频率/组距 0.08 0.16 0.30 0.44 0.50 0.28 0.12 0.08 0.04 小矩形的面积 组距 频率 组距频率= 分组组频频数频频率频频率/组组 距 0,0.5)40.040.08 0.5,1)80.080.16 1,1.5)150.150.30 1.5,2)220.220.44 2,2.5)250.250.50 2.5,3)140.140.28 3,3.5)60.060.12 3.5,4)40.040.08 4,4.520.020.04 合计计100 5. 画频率分布直方图 : 用水量/t 0.10 0.20 0.30 0.40 0.50 O 频率/组距 0.511.52.53.54.5234 请计算每个小矩形的面积,它代表什么?为什么? 所有小矩形的面积的和是多少?1 注意 纵坐标是 频率/组距 同样一组数据,如果组距 不同,横轴、纵轴单位不 同,得到的图的形状也会 不同.不同的形状给人不 同的印象,这种印象会影 响我们对总体的判断. 用水量/t 0.10 0.20 0.30 0.40 0.50 O 频率/组距 0.511.52.53.54.5234 频率分布直方图,显示了样本数据落在各个小组 的比例的大小,图中最高的小矩形说明了什么? 大部分居民的月均用水量都 集中在什么之间? 居民的月均用水量的分布呈 “山峰”状的,而且是“单峰”的 另外还有一定的对称性. 月均用水量在2,2.5)内的居民最多. 在1,3)之间. 用水量/t 0.10 0.20 0.30 0.40 0.50 O 频率/组距 0.511.52.53.54.5234 频率分布直方图的特征: 优点:从频率分布直方图可以清楚地看出数据分布的总体趋势 缺点:从频率分布直方图得不出原始的数据内容, 把数据表示成直方图后,原有的具体数据就被抹掉了 如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗? 用水量 /t 0.10 0.20 0.30 0.40 0.50 O 频率/组距 0.511.52.53.54.5234 居民月用水量标准应定为3t. 分组组频频数 频频率累积频积频 率 0,0.5)40.04 0.5,1)80.08 1,1.5)150.15 1.5,2)220.22 2,2.5)250.25 2.5,3)140.14 3,3.5)60.06 3.5,4)40.04 4,4.5)20.02 合计计1001.00 0.04 0.12 0.27 0.49 0.74 0.88 0.94 0.98 1.00 6 频率分布折线图如下 : 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.51 1.5 2 2.533.544.5 连接频率分布直方图中 各小长方形上端的中点 ,得到频率分布折线图 频率 组距 月均用水量 (mm) ab 7.当样本容量无限增大,分组的组距无限缩 小,那么频率分布直方图就会无限接近一条光 滑曲线总体密度曲线 总体在区间 内取值的概率 S 总体密度曲线 总体密度曲线 总体密度曲线反映了总体分布,即反映了总体 在各个范围内取值的概率根据这条曲线,图中带 斜线部分的面积,就是总体在区间(a,b)内取值 的概率 总体密度曲线 与x轴围成的 面积为1. 连续型总体 例1对某电子元件进行寿命追踪调查,情况如下: 寿命 个数 100200200300300400400500500600 20 3080 4030 (1)列出频率分布表; (2)画出频率分布直方图及频率分布折线图; (3)估计电子元件寿命在100h400h以内的频率; (4)估计电子元件寿命在400h以上的频率; 应用举例: (1)列出频率分布表; 100200 200300 300400 400500 500600 寿命 合计 频率频数频率/组距 20 30 80 40 30 200 0.10 0.15 0.40 0.20 0.15 1 0.001 0.0015 0.004 0.002 0.0015 频率/组距 (3)电子元件寿命在 100h400h以内的频率为 0.65 (4)电子元件寿命在 400h以上的频率为0.35 频率分布直方图 步骤 2.决定组距与组数 3.将数据分组 4.列频率分布表 1.求极差 5.画频率分布直方图 小结 1. 右图是容量为100的 样本的频率分布直方图, 试根据图中的数据填空: (1)样本数据落在范围 6,10)内的频率为_; (2)样本数据落在范围 10,14)内的频数为_; (3)总体在范围2,6)内的 概率约为_; O2610 14 18 0.02 0.03 0.08 0.09 样本 数据 频率 组距 0.32 36 0.08 检测 2.一个容量为35的样本,分组后,组距与频数如下 :5,10)5,10,15)12,15,20)7,20,25)5,25,30)4, 30,35)2,则样本在区间20,+)上的频率为( ) A.20% B.69% C.31% D.27% C 3.一个容量为32的样本,已知某组样本的频率 为0.125,则该组样本的频数为( ) A.2 B.4 C.6 D.8 B O6070 80 90 100 0.01 0.02 0.04 车速 频率 组距 110 4.某路段检查监控录象 显示,在某时段内,有 1000辆汽车通过该站 ,现在随机抽取其中的 200辆汽车进行车速分 析,则估计在这一时段 内通过该站的汽车中速 度不小于90km/h的约 有( ) A100辆 B200辆 C300辆 D400辆 C 5.有一个容量为50的样本数据的分组的频数如下: 12.5, 15.5) 3 15.5, 18.5) 8 18.5, 21.5) 9 21.5, 24.5) 11 24.5, 27.5) 10 27.5, 30.5) 5 30.5, 33.5 4 (1)列出样本的频率分布表 ; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在15.5, 24.5)的 百分比是多少? 0.040 0.010 0.030 频率 组距 解:组距为3 分组 频数 频率 频率/ 组距 0.06 0.16 0.18 0.22 0.20 0.10 0.08 1 0.020 0.053 0.060 0.073 0.067 0.033 0.027 12.5, 15.5) 3 15.5, 18.5) 8 18.5, 21.5) 9 21.5, 24.5) 11 24.5, 27.5) 10 27.5, 30.5) 5 30.5, 33.5 4 合计 50 0.020 0.050 12.515.5 0.060 0.070 18.527.521.524.533.530.5 数据落在15.5, 24.5) 的百分比是56% 某篮球运动员在某赛季各场比赛的得分情况如下: 12,15,24,25,31,31,36,36,37,39,44,49,50 1 2 3 4 5 叶:表示个位数字 茎:表示十位数字 茎叶图 2545166794901 从这张图可以粗 略地看出,该运 动员平均得分及 中位数、众数都 在20到40之间, 且分布较对称, 集中程度高,说 明其发挥比较稳 定 茎叶图的画法: 将所有的两位数的十位数字作为“茎”,个位 数字作为“叶”,茎相同者共用一个茎,茎按从小 到大的顺序从上向下列出,共茎的叶一般按从大 到小(或从小到大)的顺序同行列出 茎叶图的优缺点: 优点是所有的信息都可以从茎叶图中得到, 便于记录和表示但茎叶图表示三位或三位以上 的数据时不够方便 某医院的发热门诊部对一天接待的16名病 人的体温进行了测量,得到以下数据: 37.5,38.0,39.2,38.5,39.5,37.8,39.1 ,38.2,37.6,39.2,38.1,39.5,37.8,38.5, 38.7,39.3 请作出当天病人体温的茎叶图,并计算出 病人的平均体温 有一个容量为50的样本,其数据的茎叶 图表示如下: 1 34566678888999 2 0000112222233334455566667778889 3 01123 将其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业级智能考勤管理系统建设与运营手册
- 客户服务质量评价标准及反馈模板
- 项目进度延迟原因分析报告催办函(7篇)范文
- 2026北京市育英学校招聘考试模拟试题及答案解析
- 温泉度假区安全防控管理指南
- 网络伦理文明传播承诺书3篇
- 2026广西工商职业技术学院高层次人才(学术院长)招聘5人笔试备考题库及答案解析
- 汽车维修工电气系统检修手册
- 2026贵州机电职业技术学院第十四届贵州人才博览会引进人才3人工作考试模拟试题及答案解析
- 2026广东梅州市梅江区统计局招聘见习人员6人笔试备考试题及答案解析
- (三诊)成都市2022级高中高三毕业班第三次诊断性检物理试卷(含答案)
- 工程合同标前协议
- 【规范药房创建资料】药品调配差错报告制度
- 外研版小学英语三到六年级知识清单(复习专用)
- 2025年云南省安全员-C证(专职安全员)考试题库
- 华为采购质量优先及三化一稳定推进
- 【MOOC】英语口语进阶-南京大学 中国大学慕课MOOC答案
- 雨季猪场生物安全防控
- 《边教书边成长》读书分享课件
- 水文地质学基础复习重点
- 浙江省中高职一体化竞赛电商(高职)题库附有答案
评论
0/150
提交评论