版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 5 用样本估计总体 5.1 估计总体的分布学会用样本的频率分布估计总体.会根据样本数据画出频率分布直方图及频率分布折线图. 从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据可以看作是总体,我们就可以直接从中分析总体的各种信息.如人口普查得到的数据较为全面,从中可以很好地反映对象的重要信息. 但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体中抽取一局部作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和根本数字特征.一般的,总体分布是指总体中个体所占比例. 如何通过样本来估计总体的分布情况呢?这就需要我们先将样本的分布情况表示出来.例 1
2、895年,在英国伦敦有106块男性头盖骨被挖掘出.经考证,这些头盖骨的主人死于16651666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示单位:mm,请你估计在16651666年之间,英国男性头盖骨宽度的分布情况.解:如果把总体看作是16651666年之间的英国男性头盖骨的宽度,那么我们就是通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成表: 从表格中,我们就能估计出总体大致的分布情况了,如在16651666年之间,英国男性头盖骨宽度主要在136149mm之间,135m
3、m以下以及140mm以上所占的比例相对较小等.但是,这些关于分布情况的描述仍不够形象. 为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组,再画频数分布直方图,用图中矩形的高度来反映频数. 我们也可以用区间上矩形的面积来反映频率,得到以下图.讨论(1)头盖骨的宽度位于哪个区间的数据最多? (2) 头盖骨的宽度位于140145 mm的频率约是多少?(3) 头盖骨的宽度小于140 mm的频率约是多少?(4 头盖骨的宽度位于137142 mm的频率约是多少?14014543.4%28.3%0.041653/5+0.086852/5=0.298 4,即29.84% 从频率分布表可以看出该样
4、本宽度在140mm145mm之间的头盖骨所占的频率为43.4%,宽度在137mm142mm之间的头盖骨所占的频率为29.8%,由此估计,在1665年1666年之间,英国男性头盖骨宽度在140mm145mm之间的约为43.4%,宽度在137mm142mm之间的约为29.8% 图中所有小矩形的面积之和,也就是头盖骨的宽度落在各宽度区间的频率之和,等于1. 当样本容量较大时,样本中落在每个区间上的样本数的频率会稳定于总体的相应区间内取值的概率,因此,我们可以用样本的频率分布去估计总体的分布.另外,当样本量增大时.用样本的频率分布去估计总体的分布就越精确.制作频率分布表的一般步骤:(1) 计算极差,
5、确定组距和组数.在确定组距和组数时,要根据极极差的大小, 数据的多少, 选择恰当的组距, 使表格不至于太长或太短;(2)分组, 通常对组内数值所在区间取左闭右开区间, 最后一组为闭区间;(3)计算频数、频率,列出频率分布表.说明:组距与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的都少,常分成512组.在实际操作中,一般要求各组的组距相等. 为方便起见,组距的选取力求“取整. 组数=极差/组距. 如果极差不利于分组(如不能被组数整除),可适当增大样本所对应的区间,如在左、右两端各增加适当范围. 解决频率分布直方图的相关计算, 需掌握以下关系式: 1 即小矩形
6、的面积为数据落在相应区间的频率,注意纵坐标不是频率,而是频率与组距的比; 2各个小矩形面积的总和等于1; 3此关式可变形为频数分布直方图: 列出频数分布表后,建立直角坐标系,在横轴上确定组距的长,在纵轴上截取单位长度表示频率与组距的比1.以组距为宽,各组的频率(即 )与组距即 的比为高即 做小矩形,所的图形即为频数分布直方图. 频数分布直方图的优点是能直观地表达数据个数的分布规律及分布总体势态,一般是中间高、两端地、左右对称的“峰状结构.缺点是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.说明:频率分布直方图以面积的形式反映了数据落在各个小组的频
7、率的大小,各个小矩形面积的总和等于1.在频率直方图中,按照分组原那么,再在左右两边各加一个区间,从所得的各个区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线我们称之为频率折线图,有时用它来评估总体的分情况.频率组距产品尺寸(mm)ab 当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线总体在区间 内取值的概率总体密度曲线根据上图可得这100名学生中体重在56.5,64.5的学生人数是( )A. 20 B. 30 C. 40 D. 501为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg) ,得到频率分布直方图如下:C0.030.050.07体重(kg)频率/组距54.5 58.5 62.5 66.5 70.5 74.5 240027003000330036003900X 体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中北大学《中国画论史》2025-2026学年期末试卷
- 盐城师范学院《企业管理与技术经济分析》2025-2026学年期末试卷
- 长春东方职业学院《中国书画》2025-2026学年期末试卷
- 扬州大学广陵学院《马克思主义中国化进程与大学生时代责任》2025-2026学年期末试卷
- 2024河北建筑安全员《C证》考试题库及答案
- 2024年销售人员绩效考核方案
- 通信及基础工程8
- 2024年癌症病人救助申请书
- 2024年琴操-龟山操,琴操-龟山操韩愈,琴操-龟山操的意思,琴操-龟山操赏析(共8篇)
- 2023年河南省洛阳市偃师区中考一模英语试题
- 文艺复兴建筑风格课件
- 《自动墙壁清洗机设计》12000字(论文)
- 志愿服务项目设计与管理
- 企业数字化改造升级项目合同
- 导管异常滑脱应急预案
- 围术期伴发的精神障碍病因介绍
- 八年级数学培优辅差记录表
- 科研诚信教育宣传材料
- 条件概率公开课省公开课金奖全国赛课一等奖微课获奖课件
- 《光伏发电工程预可行性研究报告编制规程》(NB/T32044-2018)中文版
- 推拿手法课件
评论
0/150
提交评论