




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5 用样本估计总体 5.1 估计总体的分布,学会用样本的频率分布估计总体.会根据样本数据画出频率分布直方图及频率分布折线图.,从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看作是总体),我们就可以直接从中分析总体的各种信息.如人口普查得到的数据较为全面,从中可以很好地反映对象的重要信息. 但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征.一般的,总体分布是指总体中个体所占比例.,如何通过样本来估计总体的分布情况呢?,这就需要我们先将样本的分布情况表示出来.,例 1895年,在英国伦敦有106块男性头盖骨被挖掘出.经考证,这些头盖骨的主人死于16651666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm),请你估计在16651666年之间,英国男性头盖骨宽度的分布情况.,解:如果把总体看作是16651666年之间的英国男性头盖骨的宽度,那么我们就是通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成表:,从表格中,我们就能估计出总体大致的分布情况了,如在16651666年之间,英国男性头盖骨宽度主要在136149mm之间,135mm以下以及140mm以上所占的比例相对较小等.但是,这些关于分布情况的描述仍不够形象.,为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组,再画频数分布直方图,用图中矩形的高度来反映频数.,我们也可以用区间上矩形的面积来反映频率,得到下图.,讨论,(1)头盖骨的宽度位于哪个区间的数据最多? (2) 头盖骨的宽度位于140145 mm的频率约是多少?(3) 头盖骨的宽度小于140 mm的频率约是多少?(4) 头盖骨的宽度位于137142 mm的频率约是多少?,140145,43.4%,28.3%,0.041653/5+0.086852/5=0.298 4,即29.84%,从频率分布表可以看出该样本宽度在140mm145mm之间的头盖骨所占的频率为43.4%,宽度在137mm142mm之间的头盖骨所占的频率为29.8%,由此估计,在1665年1666年之间,英国男性头盖骨宽度在140mm145mm之间的约为43.4%,宽度在137mm142mm之间的约为29.8% 图中所有小矩形的面积之和,也就是头盖骨的宽度落在各宽度区间的频率之和,等于1. 当样本容量较大时,样本中落在每个区间上的样本数的频率会稳定于总体的相应区间内取值的概率,因此,我们可以用样本的频率分布去估计总体的分布.另外,当样本量增大时.用样本的频率分布去估计总体的分布就越精确.,制作频率分布表的一般步骤:(1) 计算极差, 确定组距和组数.在确定组距和组数时,要根据极极差的大小, 数据的多少, 选择恰当的组距, 使表格不至于太长或太短;(2)分组, 通常对组内数值所在区间取左闭右开区间, 最后一组为闭区间;(3)计算频数、频率,列出频率分布表.说明:组距与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的都少,常分成512组.在实际操作中,一般要求各组的组距相等. 为方便起见,组距的选取力求“取整”. 组数=极差/组距. 如果极差不利于分组(如不能被组数整除),可适当增大样本所对应的区间,如在左、右两端各增加适当范围.,解决频率分布直方图的相关计算, 需掌握下列关系式: (1) 即小矩形的面积为数据落在相应区间的频率,注意纵坐标不是频率,而是频率与组距的比; (2)各个小矩形面积的总和等于1; (3)此关式可变形为,频数分布直方图: 列出频数分布表后,建立直角坐标系,在横轴上确定组距的长,在纵轴上截取单位长度表示频率与组距的比1.以组距为宽,各组的频率(即 )与组距(即 )的比为高(即 )做小矩形,所的图形即为频数分布直方图. 频数分布直方图的优点是能直观地体现数据个数的分布规律及分布总体势态,一般是中间高、两端地、左右对称的“峰”状结构.缺点是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.说明:频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小,各个小矩形面积的总和等于1.,在频率直方图中,按照分组原则,再在左右两边各加一个区间,从所得的各个区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线我们称之为频率折线图,有时用它来评估总体的分情况.,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线,总体在区间 内取值的概率,总体密度曲线,根据上图可得这100名学生中体重在56.5,64.5的学生人数是( )A. 20 B. 30 C. 40 D. 50,1为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg) ,得到频率分布直方图如下:,C,0.03,0.05,0.07,54.5,58.5,62.5,66.5,70.5,74.5,2400,2700,3000,3300,3600,3900,X 体重,y,0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年机动车维修技术人员资格考试相关法规知识题库及答案
- 生物多样性保护在2025年生态修复工程中的经济效益分析
- 2025-2030中国热封漆市场运营策略与销售前景监测报告
- lol题目及答案大全
- 2025年工业机器人在柔性制造系统中的集成与应用策略研究报告
- 2025年环保设备制造业市场深度分析:竞争与产品创新并行
- 生态旅游度假区旅游项目投资回报与可持续发展研究报告
- 金融行业数据资产化与合规管理研究报告
- 2025-2030环境信息披露制度对企业行为影响评估
- 石家庄市网格员考试真题2024
- DL∕T 1362-2014 输变电工程项目质量管理规程
- 业务跟单培训
- 河北省唐山市路北区2023-2024学年八年级下学期期末数学试题
- DL-T-5161.13-2018电气装置安装工程质量检验及评定规程第13部分:电力变流设备施工质量检验
- 安全顾问聘请协议
- 设备材料进场报验单
- 班组长计划管理能力考试题库-上(选择题)
- 八年级物理下册期末试卷综合测试卷(含答案)
- (完整版)《机械制造工艺基础》教案
- 小学四年级数学口算题(每页60道直接打印).文档
- 抖音剪辑合同
评论
0/150
提交评论