第一章-第四节-总体分布的估计-人教版_第1页
第一章-第四节-总体分布的估计-人教版_第2页
第一章-第四节-总体分布的估计-人教版_第3页
第一章-第四节-总体分布的估计-人教版_第4页
第一章-第四节-总体分布的估计-人教版_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.4总体分布的估计知识回顾2、前面我们学习了常用的几种抽样方法,要注意这几种抽样方法的联系与区别.

3、初中时我们学习过样本的频率分布包括频数、频率的概念,频率分布表和频率分布直方图的制作1、用样本去估计总体,是研究统计问题的一个基本思想4.频率分布样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率。所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。5.频率分布的表示形式有:样本频率分布表样本频率分布条形图样本频率分布直方图

在初中我们学习过样本的频率分布,在此基础上我们来研究总体的分布及其估计.

我们从前面学习概率时介绍的历史上所做的抛掷硬币的大量重复试验入手,在那里曾介绍了如下试验结果.

在这个问题中,抛掷硬币试验的结果的全体构成一个总体(为便于研究问题,可把出现“正面向上”的结果记为0,把出现“反面向上”的结果记为1),每次抛掷硬币试验的结果是总体中的一个个体,那么,上面的表格就是从总体中抽取的容量为72088的相当大的样本的频率分布表.这个频率分布表还可用如图1-1所示的条形图表示.图1-1

我们看到,随着试验次数的不断增加,出现“正面向上”和“反面向上”的频率值都越来越接近0.5,在它附近摆动.当试验次数无限增大时,两种试验结果的频率值就成为相应的概率,得到下表.

我们看到,随着试验次数的不断增加,出现“正面向上”和“反面向上”的频率值都越来越接近0.5,在它附近摆动.当试验次数无限增大时,两种试验结果的频率就成为相应的概率.上表排除了抽样造成的误差,精确地反映了总体取值的概率分布规律.这种总体取值的概率分布规律通常称为总体分布.

再来看下面的例子.从规定尺寸为25.40mm的一堆产品中任取100件,测得它们的实际尺寸如下:25.3925.3625.3425.4225.4525.3825.3925.4225.4725.3525.4125.4325.4425.4825.4525.4325.4625.4025.5125.4525.4025.3925.4125.3625.3825.3125.5625.4325.4025.3825.3725.4425.3325.4625.4025.4925.3425.4225.5025.3725.3525.3225.4525.4025.2725.4325.5425.3925.4525.4325.4025.4325.4425.4125.5325.3725.3825.2425.4425.4025.3625.4225.3925.4625.3825.3525.3125.3425.4025.3625.4125.3225.3825.4225.4025.3325.3725.4125.4925.3525.4725.3425.3025.3925.3625.4625.2925.4025.3725.3325.4025.3525.4125.3725.4725.3925.4225.4725.3825.39

如果把这堆产品中产品尺寸的全体看作一个总体,那么上面数据就是从总体中抽取的一个容量为100的样本.与前一个例子不同的是,这里的总体可以在一个实数区间内取值(称为连续型总体).运用在初中“统计初步”里学过的方法,可以得到这些数据的以下频率分布表和频率分布直方图(图1-2).具体步骤如下:一、计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。二、决定组距与组数(将数据分组)组距:指每个小组的两个端点的距离,组距=极差/组数极差为:25.56–25.24=0.3三.决定分点可以令分点比数据多1位小数,并且把第1小组的起点稍微减少一点组数:将数据分组,当数据在100个以内时,按数据多少分成5-12组

分组个数累计频数

频率累计频率[25.235,25.265)一10.010.01[25.265,25.295)T20.020.03[25.295,25.325)正50.050.08[25.325,25.355)正正T120.120.20[25.355,25.385)正正正下180.180.38[25.385,25.415)正正正正正250.250.67[25.415,25.445)正正正一160.160.79[25.445,25.475)正正下130.130.92[25.475,25.505)TT40.040.96[25.505,25.535)T20.020.98[25.535,25.565)T20.021.00

合计1001.00四.列出频率分布表频率/组距产品尺寸(mm)五.画频率分布直方图注意:直方图的纵轴表示频率与组距的比值,

长方形的面积=思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?频率分布的条形图和频率分布直方图的区别

两者是不同的概念;横轴:两者表示内容相同

纵轴:两者表示的内容不相同

频率分布条形图的纵轴(长方形的高)表示频率

频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组据上长方形的面积。

长方形的面积=频率分布直方图

图1-2表明了所抽取的100件产品中,尺寸落在各个小组内的频率的大小.样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线,如图1-3所示.总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率.根据这条曲线,图中带斜线部分的面积,就是总体在区间(a,b)内取值的概率.

通常,我们不易知道一个总体的分布情况.在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确.

比如说,利用表1-3中的频率分布表,可对总体分布进行估计.从表中看到,样本数据落在25.355到25.445之间的频率为0.59,说明产品尺寸在这个范围内的概率约为0.59.

例1.(1)某厂生产的产品可分为一等品、二等品、等外品三类.抽查检验的记录为一等品96个,二等品195个,等外品9个、估计产品中的一等品率、二等品率、等外品率,并画出频率分布条形图.设ξ=

解:(1)一等品率的估计二等品率的估计;等外品率的估计;频率分布条形图如下:(2)如果已知产品的一等品率、二等品率、等外品率分别是32%,65%,3%.设η的定义与ξ相同,求η的概率分布及其条形图,将这个图形与频率分布条形图进行比较。(2)η的分布列为η的概率分布条形图与(1)中的图形相同。

例2.为了解某地儿童生长发育情况,抽查了100名7岁女童的身高(cm),已按数据的大小排列如下:84.484.585.285.786.286.486.987.187.387.687.988.288.488.488.588.789.089.089.189.289.389.389.489.890.090.l90.290.390.490.690.790.891.191.191.191.491.791.791.791.891.992.192.592.592.792.792.892.892.992.993.093.193.293.293.493.593.693.693.693.893.994.094.394.394.494.494.494.594.694.794.894.995.095.195.195.195.595.695.696.096.296.396.496.596.897.097.297.397.397.998.398.498.799.299.399.499.5100.7100.9101.5

(l)列出样本数据的频率分布表;(2)画出频率分布直方图;(3)利用频率直方图,估计身高在第4、第5两个组的概率;(4)估计身高不小于90cm的概率;(5)利用频率分布表估计身高的平均值.

解:(1)样本数据的极差(最大值与最小值之差)为R=101.5-84.4=17.1,将组距定为2,第1小组起点取为84,则组数为8,样本的频率分布表为身高[84,86)[86,88)[88,90)[90,92)[92,94)[94,96)[96,98)[98,100)[100,102)合计频数47131720181173100频率.04.07.13.17.20.18.110.070.031.00(2)频率分布直方图(3)身高在第4第5两个小组内的概率的估计为其频率为0.17+0.20=0.37.

(4)身高不小于90cm的频率为第3至第9组内的频率之和0.76,即身高不小于90cm概率的估计值为0.76.

(5)身高的均值的估计为例3.某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔1小时抽一包产品,称其重量是否合格,分别记录.抽查数据如下:甲车间:102,101,99,98,103、98,99

乙车间:110,105,94,95,109,89,98

问:(1)这种抽样是何种抽样方法?(2)估计甲、乙两车间包装重量的均值与方差,并说哪个均值的代表性好?哪个车间包装重量较稳定?

解:(1)根据系统抽样方法的定义可知这是系统抽样方法.

(2)先计算,再计算

因为这说明甲车间包装重量比乙车间稳定,甲车间的均值100的代表强.练习题1.在频率分布直方围中,各个小长方形的面积表示(

)(A)落在相应各组的数据的频数(B)相应各组的频率(C)该样本所分成的组数(D)该样本的样本容量B2.可用于总体数学期望的估计是(

)(A)样本均值(B)样本极差R=max(x1,…,xn)-min(x1,…,xn)(C)样本方差(D)样本平均差A3.以下可以描述总体稳定性的统计量是(

)(A)样本均值(B)样本中位数(C)样本方差s2(D)样本最大值S(n)C4.在已分组的数据中,每组的频数是指

,每组的频率是指

。落入该组的数据的个数落入该组数据个数与数据总数的比值5.某电视栏目收视情况的调查结果为:抽查100户,有30户收看此栏目,则此栏目的收视率的估计是

。30%6.某医院急诊中心关于其病人等待急诊的时间记录如下:用上述分组资料计算得病人平均等待时间的估计值=

,病人等待时间标准差的估计值s=

。0.5(分钟)5.34(分钟)7.假定下述数据是甲、乙两个供货商的交货天数。甲:10,9,10,10,11,11,9,11,10,10;乙:8,10,14,7,10,11,10,8,15,12.估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性.

解:(10+9+……+10)=10.1,(8+10+……+12)=10.5,(102+92+……+102)-10.12=0.49,(82+102+……+122)-10.52=6.05

从交货天数的平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论