用样本的频率分布估计总体的分布1me09-9-24.ppt_第1页
用样本的频率分布估计总体的分布1me09-9-24.ppt_第2页
用样本的频率分布估计总体的分布1me09-9-24.ppt_第3页
用样本的频率分布估计总体的分布1me09-9-24.ppt_第4页
用样本的频率分布估计总体的分布1me09-9-24.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1 用样本的频率分布估计总体的分布(一),抽样是统计的第一步,接下来就要对样本进行分析,从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息。 如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。,一、频率分布表与频率分布直方图:,1频数、频率 将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。 每组的频数除以样本容量的商叫做该组的频率; 频率反映每组数据在样本中所占比例的大小。,频率分布表:,2列频率分布表的步骤,2列频率分布表的步骤,下面我们通过一个具体的实例来阐述这一方法。,某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中的100件钢管的内径尺寸:,最大值,最小值,列频率分布表的方法步骤:,求极差(也称全距,即一组数据中最大值与最小值的差): 计算极差时,需要找出这组数据的最大值和最小值。,此题中, 25.5625.24= 0.32,所以极差等于0.32mm.,决定组距与组数,样本数据有100个,可以把样本分为812组,这里取11组。由上面算得极差为0.32,,注: (1)一般样本容量越大,所分组数越多。 (2)为方便起见,组距的选择应力求“取整”,如果极差不利于分组( 如不能被组数整除)要适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同)。,决定分点,将数据分组,将第1组的起点定为25.235,以组距为0.03将数据分组时,可以分成以下11组: 25.235,25.265),25.265,26.295), , 25.535,25.565.,分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,当然也可以采用其他分组方法。,登记频数,计算频率,列出频率分布表,频率分布表:,练习. 一个容量为20的数据样本,测得各种直径的个数 为:10,20 2个 (20,30 3个 (30,40 4个 (40,50 5个 (50,60 4个 (60,70 2个 作出频率分布表?, 绘制频率分布直方图,频率分布直方图的绘制方法与步骤: S1 先制作频率分布表,然后作直角坐标系,以横轴表示产品内径尺寸,纵轴表示频率/组距.,S2 把横轴分成若干段,每一段对应一个组的组距,即在横轴上标上25.235,25.265, , 25.565表示的点; S3 在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组的频率。 这些矩形就构成了频率分布直方图。,有关问题的理解:, 因为小矩形的面积=组距频率/组距=频率,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小。,在频率分布直方图中,各小矩形的面积之和等于1.,同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。,上例中,如果规定,钢管内径的尺寸在区间25.325-25.475内为优等品,以上频率分布直方图反映出优等品的比例,也就是频率是多少?,0.12+0.18+0.25+0.16 +0.13=0.84,频率分布直方图的特点,可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。,1. 有一个容量为的样本数据,分组后各组的频数如下: (12.5,15.5,3; (15.5,18.5,8; (18.5,21.5,9; (21.5,24.5, 11; (24.5,27.5,10; (27.5,30.5,4. 由此估计,不大于27.5的数据约为总体的 ( ) A91% B92% C95% D30%,A,练习题:,2. 一个容量为20的样本数据,数据的分组及各组的频数如下: (10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2. 则样本在区间(,50)上的频率为 ( ) A0.5 B0.7 C0.25 D0.05,B,3. 从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)40,50),2;50,0),3;60,70),10;70,80),15;80,90),12;90,100),8; (1)列出样本的频率分布表(含累计频率); (2)画出频率分布直方图; (3)估计成绩在60,90)分的学生比例;,解:(1)频率分布表如下:,(2)频率分布直方图如下:,(3)估计成绩在60,90)分的学生比例;,解:成绩在60,90)的学生比例即为学生成绩在60,90)的频率,0.2+0.3+0.24 =0.74.,4. 一个容量为100的样本,数据的分组和各组的一些相关信息如下:,(1)完成上表中每一行的两个空格; (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论