5-2样本数据的整理与显示ppt课件_第1页
5-2样本数据的整理与显示ppt课件_第2页
5-2样本数据的整理与显示ppt课件_第3页
5-2样本数据的整理与显示ppt课件_第4页
5-2样本数据的整理与显示ppt课件_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二节第二节 样本数据的整理与显示样本数据的整理与显示1、经验分布函数、经验分布函数2、频数频率分布表、频数频率分布表3、样本数据的图形显示、样本数据的图形显示1. 定义定义一、经验分布函数一、经验分布函数12(1)(2)( )(1)(2)( ),( ),nnnx xxF xxxxxxx设是总体分布函数为的一个样本,若将样本观测值由小到大排列为则称为有序样本.(1)( )(1)( )0,( ),1,2,.,11,nkknxxkF xxxxknnxx 则称则称Fn(x)为该样本的经验分布函数为该样本的经验分布函数.定义:用有序样本定义如下函数:定义:用有序样本定义如下函数:50,3441 5,3

2、44347( )2 5,3473514 5,3513551,355xxF xxxx若若若若若例例1 某厂生产听装饮料,现从生产线上随机抽取某厂生产听装饮料,现从生产线上随机抽取5听听饮料,称其净重量单位:饮料,称其净重量单位:g)如下如下: 351,347,355 ,344,351 , 求经验分布函数。求经验分布函数。注:其图形呈阶梯形、右连续注:其图形呈阶梯形、右连续.解:经排序得解:经排序得 x(1)= 344, x(2)= 347, x(3)= x(4)= 351, x(5)= 355注注1:当:当x1,xn的值固定时的值固定时(从而从而x(1),x(n)给定给定), 作为作为x的函数的

3、函数 Fn(x)是一个非减右连续函数,且满足是一个非减右连续函数,且满足()0,()1nnFF 因此因此Fn(x)是一个分布函数。是一个分布函数。注注2:对每个固定的:对每个固定的x, Fn(x)作为样本的函数,是一个随作为样本的函数,是一个随机变量。对固定的机变量。对固定的x, Fn(x)为事件为事件“Xx在在n次独立重次独立重复试验中发生的频率,于是由复试验中发生的频率,于是由Bernoulli大数定律:只要大数定律:只要n充分大,充分大, Fn(x)依概率收敛于总体分布函数依概率收敛于总体分布函数F(x). 且呈阶梯形且呈阶梯形, 期间断点就是期间断点就是x(k) 处处 (k=1,n).

4、 若有若有l个个x(k)一样一样, 则则Fn(x)在在x(k)处有处有跃度跃度 l n.定理定理1格里纹科定理)格里纹科定理)12,( )( ),lim sup |( )( )| 01.nnnnxx xxF xF xnPF xF x 设是总体分布函数为的样本,为其经验分布函数,当时 有注:该定理表明:只要注:该定理表明:只要n充分大,充分大, 经验分布数经验分布数Fn(x) 是总体分布函数是总体分布函数F(x)的良好近似的良好近似. 在经典统计学中,在经典统计学中,这是用样本来推断总体的理论依据这是用样本来推断总体的理论依据.( ), ( ), 1 ( )( ),( )( )1( )2 nnn

5、XF xF xE F xF xVar F xF xF xn设总体 的分布函数为经验分布函数为试证:例 :二、频数频率分布表二、频数频率分布表整理数据的常用方法是根据数据给出频数整理数据的常用方法是根据数据给出频数/ 频率分布表频率分布表20288024402700350036003080386032003500310031803200330030403020342029003440300032620名新生婴儿的体重的观察值为例步骤如下:步骤如下: Step1 对样本值进行分组:确定组数对样本值进行分组:确定组数k (一般一般520组组).( )(1)nxxdk Step2 确定每组组距确定每组

6、组距(等距):组距等距):组距111(,1,2, ,iika aik aa abStep4 统计样本值落入各区间的频数统计样本值落入各区间的频数, 并求出频率。并求出频率。( )nx Step3 确定每组组限:选取确定每组组限:选取a(略小于略小于 )和和b(略大于略大于 ), 分区间分区间(a,b为为k 等份等份(1)x例例3的频数频率分布表如下:的频数频率分布表如下:将数据分成五组将数据分成五组:(左开右闭区间)(左开右闭区间)110215345分组编号组限组中值 组频数 组频率(%) 累积频率(%)2400-270025502102700-300028503253000-33003150

7、840653300-36003450525903600-39003750210100其中频率是频数除以总频数。其中频率是频数除以总频数。累积频率是指相应的组频率之和。累积频率是指相应的组频率之和。为了直观,一般用直方图表示。为了直观,一般用直方图表示。1. 1. 频率直方图频率直方图(frequency histogram) (frequency histogram) 以“变量为横轴, 以“频率为纵轴画柱形图, 即得频率直方图. (若以“频率组距为纵坐标, 则为单位频率直方图,再画平滑直线图即得总体X的密度近似曲线) 三、样本数据的图形显示三、样本数据的图形显示i1 300300第 个长方形高

8、度为频率的 倍,为组距。体重体重24003900015300频率频率()/3003300把每一个数值分为两部分,前面一部分比如把每一个数值分为两部分,前面一部分比如百位和十位称为茎,后面部分比如个位百位和十位称为茎,后面部分比如个位称为叶,然后画一条竖线,在竖线的左侧写上称为叶,然后画一条竖线,在竖线的左侧写上茎,右侧写上叶,就形成了茎叶图。如:茎,右侧写上叶,就形成了茎叶图。如:数值数值 分开分开 茎茎 和和 叶叶 112 11 | 2 11 和和 2 2. 2. 茎叶图茎叶图(stem-and-leaf displays) (stem-and-leaf displays) 茎叶图既展示了分

9、布形状又有原始数据。它象一片带有茎茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较大的数目,叶为较小的数目。的叶子。茎为较大的数目,叶为较小的数目。 例例4 .对应聘人员成绩进行考察,对应聘人员成绩进行考察,30人得分情况如下。人得分情况如下。64, 67, 70, 72, 74, 76, 76, 79, 80, 81,82, 82, 83, 85, 86, 88, 91, 91, 92, 93,93, 93, 95, 95, 95, 97, 97, 99, 100,100 102,104,106,106,107,108,108上述数据可以用茎叶图来表示,左侧数字表示得分的上述数据可以用茎叶图来表示,左侧数字表示得分的百位及十位数,右侧数字表示个位数。百位及十位数,右侧数字表示个位数。6789104702466901223568112333566779002466788例例5. 某赛季甲、乙两名篮球运动员每场比赛得分情况某赛季甲、乙两名篮球运动员每场比赛得分情况如下:如下:甲的得分:甲的得分:12,15,24,25,31,31,36,36,37,39, 44,49,50乙的得分:乙的得分:8,13,14,16,23,26,28,33,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论