概率第七章样本分布090511下.ppt_第1页
概率第七章样本分布090511下.ppt_第2页
概率第七章样本分布090511下.ppt_第3页
概率第七章样本分布090511下.ppt_第4页
概率第七章样本分布090511下.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 样本分布, 组成总体的每一个元素即总体的每个数量指标,可以看作随机变量 X 的某个取值。,研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,,X 的分布函数和数字特征称为总体的分布函数和数字特征,一.总体和样本,总体,个体,例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体.,它是一个随机变量(或多维随机变量)记为X ,样本 从总体中抽取的部分个体,称 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实现,用 表示样本, n 称为样本容量,样本空间 样本所有可能取值的集合,在进行抽样时,样本的选取是随机的,即总体中每个,实际中,如总体样数很大,而抽取的样本容量相对小,,简单随机样本:进行重复抽样所得的随机样本.,个体都有同等机会被选入样本。抽样通常有两种方式:,一种是不重复抽样,另一种是重复抽样。,如果总体单位数是无限的,抽取有限个不影响总体的,分布(此时重复抽取与不重复抽取没有多大区别)。,即可认为总体为无限的.,.(现在我们只研究简单随机样本),简单随机样本具有以下两个性质:,(2)代表性:即 中的每一个都与,(1)独立性:即 中,各个随机变量,的取值互不影响,这时,我们称 是相互,独立的随机变量,总体 有相同的概率分布,相同分布的随机变量离散型的具有相同的概率分布律,连续型的具有相同的概率密度,所以期望与方差全相同,样本容量为n的样本是n个相互独立且与总体有相同分布,记为,是n元随机变量 的一个样本观测值,,记为,构成的一个n元随机,变量,一个容量为n的样本-,(1)指一个n元随机变量。,从这个角度来说,,(2)指某一次抽样的具体数值。,从这个角度来说,,统计量定义:,都是统计量,3统计量,统计量一般是样本 的连续函数,由于,样本 是随机变量,因而它的函数也是随机变量。,如:,二样本分布函数,在实际统计工作中,数据的处理形式为表和图。,统计表有简单表和分组表;统计图有频数(率)图,,频率直方图和累计频率直方图。,1.分组数据的统计表和频数直方图,简单表就是依出现的先后次序或按其数值大小列成表格,,一般用处不大。,如果数据较多,可分成若干组,按各组数值大小列成表格,或制图,例1. 观察新生女婴儿的体重 (它是一个连续型随机变量),取170号按顺序测得体重如表7-1.,此表是体重 按出生顺序 排序. 单位为克(g),分组数据的频数分布表,分组时一般采取等区间分组,区间长度称为组距.,制作分组数据表的步骤:,(1)从数据找出最大值M与最小值L,并求出它们的差.,这里:L=1800,M=4280,M-L=2480,(2)决定分组的界限。一般采用包含区域(L,M),的稍宽区域(a, b)为分组的界限。,这里取:a=1700, b=4300, L,M a, b,(3)决定组距(用D表示)和组数(用k表示),它们之间的关系,为D=(b-a)/k,取组数时常常按照一定的经验法则,一般,来说,决定组数应使每组至少有个4、5个数据,当数据很,多时,只要可以反映分布的趋势,也可以每组很多数据。,这里:取k=13, D =(b-a)/k=(4300-1700)/13=200,其中落到各组的数据个数称为组频数。,例2 将例1中前20个新生婴儿体重按大小顺序列成一简单,统计表,如下表所示。,2,5,8,3,2,组频数,3750,3450,3150,2850,2550,组中值,3600-3900,3300-3600,3000-3300,2700-3000,2400-2700,组限,5,4,3,2,1,分组编号,若进一步把20个数据分成5组(每组不包括上限)。试 给出分组数据的频数分布表。,解:,这里取:a=2400, b=3900,要分5个组,,组距 =(b-a)/5=(3900-2400)/5=300,画频率分布直方图的步骤:,1. 求b-a,3. 将数据分组,5. 画频率分布直方图,4. 列频率分布表,图中小长方体的面积等于对应的频率,各小长方体的面积之和等于1,频率直方图和累计频率直方图,组频率:是指组频数与样本容量的比值。,累积频率:相应一些组频率累加起来的和。,2. 决定组距与组数,2,5,8,3,2,组频数,3750,3450,3150,2850,2550,组中值,3600-3900,3300-3600,3000-3300,2700-3000,2400-2700,组限,5,4,3,2,1,分组编号,100,90,65,25,10,累积频率,10,25,40,15,10,组频率,累 积 频 率 直 方 图,其上某区间上的长方形面积约等于同底的曲顶梯形面积.,(只适用于连续型随机变量),故各长方形的顶点连成的曲线可近似模拟概率密度.,经验分布函数,根据观察结果来确定总体分布函数是数理统计的重要,问题之一,为此我们引进经验分布函数的概念.,组观察值,即对X进行n次独立重复观察,测得一组观察值.,对任一实数x,用vn(x)表示事件X x出现的频数,即小于等于x的观测值xi 的个数.,设函数,(i=1,2,.,n),显然 是随机变量,将对总体X的一次观察作为一次试验,记A=X x,则:,X的分布函数F(x)=P(X x ),=P(A)=p.,将对总体X的一次观察作为一次试验,记A=X x,则:,于是,对总体X的n次观察相当于n重贝努里试验,vn(x)表示事件Xx出现的频数,即n重贝努里试验中事件,X x发生的次数,故有vn(x)B(n,F(x),根据贝努里大数定律,p=P(A)=F(x),vn(x)表示事件X x出现的频数,X的分布函数F(x)=P(X x ),=P(A)=p.,这表明,当样本容量n充分大时,可用总体X的函数,来近似表示X的分布函数,所以称 为X的经验分布函数.,顺序排列:,的一条阶梯曲线。,对任一实数x, vn(x)表示事 件X x出现的频数,则:,若观察值不重复,则每一跃度为,将它们从小到大排列为:,-402=22.5=2.5=2.533.24,其样本分 布函数为:,1 2 3 4 5 6 7 8 9 10,三样本分布的数字特征,即样本分布的某些特征的数字,经常用它估计总体的,样本平均数,定义:对于样本,对某些具体的样本值,其样本平均数是,数字特征。,(1)不考虑分组时:,(加权平均值),(2)考虑分组时,例:例7.2中20个新生女婴儿的平均体重是?,2样本方差,及,分别为样本方差和样本标准差,由定义有,,解:,在具体计算样本方差时常用此式,或,证:,使用以下公式:,=112736.84,例:,解:,3.样本方差和样本平均数的简算公式.,则,(对分组数据也适用,可令,解:,令,a=3150,c=300,由上表得,的计算比直接计算样本平均数和方差要简便的多,则,4.几个常用统计量的分布,(1),(2),证明: (1)因,则取,由Th7.1知,的期望,方差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论