统计量和抽样分布.ppt_第1页
统计量和抽样分布.ppt_第2页
统计量和抽样分布.ppt_第3页
统计量和抽样分布.ppt_第4页
统计量和抽样分布.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从本章起转入课程的第二部分,数理统计,数理统计的特点是应用面广,分支较多. 社会的发展不断向统计提出新的问题.,第四章、抽样分布,引言,从本章节开始,,我们将讲述数理统计的基本内容.,理统计作为一门学科诞生于19世纪末20世纪初,,有广泛应用的一个数学分支,,它以概率论为基础,,据试验划观察得到的数据,,来研究随机现象,,研究对象的客观规律性作出合理的估计和判断.,大量随机现象必然呈现出它们的规律性,,故理论上只,要对随机现象进行足够多次观察,,则研究对象的规律,数,是具,根,以便对,由于,必就一定能清楚地呈现出来,,但实际上人们常常无法,对所研究的对象的全体(或总体),进行观察,,而只能抽,取其中的部分(或样本),数据.,数理统计的任务包括:,限的数据资料;,究,,从而对研究对象的性质、特点,,作出合理的推断,此即所谓的统计推断问题,,本课程主要讲述统计推断,的基本内容.,进行观察或试验以获得有限的,怎样有效地收集、,整理有,由于学时有限,课程的的这部分内容我们只介绍理论部分,即抽样分布。至于具体的方法,学生可以自己推导并学会处理问题。,4.1 统计量,一、总体与样本,一个统计问题总有它明确的研究对象.,1.总体,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,总体,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况. 这时,每个个体具有的数量指标的全体就是总体.,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性. 从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.,这样,总体就可以用一个随机变量及其分布来描述.,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批 灯泡的寿命,总体,寿命X可用一概 率分布来刻划,鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.,2. 样本的数学描述,样本是随机变量.,抽到哪5辆是随机的,容量为n的样本可以看作n维随机向量.,样本的双重含义:泛指一次抽样结果,是一个n维向量,称为样本的一个观测值。,n维随机向量;指某次具体抽样结果,但是,一旦取定一组样本,得到的是n个具体的数 ,称为样本的一次观察值,简称样本观测值 .,2. 独立性: X1,X2,Xn是相互独立的随机变量.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,代表性: X1,X2,Xn中每一个与所考察的总 体有相同的分布.,定义1 设总体X具有分布函数,为简单的随机样本,简称样本。,事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.,3. 总体、样本、样本值的关系,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,分组数据统计表和频率直方图,通过观察或试验得到的样本值,,一般是杂乱无章的,,需要进行整理才能从总体上呈现其统计规律性,,组数据统计表或频率直方图是两种常用的整理方法.,1.,分组数据表:,若样本值较多时,,组,,分组的组数应与样本容量相适应.,分组太少,,难以反映出分布的特征,,分组太多,,则由于样本取,值的随机性而使分布显得杂乱.,因此,,分,可将其分成若干,则,分组时,,确定,分组数(或组距)应以突出分布的特征并冲淡样本的,随机波动性为原则.,区间所含的样本值个数称为该,区间的组频数.,组频数与总的样本容量之比称为组,2.,频率直方图:,频率直方图能直观地表示出组频,率的分布.,其步骤如下:,(1),频率.,(2),并,且小区间不包含右端点):,(3),组频率,及,求组频数,(4),为宽作小矩形,,所有小矩形合在一起就构成了频率,直方图.,例1,从某厂生产的某种零件中随机抽取120个,测得,列出分组表,并作频率,直方图.,解,先从这120个样,本值中找出最小值,190,取,将区间,等分成11个小区间,组距,例1,从某厂生产的某种零件中随机抽取120个,测得,列出分组表,并作频率,直方图.,解,得到分组表及频,从直方图的形状,可以粗略地认为该种零件的质量,率直方图.,服从正态分布,其数学期望在209附近.,经验分布函数,定义2,可按大小次序排列成,若,因而函数,注:,样本的频率直方图可以形象地描述总体的概率,分布的大致形态,,而经验分布函数则可以用来描述,总体分布函数的大致形状.,有下列结论(格里汶科, 1933):,对于上述经验分布函数,由此结果,,对于任一实数,从而在实际中可当作,来使用.,这就是由样本推断总体其可行性,的最基本的理论依据.,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,二、统计量和抽样分布,1. 统计量,定义2 设是来自总体X的一个样 本, 是一个连续函数,如果 中不包含任何未知参数,则称 是 的一个统计量。,例如,,未知.,为总体的一个样,令,本,,但,不是该样本的统计量,,因其含有总体分布中的未知,参数,注:,这个随机向量的函数,,用大写字母,,如:,等;,但是,,统计量就是一个具,统计量是,体的实数值,,用小写字母,如:,等.,2. 几个常见统计量,样本均值,样本方差,它反映了总体均值 的信息,它反映了总体方差 的信息,样本标准差:,修正样本方差:,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k阶矩 的信息,它反映了总体k阶 中心矩的信息,补充说明,为样本的偏差平方和,,可将其变形如下:,称,从而,例2,某厂实行计件工资制,为及时了解情况,随机,抽取30名工人,调查各自在一周内加工的零件数,其样本均值,它反映了该厂工人周工资的一般水平.,为:,所以样本方差为,由于,样本标准差为,例3,设我们获得了如下三个样本:,样本,样本,样本,明显可见它们的“分,散”程度是不同的:,这一直觉可以用样本方差来表示.,这三个样本的均,值都是 5,即,而样本容量,易得,例3,设我们获得了如下三个样本:,样本,样本,样本,易得,同理易得,由此可见,这与直觉是一致的.,由于样本方差的量纲与样本的量纲不一致,故常用,样本标准差表示分散程度,易求出,易求出,同样有,因此,常用,去估计,计.,例3,设我们获得了如下三个样本:,样本,样本,样本,分位数,对给定的实数,(1),(2),例如,,标准正态分布的上侧分位数和双侧分位数,分位数,例如,,标准正态分布的上侧分位数和双侧分位数,分别如下图:,分位数的性质:,通常,,直接求解分位数是很困难

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论