[数学]6第六章-统计量及其分布.ppt_第1页
[数学]6第六章-统计量及其分布.ppt_第2页
[数学]6第六章-统计量及其分布.ppt_第3页
[数学]6第六章-统计量及其分布.ppt_第4页
[数学]6第六章-统计量及其分布.ppt_第5页
免费预览已结束,剩余80页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

总体个体样本统计量抽样分布定理,第六章统计量及其分布,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,6.1数理统计学简介,一什么是数理统计学,研究随机现象规律性的一门学科,以概率论,问题作出推断、预测和决策.,资料,对数据进行分析(统计分析)从而对所研究的,为基础,研究如何用有效的方法收集和利用数据,具体地说,就是研究从一定总体中随机抽出一部分(样本),对样本的性质进行研究,以对总体的性质作出推测性判断的科学(例如,产品质量,人均收入).,为什么要用样本去推测和判断总体的性质,主要有以下几个原因:破坏性数量巨大,因为是用部分去推断总体的性质,所以得出的结论就不一定完全正确,分析方法的关键是使可能产生的错误越小越好,以对所提问题作出尽可能正确的结论.,数理统计和概率论有着密切的联系,概率论是数理统计的基础,数理统计是概率论的应用.,概率论是将事件出现的频率抽象为概率的概念进行研究,并由此建立了随机变量的概率分布的基本理论.数理统计则是直接从随机现象的观测值去研究其客观规律性.,二数理统计学的基本内容,统计推断,根据实际问题的不同要求,产生了数理统计学的众多研究分支.,本课程侧重于,概括起来分为两大类:,试验的设计和研究,例1某钢筋厂日产钢筋10000根,质量检查员每天抽查其中50根的强度.,(1)如何从这50根钢筋的强度数据去估计整批10000根的强度平均值,如何估计整批钢筋强度偏离平均值的离散程度?,(2)如果规定了这种钢筋的标准强度,如何由抽查的50个强度数据判断整批钢筋的平均强度与标准强度有无差异?,(于是可提出很多问题),此问题为参数估计.,此问题为假设检验.,(3)抽查的50个强度数据有大有小,如果当天生产的钢筋是采取不同工艺生产的,那么强度呈现的差异是由于工艺不同造成的,还是仅仅由随机因素造成的?,(4)如果钢筋强度与某种原料的成分含量有关,那么从抽查的50个强度与该原料含量的50组对应数据,如何去表达整批钢筋强度与该原料含量的关系?,此问题为方差分析,即分析造成强度差异的原因.,此问题为回归分析.,以上四个问题都是数理统计学研究的基本内容,此外还有正交试验设计,多元统计分析,时间序列分析,抽样理论,质量控制,可靠性理论和统计决策理论等.,总体中所含个体的数目可以是有限的,也可以是,6.2总体和样本,一总体个体样本,总体:就是研究对象的全体.,个体:是组成总体的每个元素.,无限的,分别称为有限总体和无限总体.,从总体中随机抽取n个个体,称为容量为n的样本(子样).,任何一个总体,都可以用一个随机变量X来表示.,例如,从一批日光灯中随机抽取一个,其寿命X显然是,为相同值的日光灯在这批日光灯中所占的比例.因此,一个随机变量,它取各种可能值的概率恰好就是寿命,如果知道X的分布,则这批日光灯的寿命情况就完全清,楚了.即可以用X及其分布来描述这批日光灯这一总体.,再例如,从某大学全体学生中随机抽取一个,其学习成绩X显然是一个随机变量,它取各种可能值的概率恰好就是成绩为相同值的学生在全校所占的比例.因此,可以用X及其分布来描述该校全体学生这一总体.,在统计研究中,人们关心的仅仅是代表总体的一项,(或几项)数量指标以及数量指标的分布情况.,总体就是指某个随机变量X可能取值的全体。X的分布,称为总体的分布.,常用“总体X服从.分布”这一说法.,从总体X中随机抽取容量为n的样本,用,表示.不难理解,X及,都是随机变量.,是n维随机变量.,简单随机样本,简单随机样本是应用中最常见的情形,今后,若取自总体X的样本X1,X2,Xn相互独立,且与X有相同的分布,则称X1,X2,Xn为取,自总体X的简单随机样本.简称为样本.,当说到“X1,X2,Xn是取自某总体的样本”,时,若不特别说明,均指简单随机样本.,(x1,x2,xn),称为样本的一组观测值,,简称样本值.,一旦取定一组样本,得到的是n个具体的数,一般来说,不同次的抽取(每次取n个),将得到不同,的样本观测值.,样本,所有可能取值的全体称为样本,空间,它是n维空间或其中的一个子集.,一组样本观测值(x1,x2,xn)就是样本空间中的一个点.,定理1,若(X1,X2,Xn)是取自总体X的样本,而X的概率密度为f(x)(或分布函数为F(x),则(X1,X2,Xn)的联合密度函数为,(或联合分布函数为,),总体X的一个样本,,求样本的联合密度.,例1设总体,解:因为XU1,2,其密度为,Xi的密度,样本的联合密度为,二理论分布和经验分布,作出经验分布用以观察理论分布的概况.,若总体是随机变量X,则X的分布就是总体的分布,(称为理论分布).样本是总体的代表和反映,简单,随机样本能很好地反映总体的情况.通常的方法是,若x1,x2,xn为总体X的n个独立观测值,称Fn*(x)为总体X作n次独立观察的经验分布函数.,并作函数,定义,将这些值按从小到大的顺序排列为,x1*x2*.xn*,从图中可以看到,Fn*(x)是F(x)的一个近似.,关于Fn*(x)与理论分布F(x)的关系,有如下定理:,对于样本的不同取值,将得到不同的经验分布函数,Fn*(x),所以对于x的每一个数值,Fn*(x)是一个,随机变量.,当n时,Fn*(x)以概率1关于x一致收敛于F(x),这个定理是用样本推断总体的基本理论依据.,定理2(格列汶科),即,Fn*(x)的图形是一条阶梯形曲线,若样本观测值,不重复,则每一跃度为;,若有重复,则按的倍数为跃度.,显然经验分布函数Fn*(x)具有以下性质:,0Fn*(x)1,Fn*(x)单调上升,Fn*(x)右连续,三分布密度的近似求法(略),如果X是一个连续型随机变量,可以用样本观测值作出的频率直方图来近似代替分布密度曲线.,由样本去推断总体情况,需要对样本进行“加工”和“提炼”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,一统计量,6.3统计量和抽样分布,定义,设(X1,X2,.,Xn)为取自总体X的一个样本,T=T(X1,X2,.,Xn)为样本(X1,X2,.,Xn)一个实值连续函数,且T中不含任何未知参数,则称T(X1,X2,.,Xn)为一个,统计量.,注:,1.统计量是不含任何未知参数的样本的函数,2.统计量T=T(X1,X2,.,Xn)是随机变量,它应该有确定,它是完全由样本决定的量.,的概率分布.,统计量的分布称为抽样分布.,例1,而,都不是统计量.,都是统计量,是取自总体X的一个样本,则,设总体XN(,2),其中,2未知,几个常见的统计量:,样本均值:,样本方差:,设X1,X2,.,Xn,是取自总体X的一个样本,,因为,样本k阶原点矩:,样本k阶中心矩:,k=1,2,样本标准差:,k=1,2,显然,样本(X1,X2,.,Xn)的观察值为,(x1,x2,xn),的观察值分别记为,通常,大写字母表示统计量,如,小写字母表示观察值,如,顺序统计量,定义,设(X1,X2,.,Xn)为取自总体X的一个样本,现由样本建立n个函数:,(X1,X2,.,Xn)k=1,2,.,n,x1*x2*.xn*后的第k个数值.则称X1*,X2*,.Xn*为顺序统计量.,显然,X1*X2*.Xn*,其中Xk*为这样的统计量,它的观察值为xk*.xk*为样本,X1,X2,.,Xn的观察值x1,x2,.,xn中按大小排列,X1*=minX1,X2,.,Xn,Xn*=maxX1,X2,.,Xn,称X1*为最小项统计量,Xn*为最大项统计量,称Dn*=Xn*X1*为样本的极差,若n是奇数,则称为样本的中值,若n是偶数,则称为样本的中值,设(X1,X2,.,X5)为总体X的样本,今对这个样本进行了三次观察,其值如下表:,例2,求,S2及Dn*的观察值,解,二抽样分布,(常用统计量的分布),12分布,2分布是由正态分布派生出来的一种分布.,定义,设随机变量X1,X2,.,Xn相互独立且均服从,N(0,1),则称随机变量,2,所服从的分布为自由度是n的2,分布.,2(n),2,记为,定理3,随机变量2的分布密度函数为,n取不同值时的2分布,的图形,*例3,相互独立,都服从,若,正态分布,则,证:,令,i=1,2,.,n,则,又因为Xi,所以,YiN(0,1),且Y1,Y2,.,Yn,相互独立,所以,2分布具有下列性质:,性质1,性质2,(2分布的可加性),若,且X,Y相互独立,则,2t分布(student分布),定义,设XN(0,1),Y,且X与Y相互独立,,则称随机变量,所服从的分布,为自由度是n的t分布,记为Tt(n),定理4,t分布的密度函数为,(t分布的密度函数fT(x)的图像参见教材),(1)fT(x)是偶函数,图像关于y轴对称.,注:,(2)t分布曲线很接近标准正态分布曲线.,且当n充分大时,t分布的极限分布是标准正态分布.,所以,(3)对于较小的n,t分布与N(0,1)分布相差很大.,当n30时,它们的差别已很小.,可以证明,t分布的期望和方差分别为,3F分布,若随机变量X与Y相互独立,且,则称随机变量,所服从的分布为F分布,记为,其中m称为第一自由度,n称为第二自由度.,定理5,F分布的密度函数为,推论:若FF(m,n),则,证:,因为,令,(F分布的密度fF(x)图像参见教材),可以证明,F分布的期望和方差分别为,4.概率分布的分位数,设连续型随机变量X的分布函数为F(x),0p1,若实数满足,PX=F()=p,则称实数为X的概率分布的p分位数.,例如,标准正态分布N(0,1)的p分位数,即是满足,的实数,也就是说,N(0,1)的密度曲线下,的左边的,面积恰好等于p.,上侧分位数:,PX=,满足,的实数称为随机变,量X的上侧分位数.,N(0,1),t分布,2分布,F分布的上侧分位数,通常记为u,t,2,F,这些数值可以查表.,上侧分位数与分位数的关系:,即也是X的1分位数.,则有,若X的上侧分位数为,PX=,PX=1PX=1,双侧分位数1,2,是指满足,PX30),随机变量,例6,求1,2使之满足,解:,例7.,设总体XN(72,102),为使样本均值大于70的,概率不小于0.9,则样本容量n至少应取多少?,解:,设样本容量为n,则,查表可得,解出n41.6,即n=42,例8.,设总体XN(1,0.32),为使样本均值满足,则样本容量n至少应取多少?,解:,因为XN(1,0.09),查表得,且有,故由,得,故应取n=25.,例9.,解:,设总体XN(40,52),(1)抽取容量为36的样本,求,(2)抽取容量为64的样本,求,(3)样本容量n为多大时,才能使,总体XN(40,52),所以统计量,(1)n=36,故,即,(查表),0.99984(10.9918)0.9916,(2)n=64,则统计量,(查表),0.9452(10.9452)0.8904,(3),查表,得,解出n96,例10.,设在总体XN(,2)中抽取容量为16的样本,其中,2均未知,(1)求,(2)求D(S2),解:(1),因为总体XN(,2),根据定理6,有,S2为样本均值和方差,即,(查表),例11.,设X1,X2,.,X9是来自总体XN(0,22)的样本.,解:,Y=a(X1+X2)2+b(X3+X4+X5)2+c(X6+X7+X8+X9)2服从,2分布,求系数a,b,c.,因X1,X2,.,X9独立同分布且XiN(0,22)(i=1,2,.9).,故X1+X2N(0,22+22)=N(0,8).,X3+X4+X5N(0,12),X6+X7+X8+X9N(0,16),从而,即,故,得,自由度为3,例12.,解:,设随机变量T服从t(n)分布,求T2的分布.或证明T2F(1,n).,由t(n)分布的定义有,由F分布的定义知,T2服从F(1,n)分布.,其中XN(0,1),Y2(n).,故,例13.,解:,设X1,X2,.,Xn是来自总体XN(0,1)的样本.,问下列统计量各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论