第五部分 数理统计方法之概率统计模型.docx_第1页
第五部分 数理统计方法之概率统计模型.docx_第2页
第五部分 数理统计方法之概率统计模型.docx_第3页
第五部分 数理统计方法之概率统计模型.docx_第4页
第五部分 数理统计方法之概率统计模型.docx_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五部分 数理统计方法第十章 概率统计模型在现实当中,未来的不确定性事件是我们研究的对象。概率论和数理统计是研究的主要工具。其特点是在随机变量的概率分布或密度函数已知的情况下,然后去研究性质、特点和规律性。首先我们归纳一下有关的理论知识,然后给出一些模型实例。10.1 统计知识为了更好地统计建立模型,我们先系统地总结一下有关基础知识。假如我们要研究某厂所生产的一批灯泡的平均寿命。由于测试灯泡的寿命具有破坏性,所以我们只能从这批产品中抽取一部分进行寿命测试,并且根据这部分产品寿命数据对整批产品的平均寿命作出统计推断,即由部分推断整体。为此我们引入总体和个体这二个概念。定义1 在统计学中,常把研究对象的全体称为总体,也称母体,而把组成总体的每个元素称为个体 。例如上述的一批灯泡的全体就组成一个总体,其中每一个灯泡就是一个个体。但是,在统计学中,我们并不笼统地研究所关心对象的一切情况,而只是对它的某一个或几个数值指标感兴趣。例如,考察灯泡时,我们并不研究它的形状、式样等特征,而只是关心灯泡寿命、亮度等数值指标的大小。当我们只考察灯泡寿命这项数值指标时,一批灯泡中的每一个灯泡均有一个确定的寿命值,因此,很自然地,我们应该把所有的这些灯泡寿命的全体当作总体,这时,每个灯泡寿命值就是个体。我们知道,即使在相同的生产条件下生产灯泡,由于种种微小的偶然因素的影响,它们的寿命值也不尽相同,但确有一定的统计规律,这说明灯泡寿命是一个随机变量,这时,每只灯泡的寿命值就是随机变量的可能取值,而总体就是随机变量的所有这些可能取值的全体。因而我们可以用随机变量X来描述总体,简称总体X,X的分布函数称为总体X的分布函数。这样就把对总体的研究转化为对表示总体的随机变量X的研究。这种联系也可以推广到多维。例如,要研究总体中个体的两个数值指标X和Y,比如X表示灯泡的寿命和Y表示灯泡的亮度,我们可以把这两个指标所构成的二维随机向量可能取值的全体看作一个总体,简称的二维总体,的联合分布函数称为总体的联合分布函数。由于总体可用随机变量来描述,因而研究总体就需要研究其分布,一般来说,其分布是未知的,或分布类型的已知,但其中的参数未知。为了要确定总体的分布,我们可以从总体中按机会均等的原则随机地抽取一些个体,然后对这些个体进行观测或测试某个指标的数值。这种按机会均等的原则选取一些个体进行观测或测试的过程称为随机抽样,简称抽样。定义2从总体X中,随机地抽取n个个体,这n个个体的指标分别为,通常记为,称为总体X的一个样本 ,或称子样,n称为样本的容量 。样本中的每个是一个随机变量,从而我们可以把容量为n的样本看作为一个n维随机向量,在一次抽样以后,观测到的一组确定的值()称作容量为n的样本的观测值,此观测值()可以看作随机实验的一个结果。由于抽样是随机的,样本就有两重性:(1)在抽样进行之前,它们是随机的,因而是n维随机向量;(2)在抽样结束之后,它们是一组确定的数,即观测值()。实际上,从总体中抽取样本可以有各种不同的方法。为了要使抽到的样本能够对总体作出较可靠的推断,就要求抽到的样本能很好地反映总体的特性,为此就需要对抽样方法提出一些要求。现在介绍一种满足下面两个要求的抽样方法:(1)代表性:总体的每一个体有同等机会被抽到,使样本能代表总体,即要求每个必须与总体X具有相同的分布;(2)独立性:观测结果之间互不影响,即要求是相互独立的。定义3 若总体X的一个样本满足代表性和独立性,则称为总体X的一个简单随机样本 ,或称为来自总体X的简单随机样本。今后如不作特别说明,凡提到样本总是指简单随机样本。一般而言,有放回抽样所得到的样本就是简单随机样本。而对于不放回抽样,当样本容量n相对于样品总数N很小(一般)时,可以把所得到的样本近似地看作一个简单随机样本。因此,在许多情况下,代表性和独立性可以得到满足和近似满足,而在统计方法的研究上,有代表性和独立性这两个条件将是十分方便的。若总体X的分布函数是,由代表性知的分布函数为,再由独立性,显然可得样本的联合分布函数为 。同样,若总体X为离散型随机变量,且其概率分布为则的联合概率分布为,其中的取值范围为。若总体X为连续型随机变量,且其密度函数为,则的联合密度函数为 。10.2 统计量样本是总体的代表和反映,即样本含有总体的信息,但较为分散,为了对总体进行推断,需要将分散在样本中有关总体的信息集中起来以反映总体的各种特征,这就需要对样本进行加工。一种有效的方法是构造样本的函数,不同的样本函数反映总体的不同特征,这种样本函数便是统计量。定义4设是来自某总体X的一个容量为n的样本,若样本函数中不含任何未知参数,则称T为统计量 。定义中“不含任何未知参数”是指在获得了样本的观测值()后,代入统计量立即可以算得统计量的观测值 。例1设总体X服从正态分布N(),其中为已知参数,为未知参数,是来自总体X的样本,则,均是统计量,而,都不是统计量。在具体的统计问题中,选用什么样的统计量是一个依赖于具体情况与要求而定的问题。统计量的选取既要针对问题的需要,又要具备较好的性质,便于应用。下面介绍一些常用的统计量。以后,我们记总体X的数学期望EX为,即EX;总体X的方差DX为,即DX。注意,只是将EX和DX分别记为和,总体X并不一定服从。10.2.1样本均值定义5设样本来自总体X,则称统计量为样本均值 。当获得了样本观测值后代入,可求得样本均值的观测值: ,亦简称样本均值。性质1设总体X的数学期望EX及方差DX存在,样本来自总体X,则 。由性质1知,样本均值反映了总体X的数学期望EX的信息。这是因为,的取值虽然有时会比大,有时会比小,但是,的中心位置正好是,并且围绕的摆动幅度(即方差)随样本容量n的增大而减小,这就是说n越大,越向总体的数学期望集中。所以,当n较大时,样本均值可作为总体的数学期望的近似值,为近似的精度。其实切比雪夫大数定律(即平均值具有稳定性)也是说明了这个问题。10.2.2样本方差定义6设样本来自总体,则称统计量为样本方差 ,称为样本标准差 。称统计量。 为修正样本方差 ,称为修正样本标准差 。把观测值代入和,可得样本方差和修正样本方差的观测值 。在实际应用中也简称它们为样本方差和修正样本方差。又 ,此式为计算和提供了方便。性质2 设总体X的数学期望EX及方差DX存在,样本来自总体X,则。由性质2知,修正样本方差反映了总体X的方差的信息。这是因为,的取值围绕摆动,的中心位置正好是。可以设想一下,当总体方差较大时,样本的观测值就较为分散,从而使偏差平方和较大,也即也较大,反之也如此。因此,修正样本方差反映了数据取值分散与集中的程度,即反映了总体方差的信息。虽然,也一定程度反映总体X的方差,但是有系统误差(除了随机性以外),而克服了的缺点,无系统误差。当n较大时,和差别不大。10.2.3样本的相关系数我们可以模拟总体X的相关系数的定义构造出样本的相关系数。定义7设是来自二维总体的一个样本,则称统计量为样本的相关系数 。由构造的方法知的,样本的相关系数反映了二维总体中X与Y的相关系数的信息。10.2.4样本矩定义8 设样本来自总体,统计量 称为样本阶矩或样本阶原点矩,其中是正整数。而统计量 称为样本阶中心矩,其中是正整数。当时,即其为样本均值;当时,为样本方差。样本阶矩和样本阶中心矩常被用来作为总体相应矩的估计。10.3 抽象分布统计量是我们对总体的分布或数字特征进行统计推断的基础。因此求统计量的分布是数理统计的基本问题之一。定义9 我们称统计量的分布为抽样分布 。关于抽样分布,我们关心两类问题:(1)当已知总体X的分布类型时,若能对固定的样本容量n推导出统计量的分布,则称这种抽样分布为精确分布,它在小样本问题(n较小)中特别有用;(2)不对任何个别的n求出统计量的分布,而只求出当时,统计量的极限分布,则称这种抽样分布为极限分布,它在大样本问题(n较大)中很有用。由于正态总体(即服从正态分布的总体)在数理统计中占有特别重要的地位,下面主要推导正态总体的几个常用的精确抽样分布。10.3.1正态总体样本的线性函数的分布设总体X服从正态分布N(),为来自此总体的样本。考察统计量:,其中为已知常数。关于U,我们有以下定理。定理1 设是来自正态总体N()的一个样本,统计量U是样本的任一确定的线性函数,即则U也是正态随机变量,即 。推论1 设是来自正态总体N()的一个样本,则样本均值也是正态随机变量,即 。将标准化,即得:推论2 设是来自正态总体N()的一个样本,则 。10.3.2 分布定义10 设是相互独立且服从于N(0,1)的随机变量,则称随机变量服从自由度为n的分布,记作。若,则它的密度函数为其中为函数。性质3 设,且和相互独立,则。即分布具有可加性。证明:由分布的定义即知本性质成立。推论3 设且它们相互独立,则证明:由性质73及归纳法即知来推论成立。下面的重要定理是分布在正态总体抽样中的应用。定理2 设是来自正态总体N()的一个样本,且,则(1);(2)与相互独立。10.3.3 t-分布定义11 设,且X与Y相互独立,则称随机变量服从自由度为n的t-分布,记作 。若,则它的密度函数为。在图7-2中给出了当n=5,时,t-分布的密度函数曲线。必须对t-分布的密度函数曲线形状有所了解。性质4 t-分布的极限分布为标准正态分布N(0,1),即 。下面的二个重要定理是分布在正态总体抽样中的应用。定理3设是来自正态总体的一个样本,则统计量。定理4设和是分别来自正态总体和的二个独立样本,记,,则 。,10.3.4 F分布定义12 设,且X与Y独立,则称随机变量服从自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论