北邮概率论与数理统计统计量及其分布_第1页
北邮概率论与数理统计统计量及其分布_第2页
北邮概率论与数理统计统计量及其分布_第3页
北邮概率论与数理统计统计量及其分布_第4页
北邮概率论与数理统计统计量及其分布_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 6.3 统计量及抽样分布 6.3.1 统计量 为研究一个问题而收集数据,数据就是样本,样本中含有总体的信息。要实施统计推断,则要依据样本所提供的信息。样本本身是一堆杂乱无章的数字,需要对这些数字进行加工、整理把样本中所含的信息集中起来以反映总体的各种特征,也就是要由样本计算出一些量以用于统计推断。这些量是样本的函数而且完全由样本所确定,在统计学中,把凡是由样本算出的量称为统计量。因此有下面定义。定义6.3.1 设为取自某总体的样本,若样本的函数中不含任何未知参数,则称为统计量。 在此要强调一点:统计量只依赖于样本,而不能与任何未知的量有关,特别地不能依赖于未名参数。换言之,统计量是能由样本完

2、全确定的量.在具体的统计问题中选用什么统计量,当然要看问题的性质.一个好的统计量应该能很好地集中与问题有关的信息. 例如: 样本均值.设为来自某总体的样本,则样本均值定义为若要对总体均值作推断(估计、检验),那么我们很自然地会想到样本均值. 例如: 样本方差.设为来自某总体的样本,则样本方差定义为若要对总体方差作推断(估计、检验),那么我们很自然地会想到样本方差.在这里我们常说“的自由度为”,自由度这个名词有如下两种解释:(1) 是个数,的平方和,而这个数受到一个(也只有一个)约束: ,故只有个自由度.(2) 若代入中,并将其整理为二次型,则的秩为.自由度就定义为这个秩。 下面列举一些常用的统

3、计量:样本均值: , 样本方差: ,样本标准差: 样本阶原点矩:样本阶中心矩:样本偏度 样本峰度 次序统计量:设有样本,按如下方式定义随机变量,当有了样本值后,将样本值从小到大排序为,那么的取值为,称为第个次序统计量,称为样本的次序统计量, 是的一次实现.和分别称为极小和极大次序统计量. 称为样本极差.样本分位数:样本分位数定义为 样本中位数为 注:样本分位数的定义在不同的教材上可能会有所差异。样本经验分布函数:对于任意的实数,即表示样本中小于或等于的频数. 经验分布函数定义为. 对应于样本的二重性,统计量也有二重性.若样本是个随机变量,则统计量是随机变量. 而对于具体的样本值,是一个具体的取

4、值,称此具体取值为统计量的观察值. 在统计分析和统计推断中,统计量起着重要作用,对统计量的统计性质的了解就很重要. 比如计算统计量的特征数(比如,期望、方差等),推导统计量的概率分布. 例如, 对于任意给定的实数,经验分布函数值是一个随机变量,并且服从二项分布,其中为总体分布函数.对于具体的样本观察值,那么经验分布函数的观察值 (经验分布函数的观察值仍记为)是一个阶梯形的函数,例如,若样本值两两不相等,其次序统计量为,则 例6.3.1 设总体的数学期望为,方差为,为来自该总体的简单随机样本,为样本均值和样本方差,则 (1) (2) (3)证明:(1)(2) ;(3)由于 ,从而 所以 例6.3

5、.2 设总体的数学期望为,方差为,为来自该总体的简单随机样本,为样本均值.求(1),(2)解:(1) 时 (2) .或例6.3.3 设为来自总体的简单随机样本,为极大次序统计量,求(1)的概率密度函数;(2),.解:的分布函数为 这里是分布的分布函数,从而可得的概率密度函数为 所以 .例6.3.4 设为来自总体的简单随机样本,的分布函数为,为样本的经验分布函数,对于任意给定的实数,求,.解: 对于任意给定的实数,从而 ,. 6.3.2 抽样分布样本是随机变量,有一定的概率分布。而统计量是样本的已知函数,那么它是随机变量,有其概率分布,这个分布称为抽样分布。为特定的统计推断问题而构造特定统计量,

6、由于统计量会受到随机性的影响,因而推断的结果也会有随机性干扰.统计推断方法的优良性只能是从整体效果去考察,而整体效果取决于统计量的抽样分布.因此研究统计量的抽样分布就成为统计推断的一个重要问题.例如, 若为取自总体的简单随机样本,用样本均值估计总体均值,那么这个统计量的抽样分布为,从这个抽样分布,我们可以知道样本均值是如何围绕总体均值而随机波动的,如果己知则可以计算出与的偏差超过一定限度的机会有多大,即概率。再比例, 若为取自总体的简单随机样本,那么统计量的抽样分布为。如用样本均值估计总体均值,那么样本均值的抽样分布决定了这个估计量的性能。从原则上讲,统计量的抽样分布可由样本分布定出,但在很多

7、情况下,统计量的精确分布非常复杂. 在统计量的精确分布难以确定或非常复杂时,我们常常求助于统计量的近似分布.例如, 如果为取自某总体的简单随机样本,总体的均值为,方差为。由中心极限定理知依分布收敛于,从而样本均值在很大时的近似分布为.6.3.3 三大分布 很多统计推断是基于正态模型(即基于总体为正态分布的假设),而对于来自正态总体的简单随机样本,一些常用统计量(样本均值、样本方差)的精确分布是可以推导出来的.这些分布涉及下面介绍的“三大分布”. (一)分布在第三章中,我们介绍过形状参数为,尺度参数为的Gamma分布为自由度为的分布.若随机变量独立同分布于,那么,再由Gamma分布的可加性知,从

8、而服从自由度为的分布.因此也可以如下方式给出分布的定义.定义5.4.1 设为取自总体的简单随机样本,则称统计量的分布为自由度为的分布,记为.由Gamma分布的概率密度的表达式,易知自由度为的分布的密度函数为.自由度为的分布的分位数记为,即满足 ,其中,分位数可从附表3中查到.比如.由此定义,易得分布的两条性质:(1) 若随机变量,则.(2) 若随机变量,且与相互独立,则. 例6.3.5 设为取自总体的简单随机样本,则 (),从而.若已知,则可得统计量的密度函数为 .(二) 分布定义 设随机变量,且与相互独立,则称的分布为自由度为的分布,记为. 自由度为的分布的密度函数为 .分布的密度函数是偶函

9、数,而且随的增大而减少,因此其分布也有标准正态分布类似的特征:中间高,两端低;左右对称.而且有当时, 分布收敛于标准正态分布.自由度为的分布的分位数记为,即满足 ,其中,分位数可从附表4中查到.比如.由于分布的密度函数是偶函数,故分位数有如下关系,当自由度较大(如)时, 分布可用标准正态分布近似, 分布的分位数可用标准正态分布的分位数近似.分布的性质:(1) 时, 分布的数学期望存在,且期望为0.(2) 时, 分布的方差存在,且方差为.(3) 若,则.例6.3.6 设为取自总体的简单随机样本,则.(三) 分布定义 设随机变量,且与相互独立,称的分布为自由度为和的分布,记为. 自由度为和的分布的

10、密度函数为 自由度为和的分布的分位数记为,即满足 ,其中,分位数可从附表5中查到.比如.由此定义,易得分布的性质:(1) 若随机变量,则.(2) .例6.3.7 设为取自总体的简单随机样本,则.例6.3.8 设为取自总体的简单随机样本, 设为取自总体的简单随机样本,且两样本独立,则.6.3.4 正态总体的抽样分布在正态总体下,样本均值和样本方差等常用统计量的精确分布是可以导出的.下面给出其结果. 定理6.3.1 设为来自总体的简单随机样本,为样本均值和样本方差,则 (1), (2), (3)相互独立. 对于结论(1),利用正态分布的性质易得,下面给出结论(2),(3)的证明. 证明:记,则,其

11、中,为阶单位矩阵。取一个阶正交矩阵,的第一行的每个元素均为。 令, 由多维正态分布的性质知由于为正交矩阵,且的第一行的每个元素均为,故 ,所以,并且相互独立。 从而有 ,且与独立。又,所以与独立,并且 。 推论:设为来自总体的简单随机样本,分别为样本均值和样本方差,则.证明:由定理知 , ,并且两者独立,从而即在数理统计中,经常会遇到两独立样本的比较问题.在正态模型下常需对两正态总体的均值、方差作比较,此时一般可通过对样本均值的比较、样本方差的比较得出结论.这就需要知道样本均值之差、样本方差之比的抽样分布.下面给出在正态总体下,样本均值之差、样本方差之比的抽样分布.定理6.3.2 设为来自总体的简单随机样本,分别为该样本的样本均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论