应用统计-基本概念与抽样分布_第1页
应用统计-基本概念与抽样分布_第2页
应用统计-基本概念与抽样分布_第3页
应用统计-基本概念与抽样分布_第4页
应用统计-基本概念与抽样分布_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计的基本概念与抽样分布例:某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作第一,对生产出来的钢筋的强度进行检测,获得必要的数据。第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。,1.2总体、个体、样本,1.2.1总体与个体我们把所研究对象的全体称为总体或母体。组成总体的每个单元称为个体总体X可看作一个随机变量,称X的概率分布为总体分布,称X的数字特征为总体的数字特征,对总体进行研究就是对总体的分布或对总体的数字特征进行研

2、究.1.2.2样本从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量.样本具有二重性:随机性和确定性,定义1.1设总体X的样本满足独立性:每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立;代表性:样本中每一个个体都与总体X有相同分布。则称此样本为简单随机样本。进行有放回抽样就是简单随机样本,无放回抽样就不是简单随机样本。但N很大,n相对较小时无放回抽样得到的样本可以近似看作简单随机样本.称样本的分布为样本分布。如果为简单随机样本,为总体X的分布函数,则样本分布有比较简单的形式它完全由总体X的分布函数确定,它完全由总体X的分布函数确定,两种形式例1.1设有一批

3、产品,其次品率为p,如果记“”表示抽取一件产品是次品;“”表示抽取一件产品是正品;那么,产品的质量就可以用X的分布来衡量。X服从0-1分布,参数就是次品率p。如果为简单随机样本,求样本分布.解:总体X的概率分布为,例1.2设总体X服从参数为的正态分布,求样本的分布密度。解:总体X的分布密度为所以的概率分布为,统计量统计量的定义定义1.2设为总体X的一个样本,为的连续函数,且不含有任何未知参数,则称T为一个统计量。注:1.统计量是完全由样本确定的一个量,即样本有一个观测值时,统计量就有一个唯一确定的值;2.统计量是一个随机变量,它将高维随机变量问题转化为一维随机变量来处理,但不会损失所讨论问题的

4、信息量.,常见的统计量1.样本均值2.样本方差3.k阶原点矩4.k阶中心矩5.顺序统计量6.样本极差与中位数,例1.3设总体X为连续型的,求最大顺序统计量与最小顺序统计量的分布密度.解:最大顺序统计量的分布函数为,最小顺序统计量的分布函数为,如果总体中服从均匀分布则,其分布密度为,充分统计量例:某厂要了解其产品的不合格率p,检验员检查了10件产品,检查结果是,除前二件是不合格品(记为)外,其它都是合格品(记为)。当厂长问及检查结果时检验员可作如下两种回答:(1)10件中有两件不合格;(2)前两件不合格。这两种回答反映了检验员对样本的两种不同的加工方法。其所用的统计量分别为,显然,第二种回答是不

5、能令人满意的,因为统计量不包含样本中有关p的全部信息。而第一种回答是综合了样本中有关p的全部信息。因为样本提供了两种信息:(1)10次检验中不合格品出现了几次;(2)不合格品出现在哪几次试验上。,第二种信息(试验编号信息)对了解不合格品率p是没有什么帮助的.充分统计量就是能把含在样本中有关总体或者参数的信息一点都不损失地提取出来。或者说充分统计量包含了有关总体或有关参数的全部信息.考虑样本的分布,由于且是服从二项分布故,它与无关,定义1.3设总体X的分布为一个含未知参数的分布族,是X的一个样本。是一个统计量,对给定的t,样本在的条件下的条件分布与参数无关,则称统计量T是参数的充分统计量。,上例

6、的一般情况是设是来自0-1分布的一个简单随机样本,其中,则是参数的充分统计量。,由定义可得定理1.1设是参数的充分统计量,是单值可逆函数,则也是参数的充分统计量。,当总体为连续型总体时,充分统计量要用条件分布密度来描述。奈曼(J.Neyman)和哈尔斯(P.R.Halmos)在20世纪40年代提出并严格证明了一个判别充分统计量的方法:因子分解定理。,定理1.2(因子分解定理)设样本的联合分布为一个含未知参数的分布族,则是一个充分统计量当且仅当存在这样的两个函数:(1)与无关的非负函数;(2)与有关,且仅与统计量T的值有关的非负函数使得其中在离散总体的情况下表示样本的分布列,在连续总体的情况下表

7、示样本的分布密度。,例设是来自分布,即它的分布密度为的一个简单随机样本,其中则分别是参数的充分统计量,解:样本的联合分布密度为如果令由因子分解定理知是的充分统计量。,例设总体X的分布密度为是X的一个简单随机样本,试证明最小顺序统计量的充分统计量。,证:样本的联合分布密度为如果令由因子分解定理知是的充分统计量。,1.4抽样分布我们称统计量的分布为抽样分布,不同的统计量其分布不一定相同.常见的分布类型有:正态分布伽玛分布卡方分布t分布F分布,伽玛分布定义1.4如果连续型随机变量X的密度函数为其中为函数,则称X为服从参数是的伽玛分布,记为,伽玛分布的性质(1)由此可得,(2)如果,并且X和Y相互独立

8、,容易求得这个性质称为可加性,即伽玛分布具有可加性.,卡方分布用构造性的方式定义是定义1.5设为相互独立的随机变量,且均服从,则它们的平方和也是一个随机变量,它所服从的分布称为自由度为n的分布,记为,它的密度函数为其密度函数与参数n有关,它的图形也有一定差异,卡方分布的性质若,则即卡方分布是一种伽玛分布,因此具有伽玛分布的性质()()如果,并且X和Y相互独立,有卡方分布也具有可加性,例是来自参数为的指数分布总体,试证明:,总体的密度为当时,我们有密度为说明,假定子样是简单随机子样,则且它们之间相互独立,故有,t分布构造性的方式定义定义1.6设,且X与Y相互独立,记则也是一个随机变量,它所服从的

9、分布称为自由度为n的t分布,记为,它的密度函数为与参数n有关,不同的n其图形也有差异,性质若则()当时,t分布是柯西分布,柯西分布不存在数学期望和方差参数为2的t分布也不存在数学期望和方差()时,,()可以证明这是标准正态分布的分布密度,即当n充分大时,T近似服从标准正态分布,分布构造性的方式定义定义1.设,且X与Y相互独立,记则也是一个随机变量,它所服从的分布称为自由度为(m,n)的F分布,记为,它的密度函数为它与m,n有关,其图形也有一定差异,容易得到若,则,例设试证明:证明:由t分布的构造性定义知,存在相互独立的变量和,使得于是,仍相互独立,由分布的定义知结论成立,分位数:定义1.6设X为连续型随机变量,其分布函数为,对,如果存在数满足则称为此分布的分位数分位数的几何意义可用图形表示,它的值可查表得到,不同的分布有不同的分位数,有不同的表可查,常见的分位数有它们的值可以通过附表1、附表2、附表3、附表4查得,分位数具有性质(1)(2)(3)当n足够大时(一般n45)有近似公式,例:查表求下列分位数的值,抽样分布定理定理1.1设总体,为X的一个简单随机样本,为样本均值与样本方差,则有:(1)(2),(3)相互独立;(4),定理1.2设有两个总体与,从两个总体与中分别独立抽取容量为m,n的简单随机样本记为样本的样本均值与方差,为样本的样本均值与方差,则(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论