第7章参数估计_第1页
第7章参数估计_第2页
第7章参数估计_第3页
第7章参数估计_第4页
第7章参数估计_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7章 参数估计假设随机变量服从正态分布,在实践中,通常数学期望,方差都是未知的,需要进行估计,常用的估计法有点估计,区间估计等等,首先我们来讨论点估计。§7.1 点估计假设某一总体的分布函数为,其中参数未知,需要进行估计,又假设为从总体中抽出的一个样本,由这个样本构造一个函数,并以此作为参数的估计值,我们就称为的点估计。常用的点估计有矩估计,极大似然估计等等,下面我们分别进行讨论。 1 矩估计法若总体的密度函数为,其中为未知参数,如果总体的阶矩()存在,设,又假设为从总体中抽出的一个样本,为这个样本的阶样本矩,令若上述关于的方程组有解,则称这个解是的矩估计量或矩估计。按矩估计的定义

2、,无论总体是什么分布,只要真实矩存在,阶样本原点矩均是它们相应真实原点矩的矩估计量。例 6.2 设为从某个总体中随机取出的一个样本,且 存在, 试求的矩估计量。解 而,所以,解得,。例 6.3 设为上的均匀分布,为样本,求的矩估计。解令解上述关于的方程得。例 6.4 在贝努利试验中,设事件在每一次试验中发生的概率为,求参数的矩估计。解 设,而为的一个样本, 为事件发生的频率,由矩估计定义,故有使用矩估计法的一个前提是总体存在适当阶的矩,阶数应不小于待估参数的个数(或者说参数空间的维数),但这不总是可以做到的。矩估计法简便易行,且只要充分大,估计的精确度也很高,但它只用到总体的数字特征的形式,而

3、未用到总体的具体分布形式,损失了一部分很有用的信息,因此,在很多场合下显得粗糙和过于一般。3极大似然估计()参数的点估计方法中另一个常用方法就是极大似然估计,简记为。我们通过一个具体例子来说明这一估计的思想。我们来看一个的例子。例2 已知有一批产品,试估计这批产品的不合格品率。这里。解 设,于是服从概率分布, 我们从产品中随机抽取出一个容量为的样本,于是的概率为 。这概率可以看作是未知参数的函数,用表示,称作未知参数的似然函数,也即 。 在一次抽样中,值使获得这一组特殊观测值的概率应该最大,也即似然函数应该达到最大值。所以我们以使达到极大的值作为参数的一个估计值是合理的。对两边取对数,得,由于

4、对数函数是的单调函数,所以与在同一个值上达到极大。由对求导数,并使其等于零,得 ,解方程得解为 。不难验证,使达到极大,因此称为参数的极大似然估计值,其相应的统计量 称做参数的极大似然估计量。极大似然估计的出发点是基于这样一个统计原理:在一次随机试验中,某一事件已经发生,比如已经得到某个具体的样本,则必然认为发生该事件的概率最大。通过上述讨论,下面我们给出极大似然估计的概念。极大似然估计定义:设为取自具有概率函数的母体的一个样本,样本的联合概率函数 是的函数。我们用表示,即 我们称这个函数为样本的似然函数。称为对数似然函数。如果是离散型母体,给出观测到()的概率。所以我们只要寻找这样的观测值(

5、)的函数,使 成立。我们称为参数的极大似然估计值,其相应的统计量称作参数的极大似然估计量。如果是连续型变量,表示密度函数。我们只需求出使得达到极大的,便可得到极大似然估计。由于是的单调增函数,使成立的也使成立。若关于的偏导数都存在,于是的极大似然估计必须满足似然方程组 这两个方程组是两个同解方程组。通常情况下,解对数似然方程组更容易。例1 设是的样本,求与的解 由已知,因此事件发生的概率为,由分别对求偏导,得似然方程组解似然方程组,即得。由此可见,对于正态分布总体来说,的矩估计与是相同的。例 2 求均匀分布中参数的解 设为从总体中随机取出的一个样本,则样本的似然函数为本例似然函数不连续,不能用

6、似然方程求解的方法,只有回到极大似然估计的原始定义。注到最大值只能发生在 ;而欲最大,只有使最小,即使尽可能小,尽可能大,但在式(6.4)的约束下,因此只能取=,=和矩估计的情形一样,有时虽能给出似然方程,也可以证明它有解,但得不到解的解析表达式。§6.2 估计量的评价准则对于同一参数,用不同方法来估计,结果是不一样的。那么究竟孰优孰劣就需要进行判断,判断不同估计量优劣的方法主要有下述3个指标:1相合性设=是的一个估计量,若对任意给定的及,都有,就称是的相合估计。相合性是对一个估计量最基本的要求,如果一个估计量连相合性都不满足,这个估计量便没有什么意义。可以证明,矩估计,极大似然估计

7、都是相合估计。2无偏性 定义 : 设=是的一个估计量,若对任意的,都有,则称是的无偏估计量,如果,则称是的渐近无偏估计量。无偏性反映了估计量的取值在真值周围摆动,显然,我们希望一个量具有无偏性。例1 假设总体阶矩存在,而是从总体体中随机取出的一个样本,样本阶矩为,证明:样本阶矩是总体阶矩 矩的无偏估计。证明:因为是从总体体中随机取出的一个样本,所以独立同分布,从而,因此,所以由无偏估计的定义,样本阶矩是总体阶矩 矩的无偏估计。如果,则为样本平均数,为数学期望,因此样本平均数是数学期望的无偏估计。例2.假设求是从某一总体中随机取出的一个样本,且,为样本方差。求证:不是总体方差的无偏估计。证明:因

8、为故 ,所以 不是总体方差的无偏估计。但 ,因此是渐近无偏估计。在的基础上,我们适当加以修正可以得到一个的无偏估计,这个估计量也和样本方差一样是经常被采用的:。例3假设总体X服从指数分布,其密度函数为,其中参数未知,又设是从总体中随机取出的一个样本,试证明:和都是的无偏估计。证明:因为,而得密度函数为,所以,从而。上述例子表明,一个参数的无偏估计可以有很多个。3有效性 前面已经说过,无偏估计量只说明估计量的取值在真值周围摆动,但这个“周围”究竟有多大?我们自然希望摆动范围越小越好,即估计量的取值的集中程度要尽可能的高,这在统计上就引出最小方差无偏估计的概念。定义 假设=与=是未知参数的两个无偏

9、估计,如果对于任意的,总有,并且至少对于某一个不等式成立,就称比有效。§7.3 区间估计1定义对于一个未知参数,除了希望给出其估计值以外,同时也希望能够给出估计值的误差区间,误差区间也叫做置信区间,求置信区间的过程也就叫做未知参数的区间估计。下面给出区间估计的的定义。定义:对于参数,如果有两个统计量,,满足对给定的,有则称区间,是的一个区间估计或置信区间,分别称作置信下限、置信上限,称为置信水平。2单个正态总体均值与方差的区间估计求区间估计的一般步骤如下:10 先求出的一个点估计,它满足两点:一是它较前面提出的标准应该是一个“好的”估计量,二是它的分布形式应该已知,只依赖未知参数20

10、 所求的区间考虑为的一个邻域,使得对于=1- (6.22)对于一般分布的总体,其抽样分布的计算通常有些困难,因此,我们将主要研究正态总体参数的区间估计问题。下面我们来看几个例子。例1一车床加工圆柱形工件,其产品直径据经验服从正态分布,现从中随机抽取100个样本,测得数据如下表:直径(cm)27282930313233频 数5812501573若总体方差=25,试计算总体均值 及其95%的置信区间。解: )。由定理知,从而Z=。给定置信水平=0.05,查正态分布表,得,则P,其意义如图2·2·1所示。图2·2·1图2·2·1表明, 当置

11、信水平给定以后,的概率为1,若取为0.05,则1=0.95,。从而在0.95的概率意义下,有成立。解不等式,得,将、,代入上式,得。就是说,的真值落在区间(26.05,33.85)内的概率为0.95,所以的95%的置信区间为(26.05,33.85)。我们把区间 )叫做总体平均数的置信区间,叫作置信概率, 叫作置信水平。叫做分位值。在例1中,总体方差是已知的,然而在实践中,通常总体方差常是未知的,在这种情况下,只要样本足够大,可用样本方差代替总体方差。例2 已知在一次数学测验中, 学生的考试成绩服从正态分布,现从中随机抽取了400个样本,计算出样本均值为67.2分,样本标准差为10分,试在95

12、%的概率下,求总体均值的置信区间。解:由题意,令,则,给定置信水平,则。从而在95%的概率以以下,。由于很大,因此 得, , ,总体均值95%的置信区间为(66.225,68.175)。令= =,则为置信区间长度。越小,表明估计值越精确,越大,则表明估计值越差。例3 已知在一次数学测验中,考生的成绩服从正态分布,总体标准差,要使总体平均数的估计误差不超过1分,问至少需要多大的样本?解:取置信水平则。要使总体平均数的估计误差不超过1分,至少应有<1,即 。在实践中,除了需要求出平均数的置信期间以外,有时也需要求出方差的置信区间,下面我们举例进行讨论。例4有一大批糖果,现从中随机取出16袋,

13、称得重量如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496试求总体平均数的置信区间。解 经计算,给定置信水平,查分布表得,因此,所以平均数的95%的置信区间为(500.4,507.1)。例5·已知在一次数学测验中,考生的成绩分布服从正态分布,其中总体均值和总体方差均未知,现从中随机抽取了61个样本,算得样本方差,试在95%的概率意义下,求总体方差的置信区间。解:由定理2·2, 。又由题意, 。给定置信水平,查分布表,得,解不等式,得 。, , , 。所以的95%的置信区间为。将上式两边开方,得

14、,95%的置信区间为()。区间即为总体方差估计值的置信区间。例6求例4的标准差的置信区间。解:由例4知,给定置信水平,查分布表得, ,所以标准差的一个95%的置信区间为(4.58,9.60)。3 双正态总体参数的区间估计1)两个总体均值差的置信区间设,分别为出自和的样本,且它们相互独立, 假设已知,则,故,从而,给定,查正态分布表,得 ,于是,解不等式 得。上述区间就是置信水平为95%的两个总体均值差的置信区间。例1 已知在一次数学测验中,甲、乙两班的考试成绩服从正态分布,有关数据如下表: 班 级 学 生 平 均 成 绩 标准差(S) 甲 (X) 100 805 12 乙 (Y) 150 76

15、 11 试估计两个班级的平均成绩差的置信区间。解: 1计算统计量: ,所以的置信区间(2.87,6.13)。 2)若若未知,因为,从而由定义,得到。令,则。给定置信水平,查分布表得,从而,于是得到的置信区间为例2 已知全班19名学生参加了一项测验,将测验结果按男女生分组,所得数据如下表: 学 生 平均分 标 准 差 n 男 (X) 10 1.6 10 女 (Y) 11.8 3.06 9试估计两个小组平均成绩差的置信区间。解: , 所以的置信区间为(-4.24,0.64)。§7.4 0-1分布的参数区间估计假设有一容量为的样本,它来自(0-1)分布总体,的分布函数为,其中为未知参数,下

16、面我们来求的置信水平为的置信区间。已知0-1分布总体的数学期望为,方差为,又设是从总体中随机抽取出的一个样本,因为样本容量较大,因此由中心极限定理,近似服从正态分布,于是在置信水平下,解不等式,得,令,这里,。因此的置信水平为的置信区间为。例1 设从一大批产品中随机抽取100个产品,得一级品60个,求这批产品的一级品率的95%的置信区间。解 由已知,是0-1分布的参数,且,查表得,所以,这批产品的一级品率的95%的置信区间为(0.51,0.69)。§7.5 单侧置信区间在上述讨论中,对于未知参数,我们给出两个统计量,得到的双侧置信区间。但在某些实际问题中,例如,对于设备、元件的寿命来说,平均寿命长是我们所希望的,我们关心的是平均寿命的“下限”;与之相反,在考虑化学药品中杂质念量的均值时,我们常关心参数的“上限”。这就引出了单侧置信区间的概念。对于给定值,若由样本确定的统计量(),对于任意满足 ,称随机区间是的置信水平为的单侧置信区间,称为的置信水平为的单侧置信下限。 又若统计量(),对于任意满足,称随机区间是的置信水平为的单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论