教学材料《概率论》-第七章_第1页
教学材料《概率论》-第七章_第2页
教学材料《概率论》-第七章_第3页
教学材料《概率论》-第七章_第4页
教学材料《概率论》-第七章_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节点估计所谓参数的点估计,是指把总体的未知参数估计为某个确定的量或者某个确定的值.具体从一个简单的实例来看.引例某地水稻面积为10000亩,随机抽取4块稻田,亩产(单位:千克)分别为300,350,400,450,求该地平均亩产量及总产量的估计.设平均亩产量为μ,样本均值X=375,平均亩产量估计^μ=X=375,总产量的估计为10000^μ.设总体X的分布函数为F(x,θ),其中θ是未知参数或未知参数向量.X1,X2,,Xn是总体X的一个样本,x1,x2,,xn是相应的样本值.构造一个统计量θ^(X1,X2,,Xn

)作为参数θ的估计,用它的观察值θ^(x1,x2,,xn

)作为未知参数的估计值,称θ^(X1,X2,,Xn

)为θ的估计量,称θ^(x1,x2,,xn

)为θ的估计值.构造估计量θ^(X1,X2,,Xn

)的方法很多,下面介绍两种常用的方法:矩估计法和极大似然估计法.下一页返回第一节点估计一、矩估计法矩估计法是一种古老、经典的参数估计方法,它是英国统计学家皮尔逊于1894年首创的,沿用至今.矩估计法的一般原则是:用样本矩估计总体矩,若估计结果不够良好,再做适当调整.设总体X的分布函数为F(x,θ1,θ2,,θk

),其中参数θ1,θ2,,θk均未知,X1,X2,,Xn是来自总体X的一个样本.假设总体X的前k阶矩存在,则一般来说,它们是θ1,θ2,,θk的函数,即上一页下一页返回第一节点估计同时,样本k阶原点由第五章大数定律知,样本矩依概率收敛于相应的总体矩μl=E(Xl

),我们就用样本矩作为相应总体矩的估计量,这种估计方法称为矩估计法.具体做法就是令从中求出方程组的解为称为参数的矩估计量,为参数θl(1≤l≤k)的矩估计值.上一页下一页返回第一节点估计【例7-1】设总体X~b(1,p),其中p为未知参数.又设X1,X2,,Xn是来自总体X的一个样本,求p的矩估计量.【例7-2】设总体X服从[0,θ]上的均匀分布,其中θ>0为未知参数.又设X1,X2,,Xn是来自总体X的一个样本,求θ的矩估计量解上一页下一页返回第一节点估计【例7-3】设总体X的均值μ及方差σ2都存在,且有σ2

>0,但是μ与σ2均未知.又设X1,X2,,Xn是来自总体X的一个样本,试求μ,σ2的矩估计量.例7-3表明,总体均值和总体方差的矩估计量的表达式不因总体分布不同而异,即矩估计法中总体均值的估计量为样本均值,总体方差的估计量为样本方差.例如,总体X~N(μ,σ2),参数μ与σ2均未知,即得μ,σ2的矩估计量分别为上一页下一页返回第一节点估计二、极大似然估计法极大似然估计法通常又称为最大似然估计法,其基本思想是在已经得到试验结果的情况下,取使这个结果出现的可能性达到最大的那个θ^作为未知参数θ真值的估计.也就是说,当它作为参数θ的估计值时,使结果出现的可能性最大,即概率最大.(1)设总体X是离散型的,其分布律为P{X=x}=p(x,θ),其中θ为待估计的参数,假定x1,x2,,xn为样本X1,X2,,Xn的一组观测值.上一页下一页返回第一节点估计将看作参数θ的函数,记为L(θ),即(2)设总体X是连续型的,其概率密度为f(x,θ),其中θ为待估计的参数,则样本X1,X2,,Xn的概率密度为也将看作参数θ的函数,记为L(θ),即由上述可知,不管是离散型的总体还是连续型的总体,只要知道了其分布律或概率密度,总可以得到一个关于参数θ的函数L(θ),称之为似然函数.上一页下一页返回第一节点估计如前所言,极大似然估计的主要思想就是:如果随机抽得的样本观测值为x1,x2,,xn,则应该选取未知参数θ的值使得出现该样本的可能性最大,即使得似然函数L(θ)的值最大.也就是说,求参数θ的极大似然估计就转化为求似然函数L(θ)的极值点问题.L(θ)作为参数θ的函数,它在θ^时最大,则称θ^为θ的极大似然估计,即上述求极值的问题一般是通过求解下面的方程得到的:上一页下一页返回第一节点估计然而,L(θ)是n个函数的连乘积,求导数比较复杂,而lnL(θ)是L(θ)的单调增函数,lnL(θ)与L(θ)在同一点处取得极值,于是求解方程(7-1)可以转化为求解方程当似然函数是参数向量θ1,θ2,,θk的函数时,求解方程(7-2)即转化为求解对数似然方程组上一页下一页返回第一节点估计【例7-4】设总体X~b(1,p),X1,X2,,Xn是来自总体X的一个样本,求p的极大似然估计量解X的分布律为上一页下一页返回第一节点估计【例7-5】设总体X~N(μ,σ2

),X1,X2,,Xn是来自总体X的一个样本,求μ,σ2的极大似然估计量.解得^μ=X,σ^2=B2,与矩估计量的结果(例7-3)相同.上一页下一页返回第一节点估计【例7-6】设总体X服从[0,θ]上的均匀分布,X1,X2,,Xn是来自总体X的一个样本,求θ的极大似然估计量.因为0≤xi≤θ,i=1,2,,n,所以θ∈[max1≤i≤n{xi},+),从而参数θ的极大似然估计量{Xi},这与矩估计量的结果(例7-2)不同.两种点估计方法中,矩估计法直观简单,无须知道总体的分布,但是矩估计法对样本容量有要求,而且有时矩估计量不唯一ꎻ极大似然估计法效果比较好,对样本容量无要求,但要知道总体分布,且计算较复杂.上一页返回第二节估计量的评价标准由前一节可知,对同一个未知参数用不同的估计方法求出的估计量可能不相同,原则上任何统计量都可以作为未知参数的估计量,我们自然会问,采用哪一个估计量效果要好?这就涉及评价估计量的标准问题.下面介绍三个常用的标准.一、无偏性一个好的估计量其不同的估计值应在未知参数真值的附近,由此引出无偏性标准.设X1,X2,,Xn是来自总体X的一个样本,θ是待估计的参数.定义7.1设θ^为θ的一个估计量,若E(θ^)=θ,则称θ^为θ的无偏估计量.估计量的无偏性是说,对于某些样本值,由这一估计量得到的估计值相对于真值来说有的偏大,有的则偏小,反复将这一估计量使用多次,就“平均”来说其偏差为零.下一页返回第二节估计量的评价标准在科学技术中,称E(θ^)-θ为用θ^估计θ时产生的系统误差,无偏估计的实际意义是指估计量没有系统误差,只可能有随机误差.【例7-7】设X1,X2,,Xn是来自总体X的样本,E(X)=μ,则样本均值是μ的无偏估计量.

证【例7-8】设X1,X2,,Xn是来自总体X的一个样本,E(X)=μ,D(X)=σ2,问:样本方差及样本二阶中心距是否为总体方差σ2的无偏估计?上一页下一页返回第二节估计量的评价标准从【例7-7】、【例7-8】可以看出,样本均值是总体均值的无偏估计,样本方差是总体方差的无偏估计.但作为总体方差矩估计量和极大似然估计量的样本二阶中心矩B2不是总体方差的无偏估计.事实上,k阶样本矩是k阶总体矩的无偏估计.上一页下一页返回第二节估计量的评价标准一般来说,无偏估计量的函数并不是未知参数相应函数的无偏估计量.例如,样本方差S2是总体方差σ2的无偏估计量,但是样本标准差S不是总体标准差σ的无偏估计量.【例7-9】设总体X服从参数为θ的指数分布,其概率密度为其中,θ>0为未知,X1,X2,,Xn是来自总体X的一个样本,试证X1和X是θ的无偏估计量.证由于E(X1)=E(X)=E(X)=θ,因此X1和X是θ的无偏估计量.由此可见,一个未知参数可以有不同的无偏估计量.事实上,【例7-9】中的X1,X2,,Xn的每一个都可以作为θ的无偏估计量.上一页下一页返回第二节估计量的评价标准二、有效性对于未知参数θ,现在来比较θ的两个无偏估计量θ^1和θ^2,如果在样本容量n相同的情况下,θ^1的观察值较θ^2更密集在真值θ的附近,我们就认为θ^1比θ^2理想.由于方差是随机变量取值与其数学期望的偏离程度的度量,因此无偏估计以方差小者为好.这就引出了估计量的有效性这一概念.定义7.2设为θ的两个无偏估计量,若则称有效.【例7-10】证明例7-9中两个无偏估计量X较X1有效.上一页下一页返回第二节估计量的评价标准三、一致性一个好的估计量应是无偏的,且是具有较小方差的.不过无偏性和有效性都是在样本容量n固定的前提下提出的,我们自然希望当样本容量无限增大时,估计量能在某种意义上无限地接近于待估计参数的真值.由此引入一致性(相合性)标准.定义7.3设θ^(X1,X2,,Xn)为未知参数θ的估计量,若当n→+时,θ^(X1,X2,,Xn

)依概率收敛于θ,即对任意的ε>0,均有则称θ^为参数θ的一致估计量.上一页下一页返回第二节估计量的评价标准【例7-11】则样本方差与样本二阶中心矩都是σ2的一致估计量.

由辛钦大数定律知,样本均值X是总体均值μ的一致估计量.实际上,样本矩Ak=都是相应总体矩的一致估计量.进一步,若待估参数θ

其中g为连续函数,则θ的矩估计量是g的一致估计量.一致性是对一个估计量的基本要求,若估计量不是一致的,那么不论将样本容量n取多大,都不能将θ估计得足够准确,这样的估计量就是不可取的.上一页返回第三节区间估计一、区间估计的概念第一节讨论了参数的点估计,但是对于一个未知量,人们在测量或计算时,并不仅限于得到参数的近似值,还需估计误差,即要求知道近似值的精确程度.因此,对于待估计参数θ,除了求出它的点估计θ^外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度.这种形式的估计称为区间估计,这样的区间即所谓的置信区间.下面给出置信区间的定义.设θ^为未知参数θ的估计量,其误差小于某个正数ε的概率为1-α(0<α<1),即这表明,随机区间(θ^-ε,θ^+ε)包含参数θ真值的概率(可信程度)为1-α,则这个区间(θ^-ε,θ^+ε)称为置信区间,1-α称为置信水平.下一页返回第三节区间估计定义7.4设总体X的分布函数为F(x,θ),其中θ是未知参数.若对于给定的概率1-α(0<α<1),存在两个统计量θ1=θ1(X1,X2,

,Xn

)与θ2=θ2(X1,X2,

,Xn

),使得则随机区间(θ1,θ2)称为参数θ的置信水平为1-α的置信区间,θ1称为置信下限,θ2称为置信上限.置信区间的含义是,若反复抽样多次(各次的样本容量相等,均为n),每一组样本值确定一个区间(θ1,θ2),每个这样的区间要么包含θ的真值,要么不包含θ的真值.按照伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1-α)%,不包含θ真值的约占100α%.例如,若α=001,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个.上一页下一页返回第三节区间估计置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性.对于置信水平为1-α的置信区间(θ1,θ2),一方面置信水平1-α越大,估计的可靠性越高ꎻ另一方面区间(θ1,θ2)的长度越小,估计的精确性越好.但这两方面通常是矛盾的,提高可靠性通常会使精确性下降,而提高精确性通常会使可靠性下降,所以要找两方面的平衡点.在实际应用中,往往先固定可靠度,再提高估计精确度.在学习区间估计方法之前,我们先回顾一下标准正态分布的上α分位点概念.设X~N(0,1),若zα满足条件P{X>zα}=α(0<α<1),则称点zα为标准正态分布的上α分位点.例如求z0.01,按照上α分位点定义,我们有P{X>z0.01}=0.01,则P{X≤z0.01}=0.99,即Φ(z0.01)=0.99,查表可得z0.01=2.327.上一页下一页返回第三节区间估计【例7-12】设X~N(μ,σ2),μ未知,σ2

已知,X1,X2,,Xn为来自总体X的一个样本,求μ的置信水平为1-α的置信区间.解如图7.1所示,由于,对于给定的α,由上α分位点定义查表可得上一页下一页返回第三节区间估计值得一提的是,置信水平为1-α的置信区间并不是唯一的.以上例来说,若给定α=0.05,有上一页下一页返回第三节区间估计是μ置信水平为0.95的置信区间.将式(7-4)与式(7-5)对比,由式(7-4)确定的置信区间长度为很明显,由式(7-4)确定的置信区间长度要短.置信区间长度短表示估计的精确程度高,故由式(7-4)给出的区间较式(7-5)为优.易知,像标准正态分布那样的总体分布,其概率密度的图形是单峰且对称的,当固定样本容量为n时,以形如式(7-4)那样的对称区间的区间长度最短,也就是在准确度一定的前提下此种区间形式精确程度最高,实际应用中我们自然选它.以下类同情况,不再做说明.上一页下一页返回第三节区间估计二、单个正态总体参数的区间估计1.正态总体均值μ的区间估计设总体X~N(μ,σ2),X1,X2,,Xn为X的一个样本,X,S2分别是样本均值和样本方差.给定置信水平为1-α,下面分两种情况进行讨论.(1)σ2已知时,μ的置信区间:易知X是μ的无偏估计,且有枢轴量X-μσ/n~N(0,1).上一页下一页返回第三节区间估计由标准正态分布的上α分位点的定义,有上一页下一页返回第三节区间估计【例7-13】某车间生产滚珠,从中随机抽取10个,测得滚珠的直径(单位:毫米)如下:若滚珠直径服从正态分布N(μ,σ2),并且已知σ=0.16(毫米),求滚珠直径均值μ的置信水平为0.95的置信区间.解计算样本均值置信水平1-α=0.95,查表得zα/2=z0.025=1.96.由此得μ的置信水平为0.95的置信区间为即上一页下一页返回第三节区间估计(2)σ2未知时,μ的置信区间:此时不能使用因为其中包含未知参数.考虑到S2是σ2的无偏估计,将上述区间中的σ换成我们已知枢轴如图7.2所示.上一页下一页返回第三节区间估计【例7-14】在【例7-13】中,若σ未知,求滚珠直径均值μ的置信水平为0.95的置信区间.解计算样本均值x=14.92,样本标准差s=0.193ꎻ置信水平1-α=0.95,自由度n-1=10-1=9,查表得tα/2(n-1)=t0.025(9)=2.26.由此得μ的置信水平为0.95的置信区间为上一页下一页返回第三节区间估计需要说明的是,对比【例7-13】和【例7-14】中μ的置信区间,可以发现当σ2未知时,μ的置信区间长度要比σ2已知时的置信区间长度大,这表明当未知条件增多时,估计的精确度变差,这也符合我们的直观感觉.2.正态总体方差σ2的区间估计(1)如图7.3所示,μ未知时,σ2的置信区间:σ2的无偏估计为S2,且统计量选取分位点上一页下一页返回第三节区间估计于是得到方差σ2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论