参数估计习题解答.doc_第1页
参数估计习题解答.doc_第2页
参数估计习题解答.doc_第3页
免费预览已结束,剩余45页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计习题与习题解答6.11从一批电子元件中抽取8个进行寿命测试,得到如下数据(单位:h):1 050, 1 100, 1 130, 1 040, 1 250, 1 300, 1 200, 1 080试对这批元件的平均寿命以及分布的标准差给出矩估计.解:样本均值 样本标准差 因此,元件的平均寿命和寿命分布的标准差的矩估计分别为1143.75和96.05622 设总体,现从该总体中抽取容量为10的样本,样本值为0.5,1.3,0.6,1.7,2.2,1.2,0.8,1.5,2.0,1.6试对参数给出矩估计.解:由于E(X)=,即=2E(X),而样本均值=1.34,故的矩估计为3 设总体分布列如下,是样本,试求未知参数的矩估计解:(1) 总体均值E(X)=,解之可得N=2E(X)+1故N的矩估计量,其中为样本均值,若不是整数,可取大于的最小整数代替(2) 总体均值E(X)=,由于,故有E(X),即,从而参数的 q 矩估计为4设总体密度函数如下,是样本,试求未知参数的矩估计解:(1) 总体均值E(X)=,即即,故参数的矩估计为(2)总体均值E(X)=,所以,从而参数的矩估计(3)由E(X)=可得,由此,参数的矩估计(4)先计算总体均值与方差 E(X)=+=+=Var(X)=由此可以推出,从而参数的矩估计为5设总体为,先对该总体观测n次,发现有k次观测为正,使用频率替换方法求的矩估计.解:由题意知,观测为正的频率f=,下面计算观测值为正的概率.当总体为N()时,P(X0)=1-P(X0)=1-P(X-)=其中为标准正态分布的分布函数.利用频率替换概率的方法有,这给出参数的矩估计为譬如,若设=0.281,则由上式知是标准正态分布的分布的0.281分位数,查表得=-0.586甲、乙两个校对员彼此独立对同一本书的样稿进行校对,校完后,甲发现a个错字,乙发现b个错字,其中共同发现的错字有c个,试用矩法给出如下两个未知参数的估计:(1) 该书样稿的总错字个数;(2) 未被发现的错字数.解 (1)设该书样稿中总错字的个数为,甲校对员识别出错字的概率为,乙校对员识别出错字的概率为,由于甲,乙是彼此独立地进行校对,则同一错字能被识别的概率为,根据频率替换思想有 由独立性可得矩法方程,解之得.(2) 未被发现的错字估计等于总错字数的估计减去甲,乙发现的错字数,即譬如,若设a=120,b=124,c=80,则该书样稿中错字总数的矩法估计,而未被发现的错字个数的矩法估计为186-120-124+80=22个.7设总体概率函数如下,是样本,试求未知参数得最大似然估计.(1)(2)已知,1解 (1)似然函数为,其对数似然函数为将关于求导并令其为0即得到似然方程解之得 由于 所以是q 的最大似然估计.(2)似然函数为,其对数似然函数为解之可得由于,这说明是的最大似然估计.8设总体概率函数如下,是样本,试求未知参数的最大似然估计.(1)已知;(2(3)解:(1)样本的似然函数为要使达到最大,首先示性函数应为1,其次是尽可能大.由于c0,故是的单调增函数,所以q 的取值应尽可能大,但示性函数的存在决定了q 的取值不能大于,由此给出的最大似然估计为(2)此处的似然函数为 其对数似然函数为 由于 所以,是的单调增函数,要使其最大,的取值应该尽可能的大,由于限制,这给出的最大似然估计为.将 关于 求导并令其为0得到关于 的似然方程 ,解之得 .(3)似然函数为.由于是关于的单调递减函数,要使达到最大,应尽可能小,但由限制可以得到,这说明不能小于,因而的最大似然估计为.9设总体概率函数如下,是样本,试求未知参数的最大似然估计.(1);(2);(3).解:(1)不难写出似然函数为 .对数似然函数为.将之关于求导并令其为0得到似然方程 ,解之可得.而:,故是的最大似然估计(2) 此处的似然函数为 .它只有两个取值:0和1,为使得似然函数取1,的取值范围应是,因而的最大似然估计可取中的任意值. (3) 由条件,似然函数为.要使尽量大,首先示性函数应为1,这说明;其次要尽量小,综上可知,的最大似然估计应为,的最大似然估计应为10一地质学家为研究密歇根湖的湖滩地区的岩石成分,随机地自该地区取100个样品,每个样品有10块石子,记录了每个样品中属石灰石的石子数.假设这100次观察相互独立,求这地区石子中石灰石的比例的最大似然估计.该地质学家所得的数据如下样本中的石子数012345678910样品个数016723262112310解:本题中,总体X为样品中石灰石的个数,且X服从参数为的二项分布,即又设为样本,则其似然函数为(忽略常数),对数似然函数为将对数似然函数关于求导并令其为0得到似然方程解之得由于由二阶导数的性质知,p的最大似然估计为11. 在遗传学研究中经常要从截尾二项分布中抽样,其总体概率函数为若已知,是样本,试求p的最大似然估计.解:当m=2时,该截尾二项分布只能取1与2,不妨设的样本中有个为1,有n-n1个2则其似然函数为(忽略常数)对数似然函数为将对数似然函数关于p求导并令其为0得到似然方程解之得后一个等式是由于所以,代入上式即得.12已知在文学家箫伯纳的An Intelligent Womans Guide To Socialism 一书中,一个句子的单词数X近似地服从对数正态分布,即.今从该书中随机地取20个句子,这些句子中的单词数分别为52 24 15 67 15 22 63 26 16 327 33 28 14 7 29 10 6 59 30求该书中一个句子单词数均值的最大似然估计.解:正态分布的参数的最大似然估计分别为样本均值和方差.即由于最大似然估计具有不变性,因而的最大似然估计为13设是来自对数级数分布的一个样本,求参数p的矩估计.解:由于,因此有,从而得到p的矩估计.14一个罐子里装有黑球个百球,有放回地抽取一个容量为n的样本,其中 有k个百球,求罐子里黑球和白球数之比R的最大似然估计.解法1:记p为罐子中白球的比例,令表示第i次有放回抽样所得的白球数,则故p的最大似然估计为.因为黑球数与白球数比值.根据最大似然估计的不变性,有,对具体的样本值即n个抽到k个白球来讲,R的最大似然估计为.解法2:设罐子里有白球个,则有黑球R个,从而罐子中共有(1+R)个球,从中有放回的抽一个球为白球的概率为从罐子中有放回的抽 n个球,可视为从二点分布X0(黑球)1(白球)p中抽取一个样本容量为n的样本.当样本中有k个白球时,似然函数为 L(R)=,其对数似然函数为lnL(R)=(n-k)lnR-nln(1+R),将对数似然函数对R求导,并令其为0,得似然方程解之可得R=.由于其对数似然函数的二阶导数为,所以R=是R的最大似然估计.譬如,在n=10,k=2场合,R的最大似然估计R=,即罐中黑球数与白球数之比的最大似然估计为4,若白球1个,黑球为4个;或者白球2个,黑球8个等.15.设和分别来自总体N()和N()的两个独立样本.试求的最大似然估计.解:合样本的似然函数为L=,对数似然函数为lnL=-.将对数似然函数对分别求导并令其为0,得, ,由此得到的最大似然估计为.16某批产品含有N件,其中M件为不合格品,现从中随机抽取n件中有x 件不合格品,则x服从超几何分布,即,假如N与n已知,寻求该批产品中不合格品数M的最大似然估计.解:记未知参数M的似然函数L(M,x)=P(X=x).考察似然比由要使似然比得,必然导致 (M+1)(N-M-n+x)(M+1-x)(N-M)化简此式可得,这表明:当为整数和时似然函数L(M,x)是M的增函数,即 (*)类似地,要使似然比,必导致.这表明,当 为整数且时,似然函数L(M,x)是M的减函数,即 (*)比较(*)和(* *)可知,当是整数时,M的最大似然估计为或+1,而当不为整数时,M的最大似然估计为,其中a为不超过a的最大整数,综合上述,M的最大似然估计为譬如,在N=19,n=15,x=2场合.=,由于为整数,故M的最大似然估计为7或8.下面以实际计算加以佐证,几个L(M,2)=(x=2)如下表所示:M678910L(M,2)0.36890.39730.39730.37150.3251可见M取7或8可使似然函数达到最大.又如,在N=16,n=5,x=2场合,=(N+1)-1=(16+1)-1=5.8(不为整数),这时M的最大似然估计=+1=5.8+1=6.实际计算表明M5678L(M,2)0.37770.41210.40380.359可见M取6可使似然函数达到最大. 6.2 点估计的评价标准内容概要1.相合性 设为未知参数,=(,)是的一个估计量,n是样本容量,若对任何一个0,有,则称为参数的相合估计.相合性本质上就是按概率收敛,它是估计量的一个基本要求,即当样本量不断增大时,相合估计按概率收敛于未知参数;矩法估计一般都是相合估计;在很一般的条件下,最大似然估计也是相合估计.2无偏性 设=(,)是的一个估计,的参数空间为,若对,有则称是的无偏估计,否则称为有偏估计.假如对任意的,有,则称是的渐近无偏估计.3有效性 设是的两个无偏估计,如果对任意的有,且至少有一个使得上述不等号严格成立,则称比有效.4均方误差 设是的一个估计(无偏的或有偏的),则称为的均方误差.均方误差较小意味着:不仅方差较小,而且偏差也小,所以均方误差是评价估计的最一般标准.使均方误差一致最小的估计量一般是不存在的,但两个估计好坏可用均方误差评价:在无偏估计类中使均方误差最小就是使方差最小.习题与解答6.21总体XU(2),其中是未知参数,又为取自该总体的样本,为样本均值.(1)证明是参数的无偏估计和相合估计;(2)求的最大似然估计,它是无偏估计吗?是相合估计吗?解:(1)总体XU(2),则,从而于是,这说明是参数的无偏估计.进一步,这就证明了也是的相合估计.(2)似然函数为,显然是的减函数,且的取值范围为,因而的最大似然函数估计为下求的均值与方差,由于的密度函数为 故,从而:所以不是q的无偏估计,但它是q的渐近无偏估计和相合估计.2.设x1,x2, x3,是取自某总体的容量为3的样本,试征下列统计量都是该总体均值m的无偏估计,在方差存在时指出哪一个估计的有效性最差?(1)(2)(3)解:先求三个统计量的数学期望这说明他们都是总体均值m的无偏估计,下面求他们的方差,不妨设总体的方差为s2.不难看出,从而的有效性最差.3. 设是参数的无偏估计,且有,试征2不是参数2的无偏估计.证明:由方差的定义可知,.由于是参数的无偏估计,即,因而 ,所以2不是参数2的无偏估计.4. 设总体X N( m,s2), x1,x2,xn是来自该总体的一个样本.试确定常数C,使为s2的无偏估计.解:由于总体X N( m,s2),所以于是可见,要使为s2的无偏估计,只有.5. 设从均值为m方差为s20的总体中分别抽取容量为n1和n2的两个独立样本,其样本均值分别为.试证,对任意常数啊a,b(a+b=1),都是m的无偏估计,并确定常数a,b使Var(Z)达到最小.证:由于为容量为n1和n2的两个独立样本的样本均值,故因而:.这说明是m的无偏估计.又由a+b=1知,从而求导知,当时,Var(Y)达到最小,此时这个结果表明,来自同一总体的两个容量为n1和n2的两个独立样本合样本(样本容量为n1+n2)的均值是线性无偏估计类中方差最小的.6. 设分别来自总体N( m1,s2),和N( m2,s2)中抽取容量为n1和n2的两个独立样本,其样本方差分别为s12, s22.试证,对任意常数啊a,b(a+b=1),Z=a s12,+b s22都是s2的无偏估计,并确定常数a,b使Var(Z)达到最小.解:由已知条件有且独立.于是故这证明了是的无偏估计.又从而因而当时,达到最小,此时该无偏估计为这个结果表明,对来自方差相等(不论均值是否相等)的两个正态总体的容量为和的样本,上述是的线性无偏估计类中方差最小7.设有k台仪器,已知用第i台仪器测量时,测量值总体的标准差为用这些仪器独立的对某一物理量各观察一次,成为的无偏估计,且方差达到最小.解:若要使为的无偏估计,即则必须有此时因此,问题转化为在的条件下,求的极小值.令由和得到从(1)中可以得到代入(2)中,解出,从而8设是来自均匀总体的一个样本.(1) 验证都是的无偏估计;(2) 比较上述三个估计的有效性.解: 令则即是来自的样本,且于是,我们可将诸估计写成与的函数:由此,又这说明由此可以得到综上,均是的无偏估计,而且与的方差相等,但在比较与的方差是要取决于n的大小,当时,比有效;当时,比有效.9.设样本来自一个正态总体样本来自另一个正态总体且两个样本独立.(1)求的矩估计;(2)如果固定,试问如何分配和才能使得的方差达到最小.解;(1)由题意可知的矩估计为的矩估计为因而的矩估计(2)由于且两个样本独立,故在的条件下使用和本节第5题相同的方法,由可解出(另一解不适合),而故时的方差达到最小.10设总体是样本,试证和都是的无偏估计量,并比较其有效性.解:由指数分布知,因而这说明是的无偏估计量.又最小次序统计量的密度函数为即因而有从而即是的无偏估计量,且注意到当n1时,这说明作为的无偏估计,比更有效.11设总体为为其样本,试求的无偏估计.解:此处样本均值为参数的充分统计量,且,于是因而从而可得的一个无偏估计为12设总体为为样本,证明样本均值和样本中程都是的无偏估计,并比较它们的有效性.解:由总体得因而,这首先说明样本均值是的无偏估计,且.为求样本中程的均值与方差,注意到令,n,则由于故从而这就证明了样本中程是的无偏估计.又注意到(参见第五章5.3节习题29)所以 从而于是在时,这说明作为的无偏估计,在n2时,样本中程比样本均值有效.13.设是来自正态总体对考虑如下三个估计(1)哪一个是的无偏估计?(2) 哪一个均方误差最小?解:(1)由于,故有,从而这说明仅有是的无偏估计,而与是的有偏估计.(2) 我们知道,估计的均方误差是估计的方差加上偏差的平方,即而Var这给出VarVarVar于是MSEVarMSEMSE显然所以的均方差最小.注意,这里是的有偏估计,上述结论表明,在均方误差意义下,有时有偏估计要比无偏估计更优.14. 设是来自密度函数为的样本,(1)求的最大似然估计,它是否是相合估计?是否是无偏估计?(2)求的矩估计,它是否是相合估计?是否是无偏估?(3)考虑的形如的估计,求使得的均方误差达到最小的c,并将之与的均方误差进行比较.解:(1)似然函数为显然在示性函数为1的条件下是的严增函数,因此的最大似然估计为又的密度函数为故故不是的无偏估计,但是的渐近无偏估计.由于且Var这说明是的相合估计.(2) 由于这给出,所以的矩估计为又所以Var从而有VarVar这说明既是的无偏估计,也是相合估计.(3) 对形如的估计类,其均方误差为MSE Var因而当时,MSE达到最小,利用上述结果可以算出MSE,MSE故有MSEMSEMSE,所以在这三个估计中,的均方误差最小.15.设总体是样本,的矩估计和最大似然估计都是 ,它也是的相合估计和无偏估计,试证明在均方误差准则下存在优于的估计(提示:考虑找均方误差最小者).证:由于总体所以Var现考虑形如的估计类,其均方误差为MSE将上式对求导并令其为0,可以得到当时,MSE最小,且这就证明了在均方误差准则下存在一个优于的估计.这也说明,有偏估计有时不比无偏估计差.16.设独立同分布,E=,Var()+,证明是的相和估计.证:由于=这就证明了是的相合估计.17.设是取自均匀分布总体的一个样本,若分别取和作为的估计量,问是否为的无偏量估计量?如果不是,如何修正才能获得的无偏估计.解:令Y=,则YU(0,1)记为样本相应的次序统计量,于是有从而可见不是的无偏估计量,由解之得 因而 是的无偏估计量.18.设 独立同分布,其共同的密度函数为 (1)证明:和都是的无偏估计;(2)计算和的均方误差并进行比较; (3)证明:在均方误差意义下,在形如的估计中 最优.解:(1)先计算总体均值为,故这说明是的无偏估计.又总体分布函数为记Y=,则密度函数为于是有 这表明也是的无便估计.(2)无偏估计的方差就是均方误差,由于故有又从而由于因此在均方差意义下,优于.(3)对形如的估计有,故因此当时,上述均方误差最小,所以在均方误差意义下,在形如的估计中,最优.19设是来自均匀分布的一个样本,对参数有如下三个估计(1)验证这些估计的无偏性;(2)比较这些估计的有效性;(3)研究这些估计的相合性.解:(1)由于所以又的密度函数为所以类似地,的密度函数为所以由此看出,三个估计都是的无偏估计.(2)分别计算三个估计的方差由于时,有所以这三个估计中最有效,为次,最差.(3)由于与的方差都随着而趋于零,故与都是的相合估计,但不是的相合估的计.为了证明这一点,我们需要的分布函数,由于的分布函数为于是,的分布函数为由此可得在充分小时,这是一个很小的数,它与1相差很大,这表明不会趋于1,故不是的相合估计.20设是来自二点分布的一个样本,(1)寻求的无偏估计;(2)寻求的无偏估计;(3)证明的无偏估计不存在.解:(1)是的最大似然估计,是的最大似然估计,但不是的无偏估计,这是因为由此可见是的无偏估计.(2) 是的最大似然估计,但不是无偏估计,这是因为由此可见是p(p-1)的一个无偏估计,或者上式是p的n+1次方程,它最多有n+1个实根,而p可在(0,1)取无穷多个值,所以不论取什么形式都不能使上述方程在0p1上试成立,这表明的无偏估计不存在.21设是来自均匀分布U的一个样本,寻求的无偏估计.解:容易看出,分别是的最大似然估计,但它们都不是无偏差估计,这是因为均匀分布U的分布函数与密度函数分别为由此可导出次序统计量的密度函数分别为从而可以分别求出它们的期望 (*) (*) 这表明:不是与的无偏估计,但做恰当修改后,可获得与的无偏差估计.把(*)与(*)两式相加与相减可得再使用加减消取法,即可得的无偏估计发表为22设是来自总体分布函数为的一个样本,若是的有偏估计,且其期望有如下形式 (*)其中的函数,而与样本量n无关.这时,为了减少偏差,常用如下的、“刀切法”:记是把原样本中的第个分量剔除,用留下的容量为n-1的样本得到的类似估计量.即的估计公式有相同形式,且(1)证明:新的估计(一切的估计)是的无偏估计;(2)用刀切法寻求泊松分布中参数平方的一阶刀切估计.解:(1)一阶刀切估计期望为所以的无偏估计.(2)在泊松分布中,样本均值的无偏估计,但不是的无偏估计,这是因为,若做简单修改,用代替,就可以得到的一个无偏估计现在用“刀切法”寻找的一介刀切估计,已知是的有偏估计,且,其中仅是的函数.若剔除样本中第个分量,可得再做一阶刀切估计就可以得到的一个无偏估计,以下来化简这个一阶刀切估计,把和代入上式,可得这就是的另一个无偏差估计.6.3最小方差无便估计内容概要1一致最小方差无偏估计 设是的一个无偏估计,如果对另外任意一个的无偏估计,在参数空间上都有则称是的一致最小方差无偏估计,简记为UMVUE.2判断准则 设是的一个无偏估计,.如果对任意一个满足的,都有则是的UMVUE.3. 充分性原则 任一参数的UNVUE不一定存在,若存在,则它一定是充分统计量的函数; 若的某个无偏估计不是充分统计量的函数,则通过条件期望可以获得一个新的无偏估计,且方差比原估计的方差要小; 考虑的估计时,只需要在其充分估计量的函数中寻找即可,该说法对所有统计推断都是正确的.这便是充分性原则.4费希尔信息量 设总体的概率函数满足下列条件:(1) 参数空间是直线上的一个开去区间;(2) 支撑与无关;(3) 导数对一切都存在;(4) 对,积分与微分运算可交换次序,即(5) 期望存在,则称该期望为总体分布的费希尔(Fisher)信息量.如果二阶导数对一切都存在,则还可用下式计算5常用分布的费希尔信息量二点分布b(1,p)的费希尔信息量;泊松分布的费希尔信息量;指数分布的费希尔信息量;正态分布的费希尔信息量;正态分布的费希尔信息量;正态分布的费希尔信息量(信息矩阵).6CR不等式设是未知参数的一个无偏估计,若存在,则在费希尔信息量也存在的条件下有上式称为克拉美-罗(CR)不等式,称为的无偏估计的方差的CR下界,简称的C-R下界.特别,对的无偏估计,有.注:的C-R下界并不是对任意参数的无偏估计的方差都可达到.但能达C-R到下界的的估计一定是的UMVUE.习题与解答6.31设总体概率函数是是其样本,是的充分统计量,则对的任一估计令证明这说明,在均方误差准则下,人们只需考虑基于充分统计量的估计.证:我们将均方误差作如下分解注意到,这说明于是因而2.设分别是的UMVUE,证明:对任意的(非零)常数是的UMVUE.证:由于分别是的UMVUE,故,且对任意一个,满足,由本节11题结论有,于是因此是的UMVUE.3.设是的UMVUE,是的无偏估计,证明:若则证:因为是的UMVUE,是的无偏估计,故其差是0的无偏估计,即,且,由本节11题结论知,这说明 即4. 设总体为样本,证明,分别为的UMVUE.证:大家知道,分别是的无偏估计,设是0的任一无偏估计,则即 (*)将(*)式两端对求导,并注意到,有 (*)这说明,即,于是,从而是的UMVUE.为证明是的UMVUE,我们将(*)式的两端再对求导,得由此可以得到,下一步,将(*)式两端对求导,略去几个前面已经指出的积分为0的项,有这表明由此可得到,因而,这就证明了是的UMVUE.5.设总体的概率数为,满足定义6.3.1的条件,若二阶导数对一切的存在,证明费希尔信息量证:记,则所以另一方面,这就证明了6.设总体密度函数为是其样本.(1) 求的最大似然估计;(2) 求的有效估计.解:(1)似然函数为 对数似然函数为将似然函数求导并令其为0,得似然方程解之得(2) 令则因此从而有于是为求有效估计,需求出的希尔信息量,注意到,而于是的任意无偏估计的C-R下界为从而是的无偏估计,且方差达到了下界.所以是的有效估计7.设总体密度函数为,求的费希尔信息量解:对数密度函数为 求一、二阶导数,有由此给出 8.设总体密度函数为已知,求的费希尔信息量解:对数密度函数为 求一、二阶导数,有由此给出 9.设总体分布列为求的费希尔信息量解:对数分布为求一二阶导数,有在本章第3题中,我们已经算得于是10.设是来自的样本,试证明是的有效估计,从而也是UMVUE解:总体的密度函数为于是所以的费希尔信息量为,这就是说g(的任一无偏估计的CR下界为又这就证明了是的有效估计.从而也是UMVUE11.证明:定理6.3.3的逆也对,即:若是的UMVUE,则对任一满足且的有 证:采用反证法.倘若在参数空间中有一个使得,取则令则,这说明也是的无偏估计,但这与是的UMVUE矛盾,这就证明了对参数空间中任意的都有,也即定理6.3.3的逆也对.由此我们知道,条件“对任意满足的有“是的UMVUE”的充分必要条件.12.设总体为样本,试求:(1)的最小方差无偏估计;(2)的最小方差无偏估计.解:(1)本节第4题已经证明了和分别是和的UMVUE,则由本节第2题知是的最小无偏估计.(2)对任意一个0的无偏估计有(见本节第4题证明过程)和,于是有,而且,所以是的最小方差无偏估计.13.设独立同分布, 的取值有四种可能,其概率分别为记为为中出现各种可能结果的次数,(1)确定使为的无偏估计;(2)将与的无偏估计方差的CR下界比较.解:(1) 由于所以从而有=.若使T为的无偏估计,即要求解之得即是的无偏估计.(2)=对数似然函数为(略去与的无关的项)于是注意到观测量是随机变量,且故,.从而费希尔信息量为.所以的无偏估计方差的C-R下界为.由于于是的方差为:,即T的方差没有达到的无偏估计方差的C-R下界.14.设是来自正态总体的一个样本,若均值已知,证明:(1)是的有效估计;(2)是的无偏估计,但不是有效估计.证明:(1.)由知.为了获得的无偏估计的C-R下界,需要费希尔信息量,大家知道,正态分布的密度函数p(x)的对数是,.由此得的费希尔信息量从而的无偏估计的C-R下界为,此下界与上述无偏估计的方差相等,故此是的有效估计.(2)由于可见,即是的无偏估计,其方差为为了获得的无偏估计的CR下界,需要知道的费希尔信息量,由于,从而的无偏估计的CR下界为,由于无偏估计的方差,故不是的有效估计.此处,的无偏估计的CR下界与的方差的比该比值常称为无偏估计的效.15.证明:若T1与T2是未知参数g(q)的两个UMVUE,则T1=T2(a.e).这个命题表明:g(q)的UMVUE在几乎处处的意义下是唯一的.证明:首先,T1-T2是0的无偏估计,则由本节第11题于是由此立刻可得从而 6.4 贝叶斯估计内容概要1. 贝叶斯统计推断使用的三种信息 总体信息,总体分布和总体所属分布族提供的信息; 样本信息,从总体中抽取的样本所提供的信息; 先验信息,在实验前人们对要做的问题在经验上和资料上所占用的信息.2. 贝叶斯统计的基本观点任意一个未知量 q 都可看作一个随机变量,用一个概率分布来描述未知参数是最好的办法,这个分布称为先验分布.3. 贝叶斯公式的密度函数形式l 总体分布依赖于参数q的概率函数在贝叶斯统计中记为 p(x|q),他表示在随机变量q 取某个给定的值时总体的条件概率函数;l 根据参数q 的先验信息可确定先验分布p (q );l 从贝叶斯观点看,样本x1,x2,xn的产生分两步.首先从先验分布p (q )中产生一个样本q0,然后从p(x1,x2,xn|q )产生一组样本这时的样本联合条件概率函数为这个分布综合了样本信息和总体信息l q0 是未知的,它是按先验分布p (q )产生的,为把先验信息综合进去,不能只考虑q0,对q的其它值发生的可能性也要加以考虑,过要用p (q )进行综合,这样一来,样本和参数的联合分布为,这个联合分布把总体信息,样本信息和先验信息三种可用信息都综合进去了;l 分析的目的是要对未知参数作统计推断.在没有样本信息时,人们只能依据先验分布对作出推断.在有了样本观察值之后,则应依据对作出推断.由于可分解为=,其中=是的边际概率函数,它与无关,不含的任何信息.因此能用来对作出推断仅是条件分布它的计算公式是,这个条件分布称为的后验分布,它集中了总体,样本和先验中有关的一切信息.后验分布的计算公式就是用密度函数表示贝叶斯公式.它是用总体和样本对先验分布作调整的结果,贝叶斯统计的一切推断都基于后验分布进行.4. 贝叶斯估计 给予后验分布对所作的贝叶斯估计有多种,常用有如下三种:使用后验分布的密度函数最大值作为的点估计,称为作大后验估计;用后验分布的中位数作为的点估计,称为后验中位数估计;使用后验分布的均值作为的点估计,称为后验期望估计.这是使用最为频繁的贝叶斯估计.5. 共厄先验分布设q 是总体参数,p (q )是其先验分布,若对任意的样本观测得到的后验分布p (q |X) 与p (q )属于同一分不族,则称该分布族是q 的共轭先验分布(族) 二项分布B(n,q )中成功概率q 的共轭先验分布是贝塔分布Be(a,b); 泊松分布P(q )的均值q 的共轭先验分布是伽马分布Ga(a,l); 在方差已知时,正态总体均值q 的共轭先验分布正态分布N(m,t2); 在均值已知时,正态总体方差s2的共轭先验分布倒伽马分布IGa(a,l)(若X Ga(a,l),则X-1的分布称为倒伽马分布IGa(a,l);习题与解答1. 6.5 区间估计内容概要1. 置信区间设q 是总体的一个参数,其参数空间为Q, x1,x2,xn是来自该总体的样本,对给定一个a(0a1),若有两个统计量,使得对任意的qQ,有则称随机区间为的置信水平为1- a的置信区间,或简称是的1-a置信区间, 分别称为的(双侧)置信下限和置信上限.这里置信水平1-a的含义是指在大量使用该置信区间时,至少有100(1-a)%的区间含有2同等置信区间在上述记号下,若对给定的(01),对任意的,有则称为的1-同等置信区间.同等置信区间是把给定的置信水平1-用足了.常在总体为连续分布场合下可以实现.3置信限在上述记号下,若给定的(01),和任意的有则称为 的1-同等置信下限,假如等号对一切,有则称为的1-同等置信上限.4.枢轴量法寻找同等置信区间常采用枢轴量法,其步骤如下:l 设法构造一个样本和的函数使得G的分布不依赖于未知参数.此种G被称为枢轴量;l 适当地选择两个常数c,d,使对给定的,(01),有P(cGd)=1-;l 若能将不等式cGd等价变形为则有为的1-同等置信区间.关于置信区间的构造有两点说明l 满足置信度要求的c,d通常不唯一,若有可能,应选平均长度达到最短的c,d,这在G的分布为对称分布的场合往往容易实现.l 实际中,选平均长度尽可能短的c,d往往很难实现,因此通常这样选择c,d,是的两个尾部概率各为a/2,即P(Gc)=P(Gd)=a/2,这样的置信区间称为登尾置信区间.这是在G的分布为偏态分布的场合通常采用的方法.5常用的置信区间(1).设x1,x2,xn是来自的样本,为均值,s为样本标准差,up为标准正态分布的p分位数,为自由度是 k的t分布 为自由度是 k的c2分布的p分位数,取置信水平为1-a,则m,s2,s的置信区间如下表所示参数枢轴量置信区间ms已知s未知s2m已知m未知sm已知m未知(1).设x1,x2,xm是来自的样本,为均值,sx为样本标准差; 设y1,y2,ym是来自的样本,为均值,sy为样本标准差,up为标准正态分布的p分位数,为自由度是 k的t分布,为自由度是 (k1,k2)的F分布的p分位数,取置信水平为1-a, 则均值差m1-m2,方差比s12/s22的置信区间如下表所示参数枢轴量置信区间均值差m1-m2,s12与s22已知s12与s22未知,但s12=s22其中s22/s12=q已知其中m,n都很大时一般场合 注:这里 ,l为最接近于的整数方差比s12/s22m1,m2已知m1,m2之一未知习题与解答6.51. 某厂生产的化纤强度服从正态分布,长期以来其标准差稳定在=0.85,现抽取了一个容量为n=25的样本,测定其强度,算得样本均值为=2.25,试求这批化纤平均强度的置信水平为0.95的置信区间.解 这是方差已知时正态均值的区间估计问题.由题设条件,查表知,于是这批化纤平均强度的置信水平为0.95的置信区间为=2.25-0.3332,2.25+0.3332,即这批化纤平均强度的置信水平为0.95的置信区间为1.9168,2.5832.2. 总体XN(,),已知,问样本容量取多大时才能保证的置信水平为95%的置信区间的长度不大于.解 由已知条件得的0.95置信区间为其区间长度为2,若使2,只需.由于=1.96,故,即样本容量至少取时,才能保证的置信水平为95%的置信区间的长度不大于.30.50,1.25,0.80,2.00是取自总体X的样本,已知Y=lnX服从正态分布N(,1).(1) 求的置信水平为95%的置信区间;(2) 求X的数学期望的置信水平为95%的置信区间.解 (1) 将数据进行对数交换,得到Y=lnX的样本值为:-0.6931,0.2231,-0.2231,0.6931.它可看作是来自正态分布N(,1)的样本,其样本均值为=0,由于=1已知,因此,的置信水平为95%的置信区间为: =-0.9800,0.9800.(2) 由于EX=是的严增函数,利用(1)的结果,可算得X的数学期望的置信水平为95%的置信区间为,=0.6188,4.3929.4用一个仪表测量某一物理量9次,得样本均值=56.32,样本标准差s=0.22.(1) 测量标准差大小反映了测量仪表的精度,试求的置信水平为0.95的置信区间;(2) 求该物理量真值的置信水平为0.99的置信区间.解 (1)此处(-1)=80.22=0.3872,查表知(8)=2.1797,=17.5345,的1-置信区间为=,=0.0221,0.776从而的置信水平为0.95的置信区间0.1487,0.4215.(2) 当 s 未知时,的1-置信区间为,.查表得(8)=3.3554,因而的置信水平为0.99的置信区间为56.32-3.35540.22/,56.32+3.35540.22/=56.0739,56.5661.5已知某种材料的抗压强度XN(),现随机地抽取10个试件进行抗压试验,测得数据如下:482 493 457 471 510 446 435 418 394 469 .(1) 求平均抗压强度的置信水平为95%的置信区间;(2) 若已知=30,求平均抗压强度置信水平面为95%的置信区间;(3) 求的置信水平为95%的置信区间.解:(1) 经计算得,=457.5, s=35.2176, 在未知时,的置信水平为95%的置信区间为,.查表得,(9)=2.26

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论