《置信区间》PPT课件_第1页
《置信区间》PPT课件_第2页
《置信区间》PPT课件_第3页
《置信区间》PPT课件_第4页
《置信区间》PPT课件_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

解(1)样本的似然函数为,当00,X1,X2,Xn是取自总体X的一组样本,求的极大似然估计量与矩估计量.,其中0为未知参数,例设总体X的密度为,故有对数似然函数:,对求导并令其为0可得似然方程:,=0,解得极大似然估计量:,令,(2),解得矩估计量:,而区间估计正好弥补了点估计的这个缺陷.,无偏性有效性一致性,估计量的期望值等于未知参数的真值.,为了使估计的结论更可信,需要引入区间估计.,评选标准,方差更小的无偏估计量.,样本k阶原点矩是总体k阶原点矩的无偏估计量;,样本方差S2是总体方差2的无偏估计量;,无偏估计量的函数未必是无偏估计量,在的所有线性无偏估计量中,样本均值X是最有效的.,参数的点估计是用样本算得的一个值去估计未知参数.使用起来把握不大.,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围.,若我们根据一个实际样本得到鱼数N的极大似然估计为1000条.,一个可以想到的估计办法是:若我们能给出一个区间,并告诉人们该区间包含未知参数N的可靠度(也称置信系数).,但实际上,N的真值可能大于1000条,也可能小于1000条.,7.3单个正态总体均值与方差的置信区间,也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数。,湖中鱼数的真值,这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.,习惯上把置信水平记作1-,这里是一个很小的正数.,譬如,在估计湖中鱼数的问题中,根据置信水平1-,可以找到一个正数,例如,通常可取置信水平=0.95或0.9等等.,根据一个实际样本,由给定的置信水平1-,我们求出一个的区间,使,置信水平的大小是根据实际需要选定的.,如何寻找这种区间?,使得,我们选取未知参数的某个估计量,只要知道的概率分布就可以确定.,下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法.,由不等式,可以解出:,这个不等式就是我们所求的置信区间,代入样本值所得的普通区间称为置信区间的实现.,1)为两个统计量(由样本完全确定的已知函数);,X1,X2,Xn是取自总体X的样本,对给定值01,满足,定义4设是总体X的待估参数,分别称为置信下限和置信上限.,一、置信区间的概念,则称随机区间,为的置信水平为1-的双侧置信区间.,若统计量,和,置信度置信概率,2)是随机区间,并非一个实现以1-的概率覆盖了,要求置信区间的长度尽可能短.,估计的可靠度:,即P()=1-要尽可能大.,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.,估计的精度:,即要求区间置信的长度尽可能短,或能体现该要求的其它准则.,要求以很大的可能被包含在置信区间内.,要求估计尽量可靠.,置信水平的概率意义:置信水平为0.95是指100组样本值所得置信区间的实现中,约有95个能覆盖,而不是一个实现以0.95的概率覆盖了.,估计要尽量可靠,估计的精度要尽可能的高:,只要知道的概率分布就可以确定.,如何根据实际样本,由给定的置信水平1-,求出一个区间,使,根据置信水平1-,可以找到一个正数,二、置信区间的求法,(一)单个正态总体,1.均值,(1)已知方差2,1.均值1-2,(1)已知方差12,22,(二)两个正态总体,2.方差2,(2)未知方差2,使得,我们选取未知参数的某个估计量,由不等式,可以解出:,这个不等式就是我们所求的置信区间,分布的分位数,(1)已知均值,(2)未知均值,(2)未知方差12,22,2.方差12/22,(1)已知均值1,2,(2)未知均值1,2,但相等!,对于给定的置信水平,根据估计量U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.,X,S2分别是其样本均值和样本方差,XN(,2/n),求参数、2的置信水平为1-的置信区间.,设X1,Xn是总体XN(,2)的样本,确定未知参数的估计量及其函数的分布,是的无偏估计量,由分布求分位数,即得置信区间,(一)单个正态总体置信区间的求法,(1)已知方差2时,故可用X作为EX的一个估计量,N(0,1),对给定的置信度1-,按标准正态分布的双侧分位数的定义,查正态分布表可得u/2,由u/2确定置信区间,有了分布就可求出U取值于任意区间的概率,简记为,由抽样分布定理知,1.均值的置信区间,是求什么参数的置信区间?,置信水平1-是多少?,1.寻找未知参数的一个良好的点估计量(X1,X2,Xn);,确定待估参数估计量函数U()的分布;,求置信区间首先要明确问题:,2.对于给定的置信水平1-,由概率,(,)就是的100(1-)的置信区间.,一般步骤如下:,3.由分位数|U|x确定置信区间(,).,查表求出分布的分位数x,总体分布的形式是否已知,是怎样的类型,至关重要.,某乡农民在联产承包责任制前人均纯收入X(单位:元),求的置信水平为0.95的置信区间.,推行联产承包责任制后,在该乡抽得n=16的样本,且XN(,252).,解由于=0.05,查正态分布表得,例1,得x=325元,假设2=252没有变化,即得置信区间(312.75,337.25).,同一置信水平下的置信区间不唯一,如在上例中取=0.01+0.04,由正态分布上侧分位数定义知,查表知,u0.025=1.96,当然区间长度越短的估计,精度就越高.,其长度也不相等.,区间长度为24.25,长度为25.5,谁是精度最高的?,由于标准正态分布密度函数的图形是单峰且对称的,在保持面积不变的条件下,以对称区间的长度为最短!,但的长度是最短的,l与n,的关系:,可知,置信区间的长度l为:,由置信区间公式,l随着的减小而增大;,20若给定,l随着n的增大而减小;,同一置信水平下的置信区间不唯一.,其长度也不相等.,故我们总取它作为置信水平为1-的置信区间.,若给定n,且由于l与成反比,减小的速度并不快,例如,n由100增至400时,l才能减小一半.,则u/2越大,l就越大,这时就越小.,10,(u/2)就越大,一般地,在概率密度为单峰且对称的情形下,a=-b对应的置信区间的长度为最短.,例2:某厂生产的零件长度X服从N(,0.04),现从该厂生产的零件中随机抽取6个,长度测量值如下(单位:毫米):14.6,15.l,14.9,14.8,15.2,15.1.求:的置信系数为0.95的区间估计。,解:n=6,=0.05,z/2=z0.025=1.96,2=0.22.,所求置信区间为,故不能采用已知方差的均值估计方法,由于与有关,但其解决的思路一致.,由于S2是2的无偏估计量,查t分布表确定上侧/2分位数,令,T=,(2)未知方差,用分布的分位数求的置信区间.,故可用S替代的估计量:,S,t(n-1),即为的置信度为1-的区间估计.,2时,由抽样分布定理知,实用价值更大!,t/2(n-1),测定总体服从正态分布,求总体均值的置信水平为0.95的置信区间.,解由于/2=0.025,查t分布表得,例3为确定某种溶液中甲醛浓度,且其4个独立测量值的平均值x=8.34%,样本标准差s=0.03%,即得置信区间,自由度n-1=3,t0.025=3.182,将x=8.34%代入得,(2)未知时,所以2的置信水平为1-的区间估计为,因为2的无偏估计为S2,2.方差2的,置信区间的求法,由抽样分布定理知,2=,由确定2分布的上侧/2分位数,找一个含与S,但不含,且分布已知的统计量,为了计算简单,在概率密度不对称的情形下,如2分布,F分布,习惯上仍取对称的分位点来计算未知参数的置信区间.,并不是最短的置信区间,/2,/2,测定总体服从正态分布,求总体均值的置信水平为0.95的置信区间.,解由于/2=0.025,查2分布表得,例4为确定某种溶液中甲醛浓度,且其4个独立测量值的平均值x=8.34%,样本标准差s=0.03%,故2的置信区间为,自由度n-1=3,得,将s2=0.0009代入,求总体方差2和标准差的置信水平为0.95的置信区间.,故的置信区间为,在实际应用中,经常会遇到两个正态总体的区间估计问题。,于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差1-2的问题。,例如:考察一项新技术对提高产品的某项质量指标的作用,将实施新技术前的产品质量指标看成正态总体N(1,12),实施新技术后产品质量指标看成正态总体N(2,22)。,设X1,Xm分别是总体XN(1,12)的样本,Y1,Yn分别是总体YN(2,22)的样本,X,Y分别是总体X和Y的样本均值,求参数1-2和12/22的置信水平为1-的置信区间.,由于X,Y分别是1,2的无偏估计量,即得置信区间,(二)两个正态总体,(1)已知方差12,22时,故可用X-Y作为1-2的一个估计量,N(0,1),对给定的置信度1-,查正态分布表可得u/2,由抽样分布定理知,1.均值1-2的置信区间,SX2,SY2分别是总体X和Y的样本方差,置信区间的求法,设X1,Xm分别是总体XN(1,12)的样本,Y1,Yn分别是总体YN(2,22)的样本,X,Y分别是总体X和Y的样本均值,求参数1-2和12/22的置信水平为1-的置信区间.,即得置信区间,(二)两个正态总体置信区间的求法,(2)未知方差12,22,但12=22=2时,仍用X-Y作为1-2的一个估计量,t(n+m-2),对给定的置信度1-,查t分布表可得,由抽样分布定理知,1.均值差1-2的置信区间,SX2,SY2分别是总体X和Y的样本方差,t/2(n+m-2),例5:某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积(单位:毫升)XN(1,2)和YN(2,2)。现从生产线上分别抽取X1,X2,X12和Y1,Y2,Y17,样本均值与样本方差分别为:,求1-2的置信系数为0.95的区间估计。,解:m=12,n=17,=0.05,且,查t分布表,得tm+n-2(/2)=t27(0.025)=2.05.因此,置信度为1-的置信区间:,例6(比较棉花品种的优劣):假设用甲、乙两种棉花纺出的棉纱强度分别为XN(1,2.182)和YN(2,1.762)。试验者从这两种棉纱中分别抽取样本X1,X2,X200和Y1,Y2,Y100,样本均值分别为:,求1-2的置信系数为0.95的区间估计。,解:1=2.18,2=1.76,m=200,n=100,=0.05,1-2的置信系数为1-的置信区间为:,设同上,求参数12/22的置信水平为1-的置信区间.,即得12/22的置信区间,(二)两个正态总体置信区间的求法,(2)未知1,2时,F(m-1,n-1),对给定的置信度1-,查F分布表可得上侧分位数,由抽样分布定理知,2.方差比12/22的置信区间,F/2(m-1,n-1),F1-/2(m-1,n-1),求两总体方差比12/22的置信水平为0.90的置信区间.,称重后所的样本方差分别为sx2=0.0125,sy2=0.01,假定所装番茄酱的重量X与Y分别服从正态分布N(1,12)和N(2,22),解由于/2=0.05,查F分布表得,例7某厂用两条流水线生产番茄酱小包装,现从两条流水线上各随机抽取样本容量分别为m=6,n=7的样本,将条件代入得12/22的置信区间为(0.2847,6.1875).,自由度m-1=5,n-1=6,主要根据抽样分布Th,(二)两个总体,由的概率分布和置信水平1-,确定其相应的分位数x/2;,小结正态总体置信区间的求法,(一)单个总体,均值,已知方差2,均值差1-2,已知方差12,22,方差2,未知方差2,解得所求的置信区间,根据未知参数的无偏估计量,确定其某个估计量;,由不等式,已知均值,未知均值,未知方差12,22,方差比12/22,已知均值1,2,未知均值1,2,但相等!,X1,Xn是取自X的样本,则称随机区间(-,)为的置信水平为1-的单侧置信区间,但有些实际问题,人们关心的只是参数在一个方向的界限.,这时,可将置信上限取为+,而只着眼于置信下限,上述置信区间中置信限都是双侧的,例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.,三、单侧置信区间,定义,满足,这样求得的置信区间叫单侧置信区间.,对给定值01,满足,设是总体X的待估参数,称为单侧置信下限;,则称随机区间(,+)为的置信水平为1-的单侧置信区间,称为单侧置信上限.,若统计量,若统计量,求单侧置信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论