版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节 置信区间前面讨论了参数的点估计, 它是用样本算出的一个值去估计未知参数. 即点估计值仅仅 是未知参数的一个近似值, 它没有给出这个近似值的误差范围.例如, 在估计某湖泊中鱼的数量的问题中, 若根据一个实际样本, 利用最大似然估计法 估计出鱼的数量为 50000 条, 这种估计结果使用起来把握不大. 实际上, 鱼的数量的真值可 能大于50000 条, 也可能小于50000条.且可能偏差较大.若能给出一个估计区间, 让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量 的真值被含在这个区间内, 这样的估计显然更有实用价值.本节将要引入的另一类估计即为区间估计, 在区间估计理论中, 被广
2、泛接受的一种观点 是置信区间,它由奈曼(Neymann)于1934年提出的.内容分布图示 引言 置信区间的概念 例2例3例4例6 例1寻求置信区间的方法(0 -1)分布参数的区间估计单侧置信区间 例5 内容小结 课堂练习 习题 6-3内容要点:一、置信区间的概念定义1设9为总体分布的未知参数,X ,X,,X是取自总体X的一个样本,对给定1 2 n的数1-a(0a 1),若存在统计量9=9(x ,X,,X ),9=9(x ,X,,X ), TOC o 1-5 h z 12n12n使得_P99 9 = 1 -a,则称随机区间(9,9)为9的1-a双侧置信区间,称1-a为置信度,又分别称9与厂为9的
3、双 侧置信下限与双侧置信上限.注:1.置信度1-a的含义:在随机抽样中,若重复抽样多次,得到样本X ,X,,X的 _12n多个样本值(x,x ,x ),对应每个样本值都确定了一个置信区间(9,9),每个这样的区间 12n要么包含了9 的真值, 要么不包含9 的真值. 根据伯努利大数定理, 当抽样次数充分大时, 这些区间中包含9 的真值的频率接近于置信度(即概率) 1-a, 即在这些区间中包含9 的真 值的区间大约有 100(1 - a )%个,不包含 9 的真值的区间大约有 100a% 个. 例如, 若令 1-a =0.95, 重复抽样100次, 则其中大约有95个区间包含9 的真值, 大约有
4、5个区间不包 含9的真值._置信区间,9)也是对未知参数9的一种估计,区间的长度意味着误差,故区间估计与点估计是互补的两种参数估计._置信度与估计精度是一对矛盾置信度1-a越大,置信区间(9,9)包含9的真值的概 率就越大,但区间,9)的长度就越大,对未知参数9的估计精度就越差.反之,对参数9 的估计精度越高,置信区间,9)长度就越小,(9,9)包含9的真值的概率就越低,置信度 1 -a越小.一般准则是:在保证置信度的条件下尽可能提高估计精度.二、寻求置信区间的方法寻求置信区间的基本思想: 在点估计的基础上, 构造合适的函数, 并针对给定的置信度 导出置信区间.一般步骤:/X选取未知参数9的某
5、个较优估计量0 ;围绕0构造一个依赖于样本与参数9的函数u = u(X,X2,,X ,0);1 2 n对给定的置信水平1确定九1与使PX u X = 1a,12通常可选取满足Pu X =-的X与X,在常用分布情况下,这可由分位数1 2 2 1 2表查得;对不等式作恒等变形化后为P0 0 0 = 1a ,则(0,0)就是0的置信度为1-a的双侧置信区间。三、(01)分布参数的置信区间考虑(01)分布情形,设其总体X的分布率为PX = 1 = p, PX = 0 = 1 p,(0 p 1),现求p的置信度为1 - a置信区间.已知(01)分布的均值和方差分别为E (X) = p, D (X) =
6、p(1 p),设X ,X,,X是总体X的一个样本,由中心极限定理知,当n充分大时, TOC o 1-5 h z 12n_X E (X)X pu = ZD( X)/np(1 p)/n近似服从N(0,1)分布,对给定的置信度1-a ,则有H X-P P| p 1a,R p(1 p)/ n2经不等式变形得Pap2 + bp + c 0 1 a,其中 a = n + (u )2,b = 2nX (u )2,c = n(X)2.解式中不等式得a/2a/2P p1 21I 1;其中p = (b db2 4ac), p = (b + pb 2 4ac).12a22a于是(p ,p )可作为p的置信度为1-a
7、的置信区间.12四、单侧置信区间_前面讨论的置信区间(0,0)称为双侧置信区间,但在有些实际问题中只要考虑选取满足 Pu X = a 的 X 与 X ,对不等式作恒等变形后化为1 2 1 2 _P0 0 = 1 a或P0 0 = 1a从而得到形如(0,+g)或(-g,0)的置信区间.例如,对产品设备、电子元件等来说,我们关心的是平均寿命的置信下限,而在讨论产 品的废品率时, 我们感兴趣的是其置信上限. 于是我们引入单侧置信区间.定义 设0为总体分布的未知参数,X ,X,,X是取自总体X的一个样本,对给定的12n数1-a(0 a 1),若存在统计量0=0(X,X,,X ),12n满足P0 0 =
8、 1 -a,则称(0,+Q为0的置信度为1-a的单侧置信区间,称0为0的单侧置信下限;若存在统计 量0 =0(x ,X,,X ),12n满足P0 0 = 1-a,则称(-8,0 )为0的置信度为1-a的单侧置信区间,称0为0的单侧置信上限.例题选讲:置信区间的概念例1 (讲义例1)设总体XN (PQ 2)Q 2为已知,卩为未知,设X , X ,X是来自X的 12n样本,求卩的置信水平为1-a的置信区间.解 已知X是卩的无偏估计,且 t N(0,1),而N(O,1)不依赖于任何未知参数按 Q / Un标准正态分布的双侧a分位数的定义,有P 一 = 1 -a,I q / Ina/2口 rtI QQ
9、*即 P X u p = 1 a I Vn a/n4n a/2这样,就得到了卩的一个罡信水平为1-a的置信区间fX-罕u ,X +字u 1常写 IJn a/nTn a/2 丿f 、成IX 士討a/2丿若取a = 0.05,即1-a= 0.95,及q= 1,n = 16,查表得u = u = 1.96,则得到一个置 a/ 20.025信水平为0.95的置信区间(X 士 0.49).若由一个样本值得样本均值的观察值X = 5.20,则进一步得到一个置信水平为0.95的置 信区间(5.20 士 0.49) = (4.71,5.69).这个区间的含义是: 若反复抽样多次, 每个样本值均确定一个区间,
10、在这些区间中, 包 含卩的约占95%,或者说该区间属于包含卩的区间的可信程度为95%.例2设总体XNg,8), p为未知参数,X,,X是取自总体X的简单随机样本,如 _136果以区间(X -1, X+1)作为P的置信区间,那么置信度是多少?解 XN(p,Q2),所以XN(r q 2 =Nf 8 )=Nf 2)p,p ,77l n丿l 36 丿l 9丿p从而一N(0,1),依题意 P X -1 p X +1 = 1 -a,J2/3f 32f 3 2丿-1 = 2(2.121)-1 = 0.966 = 1 -a,即 P p -1 X 090未知参数9 0, X,,X为取自X的样本.(1)(2)1
11、试证w =警% 2(2);9 试求9 的 1 - a 置信区间.2(1)记Y = -X,设Y的分布函数与密函数分别为G(y)与g(y),则9G(y) = PY y = P#X y = PX 0, 于是x 0, g (y)=y 0, y02即 Y % 2(2),从而 9 Xi% 2(2),,= h ,-.又由%2分布的可加性得牛%2(2),i=1222而乙9Xi =9乙Xi=yX,故i=1i=12 y X %2(2). / 由上节例7知,X是9的最大似然估计,从X出发考虑W = X,由知W的分 92 n布只依赖于样本容量n,即W = -X%2(2n),给定的1-a,由92P% 11/2(2) y
12、X %恥(2) =1 -a.经不等式变形得PJ-nX2X9 =1a,于是, 所求置信区间为(2nX、2nX%a2/2(2n)(01)分布参数的置信区间例4(讲义例2)设抽自一大批产品的100个样品中, 得一级品60个,求这批产品的一级 品率p的置信水平为0.95的置信区间.解 一级品率 p 是0-1分布的参数, 此处n = 100, x = 60/100 = 0.6, 1 a = 0.95, a /2 = 0.025, u = 1.96,a/2 现按上述方法来求p的置信区间,其中a = n + u2 = 103.84, b = (2nx + u2 ) = 123.84, c = nx2 = 3
13、6.a/2a/2于是p1 = 0.50, p2 = 0.69,故得p的一个置信水平为0.95的近似置信区间为(0.50,0.69).单侧置信区间例5 (讲义例3)从一批灯泡中随机地抽取5只作寿命试验,其寿命如下(单位:h)1 0501 1001 1201 2501 280已知这批灯泡寿命XN(卩Q2),求平均寿命卩的置信度为95%的单侧置信下限. 解 T =t(n 一 1),S Itn对于给定的置信度1-a,有P( = 1 a,IS/dn ata (n - =1a,yn 、可得卩的置信度为1-a的单侧置信下限为X ta(n 1),由所得数据计算,有 X = 1160, s = 99.57, n = 5, a = 0.05.查表得t005(4) = 2.14,所以卩的置信度为95%的置信下限为X ta(n 1)孚=1064.56,0.05a a n也就是说,该批灯泡一平均寿命至少在1064.56h以上,可靠程度为95%.例6假设总体XNgQ2),从总体X中抽取容量为10的一个样本,算得样本均值X = 41.3,样本标准差S = 1.05,求未知参数卩的置信水平为0.95的单侧置信区间的下限.解 由题设知t(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 摄影棚使用免责协议书
- 2026年民政领域购买服务知识测试题
- 2026年国家安全法及维护国家安全任务职责公民组织义务测试
- 2026年跨领域知识学习与实践指南
- 2026年企业员工健康知识竞赛题库
- 2026年第三次全国土壤普查成果应用知识竞赛
- 2026年建筑起重机械司机安全知识测试题
- 2026年世界历史大事件知识竞赛试题
- 2026年智慧环卫清扫保洁调度知识测试
- 2026年村社高价彩礼治理知识问答库
- 人教A版高中数学选择性必修第二册《导数在研究函数中的应用》评课稿
- 超声波清洗机的系统设计(plc)大学论文
- 浮头式换热器课程设计说明书
- 脊柱侧弯三维矫正
- 轧钢厂安全检查表
- YY/T 0299-2022医用超声耦合剂
- JJG 968-2002烟气分析仪
- 尿素-化学品安全技术说明书(MSDS)
- GB 16357-1996工业X射线探伤放射卫生防护标准
- FZ/T 01104-2010机织印染产品取水计算办法及单耗基本定额
- 四川省房屋建筑和市政基础设施项目工程总承包招标评标综合评估法
评论
0/150
提交评论