版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数理统计数理统计 第第6.3-6.4节节 区间估计区间估计置信区间定义置信区间定义置信区间的求法置信区间的求法单侧置信区间单侧置信区间*小结小结 布置作业布置作业数理统计数理统计 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计. 它是用样本算它是用样本算得的一个值去估计未知参数得的一个值去估计未知参数. 但是,但是,点估计值仅仅点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似是未知参数的一个近似值,它没有反映出这个近似值的误差范围值的误差范围,使用起来把握不大,使用起来把握不大. 区间估计正好区间估计正好弥补了点估计的这个缺陷弥补了点估计的这个缺陷 .数理统计数理统计
2、譬如,在估计湖中鱼数的问题中,若我们譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数根据一个实际样本,得到鱼数 N 的极大似然估的极大似然估计为计为1000条条. 若我们能给出一个区间,在此区间内我们若我们能给出一个区间,在此区间内我们合理地相信合理地相信 N 的真值位于其中的真值位于其中. 这样对鱼数的这样对鱼数的估计就有把握多了估计就有把握多了. 实际上,实际上,N的真值可能大于的真值可能大于1000条,也可条,也可能小于能小于1000条条.数理统计数理统计 也就是说,我们希望确定一个区间,使我们能也就是说,我们希望确定一个区间,使我们能以比较高的以比较高的可靠程度可靠程度相
3、信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的是用概率来度量的 ,称为称为置信度置信度或或置信水平置信水平. 习惯上把置信水平记作习惯上把置信水平记作 1 ,这里,这里 是一个是一个 很小的正数很小的正数.数理统计数理统计 置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.置信区间置信区间. 称区间称区间 为为 的的 1置信水平为置信水平为 的的( , ) 例如,通常可取置信水平例如,通常可取置信水平 =0.95或或0.9等等. 1根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信
4、水平,我小的区间小的区间 ,使,使们求出一个尽可能们求出一个尽可能( , ) 1P 数理统计数理统计 一、一、 置信区间定义置信区间定义 满足满足设设 是是 一个待估参数,给定一个待估参数,给定, 0 X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的的置信水平置信水平(置信度(置信度 )为为 的的置信区间置信区间. 1和和 分别称为分别称为置信下限置信下限和和置信上限置信上限. 若由样本若由样本1P 12(,)n XXX 12(,)n XXX () ( , ) 数理统计数理统计 这里有两个要求这里有两个要求:可见,可见, 对参数对参数 作区间估计,就是要设法找出两个作
5、区间估计,就是要设法找出两个只依赖于样本的界限只依赖于样本的界限(构造统计量构造统计量). 一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间 内内 . 12(,)n XXX 12(,)n XXX () ( , ) 数理统计数理统计 可靠度与精度是一对矛盾,一般是可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高在保证可靠度的条件下尽可能提高精度精度.1. 要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 内内,就是说,概率,就是说,概率 要尽可能大要尽可能大 .即要求估计尽量可靠即要求估计尽量可靠. ( , ) P 2. 估计的精度要尽可能的高估计的精度要尽可能的
6、高. 如要求区间长度如要求区间长度 尽可能短,或能体现该要求的其它准则尽可能短,或能体现该要求的其它准则. 数理统计数理统计 在求置信区间时,要查表求分位点在求置信区间时,要查表求分位点.二、置信区间的求法二、置信区间的求法()1P aXb()()1P XbP Xa ()1,2P Xb()2P Xa 设设 , 对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位点分位点. x01()P Xx定义定义()1P Xx数理统计数理统计 ()1P aXb()()1P XbP Xa若若 X 为连续型随机变量为连续型随机变量 , 则有则有12,ax 2.bx ()1,3
7、P Xb2()3P Xa所求所求置信区间为置信区间为122(,)xx 所求所求置信区间为置信区间为1 23,ax 3.bx 1 233(,)xx 数理统计数理统计 N(0, 1)选选 的点估计为的点估计为 , ,X求参数求参数 的置信度为的置信度为 的置信区间的置信区间. 例例1 设设X1,Xn是取自是取自 的样本,的样本, ,2已知 ),(2 N 1nXU 取明确问题明确问题,是求什么是求什么参数的置信区间参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参寻找未知参数的一个良数的一个良好估计好估计.解解 寻找一个待估参数和寻找一个待估参数和统计量的函数统计量的函数 ,要求,要求其分布
8、为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.数理统计数理统计 ,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得,2 u对于给定的置信水平对于给定的置信水平, 根据根据U的分布,确定一的分布,确定一个区间个区间, 使得使得U取值于该区间的概率为置信水平取值于该区间的概率为置信水平. 1|2unXP使使为什么为什么这样取这样取?数理统计数理统计 122unXunXP从中解得从中解得,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得,2 u 1|2unXP使使数理统计数理统计 ,22 unXunX也可简记为
9、也可简记为2()Xun 122unXunXP于是所求于是所求 的的 置信区间为置信区间为 数理统计数理统计 从例从例1解题的过程,我们归纳出求置信区间解题的过程,我们归纳出求置信区间的一般步骤如下的一般步骤如下:1. 明确问题明确问题, 是求什么参数的置信区间是求什么参数的置信区间? 置信水平置信水平 是多少是多少? 12. 寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn) 3. 寻找一个待估参数寻找一个待估参数 和估计量和估计量 T 的函数的函数 U(T, ),且其分布为已知且其分布为已知. 数理统计数理统计 4. 对于给定的置信水平对于给定的置信水平 ,根据,根
10、据U(T, )的分布,确定常数的分布,确定常数a, b,使得,使得 1 1 P(a U(T, )b) = 5. 对对“aU(T, )b”作等价变形作等价变形,得到如下形式得到如下形式: 1P 即即 1 于是于是 就是就是 的的100( )的置信区间的置信区间. ( , ) 数理统计数理统计 可见,确定区间估计很关键的是要寻找一个可见,确定区间估计很关键的是要寻找一个待估参数待估参数 和估计量和估计量T 的函数的函数U(T, ), 且且U(T, )的分布为已知的分布为已知, 不依赖于任何未知参数不依赖于任何未知参数 . 而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的形式是总体分布
11、的形式是否已知,是怎样的类型,至关重要否已知,是怎样的类型,至关重要.数理统计数理统计 需要指出的是需要指出的是,给定样本,给定置信水平,给定样本,给定置信水平 ,置信区间也置信区间也不是唯一不是唯一的的. .对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间. .,2已知 例如,设例如,设 X1 , , Xn 是取自是取自 的样本的样本 , ),(2 N求参数求参数 的置信水平为的置信水平为 的置的置 1N(0, 1)nXU 0.95 信区间信区间. 由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可以求得我们可以求得 P( aUb) .数理统计数理统计
12、 N(0, 1)nXU 例如,由例如,由P(-1.96U1.96)=0.95)(ufu96. 196. 195. 096. 1,96. 1nXnX 我们得到我们得到均值均值 的置信水平为的置信水平为 1的的置信区间为置信区间为0.95 数理统计数理统计 由由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些. .33. 2,75. 1nXnX )(ufu33. 275. 1置信区间为置信区间为我们得到我们得到均值均值 的置信水平为的置信水平为 1的的0.95 数理统计数理统计 我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短. . 类似地,我们可
13、得到若干个不同的置信区间类似地,我们可得到若干个不同的置信区间. . 任意两个数任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一个的面积,就确定一个95%的置信区间的置信区间. .0buuu)(ufaaabb950.950.950.数理统计数理统计 在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a =-b时求得的时求得的置信区间的长度为最短置信区间的长度为最短. .0buuu)(ufaaabb950.950.950.a =-b数理统计数理统计 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上
14、仍取对称的分位点来计算未知参数,习惯上仍取对称的分位点来计算未知参数的置信区间的置信区间. .2 我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水平小置信水平小于于 1 的的置信区间,并且置信区间,并且置信水平越高,相应的置信水平越高,相应的置置信区间信区间平均长度平均长度越长越长. .)(22n)(221n)(xfx)(2nX 数理统计数理统计 也就是说,要想得到的区间估计可靠度高,也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差区间长度就长,估计的精度就差. .这是一对矛盾这是一对矛盾. . 实用中应在保证足够可靠的前提下,尽量使实用中应在保证足够可靠的前提
15、下,尽量使得区间的长度短一些得区间的长度短一些 .数理统计数理统计 单个总体单个总体 的情况的情况两个总体两个总体 的情况的情况*2( ,)N 211(,),N 222(,)N 数理统计数理统计 一、单个总体一、单个总体 的情况的情况2( ,)N 2( ,),XN 并设并设 为来自总体的为来自总体的 1,nXX样本样本 ,2,X S分别为样本均值和样本方差分别为样本均值和样本方差 .均值均值 的置信区间的置信区间1.12为已知为已知(0,1)XNn 可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为 1 22(,)XuXunn2()Xun 或或数理统计数理统计 22为未知为未知(
16、1)Xt nSn 可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为 1 此分布不依赖于此分布不依赖于任何未知参数任何未知参数2|(1)1XPtnSn 由由22(1),(1)SSXtnXtnnn2(1)SXtnn或或数理统计数理统计 例例1 有一大批糖果有一大批糖果.现从中随机地取现从中随机地取 16 袋袋 , 称称得重量得重量(以克计以克计)如下如下: 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布设袋装糖果的重量近似地服从正态分布,试求总试求总体均值体均值 的置信
17、水平的置信水平0.95为的置信区间为的置信区间.解解 这里这里10.95,20.025,115,n0.025(15)2.1315.t 1611503.75 ,16iixx 16211()6.2022 .15iisxx 数理统计数理统计 2(1)sxtnn于是得到于是得到 的的置信水平为置信水平为 的置信区间的置信区间为为 0.95即即(500.4,507.1)数理统计数理统计 方差方差 的置信区间的置信区间22.222(1)(1)nSn 2221222(1)(1)(1)1nSP nn 由由可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为1 2222212(1)(1)(,)(1)
18、(1)nSnSnn 2数理统计数理统计 22122(1)(1)(1)1nSPnn 由由可得到标准差可得到标准差 的的置信水平为置信水平为 的置信区间的置信区间为为1 2221211(,)(1)(1)nSnSnn 数理统计数理统计 例例2 有一大批糖果有一大批糖果.现从中随机地取现从中随机地取 16 袋袋 , 称称得重量得重量(以克计以克计)如下如下: 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布设袋装糖果的重量近似地服从正态分布,试求总试求总体标准差体标准差 的置信水平的置信水平
19、0.95为的置信区间为的置信区间.解解 这里这里20.025,120.975,115,n20.025(15)27.488, 20.975(15)6.262. 16211()6.2022 .15iisxx 数理统计数理统计 于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为0.952221211(,)(1)(1)nSnSnn 即即(4.58,9.60).数理统计数理统计 1. 随机地取炮弹随机地取炮弹 10 发做试验,得炮口速度的发做试验,得炮口速度的标准差标准差 , 炮口速度服从正态分布炮口速度服从正态分布. 求这求这种炮弹的炮口速度的标准差种炮弹的炮口速度的标准差 的置信水
20、平为的置信水平为0.95 的置信区间的置信区间.11()sm s 222(1)(1)nSn 由由2221222(1)(1)(1)1nSP nn 解解数理统计数理统计 于是得到于是得到 的的置信水平为置信水平为 的置信区间的置信区间为为0.952221211(,)(1)(1)nsnsnn 这里这里20.025,120.975,19,n20.025(9)19.023, 20.975(9)2.700, 11.s 可得到可得到 的的置信水平为置信水平为 的置信区间的置信区间为为1 2222212(1)(1)(,)(1)(1)nSnSnn 2数理统计数理统计 2. 某单位要估计平均每天职工的总医疗费,观
21、察某单位要估计平均每天职工的总医疗费,观察了了30天天,其总金额的平均值是其总金额的平均值是170元元,标准差为标准差为30元,元,试决定职工每天总医疗费用平均值的区间估计(置试决定职工每天总医疗费用平均值的区间估计(置信水平为信水平为0.95).解解设每天职工的总医疗费为设每天职工的总医疗费为X,2 E(X)= ,D(X)=则有则有2未知XUSn选择数理统计数理统计 nSXU 服从服从t(n-1) 分布分布 使使2|(1)1XPtnSn 22(1),(1)SSXtnXtnnn得均值得均值 的置信水平为的置信水平为 的区间估计的区间估计为为 1数理统计数理统计 0.0250.025(29),(
22、29)3030SSXtXt得均值得均值 的置信水平为的置信水平为 的区间估计为的区间估计为 0.950.0250.0250.02517030(29)2.0452(29),(29)3030158.8,181.2XStSSXtXt将,代入得 的置信水平为0.95的置信区间为数理统计数理统计 另解另解 某单位要估计平均每天职工的总医疗费,观某单位要估计平均每天职工的总医疗费,观察了察了30天天,其总金额的平均值是其总金额的平均值是170元元,标准差为标准差为30元元,试决定职工每天总医疗费用平均值的区间估计(,试决定职工每天总医疗费用平均值的区间估计(置信水平为置信水平为0.95).解解设每天职工的
23、总医疗费为设每天职工的总医疗费为X,近似服从正态分布近似服从正态分布X),(2nN 由中心极限定理,由中心极限定理,2 E(X)= ,D(X)=则有则有数理统计数理统计 nSXU 近似近似 N(0,1) 分布分布 使使 1|2unSXP,22 unSXunSX得均值得均值 的置信水平为的置信水平为 的区间估计的区间估计为为 1 未知,用样本标准差未知,用样本标准差S近似代替近似代替. 数理统计数理统计 将将 =170,S=30, =1.96,n=30代入得代入得,X的置信水平为的置信水平为0.95的置信区间是的置信区间是 159.27, 180.74 2 u,22 unSXunSX得均值得均值
24、 的置信水平为的置信水平为 的区间估计为的区间估计为 1数理统计数理统计 同学们可通过练习,掌握各种求未知参数的同学们可通过练习,掌握各种求未知参数的 置信区间的具体方法置信区间的具体方法.这两个小节中,我们介绍了区间估计、单侧置信这两个小节中,我们介绍了区间估计、单侧置信区间和区间和单个正态总体均值、方差的置信区间单个正态总体均值、方差的置信区间.三、三、小结小结数理统计数理统计 四、布置作业四、布置作业习题六 (A) 2 数理统计数理统计 三三*、单侧置信区间、单侧置信区间 上述置信区间中置信限都是双侧的,但对于上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向有些实际问题,人们关心的只是参数在一个方向的界限的界限. 例如对于设备、元件的使用寿命来说,平均寿命例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了过长没什么问题,过短就有问题了. 这时这时, 可将置信上限取为可将置信上限取为+ ,而,而只着眼于置信下限只着眼于置信下限 ,这样求得的,这样求得的置信区间叫置信区间叫单侧置信区间单侧置
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年度医保政策法规考试真题试卷含答案
- 2025体外循环在成人心脏手术实践指南课件
- 云南国防工业职业技术学院《数控编程与加工(军工零件)》2024-2025 学年第一学期期末试卷(制造专业)
- 顺德区托幼机构保健员岗位培训理伦试题
- 施工单位安全方针目标和计划
- 车队岗前安全业务培训课件
- 母婴保健技术考试试题及答案
- 技工院校教师职业能力比赛思政类试题
- 车间食品安全培训知识课件
- 2026年陕西省执业药师继续教育专业课考试试题及答案
- 低空智能-从感知推理迈向群体具身
- 福建国有资产管理公司招聘面试题及答案
- 四川省2025年高职单招职业技能综合测试(中职类)电子信息类试卷
- 2025年熔化焊接与热切割作业考试题库及答案
- 账务清理合同(标准版)
- 质量互变课件
- 幼儿园重大事项社会稳定风险评估制度(含实操模板)
- 2026年包头轻工职业技术学院单招职业适应性测试题库附答案
- 2025至2030中国应急行业市场深度分析及发展趋势与行业项目调研及市场前景预测评估报告
- 2025年中厚钢板行业分析报告及未来发展趋势预测
- 基于多因素分析的新生儿重症监护室患儿用药系统风险评价模型构建与实证研究
评论
0/150
提交评论