数理统计与随机过程6--参数估计.ppt_第1页
数理统计与随机过程6--参数估计.ppt_第2页
数理统计与随机过程6--参数估计.ppt_第3页
数理统计与随机过程6--参数估计.ppt_第4页
数理统计与随机过程6--参数估计.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计与随机过程,1,兰州大学信息科学与工程学院,主讲: 路永刚 E-mail: ,第七节 参数估计,区间估计(Interval Estimation),前面讨论了参数的点估计。点估计就是利用样本计算出的值 (即实轴上点) 来估计未知参数。,7.4 区间估计,其优点是:可直地告诉人们 “未知参数大致是多少”;缺点是:并未反映出估计的误差范围 (精度)。,所以在点估计使用上还有不尽如人意之处。而区间估计正好弥补了这点不足。,例如:在估计正态总体均值 的问题中,若根据一组实际样本,得到 的极大似然估计为 10.12。,一个好的估计办法是:给出一个区间,并告诉人们该区间包含未知参数 的可靠度 (也称置信系数)。,实际上, 的真值可能大于10.12,也可能小于10.12。,也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数 。,这里的“可靠度”是用概率来度量的,称为置信系数,常用 表示 置信系数也叫置信水平。,置信系数的大小常根据实际需要来确定,通常取0.95或0.99,即,根据实际样本,由给定的置信系数,可求出一个尽可能短的区间 ,使,为确定置信区间,我们先回顾前面给出的随机变量的上 分位点的概念。,课本后面附有标准正态分布、2分布、t 分布、及F分布的分位点表可供查用。,区间估计的定义,定义1:,实际应用上,一般取 = 0.05 或 0.01。,7.5 正态总体参数的区间估计,根据定理 (6.4.1) ,知,7.5.1 单正态总体参数的区间估计,也可简记为,于是, 的置信区间为,(1),例1: 某厂生产的零件长度 X 服从 N( , 0.04),现从该厂生产的零件中随机抽取6个,长度 测量值如下(单位:毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1. 求: 的置信系数为0.95的区间估计。,解:n = 6, = 0.05,z/2 = z0.025 = 1.96,2=0.22 .,所求置信区间为,因方差未知,取, 的区间估计,于是, 的置信系数为1- 的区间估计为,也可简记为,(2), 2 的区间估计,解: n=10, =0.05, t9 (0.025)=2.2622,例2:为估计一物体的重量,将其称量10次,得到重量的测量值 (单位: 千克) 如下:10.l, 10.0, 9.8, 10.5, 9.7, l0.l, 9.9, 10.2, 10.3, 9.9. 设它们服从正态分布 N( , 2)。求 的置信系数为0.95的置信区间。,例3(续例2): 求2的置信系数为0.95的置信区间。,解:n=10, = 0.05, S2=0.0583, 查附表得,,于是,,讨论,若 称为 的置信水平为的区间估计, 此区间估计是否唯一? 如果不唯一,如何选择哪个区间估计更好?,7.5.2 两个正态总体的情况,在实际应用中,我们经常会遇到两个正态总体均值差和方差之比的区间估计问题。,于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差 1-2 与方差之比12/22的问题。,例如:考察一项新技术对提高产品某项质量指标的作用,将实施新技术前产品质量指标看成正态总体 N(1, 12),实施新技术后产品质量指标看成正态总体 N(2, 22)。,定理1:设 X1, X2, , Xm是抽自正态总体X 的简单样本,XN(1, 12),样本均值与样本方差分别为,Y1, Y2, , Yn 是抽自正态总体 Y 的简单样本, Y N(2, 22),样本均值与样本方差分别为,I. 两个正态总体均值差的区间估计,当两样本相互独立时,,证明:,1).由基本定理(定理6.4.1),知,故,(4) 式成立;,且二者相互独立。,且(6)式与(7)式中的随机变量相互独立。 由 t 分布的定义,有,N(0,1), 2m+n-2, t m+n -2,利用该定理可得1-2 的置信系数为 1- 的置信区间,例4 (比较棉花品种的优劣):假设用甲、乙两种棉花纺出的棉纱强度分别为 XN(1, 2.182)和Y N(2, 1.762)。试验者从这两种棉纱中分别抽取样本 X1, X2 , X200 和 Y1, Y2, , Y100,样本均值分别为: 求 1-2 的置信系数为 0.95 的区间估计。,解: 1=2.18, 2=1.76, m=200, n=100, =0.05, 由(8)式,得 1- 2 的置信系数为 1- 的置信区间为,例5:某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积 (单位:毫升) XN(1, 2) 和 YN(2, 2)。现从生产线上分别抽取 X1, X2, X12 和 Y1, Y2, , Y17,样本均值与样本方差分别为:,求 1- 2 的置信系数为0.95的区间估计。,解:m=12, n=17, = 0.05,再由其他已知条件及(10)式,可算出,查 t 分布表,得 tm+n-2( /2) = t27(0.025)=2.05.,再由(9)式,得 1- 2 的置信系数为 1- 的置信区间,在这两个例子中, 1- 2 的置信区间都包含了零,也就是说: 1可能大于 2,也可能小于 2。这时我们认为二者没有显著差异。,II. 两个正态总体方差比的区间估计,定理2:设 X1, X2, , Xm是抽自正态总体X 的简单样本,XN(1, 12), Y1, Y2, , Yn 是抽自正态总体 Y 的简单样本,Y N(2, 22),,X和Y的样本均值与样本方差为:,由定理2,易得到两个正态总体方差之比 的置信系数为1- 置信区间为:,例5:研究机器A和机器B生产的钢管的内径, 随机抽取A生产的钢管18根, 测得样本方差0.34 (mm2); 随机抽取B生产的钢管13根, 测得样本方差为0.29(mm2)。设两样本相互独立, 且机器A和机器B生产的钢管的内径分别服从正态分布N(1, 2) 与 N(2, 2)。求 的置信水平为0.90的置信区间。,解: 由 m=18, n=13, S12=0.34, S22=0.29, = 0.10 及(11)式,得 的置信系数为 0.90 的置信区间为,7.6 非正态总体的区间估计,前面两节讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断手中的数据是否服从正态分布,或者有足够理由认为它们不服从正态分布。但是,只要样本大小 n 比较大,总体均值 的置信区间仍可用正态总体情形的公式,或,2已知时,2未知时,所不同的是:这时的置信区间是近似的。,这是求一般总体均值的一种简单有效的方法,其理论依据是中心极限定理,它要求样本大小 n 比较大。因此,这个方法称为大样本方法。,设总体均值为 , 方差为2 , X1, X2, , Xn 为来自总体的样本。因为这些样本独立同分布的,根据中心极限定理,对充分大的 n, 下式近似成立,因而,近似地有,于是, 的置信系数约为1- 的置信区间为,当2未知时,用2的估计S2 来代替,得,只要 n 很大,(2)式所提供的置信区间在应用上是令人满意的。,那么,n 究竟多大才算很大呢?,显然,对于相同的 n , (2)式所给出的置信区间的近似程度随总体分布与正态分布的接近程度而变化,因此,理论上很难给出 n 很大的一个界限。,但许多应用实践表明: 当 n30时,近似程度是可以接受的; 当 n50时,近似程度是很好的。,例1:某公司欲估计自己生产的电池寿命。现从其产品中随机抽取 50 只电池做寿命试验。这些电池寿命的平均值为 2.261 (单位:100小时),标准差 S=1.935。求该公司生产的电池平均寿命的置信系数为 95% 的置信区间。,解:查正态分布表,得 z /2= z0.025=1.96,由公式 (2),得电池平均寿命的置信系数为 95% 的置信区间为,设事件 A 在一次试验中发生的概率为 p, 现在做 n 次试验,以Yn记事件 A 发生的次数,则 Yn B(n, p)。依中心极限定理,对充分大的 n,近似地有,7.6.1 二项分布,(3)式是(1)式的特殊情形。,(4)式就是二项分布参数 p 的置信系数约为1- 的置信区间。,例2:商品检验部门随机抽查了某公司生产的产品100件,发现其中合格产品为84件,试求该产品合格率的置信系数为0.95的置信区间。,解:n=100, Yn=84, =0.05, z/2=1.96, 将这些结果代入到(4)式,得 p 的置信系数为0.95的近似置信区间为 0.77, 0.91。,例3:在环境保护问题中, 饮水质量研究占有重要地位, 其中一项工作是检查饮用水中是否存在某种类型的微生物。假设在随机抽取的100份一定容积的水样品中有20份含有这种类型的微生物。试求同样容积的这种水含有这种微生物的概率 p 的置信系数为0.90的置信区间。,解:n=100, Yn=20, =0.10, z/2=1.645, 将这些结果代入到(4)式,得 p 的置信系数为0.90的近似置信区间为 0.134, 0.226。,7.6.2 泊松分布,设 X1, X2 , Xn 为抽自具有泊松分布P( )的总体的样本,因为 E(X)=D(X) = ,应用(2)式,并用,例4:公共汽车站在一单位时间内 (如半小时,或1小时, 或一天等) 到达的乘客数服从泊松分布 P( ), 对不同的车站, 不同的仅是参数 的取值不同。现对某城市某公共汽车站进行100个单位时间的调查。这里单位时间是20分钟。计算得到每 20 分钟内来到该车站的乘客数平均值为 15.2 人。试求参数 的置信系数为95%的置信区间。,解: n=100, =0.05, z /2=1.96,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论