概率论与数理统计浙大四版第七章第七章3讲课件_第1页
概率论与数理统计浙大四版第七章第七章3讲课件_第2页
概率论与数理统计浙大四版第七章第七章3讲课件_第3页
概率论与数理统计浙大四版第七章第七章3讲课件_第4页
概率论与数理统计浙大四版第七章第七章3讲课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论与数理统计浙大四版第七章第七章3讲课件概率论与数理统计浙大四版第七章第七章3讲课件 引言 前面,我们讨论了参数点估计. 它是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大. 区间估计正好弥补了点估计的这个缺陷 . 引言 前面,我们讨论了参数点估计. 它是也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值 这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平. 习惯上把置信水平记作 ,这里 是一个很小的正数.也就是说,我们希望确定一个区间,使我们能以

2、比较高的可靠程度相置信水平的大小是根据实际需要选定的.例如,通常可取置信水平 =0.95或0.9等.根据一个实际样本,由给定的置信水平,我小的区间 ,使们求出一个尽可能置信区间.称区间 为 的置信水平为 的置信水平的大小是根据实际需要选定的.例如,通常可取置信水平 寻找置信区间的方法,一般是从确定误差限入手.使得称 为 与 之间的误差限 . 我们选取未知参数的某个估计量 ,根据置信水平 ,可以找到一个正数 ,只要知道 的概率分布,确定误差限并不难. 寻找置信区间的方法,一般是从确定误差限入手. 下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法.由不等式可以解出 :这个不等式就

3、是我们所求的置信区间. 下面我们就来正式给出置信区间的定义,并通过例 一、 置信区间定义:满足设 是 一个待估参数,给定若由样本X1,X2,Xn确定的两个统计量则称区间 是 的置信水平(置信度、置信概率)为 的置信区间.分别称为置信下限和置信上限. 一、 置信区间定义:满足设 是 一个待估参数,给 一旦有了样本,就把 估计在区间内.这里有两个要求:可见, 对参数 作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量)(X1,Xn)(X1,Xn) 一旦有了样本,就把 估计在区间内.这里有两个要求:2. 估计的精度要尽可能的高. 如要求区间长度 尽可能短,或能体现该要求的其它准则.1. 要

4、求 以很大的可能被包含在区间内,就是说,概率 要尽可能大.即要求估计尽量可靠. 可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.2. 估计的精度要尽可能的高. 如要求区间长度 概率论与数理统计浙大四版第七章第七章3讲课件关于定义的说明关于定义的说明若反复抽样多次(各次得到的样本容量相等,都是n)按伯努利大数定理, 在这样多的区间中,若反复抽样多次(各次得到的样本容量相等,都是n)按伯努利大数例如例如N(0, 1)选 的点估计为求参数 的置信度为 的置信区间. 例1 设X1,Xn是取自 的样本, 二、置信区间的求法明确问题,是求什么参数的置信区间?置信水平是多少? 寻找未知参数

5、的一个良好估计.解: 寻找一个待估参数和估计量的函数 ,要求其分布为已知.有了分布,就可以求出U取值于任意区间的概率.N(0, 1)选 的点估计为求参数 的置信度为 对给定的置信水平查正态分布表得对于给定的置信水平(大概率), 根据U的分布,确定一个区间, 使得U取值于该区间的概率为置信水平.使为什么这样取?对给定的置信水平查正态分布表得对于给定的置信水平(大概率),对给定的置信水平查正态分布表得使从中解得对给定的置信水平查正态分布表得使从中解得也可简记为于是所求 的 置信区间为也可简记为于是所求 的 置信区间为 从例1解题的过程,我们归纳出求置信区间的一般步骤如下:1. 明确问题, 是求什么

6、参数的置信区间? 置信水平 是多少?2. 寻找参数 的一个良好的点估计T (X1,X2,Xn)称S(T, )为枢轴量. 3. 寻找一个待估参数 和估计量T的函数 S(T, ),且其分布为已知. 从例1解题的过程,我们归纳出求置信区间的一般4. 对于给定的置信水平 ,根据S(T, )的分布,确定常数a, b,使得 P(a S(T, )b)= 5. 对“aS(T, )b”作等价变形,得到如下形式:则 就是 的100( )的置信区间. 4. 对于给定的置信水平 ,根据S(T, )的分布 可见,确定区间估计很关键的是要寻找一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不

7、依赖于任何未知参数(这样我们才能确定一个大概率区间).而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要. 可见,确定区间估计很关键的是要寻找一个待估参数 这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计. 这里,我们主要讨论总体分布为正态的情形. 教材上讨论了以下几种情形:单个正态总体均值 和方差 的区间估计.两个正态总体均值差 和方差比 的区间估计.比例 p 的区间估计.教材上讨论了以下几种情形:单个正态总体均值 和方差 教材180页已经给出了概率分布的上侧分位数(分位点

8、)的定义,为便于应用,这里我们再简要介绍一下.在求置信区间时,要查表求分位数. 设0 1, 对随机变量X,称满足的点 为X的概率分布的上 分位数. 教材180页已经给出了概率分布的上侧分位数(分位点)的定义,例如: 设0 1, 对随机变量X,称满足的点 为X的概率分布的上 分位数. 标准正态分布的上 分位数例如: 设0 1, 对随机变量X,称例如: 设0 1, 对随机变量X,称满足的点 为X的概率分布的上 分位数. 分布的上 分位数自由度为n的例如: 设0 1, 对随机变量X,称满 设0 1, 对随机变量X,称满足的点 为X的概率分布的上 分位数. F分布的上 分位数自由度为n1,n2的 设0

9、 1, 对随机变量X,称满足的点 书末附有 分布、t 分布、F分布的上侧分位数表,供使用. 需要注意的事项在教材上有说明. 至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的话,这个问题不难解决. 书末附有 分布、t 分布、F分布的上侧分位数表一、单个总体 的情况由例1可知:1.一、单个总体 的情况由例1可知:1. 包糖机某日开工包了12包糖,称得质量(单位:克)分别为506,500,495,488,504,486,505,513,521,520,512,485. 假设重量服从正态分布,解.新建文件夹42-1.ppt2-1例2 包糖机某日开工包了12包糖,称得质量(单位:克)

10、分概率论与数理统计浙大四版第七章第七章3讲课件附表2-2查表得附表2-2查表得推导过程如下:推导过程如下:概率论与数理统计浙大四版第七章第七章3讲课件解 有一大批糖果,现从中随机地取16袋, 称得重量(克)如下: 设袋装糖果的重量服从正态分布, 试求总体均值附表3-1例3解 有一大批糖果,现从中随机地取16袋, 称就是说估计袋装糖果重量的均值在500.4克与507.1克之间, 这个估计的可信程度为95%.这个误差的可信度为95%.就是说估计袋装糖果重量的均值在500.4克与507.1克之间推导过程如下:根据第六章第二节定理二知推导过程如下:根据第六章第二节定理二知概率论与数理统计浙大四版第七章

11、第七章3讲课件进一步可得:注意: 在密度函数不对称时, 习惯上仍取对称的分位点来确定置信区间(如图).进一步可得:注意: 在密度函数不对称时, 习惯上仍取对称的分 (续例2) 求例2中总体标准差 的置信度为0.95的置信区间.解代入公式得标准差的置信区间附表4-1附表4-2例4 (续例2) 求例2中总体标准差 的置信度为0.9休息片刻继续休息片刻继续例5 已知某地区新生婴儿的体重X随机抽查100个婴儿得100个体重数据X1,X2,X100 的区间估计求和(置信水平为1- ).例5 已知某地区新生婴儿的体重X随机抽查100个婴儿得1解:这是单总体均值和方差的估计已知先求均值 的区间估计. 因方差

12、未知,取 对给定的置信度 ,确定分位数使即解:这是单总体均值和方差的估计已知先求均值 的区间估均值 的置信水平为 的区间估计.即为从中解得均值 的置信水平为 的区间估计.即取枢轴量从中解得再求方差 的置信水平为 的区间估计. 对给定的置信度 ,确定分位数 使取枢轴量从中解得再求方差 的置信水平为 于是 即为所求.于是 需要指出的是,给定样本,给定置信水平,置信区间也不是唯一的.对同一个参数,我们可以构造许多置信区间. 需要指出的是,给定样本,给定置信水平,置信区间N(0, 1)取枢轴量由标准正态分布表,对任意a、b,我们可以求得P( aUb) . 例如,设X1,Xn是取自 的样本, 求参数 的

13、置信水平为 的 置信区间.N(0, 1)取枢轴量由标准正态分布表,对任意a、b,我们N(0, 1)例如,由P(-1.96U1.96)=0.95我们得到均值 的置信水平为的置信区间为N(0, 1)例如,由P(-1.96U1.96)=0.由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些.置信区间为我们得到均值 的置信水平为的由 P(-1.75U2.33)=0.95这个区间比前面我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信区间. 任意两个数a和b,只要它们的纵标包含f(u)下95%的面积,就确定一个95%的置信区间.我们总是希望置信区间尽可能短.类似地,我们可得

14、到若干个不同的在概率密度为单峰且对称的情形,当a =-b时求得的置信区间的长度为最短.a =-b在概率密度为单峰且对称的情形,当a =-b时求得的置信区间的 即使在概率密度不对称的情形,如 分布,F分布,习惯上仍取对称的分位点来计算未知参数的置信区间. 我们可以得到未知参数的的任何置信水平小于1的置信区间,并且置信水平越高,相应的置信区间平均长度越长. 即使在概率密度不对称的情形,如 分布,F分布,习 也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差.这是一对矛盾. 实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些 . 也就是说,要想得到的区间估计可靠度高,区间长度就

15、长,二、两个总体 的情况讨论两个总体均值差和方差比的估计问题.二、两个总体 的情况讨论两个总体均值差和方差比的估计问题.推导过程如下:1.推导过程如下:1.概率论与数理统计浙大四版第七章第七章3讲课件概率论与数理统计浙大四版第七章第七章3讲课件概率论与数理统计浙大四版第七章第七章3讲课件例7为比较, 两种型号步枪子弹的枪口速度,随机地取型子弹10发, 得到枪口速度的平均值为随机地取型子弹20发, 得枪口速度平均值为假设两总体都可认为近似地服从正态分布,且由生产过程可认为它们的方差相等, 求两总体均值差信区间.解由题意, 两总体样本独立且方差相等(但未知),例7为比较, 两种型号步枪子弹的枪口速

16、度,随机地取型概率论与数理统计浙大四版第七章第七章3讲课件解由题意, 两总体样本独立且方差相等(但未知),例8为提高某一化学生产过程的得率, 试图采用一种新的催化剂, 为慎重起见, 在试验工厂先进行体都可认为近似地服从正态分布, 且方差相等, 求两总体均值差试验. 设采用原来的催化剂进行了次试验,得到得率的平均值又采用新的催化剂进行了次试验,得到得率的平均值假设两总解由题意, 两总体样本独立且方差相等(但未知),例8为提高某概率论与数理统计浙大四版第七章第七章3讲课件推导过程如下:2.推导过程如下:2.根据F分布的定义, 知根据F分布的定义, 知概率论与数理统计浙大四版第七章第七章3讲课件解例

17、9研究由机器 A 和机器 B 生产的钢管内径, 随机抽取机器 A 生产的管子 18 只, 测得样本方差为均未知, 求方差比区间.设两样本相互独抽取机器B生产的管子 13 只, 测得样本方差为立,且设由机器 A 和机器 B 生产的钢管内径分别服从正态分布信解例9研究由机器 A 和机器 B 生产的钢管内径, 随机抽取概率论与数理统计浙大四版第七章第七章3讲课件解例10甲、乙两台机床加工同一种零件, 在机床甲加工的零件中抽取9个样品, 在机床乙加工的零件信区间. 假定测量值都服从正态分布, 方差分别为的置在置信度由所给数据算得0.98下, 试求这两台机床加工精度之比中抽取6个样品,并分别测得它们的长

18、度(单位:mm),解例10甲、乙两台机床加工同一种零件, 在机床甲加工的零件中概率论与数理统计浙大四版第七章第七章3讲课件一个正态总体未知参数的置信区间待估参数随机变量随机变量的分布双侧置信区间的上、下限一个正态总体未知参数的置信区间待估参数随机变量随机变量双侧置两个正态总体未知参数的置信区间(一)待估参数随机变量随机变量的分布双侧置信区间的上、下限两个正态总体未知参数的置信区间(一)待估参数随机变量随机变量两个正态总体未知参数的置信区间(二)待估参数随机变量随机变量的分布 双侧置信区间的上、下限两个正态总体未知参数的置信区间(二)待估随机变量随机变量 双三、单侧置信区间 上述置信区间中置信限

19、都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限. 例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了. 这时,可将置信上限取为+,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.三、单侧置信区间 上述置信区间中置信限都是双侧于是引入单侧置信区间和置信限的定义:满足设 是 一个待估参数,给定 若由样本X1,X2,Xn确定的统计量则称区间 是 的置信水平为 的单侧置信区间.称为单侧置信下限.于是引入单侧置信区间和置信限的定义:满足设 是 一个又若统计量 满足则称区间 是 的置信水平为 的单侧置信区间. 称为单侧置信上限.又若统计量 单个正态总体均值与

20、方差的单侧置信区间单个正态总体均值与方差的单侧置信区间概率论与数理统计浙大四版第七章第七章3讲课件概率论与数理统计浙大四版第七章第七章3讲课件设灯泡寿命服从正态分布. 求灯泡寿命均值 的置信水平为0.95的单侧置信下限. 例11从一批灯泡中随机抽取5只作寿命试验,测得寿命X(单位:小时)如下:1050,1100,1120,1250,1280由于方差 未知,取枢轴量解: 的点估计取为样本均值 设灯泡寿命服从正态分布. 求灯泡寿命均值 的置信水平 对给定的置信水平 ,确定分位数使即于是得到 的置信水平为 的单侧置信区间为 对给定的置信水平 ,确定分位数使即于是得到 将样本值代入得的置信水平为0.95的单侧置信下限是1065小时的置信水平为 的单侧置信下限为即 将样本值代入得的置信水平为0.95的单侧置信下限是1065 同学们可通过练习,掌握各种求未知参数的 置信区间的具体方法.这一讲,我们介绍了区间估计. 同学们可通过练习,掌握各种求未知参数的 置信区数学奖菲尔兹奖与阿贝尔奖,沃尔夫奖 为什么诺贝尔在以他名字命名的奖项中不设立数学奖?这个问题曾经引起许多猜测。比较流行的说法有两种:一个传说是诺贝尔本人认为数学与人类的进步没有直接的关联,因而不值得为数学设立专门奖项;另一个更为广泛的说法是,当时瑞典的领头数学家莱夫勒,他是诺贝尔的情敌,如果设立诺贝尔数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论