第5章总体布样本分布_第1页
第5章总体布样本分布_第2页
第5章总体布样本分布_第3页
第5章总体布样本分布_第4页
第5章总体布样本分布_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、广东工业大学管理学院广东工业大学管理学院第5章 总体分布、样本分布 与参数估计5.1 总体分布与样本分布本章的总体(population or universe)是指研究对象的全体。并且先研究只有一个特征(指标或变量)的总体。这样表述总体特征的变量可以看成一个一维随机变量。更准确地说,一维随机变量是指反映某总体特征取值,且具有如下特点的变量x:(1)在同一条件下可以无限次重复取值;(2)取值的结果可能有多个,但不确定;(3)事先不知道取值结果(outcome)。因此,总体也可理解为一个随机变量取的值全体。随机变量取值的概率分布,就称为总体分布。一个随机变量取给定值或属于一给定值集合的概率所确定

2、的函数称为该随机变量的概率分布。概率分布反映的是随机变量所有可能取值的概率的分配方式。一旦与所有可能结果相联系的概率被确定,则概率分布完全确定。x x1 x2 xn p(x) p1 p2 pn 离散随机变量的概率分布。设x为取相异值x1, x2, xn, 的离散随机变量,则函数iixxnixxpxf, 0, 2 , 1),()(称为x的概率分布或概率分布函数(probability distribution function, pdf),其中p(x=xi)为离散随机变量x取xi值的概率。例 抛掷一个均匀的骰子,假设骰子的六个面分别标有数字1,2,3,4,5,6。用x标识骰子落地后朝上一面的数字

3、。则x是离散随机变量。其概率分布如下表所示xpi11/621/631/641/651/661/6写成函数形式6 , 5 , 4 , 3 , 2 , 1, 06 , 5 , 4 , 3 , 2 , 1,61)(xxxf设x是连续随机变量,x是x取的值,若函数f(x)满足下列条件:)()(1)(0)(bxapdxxfdxxfxfba则称f(x)为x的概率密度函数(probability density function, pdf),其中p(axb)表示x在区间(a, b取值的概率。有时也称下式定义的函数为x的概率分布函数:xdxxfxf)()(连续型随机变量取给定值的概率为零。(1)位于横轴的上方

4、(2)曲线与横轴围成的面积为1 ab(3)x在区间(a,b取值的概率等于该区间上的曲边梯形的面积 ab连续型随机变量在给定集合取值的概率分配方式由其概率密度完全确定。从重复抽样的角度看从重复抽样的角度看“每次从某个总体每次从某个总体x中随机抽中随机抽取个体取个体”可理解为一个可理解为一个随机实验随机实验。随机样本随机样本:表征:表征n次抽取个体的随机抽样的一组随次抽取个体的随机抽样的一组随机变量机变量x1, x2, , xn.样本观察值(样本数据)样本观察值(样本数据):n次次随机抽样的结果随机抽样的结果:x1, x2, , xn(称为随机变量(称为随机变量x1, x2, , xn的样本观的样

5、本观察值)。察值)。n称为称为样本容量样本容量。注注:x1, x2, , xn也可以看成随机变量也可以看成随机变量x的的n次重复抽次重复抽样的结果。样的结果。大写的英文字母:随机变量小写的英文字母:随机变量的观察值例例 抛掷一个均匀的骰子,假设骰子的六个面分别抛掷一个均匀的骰子,假设骰子的六个面分别标有数字标有数字1,2,3,4,5,6。用。用x标识骰子落地后标识骰子落地后朝上一面的数字。则朝上一面的数字。则x是离散随机变量。是离散随机变量。对该随机变量进行一次抽样,其实就是掷该骰子对该随机变量进行一次抽样,其实就是掷该骰子一次。一次。第第i次抽样,就是第次抽样,就是第i次掷骰子,其结果的表示

6、:次掷骰子,其结果的表示:事前事前事后事后xixi易见,易见,xi其实就是其实就是x. 当然这里要求各当然这里要求各xi是是独立的独立的. 在理论上表在理论上表述时常说成各述时常说成各xi是是iid的的(即即independent identically distribution)5.1.3 样本分布函数设设x1, x2, , xn是随机变量是随机变量x的样本观察值,将它的样本观察值,将它们按大小顺序排列,排序后为们按大小顺序排列,排序后为x1 x2 xn , ki为为小于小于xi+1的样本值出现的累积频次,的样本值出现的累积频次,n仍为样本容仍为样本容量,则可得到样本累积频率分布函数如下量,

7、则可得到样本累积频率分布函数如下xxxxxnkxxxfniiin当当当, 1,/, 0)(11样本累积频率分布函数又简样本累积频率分布函数又简称为样本(累积)分布函数,称为样本(累积)分布函数,它是总体(累积)分布函数它是总体(累积)分布函数的近似,的近似,n越大,就越接近总越大,就越接近总体分布,如图。体分布,如图。对于有限总体,其累积概率分布函数不连续, 是阶跃式的。样本的累积分布函数也是阶跃式的。如图所示。5.1.4 格利文科(glivenko)定理(样本分布与总体分布的关系)格利文科定理:当n趋于无穷大时,fn(x)依概率1(关于x)均匀地收敛于总体分布f(x).格利文科定理的数学表达

8、如下:1)0)()(suplim(xfxfpnxn格利文科定理是用样本特征推断总体特征的依据格利文科定理是用样本特征推断总体特征的依据。这表明当n充分大时,样本分布fn(x)是总体分布f(x)的一个良好近似。是连续随机变量若是离散随机变量若xdxxxfxpxxnxiiipnii,)(,111是连续的若是离散的若xdxxfxxpxxxnsiiipnii,)()(,)()(1122122122例如,利用格利文科定理可以证明:5.1.5 随机样本的均值函数对于随机样本x1, x2, , xn, 定义样本的均值函数(简称为样本均值)为niixnx11由于式中xi是随机样本(随机变量),因此作为随机样本

9、函数的 是随机变量x比较样本数据的均值niixnx11它可以看成是 的观察值x5.1.6 随机样本的方差函数对于随机样本x1, x2, , xn, 定义样本的方差函数(简称为样本方差)为niixxns122)(11由于式中xi是随机样本(随机变量),因此作为随机样本函数的s2是随机变量比较样本数据的方差niixxns122)(11它是s2的观察值5.2 统计量与统计量的分布统计量是不含未知参数的、随机样本x1, x2, , xn的函数注意统计量是随机样本x1, x2, , xn的函数,因而也是随机变量),(21nxxxf在上面定义的函数中将每个随机样本xi用其观察值xi代替,计算的结果f (

10、x1, x2, , xn)称为统计量的值。也可以直接将f ( x1, x2, , xn)看成统计量的观察值。设设x服从均值为服从均值为,方差为,方差为2正态分布正态分布,即,即 x n ( , 2 ),则其分布密度函数为,则其分布密度函数为222)(21)(xexf特别地,当特别地,当 = 0, 2 = 1 时正态分布称为时正态分布称为标准正标准正态分布态分布。正态分布是一种最常见的分布。通常如果一个随机变量只受到大量小的独立因素的影响,则它服从正态分布。正态分布有许多特点:例如它是对称的。正态变量大约有68%的可能性在离均值一个标准差的范围内取值;大约有95%的可能性在离均值1.96倍标准差

11、的范围内取值。几乎不在离均值3倍标准差以外的地方取值。68%95%99.7%l甲生考试成绩常常不及格,如果能够拿甲生考试成绩常常不及格,如果能够拿到一个到一个6060多分的成绩,都感到非常满意多分的成绩,都感到非常满意了。某日,老师发期中考卷,甲生拿到了。某日,老师发期中考卷,甲生拿到考卷后,看到成绩是考卷后,看到成绩是8080分,喜出望外,分,喜出望外,心想这一次总算要扬眉吐气了,但是,心想这一次总算要扬眉吐气了,但是,只见老师在黑板上写下本次期中考试全只见老师在黑板上写下本次期中考试全班平均成绩是班平均成绩是9090分,标准差分,标准差5 5分。见到这分。见到这一结果,甲生还能高兴的起来吗

12、?一结果,甲生还能高兴的起来吗? 对任何一个服从正态分布的随机变量x n (,2 ),总可以将它变换为一个标准正态分布的随机变量,变换的方式为:xz也就是,z n(0, 1)。例如 设xn(54, 0.852), 要计算p(x52)。则可以这样计算:0094. 09906. 01)35. 2(1)35. 2(1)35. 2(85. 0545285. 0545285. 054)52(zpzpzpxpxp2. 设x n(0, 1), x1, x2, , xn是x的随机样本,则这些随机样本的平方和22221122nniixxxx服从自由度为n的2分布,即2 2 ( n )利用这一结果可以证明对于任何

13、取自于均值为标准差为的正态分布的样本,其方差函数s2满足) 1() 1(222nsn00.511.5202468n=2n=5n=102分布的均值为分布的均值为n,方差为,方差为2n,其中,其中n为自由度为自由度(df)。3. t分布自由度为n的t分布,记为t (n), 是由标准正态分布n(0,1)和2(n)分布组成, 其表达式为nyxt 其中x n(0,1), y 2(n), 且x与y相互独立。00.050.10.150.20.250.30.350.40.45-3.5-1.50.52.5n=5n=20n=120t分布的均值为0,方差为n/(n-2)。3. f分布f分布变量是由两个2变量之比组成

14、的:mvnuf 记为ff(n, m), 其中u 2(n), v 2(m). 对于 f(n, m),n称为第一自由度(分子自由度),m称为第二自由度(分母自由度)。00.20.40.60.811.21.41.6-0.50.51.52.5n=2,m=2n=10,m=20n=50,m=505.2.3 由一般正态分布的随机样本所构成的若干重要统计量的分布设随机变量x n ( , 2 ), x1, x2, , xn是x的随机样本,则(1)),(2nnx(2)) 1, 0( nnx(3)) 1(1222nns(4)) 1(ntnsx(5)) 1, 1(2122222121nnfss其中 是容量为n1的随机

15、变量 的样本方差; 是容量为n2的随机变量 的样本方差。21s),(211nx22s),(222ny5.2.4 任意分布的随机样本均值函数的均值和方差设随机变量x 的均值为 , 方差为2, 而分布形式任意, x1, x2, , xn是x的随机样本,则(1)x(2)nnxx22或也就是任意随机变量的样本均值就等于总体均值;样本方差等于总体方差与样本容量的商nnnnxvarnxnvarxvarniniinii222121211)(1)1()(设x1, x2, , xn是x的随机样本,则它们之间相互独立,并且均值都为 , 方差都为2, 于是2.一个应用广泛的样本均值与方差:0-1分布的样本均值与方差

16、0-1分布 反映总体中某类个体占的比例的随机变量x,可以简单地用0-1分布b(1,p)来表示,其中p就是总体中该类个体所占的比例。例如 在某学生构成的总体中,少数民族占的比例是p,则从该总体中任选一个同学为少数民族的概率为p,而任选一个同学不是少数民族的概率为1-p。0-1分布的均值为p,方差为p(1 p)从服从0-1分布的一个总体中随机地抽取n个样本x1, x2, , xn. 记样本均值函数为 则 xpxnppx)1 (25.2.5 大样本均值的分布: 中心极限定理设随机变量x 服从均值为 , 方差为2 的分布, x1, x2, , xn是x的随机样本,则有如下的中心极限定理。中心极限定理中

17、心极限定理(central limit theorem):当:当n充分充分大时,近似地有大时,近似地有),(2nnx一般地,当n30时,就可应用中心极限定理了。或者近似地有或者近似地有) 1, 0( nnx例 一汽车蓄电池商声称其生产的电池具有均值为54个月、标准差为6个月的寿命分布。现假设某消费者团体决定检验该厂的说法是否准确,为此购买了50个该厂的电池进行检验。1)假定厂商的声称是正确的,试描述这50个电池平均寿命的抽样分布。2)假定厂商声称正确,则50个样品组成的样本的平均寿命不超过52个月的寿命的概率是多少?解 1)由中心极限定理,样本均值近似服从正态分布, 即近似地),(2nnx而6

18、,54并且2285. 072. 050/36/n故)85. 0,54(2nx2)按照上面得到的结果来计算这50个电池平均寿命不超过52个月的概率这表明这50个电池平均寿命不超过52个月的概率非常小。因此这种情况应该不太可能出现。如果出现该情况意味着什么?前面已经计算得到p(x52)=0.0094nxxnxnxnxnxxnxnxxxxnxxxxnxxnsninininiininiiniinii22122221221211212122122)()(1)()(11)()(2)()(11)()(2)()(11)(2)()(11)(11由于) 1 (),(22212nxnxnii所以) 1() 1(22

19、2nsn) 1() 1(222nsn的证明) 1() 1() 1(22ntnsnnxnsx) 1, 1(1) 1(1) 1(2122222212121122222121nnfnsnnsnss利用上述结果与5.2.2的结果能够得到5.3 点估计在解决实际问题时,常常需要用样本来推断总体分布的某些参数值,这就是所谓的参数估计。参数估计又分为点估计与区间估计。粗略地讲,点估计就是用样本的某一函数值,来估计总体分布中的未知参数。而区间估计就是(以一定概率)把总体分布的参数确定在由样本决定的某个区间内。5.3.1 点估计的概念设设是总体分布中一个需要估计的参数。现在从总是总体分布中一个需要估计的参数。现

20、在从总体中得到一个随机样本体中得到一个随机样本x1, x2, , xn ,我们的目的,我们的目的是通过这一随机样本来估计参数是通过这一随机样本来估计参数 。的估计量的估计量通常是随机样本通常是随机样本x1, x2, , xn的一个函的一个函数,记为数,记为),(21nxxx简记为简记为若能够得到一组样本观察值若能够得到一组样本观察值x1, x2, , xn,则将它们,则将它们代入上述函数,可以计算出代入上述函数,可以计算出的估计值的估计值),(21nxxx的估计值也简记为的估计值也简记为 。 的的点估计点估计就是求就是求的估计值的估计值5.3.2 矩估计法对总体而言,对总体而言,矩矩是指:是指

21、:)(kxe k阶原点矩阶原点矩kxe)( k阶中心矩(中心为阶中心矩(中心为)对样本而言对样本而言niixnx11 一阶原点矩一阶原点矩niixxns122)(11 二阶中心矩二阶中心矩矩估计法就是用样本矩来估计总体的相应矩。矩估计法就是用样本矩来估计总体的相应矩。例如通常例如通常niixnx11)(xe用用 来估计来估计 用用 来估计来估计 niixxns122)(112)(xe并且称这样得到的估计量为并且称这样得到的估计量为矩估计量矩估计量。5.3.3 极大似然估计法引例引例 设甲乙两个盒子外形完全相同,甲盒中装有设甲乙两个盒子外形完全相同,甲盒中装有90个白球个白球10个黑球,乙盒中装

22、有个黑球,乙盒中装有90个黑球个黑球10个白个白球。今随机地抽取一个盒子并从中抽取一球,结球。今随机地抽取一个盒子并从中抽取一球,结果抽到白球,问这球是从哪个盒子中抽取的?果抽到白球,问这球是从哪个盒子中抽取的?从甲盒中抽取一球是白球的概率从甲盒中抽取一球是白球的概率p1=9/10从乙盒中抽取一球是白球的概率从乙盒中抽取一球是白球的概率p2=1/10p1远大于远大于p2,因此我们推断这球是从甲盒中取出。,因此我们推断这球是从甲盒中取出。这个推断我们依据的是所谓极大似然原理:这个推断我们依据的是所谓极大似然原理:如果如果进行一次随机实验,结果是若干个可能后果中的进行一次随机实验,结果是若干个可能

23、后果中的某一个出现了,则可以认为实验的条件有利于该某一个出现了,则可以认为实验的条件有利于该后果的出现,即该后果出现的概率最大后果的出现,即该后果出现的概率最大。更一般地,如果用一个参数更一般地,如果用一个参数来表示不同的盒子,来表示不同的盒子,即即对于乙盒对于甲盒, 1, 0现在随机抽取一个盒子,然后随机独立有放回现在随机抽取一个盒子,然后随机独立有放回地抽取地抽取5次,每次抽取一个球。如果结果是黑、次,每次抽取一个球。如果结果是黑、白、白、白、黑。问白、白、白、黑。问等于等于0还是等于还是等于1?对于甲盒,得到这样结果的概率对于甲盒,得到这样结果的概率321109101p对于乙盒,得到这样

24、结果的概率对于乙盒,得到这样结果的概率232109101p由于由于p1大于大于p2,因此我们推断,因此我们推断=0。也就是,也就是,是使联合概率达到最大的数是使联合概率达到最大的数。将上述问题抽象化。设将上述问题抽象化。设x是一个随机变量,其概是一个随机变量,其概率密度函数为率密度函数为 。又设。又设x1, x2, , xn是是x的的随机样本,则记联合密度函数为随机样本,则记联合密度函数为),(xfniixfl1),(称为称为的的极大似然函数极大似然函数。若得到一组样本观察值若得到一组样本观察值x1, x2, , xn ,则代入,则代入l后得后得到一个关于到一个关于的函数。如果存在的函数。如果

25、存在 使函数使函数l取最大值。则称该取最大值。则称该 为为的的极大似然估计极大似然估计值值。而称。而称),(21nxxx),(21nxxx为为的的极大似然估计量极大似然估计量。5.3.4 示例例例5.3.1 设随机变量设随机变量x 服从均值为服从均值为 , 方差为方差为2 的正的正态分布态分布, x1, x2, , xn是是x的随机样本,求的随机样本,求和和2的的极大似然估计量。极大似然估计量。首先由前面的讨论可知极大似然函数为首先由前面的讨论可知极大似然函数为nixiel12)(22)21(niixne1222)()21(对对l取极大值等价于对取极大值等价于对l的对数取极大值,而的对数取极大

26、值,而niixnl1222)(21)2ln(2ln因此在因此在l取对数后,再分别计算关于取对数后,再分别计算关于和和2的偏导数,的偏导数,并令偏导数为零,解得并令偏导数为零,解得和和2的估计量(极大似然估的估计量(极大似然估计量)分别为计量)分别为xxnnii11niixxn122)(12的极大似然估计量要小于其矩估计量的极大似然估计量要小于其矩估计量niixxns122)(11一个实例:eai管理人员electronics associates公司(公司(eai)的人事主管正在)的人事主管正在制定一项公司制定一项公司2500名管理人员的简报。其中包括管名管理人员的简报。其中包括管理人员的平均

27、年薪和公司中已完成公司管理培训项理人员的平均年薪和公司中已完成公司管理培训项目的管理人员所占比例。目的管理人员所占比例。总体:总体:eai的的2500名管理人员名管理人员实际上可以根据公司档案获得有关总体参数:实际上可以根据公司档案获得有关总体参数:总体年薪的均值与标准差:总体年薪的均值与标准差:=51800,=4000完成培训的管理人员所占比例:完成培训的管理人员所占比例:p=0.6现在考虑如果不用总体全部现在考虑如果不用总体全部2500人的数据人的数据,而是使用一而是使用一个样本可以节约时间和成本,人事主管应该如何估计个样本可以节约时间和成本,人事主管应该如何估计总体的有关参数总体的有关参

28、数假定管理人员抽取了一个有名管理人员构成的假定管理人员抽取了一个有名管理人员构成的随机样本有关数据如下表随机样本有关数据如下表由样本估计的年薪的均值与方差由样本估计的年薪的均值与方差00.51814nxxi72.33471)(2nxxsi由样本估计的参加培训人员的比例由样本估计的参加培训人员的比例633. 030/19p5.4 判断点估计量的优劣标准5.4.1 无偏估计量无偏估计量设 为的估计量。如果 则称 为的无偏估计量。)(e 无偏的分布无偏的分布 有偏的分布有偏的分布对于正态总体,可以证明总体均值的样本矩估计量(同时也是极大似然估计量) 是无偏的。x总体方差的样本矩估计量s2是无偏的,但

29、是极大似然估计量是有偏的。5.4.2 最小方差性在获得的参数估计量中, 人们总是希望估计量的方差尽可能小. 这样估计误差的分布范围才比较小 的分布函数的分布函数2的分布函数的分布函数1若总体参数为,的估计量的方差)(var,小于等于其他所有对估计量的方差)(var,也就是)(var)(var总是成立, 那么的估计量就具有最小方差性。 在对两个估计量进行比较时,若一个估计量的方差小于另一个估计量的方差,我们也常说,前者更有效。5.4.3 有效估计量在 用 估 计 量来 估 计 总 体 的 某 个参 数 时 , 如 果 ( 1 ) 估 计 量无 偏 的 ; ( 2 ) 在的 所 有 估 计 量 中

30、 估 计量的 方 差 最 小 。 那 么 , 这 个 估 计 量就 是 总 体 参数的 有 效 估 计 量 。 设设x是一均值为是一均值为,方差为,方差为2的随机变量,并且的随机变量,并且x1, x2, , xn是来自于是来自于x的随机样本,试比较如下两个估的随机样本,试比较如下两个估计量的有效性:计量的有效性:(1)(2)nxxnii1)0 and constantsare(,111niiiniiniiikkkxkx解解 首先易知首先易知)()(xexe并且并且.)(,)(211222niiniikkxvarnxvar利用初等不等式利用初等不等式niiniiknk1221可得可得).()(2

31、21122xvarnkkxvarniinii故故 比比 有效有效.xx5.4.4 渐近无偏估计量渐近无偏估计量是指: )(limen 式中n为样本容量 5.4.5 一致估计量定义:如果满足: 1)|(|limnnp 则称为的一致估计量。 上述定义中的极限表达式常常写为 limnp 并称为依概率收敛于。 一致估计量的另一种等价的定义是:(1) 是渐近无偏的;(2)0)(limnnvar其中(2)中的极限采用下式计算)(1lim)(lim2nnnnnenenvar极限符号后面的称为,而通常计算方差时,直接用下面的表达)()(2nnneevar5.4.6 渐近有效性渐近有效性的定义:渐近有效性的定义

32、:一个估计量是渐近有效的,如果(1)这个估计量是一致估计量(2)这个估计量有着比“其他方法得到的估计量”有更小的渐近方差通常判别点估计量优劣的准则l小样本准则小样本准则 无偏性无偏性 有效性有效性l大样本准则大样本准则 一致性一致性可以证明下列估计量是具有较好统计性质的估计量总体均值的矩估计量niixnx11总体方差2的矩估计量niixxns12)(11总体方差2的极大似然估计量niinxxns12)(1总体比例p的估计量样本比例nn1总体构成比例的估计常常可能会关注总体中某一类特定对象占的比例p。对于这样的问题,可以采用如下的方式处理。在总体中任取一个个体,用一个变量x来描述所抽取的对象是否

33、属于所关注的对象这一事件,即x = 1,若抽得的是所关注的对象0,若抽得的不是所关注的对象于是,该总体可以用服从0-1分布的随机变量x b(1, p)描述,其中p表示所关注的对象在总体中占的比例。对于0-1分布b(1, p),其数学期望值与方差分别为:p, p(1 p)设x1, x2, , xn是来自于总体x的一个随机样本,并且在这一样本中我们所关注的对象恰好出现了n1次。那么nnxxxnxn121)(1即样本的均值恰好等于样本的比例。由此可见,可用样本比例 来估计总体比例p。此外,由中心极限定理,当样本容量充分大时,样本的均值函数近似地服从正态分布,也就是近似地有:)1 (,(npppnx5

34、.5 区间估计5.5.1 置信区间置信区间若总体分布含一个未知参数, 如果找出了2个依赖样本x1, x2, , xn的估计量:),(),(212211nnxxxxxx使得1)(21p其中0 1,则称随机区间 为的 (1 )(或100 (1 ) %)的置信区间; 1 (或百分数100(1 )%)称为置信度或置信水平; 称为显著性水平,通常取为0.05或0.01。),(215.5.2 已知总体方差求总体均值的置信区间例5.5.1 设总体x服从n(, 0.09), 抽取了4个样本观察值x1, x2, x3, x4, 求总体均值的95%的置信区间。首先),(2nnx因此) 1, 0(23 . 0nxn

35、xz注意到n(0, 1)是一个对称分布。现在来确定k,使得95. 0)(kzkp2.5%的面积的面积95%的面积的面积kx0.000.010.020.030.040.050.060.070.080.090.00.10.20.30.4 0.50.60.70.80.9 1.01.11.21.31.4 1.51.61.71.81.9 2.02.12.22.32.4 2.52.62.72.82.90.50000.53980.57930.61790.6554 0.69150.72570.75800.78810.8159 0.84130.86430.88490.90320.9192 0.93320.945

36、20.95540.96410.9713 0.97720.98210.98610.98930.9918 0.99380.99530.99650.99740.99810.50400.54380.58320.62170.6591 0.69500.72910.76110.79100.8186 0.84380.86650.88690.90490.9207 0.93450.94630.95640.96480.9719 0.97780.98260.98640.98960.9920 0.99400.99550.99660.99750.99820.50800.54780.58710.62550.6628 0.6

37、9850.73240.76420.79390.8212 0.84610.86860.88880.90660.9222 0.93570.94740.95730.96560.9726 0.97830.98300.98680.98980.9922 0.99410.99560.99670.99760.99820.51200.55170.59100.62930.6664 0.70190.73570.76730.79670.8238 0.84850.87080.89070.90820.9236 0.93700.94840.95820.96640.9732 0.97880.98340.98710.99010

38、.9925 0.99430.99570.99680.99770.99830.51600.55570.59480.63310.6700 0.70540.73890.77030.79950.8264 0.85080.87290.89250.90990.9251 0.93820.94950.95910.96710.9738 0.97930.98380.98740.99040.9927 0.99450.99590.99690.99770.99840.51990.55960.59870.63680.6736 0.70880.74220.77340.80230.8289 0.85310.87490.894

39、40.91150.9265 0.93940.95050.95990.96780.9744 0.97980.98420.98780.99060.9929 0.99460.99600.99700.99780.99840.52390.56360.60260.64060.6772 0.71230.74540.77640.80510.8315 0.85540.87700.89620.91310.9278 0.94060.95150.96080.96860.9750 0.98030.98460.98810.99090.9931 0.99480.99610.99710.99790.99850.52790.5

40、6750.60640.64430.6808 0.71570.74860.77940.80780.8340 0.85770.87900.89800.91470.9292 0.94180.95250.96160.96930.9756 0.98080.98500.98840.99110.9932 0.99490.99620.99720.99790.99850.53190.57140.61030.64800.6844 0.71900.75170.78230.81060.8365 0.85990.88100.89970.91620.9306 0.94300.95350.96250.97000.9762

41、0.98120.98540.98870.99130.9934 0.99510.99630.99730.99800.99860.53590.57530.61410.65170.6879 0.72240.75490.78520.81330.8389 0.86210.88300.90150.91770.9319 0.94410.95450.96330.97060.9767 0.98170.98570.98900.99160.9936 0.99520.99640.99740.99810.9986利用书末的附表一,可以查得k = z0.025=1.96。于是下面的不等式成立的概率为0.95025. 00

42、25. 023 . 0zxz这等价于025. 0025. 03 . 023 . 02zxzx将z0.025=1.96代入上式,即得到所需要的置信区间)294. 0,294. 0(xxnzxnzx22一般地,已知总体方差时均值置信区间的表达式5.5.3 未知总体方差求总体均值的置信区间设 ,抽取了一组样本观察值x1, x2, xn,求总体均值的1-置信区间。这里总体的方差2是未知的。),(2nx首先由5.2.4有) 1(ntnsxt记 是自由度为n - 1 的t分布对应着显著性水平的临界值。则 ) 1(2nt1)1() 1(22ntnsxntp从而可得置信区间为nsntxnsntx) 1() 1

43、(22例 为检查北京市中学生的身体状况,抽取了由16名男高中生的构成一个随机样本。设计算出样本的平均身高为174cm,标准差为5cm。求北京市男高中生平均身高的95%的置信区间。解 首先可以算出25. 14/5ns再根据/2 = (1 0.95)/2=0.025, 以及自由度n 1=15查p376的t分布表得1315.2)15(025.0t代入置信区间的计算公式得6644. 217425. 11315. 2174) 1(2nsntx即所求置信区间为(171.3356, 176.6644)。换言之根据样本我们有95%的把握说北京市男高中生的平均身高在171.3356cm176.6644cm之间。点估计中用无偏性与有效性来评价估计量的好坏,在区间估计中是用置信度和精度来衡量估计量的优劣。以 的置信区间为例,公式nsntxnsntx) 1() 1(22表示一个以 为中心,以 为半径的区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论