概率统计第五章_第1页
概率统计第五章_第2页
概率统计第五章_第3页
概率统计第五章_第4页
概率统计第五章_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率统计(probability and statistics)宁波工程学院 理学院第五章第五章 统计量及其分布统计量及其分布 5.0 数理统计简介数理统计简介5.1 总体与样本总体与样本5.2 样本数据的整理与显示样本数据的整理与显示5.3 统计量及其分布统计量及其分布5.4 三大抽样分布三大抽样分布5.5 充分统计量充分统计量u数理统计数理统计研究收集、整理和研究收集、整理和分析分析带有随机性的数带有随机性的数据,以便对所考察的问题作出据,以便对所考察的问题作出推断和预测推断和预测u客观上,只允许我们对随机现象进行客观上,只允许我们对随机现象进行次数不多次数不多的的观察试验,我们只能获得观

2、察试验,我们只能获得观察资料局部(样本)观察资料局部(样本). .u数理统计通过有限的资料研究的问题整体,尽可数理统计通过有限的资料研究的问题整体,尽可能地作出精确而可靠的结论能地作出精确而可靠的结论u如果可逐一观察整体,则无需数理统计如果可逐一观察整体,则无需数理统计由由“局部局部”推断推断“整体整体”必然包含必然包含不肯定性或错不肯定性或错误误. .我们通过置信度或显著性水平度量我们通过置信度或显著性水平度量推断推断的可信的可信度度. .随机方法有别于数学分析方法随机方法有别于数学分析方法由由部分推断全体部分推断全体,这种推理方法为,这种推理方法为“归纳推归纳推理理”. .这种归纳推理不同

3、于数学中的这种归纳推理不同于数学中的“演绎推理演绎推理”结论是根据所观察到的大量结论是根据所观察到的大量个别个别情况,情况,“归归纳纳” ” 所得,而不是从一些假设、命题、已知的所得,而不是从一些假设、命题、已知的事实等出发,按一定的事实等出发,按一定的逻辑推理逻辑推理去得出来的去得出来的. .例如:例如:在几何学中要证明在几何学中要证明“等腰三角形底角相等腰三角形底角相等等”只须从只须从“等腰等腰”这个前提出发,运用几何这个前提出发,运用几何公理,一步一步推出这个结论公理,一步一步推出这个结论. .而:而:一个一个习惯于统计思想习惯于统计思想的人,就可能想出这样的人,就可能想出这样的方法:做

4、很多大小形状不一的等腰三角形,实的方法:做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得资料看看地测量其底角,看差距如何,根据所得资料看看可否作出可否作出“底角相等底角相等”的结论的结论. . 这样做就是这样做就是归纳归纳式的方法式的方法. .二、二、总体与个体总体与个体1、总体的三层含义总体的三层含义:总体往往难以完全把握总体往往难以完全把握,例如,例如 1、甬江污染程度甬江污染程度 2、明天本地区天气情况明天本地区天气情况2、个体的理解个体的理解:个体往往容易研究个体往往容易研究;例如:;例如: 1、甬江按照断面、深度、时间抽检的水质甬江按照断面、深度、时间抽检的水质

5、2、从从10000只灯泡中抽取只灯泡中抽取50只破坏性检验只破坏性检验 样本样本 X1, X2, , Xn 是随机变量是随机变量 样本又是一组数值样本又是一组数值 x1, x2, , xn,称为称为样本观测值样本观测值简单起见,无论是样本还是其观测值,简单起见,无论是样本还是其观测值,样本一般均样本一般均用用 x1, x2, xn 表示表示 从总体中抽取的从总体中抽取的n个个体称个个体称样本样本,用大写字母,用大写字母 X1, X2, , Xn 表示,其中每个个体叫表示,其中每个个体叫样品样品; n称为样本量称为样本量 寿命范围寿命范围 元件数元件数 寿命范围寿命范围 元件数元件数 寿命范围寿

6、命范围 元件数元件数 ( 0 24 4 (192 216 6 (384 408 4 (24 48 8 (216 240 3 (408 432 4 (48 72 6 (240 264 3 (432 456 1 (72 96 5 (264 288 5 (456 480 2 (96 120 3 (288 312 5 (480 504 2 (120 144 4 (312 336 3 (504 528 3 (144 168 5 (336 360 5 (528 552 1 (168 192 4 (360 184 1 552 13 独立性独立性: : 样本中每一样品的取值不影响其样本中每一样品的取值不影响其

7、 它样品的取值它样品的取值 - x1, x2, , xn 相互独立相互独立。抽取样本的方法有很多:简单样本、分组样本等抽取样本的方法有很多:简单样本、分组样本等“简单随机样本简单随机样本”有如下两个要求:有如下两个要求: 随机性随机性: : 总体中每一个个体都有同等机会总体中每一个个体都有同等机会 被选入样本被选入样本 - xi 与总体与总体X有相同的分布有相同的分布。设总体设总体X具有分布函数具有分布函数F(x), , x1, x2, , xn 为取自为取自该总体的容量为该总体的容量为n的样本,则样本联合分布函数为的样本,则样本联合分布函数为11(,.,)().nniiF xxF x 三、总

8、体、样本、样本值的关系三、总体、样本、样本值的关系(理论研究)(理论研究)1、因而可以由因而可以由样本值样本值推断推断总体总体。我们只能观察到。我们只能观察到样本值而见不到总体样本值而见不到总体1 1)经验分布函数)经验分布函数设设 x1, x2, , xn 是取自总体分布函数为是取自总体分布函数为F(x)的样的样本,若将样本观测值由小到大进行排列本,若将样本观测值由小到大进行排列, ,为为 x(1), x(2), , x(n),则称,则称 x(1), x(2), , x(n) 为有序样本,为有序样本,用用有序样本有序样本定义如下函数定义如下函数 (1)( )()( ) 10,( )/ ,1,

9、2,.,11,kknnxxFxk nxx xknxx x1,x2,xn研究总体与样本之间的关系是统计学的中心内容研究总体与样本之间的关系是统计学的中心内容对这种关系的研究从两方面着手:对这种关系的研究从两方面着手:一是从一是从总体到样本总体到样本,这就是研究抽样分布,这就是研究抽样分布二是从二是从样本到总体样本到总体,这就是统计推断,这就是统计推断 统计推断是以总体分布和样本抽样分布的理论关统计推断是以总体分布和样本抽样分布的理论关系为基础的。系为基础的。为正确由样本推断总体,必须对样为正确由样本推断总体,必须对样本的抽样分布有所了解本的抽样分布有所了解四、四、 统计量及其分布统计量及其分布(

10、理论研究)(理论研究)1 1、统计量与抽样分布统计量与抽样分布定义定义5.3.1 设设 x1, x2, , xn 为取自某总体的样本,若为取自某总体的样本,若样本函数样本函数T = T(x1, x2, , xn)中不含有任何未知参数。中不含有任何未知参数。则称则称T为为统计量统计量。统计量的分布称为抽样分布统计量的分布称为抽样分布。例如:例如: 以及以及经验分布函数经验分布函数都是统都是统计量。而计量。而x1 , x1/ 等均不是统计量。等均不是统计量。211,nniiiixx 尽管统计量不依赖于未知参数,但是它的分布一尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。般是依赖于

11、未知参数的。(1) 样本均值样本均值(2)样本方差样本方差2211()niiSxxn 11nxxini (3) 样本原点矩样本原点矩11nkkiiaxn (4)样本中心矩样本中心矩11()nkkiibxxn (5) 样本偏度样本偏度 1 = b3/b23/2 (了解)(了解) 样本峰度样本峰度 2 = b4/b22(7) 样本分位数与样本中位数样本分位数与样本中位数(了解)(了解)样本中位数也是一个很常见的统计量,它也是样本中位数也是一个很常见的统计量,它也是次序统计量的函数,通常如下定义:次序统计量的函数,通常如下定义:更一般地,更一般地,样本样本p分位数分位数mp可如下定义:可如下定义:

12、120.5122,12nnnxnmxxn 为为奇奇数数,为为偶偶数数(1)()(1),1(2nppnpnpxnpmxxnp 若若不不是是整整数数),), 若若是是整整数数(6) 次序统计量及其分布次序统计量及其分布 (了解)(了解) 定义定义5.3.7 设设 x1, x2, , xn 是取自总体是取自总体X的样本的样本, , x(i) 称为该样本的第称为该样本的第i 个个次序统计量次序统计量,它的取值,它的取值 是将样本观测值由小是将样本观测值由小到大排列后得到的第到大排列后得到的第 i 个个 观测值。其中观测值。其中x(1)=min x1, x2, xn 称为该样本称为该样本 的的最小次序统

13、计量最小次序统计量,称称 x(n)=max x1,x2,xn 为为 该样本的该样本的最大次序统计量最大次序统计量。定理定理5.3.1 若把样本中的数据与样本均值之差若把样本中的数据与样本均值之差 称为称为偏差偏差,则样本所有偏差之和为,则样本所有偏差之和为0,即即1()0.niixx 注注 偏差之和为偏差之和为0是必然的是必然的。但样本偏差的存在但样本偏差的存在即合理使用仍需考虑。因此,需要引入衡量这即合理使用仍需考虑。因此,需要引入衡量这种偏差的指标种偏差的指标-样本方差样本方差 这种情况类似于随机变量的方差引入这种情况类似于随机变量的方差引入证明证明 对于任意给定的常数对于任意给定的常数c

14、 2222222()()()2()()()()()()iiiiiiiiixcxxxcxcxxxcxxxxn xcxx 定理定理5.3.2 数据观测值与均值的偏差平方和数据观测值与均值的偏差平方和 最小,即在形如最小,即在形如 (xi c)2 的函数中的函数中, 最小,其中最小,其中c为任意给定常数。为任意给定常数。2()ixx 2()ixx 注注 正因为此,用正因为此,用 描述样本方差描述样本方差(2) 若总体分布未知或不是正态分布,若总体分布未知或不是正态分布, 但但 E(x)= , Var(x)= 2, ,则则n 较大时较大时 的的渐近分渐近分 布布为为N( , 2/n) , ,常记为常记

15、为定理定理5.3.3 设设x1, x2, , xn 是来自某个总体的样本,是来自某个总体的样本,x为样本均值。为样本均值。(1) 若总体分布为若总体分布为N( , 2),则,则xx的的精确分精确分布为布为N( , 2/n) ;(卷积或特征函数卷积或特征函数) N( , 2/n)中心极限中心极限这里渐近分布是指这里渐近分布是指n 较大时的近似分布较大时的近似分布. .x 抽样分布就是通常的随机变量函数的分布抽样分布就是通常的随机变量函数的分布. . 只是强调这一分布是由一个统计量所产生的只是强调这一分布是由一个统计量所产生的. . 研究统计量的性质和评价一个统计推断的优良研究统计量的性质和评价一

16、个统计推断的优良性,完全取决于其抽样分布的性质性,完全取决于其抽样分布的性质. . 样本均值的分布仅仅是众多抽样分布的一种样本均值的分布仅仅是众多抽样分布的一种抽样分布抽样分布精确抽样分布精确抽样分布渐近分布渐近分布(小样本问题中使用)(小样本问题中使用)(大样本问题中使用(大样本问题中使用)4、样本方差与样本标准差样本方差与样本标准差2211()1niisxxn 称为称为样本标样本标差差。定义定义5.3.3称为称为样本方差样本方差,其算术平方根其算术平方根修正:修正:在在n 不大时,常用不大时,常用 作为样作为样本方差,其算术平方根也称为样本标准差。本方差,其算术平方根也称为样本标准差。22

17、1*1()niisxxn x自由度:自由度:在在 确定后确定后, , n 个偏差中只有个偏差中只有n 1个数据个数据可以自由变动,而第可以自由变动,而第n个则不能自由取值,因为个则不能自由取值,因为 (xi x ) = 0 . .*2ss 概念区分:概念区分:总体期望、总体方差总体期望、总体方差 样本均值、样本均值、样本方差样本方差样本均值、样本方差的数学期望和方差样本均值、样本方差的数学期望和方差定理定理5.3.4 设总体设总体 X 具有二阶矩,即具有二阶矩,即 E(X)= , Var(X)= 2 x1, x2, , xn 为从该总体得到的样本,为从该总体得到的样本,x和和s2 分别是样本均

18、值和样本方差,则分别是样本均值和样本方差,则E( x )= , , Var( x )= 2 /n, E(s2) = 2 注注 样本均值、样本方差的数学期望和方差都不样本均值、样本方差的数学期望和方差都不依赖于总体的分布形式。依赖于总体的分布形式。/2五、三大抽样分布五、三大抽样分布“ 三大抽样分布三大抽样分布 ” 和正态分布一起构成数理统和正态分布一起构成数理统计的基础分布计的基础分布-”四大抽样分布四大抽样分布”从从样本到总体样本到总体的统计推断必然包含错误,只能通的统计推断必然包含错误,只能通过概率过概率(置信度或显著性水平)(置信度或显著性水平)度量度量统计推断统计推断的的可信度可信度概

19、率的计算需要已知分布概率的计算需要已知分布-统计量的分布统计量的分布许多常用统计量服从许多常用统计量服从“ “ 三大抽样分布三大抽样分布 ” ”例例 明天午后明天午后99%有中雨有中雨1、 2 分布分布(卡方分布卡方分布)定义定义5.4.1 设设 X1, X2, Xn, 独立同分布于标准独立同分布于标准 正态分布正态分布N(0,1) ,则,则 X12+ Xn2 的分布称的分布称 为自由度为为自由度为n 的的 分布,记为分布,记为 。分位数分位数:当随机变量当随机变量 时,对给定时,对给定 (0 1),称满足称满足 P( 1 的的 是自由度为是自由度为n的卡方分布的的卡方分布的1 分位数分位数.

20、 .分位数分位数 可以从附表可以从附表3 中查到。中查到。“抽样分布抽样分布 ”最为常用的就是最为常用的就是分位数分位数该密度函数该密度函数的图像是一的图像是一只取非负值只取非负值的偏态分布的偏态分布 Var22,()2Enn 卡方分布密度函数演示卡方分布密度函数演示定义定义5.4.2 设设X1 , X2 X1与与X2独立,独立, 则称则称 F =(X1/m)/(X2/n) 的分布是自由度为的分布是自由度为 m 与与 n 的的 F分布分布,记为记为F F(m, n),其中其中m 称为分子自称为分子自 由度由度,n 称为分母自由度。称为分母自由度。当随机变量当随机变量F F(m,n) 时,对给定

21、时,对给定 (0 1) ,称满足称满足 P(F F1 (m,n) 的的F1 (m,n) 是自是自由度为由度为m 与与 n 的的F 分布的分布的 分位数。分位数。由由 F 分布的构造知分布的构造知 F (n,m) = 1/F1 (m,n)。 1,11( ,)()( ,)1()( ,)m nm nm nPFn mP FFFn mP FFn m 1 22,22,()/( )/,( ,)( )/()/m nm nmmnnFF n mnnFmmQ:11 ,11()(, )( ,)( ,)m nP FFm nFn mFn m 该密度该密度函数的函数的图象也图象也是一只是一只取非负取非负值的偏值的偏态分布态分布 F-F-分布密度函数演示分布密度函数演示3、 t 分布分布 定义定义 5.4.3 设随机变量设随机变量X1 与与X2 独立,独立, 且且X1 N(0,1), X2 则称则称t t= =X1/ X2/n的分布为自由度为的分布为自由度为n 的的t 分布,记为分布,记为t t(n) 。 t 分布的简单了解:各方面与标准正态分布类似分布的简单了解:各方面与标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论