数理统计学的基本概念_第1页
数理统计学的基本概念_第2页
数理统计学的基本概念_第3页
数理统计学的基本概念_第4页
数理统计学的基本概念_第5页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章数理统计的基本概念一、教学要求1理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。2 了解 分布、 t 分布和 F 分布的定义和性质,了解分位数的概念并会查表计算。掌握正态总体的某些常用统计量的分布。了解最大次序统计量和最小次序统计量的分布。本章重点:统计量的概念及其分布。二、主要内容总体与个体我们把研究对象的全体称为总体 ( 或母体 ) ,把组成总体的每个成员称为个体。在实际问题中, 通常研究对象的某个或某几个数值指标, 因而常把总体的数值指标称为总体。设 x 为总体的某个数值指标,常称这个总体为总体 X。X 的分布函数称为总体分布函数。 当 X 为离散

2、型随机变量时, 称 X 的概率函数为总体概率函数。当 X 为连续型随机变量时,称 X 的密度函数为总体密度函数。当 X 服从正态分布时,称总体 X 为正态总体。正态总体有以下三种类型:未知,但已知;未知,但已知;和均未知。简单随机样本数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。 要作统计推断, 首先要依照一定的规则抽取 n 个个体,然后对这些个体进行测试或观察得到一组数据, 这一过程称为抽样。 由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为, n 维随机向量 () 称为样本。 n 称为样本容量。 ( )称为样本观测值。如果样本

3、() 满足1)相互独立;服从相同的分布,即总体分布;则称 () 为简单随机样本。简称样本。设总体 X 的概率函数 ( 密度函数 ) 为,则样本( ) 的联合概率函数 ( 联合密度函数为 )统计量完全由样本确定的量,是样本的函数。即:设是来自总体 X 的一个样本,是一个 n 元函数,如果中不含任何总体的未知参数, 则称为一个统计量, 经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。常用统计量( 1)样本均值:( 2)样本方差:3)样本标准差:它们的观察值分别为:这些观察值仍分别称为样本均值、样本方差和样本标准差。( 4)样本( k 阶)原点矩1 nk, k 1,2,LAkX in i

4、 1( 5)样本( k 阶)中心矩1 nk, k2,3,LBk( X i X )n i1其中样本二阶中心矩1 n( X i2, 又称为未修正样本方差。BkX )n i 16)顺序统计量将样本中的各个分量由小到大的重排成X (1)X (2) LX ( n )则称 X (1) , X (2) ,LX (n ) 为样本顺序统计量,X ( n )X (1) 为样本的极差。(7)样本相关系数:nn(x ix)( yiy)( x ix )( yiy)r xyi 1Sx Sy1ni1n(x ix )21 n( yi y)2i 1n i1其中: x, y 分别为数据 xi , yi 的样本均值, Sx , S

5、y 分别为样本 a 标准差。5、直方图与箱线图(1)直方图先将所有采集的数据进行整理, 得到顺序统计量, 找出其中的最小值 x(1),最大值 x(n ) ,即所有的数据都落在区间x(1) , x( n) 上,现取区间 x(1)k, x( n )k(其中 k 可取 0.5,1.5 等),该区间能覆盖区间x (1) , x( n ) ,将区间 x(1)k , x( n)k 等分为 m 个小区间(先取一个区间,其下限比最小的数据稍小,其上限比最大的数据稍大,然后将这一区间等分为m 个小区间,通常 n 较大时 m 取 10 :20 ,当50 时则 m 取 5 : 6 。若 m 取得过大,则会出现某些区

6、间内频数为零,分点通常取比数据精度高一位,以避免数据落在分点上),小区间的长度记为,( x(1) k ) ( x(n )k )称为组距,小区间的端点称为组限,数出数据落ml ,f i ,算出频率 f i (i 1,2,L l ) ,然后自左至右依次在每个小区间内的数据的频数f in在各个小区间上做以n(i1,2,L l ) 为高的小矩形,这样的图形就称其为频率直方图。显然这种小矩形的面积就等于数据落在该小区间的频率f i ( i 1,2,Ll ) ,n直方图的外廓曲线接近于总体X 的概率密度曲线。(2) p 分位数定义 设有容量为 n 的样本观察值 x1, x2 ,L , x n ,样本它具有

7、以下性质:(1)至少有 np 个观察值小于或等于观察值大于或等于 x p样本 p 分位数可按以下法则求得:将 x1, x 2 ,L , xn 按从小到大的顺序排成x(1)x(2)Lp(0 p 1) 分为数记为 xp , x p ;(2)至少有 n (1 p) 个x( n )10 ,若 np 不是整数,则只有一个数据满足定义中的两点要求,这一数据位于大于 np 的最小整数处,即为位于 np 1处的数。20 ,若 np 是整数,则 xnp , xnp 1 都符合性质要求,故x p 取 xnp , xnp 1 的平均值。x( np 1)np不是整综上可得: x p1x(np )x (np 1)2np

8、是整x( n 1 )n奇特别的: x0.5med21x( n 1 )n偶x( n )222分位数又称为第一四分位数,又记为 Q1 ;分位数又称为第三四分位数,又记为 Q3(3)箱线图:数据集的箱线图是由箱子和直线组成的图形, 它是在基于以下 5 个数据的图形概括:最小值 Min , Q1, M ,Q3 , 最大值 Max ,做法如下:( 1)画一水平数轴,在轴上标记最小值Min ,Q1 , M ,Q3, 最大值 Max ,在数轴上方画一个上下侧平行于数轴的矩形箱子,箱子的左右两侧分别位于Q1, Q3 的上方,在 M 点的上方画一条垂直线段,线段位于箱子的内部;2)自箱子的左侧中点引一条水平线直

9、至最小值上方;在同一水平高度自箱子右侧引一条水平线直至最大值上方。箱线图完成。在数据集中某一个观察值不寻常的大于或小于该数集中的其他数据, 称为疑似异常值。第一四分位数 Q1 与第三四分位数 Q3 之间的距离: IQR Q3 Q1 称为四分位数间距,若数据小于 Q1 1.5IQR 或大于 Q3 1.5IQR ,就认为他是疑似异常值。将上述箱线图的做法修改如下:( 1)同( 1)( 2)计算 IQRQ3Q1 ,若一个数据小于Q11.5IQR 或大于 Q31.5IQR ,则认为它是一个异常值,并以表示;3) 自箱子的左侧中点引一条水平线直至数据中除去疑似异常值之后的最小值上方,再自箱子的右侧中点引

10、一条水平线直至数据中除去疑似异常值之后的最大值上方;这样做出的箱线图称为修正箱线图。6关于 分布1) (Gamma)函数()x1e x dx,( s0)0它具有以下运算性质:(1)();(n)( n1)!, nN ;特别地:(1)1(1 )21( 1 )0 x2 e x dx2令 xtxt 2 , dx2tdt11x1gt2 gt2t2)x2edx2ee(e2tdtdtdt200t0令 Ie t 2dtI 2(e t 2dt )2(e s2ds)(e t 2dt )2d0e r 2rdrI0所以( 1)2( 2)设随机变量 X 服从分布,即: X:(, ) ,其密度函数为:1xf ( x )x

11、1e x00,0(qita0定理:设随机变量X ,Y 都服从分布且相互独立,即:X :( ,) ,X : (,) 其密度函数分别为:1xf X ( x )(x1ex00,0)qita01yfY ( y)y1ey00,0(qita0则 ZXY 服从参数为,的分布,即: XY :(,)7、经验分布函数设 X1,X2,LX n 是 总 体 F的 一 个 样 本 , 用 S( x ),(x)表 示X1, X 2,LX n 中不大于 x 的随机变量的个数,定义经验分布函数为:Fn (x )1x)S( x ),(n例题 1:设总体 F 有一个样本值1,2,3 ,则经验分布函数为:0, x 1F3 ( x

12、)13,1x22,2x331, x3例题 2:设总体 F 有一个样本值 1,1 ,2,则经验分布函数为:0, x1F3 ( x )2,1x231, x2格里汶科定理:(1933 年)对于任意一实数 x ,当 n时, Fn ( x ) 以概率 1 收敛于分布函数 F ( x )P lim sup Fn ( x)F ( x)0 1nx三个重要分布( 1)分布设为独立标准正态变量,称随机变量的分布为自由度为其密度函数为:1n11x x0 x 2e 2f ( x )2n 2( n )2x00性质:(1)若 2 :2 (n ), 则 E ( 2 )n, D (2 )2n因为 X i : N (0,1)所

13、以: E ( X i )0, D ( X i )1E (X i2 ) D (X i ) 1nE( 2) E(X i2 ) ni1又 D ( X i2 ) E ( X i4 ) (E ( X i2 ) 2E ( X i4 )13 1 2,( i的分布,记为。1,2,L n)其中:E ( X i4 )123214 gt 213 gt 2t2t2dt22eted ()22t 2t 21t 2(t 3 gde 2 )t 3gde 2e 2 dt 32t23t2t 23tde2(te 2 )e2 dt2213 gt 22tde2t 2t 2 e 2 dt2e 2 dt32) 2 分布的可加性设 12 :

14、 2 ( n1 ), 22 : 2 ( n2 ) ,并且相互独立,则有:22:2( n1n2 )12( 3)2 分布的分位点对于给定的正数(01) ,称满足条件P (22 (n)2f ( x )dx(n)的点2 (n) 为 2 (n) 分布的上分位点。( 2) t 分布设随机变量 X 与 Y 独立,则称的分布为自由度n 的 t 分布,记为。分布又称为学生氏分布,其密度函数为:( n1) 22n1t) 2,th(t )(1n(n 2)nt 分布的分位点:对于给定的正数(01) ,称满足条件P (t t ( n)h(t )dtt ( n )的点 t ( n) 为 t (n) 分布的上分位点。其中:

15、 t1 (n)t ( n)(3)F 分布设随机变量 U 与 V 相互独立,则称的分布为自由度的F 分布,记为。密度函数为:nmn n 1( n ) 2 y22mn m( y)( m ) 1ny2( n)22m00 y 0由定义知:若则 1 : F (m , n)F分布的分位点对于给定的正数(01) ,称称满足:P(FF (n, m )( y)dyF( n,m )的点为 F 分布的上分位点,且有抽样分布有限总体的抽样分布定理 1、设总体中个体总数(也称总体大小)为N ,样本容量为 n(nN ) 且总体有有限均值,方差2 ,则(i )E ( X )(ii ) 当抽样是有放回时( X )n当抽样是无

16、放回时( X )NnN1 n其中(X)即为 X 的标准差。单正态总体的抽样分布设总体 X (不管服从什么分布,只要均值和方差存在)的均值为,方差为2 ,X1 , X 2 ,LX n 是来自 X 的一个样本,X , S2 分别是样本均值和样本方差,则有:2E(X),D(X)n1nE(S2) E( X i X )2n1 i 11n2而1 i 1E (X i2 ) nE ( X )nE(S2)21nX i22E(nX1)ni11n2(22 )n(2 )2n 1i 1n定理 2、设 X1, X 2 ,L X n 是来自正态总体 X : N ( ,2 ) 的一个样本, X 是样本均值,则有:2X( i

17、) X:N ( ,:N (0,1)n);( ii )n定理 3、设 X 1, X 2 ,L X n 是来自正态总体 X : N ( ,2) 的一个样本, X ,S2 分别是样本均值和样本方差,则有:( n1)21n22(i )S( X iX ):(n 1)22i 1(ii ) X 与 S2 相互独立。定理 4、设 X 1, X 2 ,L X n 是来自正态总体 X : N ( ,2 ) 的一个样本, X , S2 分别是样本均值和样本方差,则有:( n1)S21n( X i)2:2(n)(i )22i 1(ii )TX:t (n1)Sn注: X: N (0,1), n21S2 :2 (n1)n

18、Xn1S2:t( n 1)T2 ( n 1)n双正态总体的抽样分布定 理5 、 设X1 , X 2 ,LXn1 与 Y1 ,Y2 ,L Yn2分 别 是 来 自 正 态 总 体N( 1, 12)和N( 2, 22)的样本,且这两个样本相互独立,设1n11n2Yi分别是这两个样本的样本均值;XX i , Yn1i1n2i1S121n1X )2, S221n2Y )21 i( X i(Yi分别是这两个样本的样本方差。则n11n21 i 1有:(1)S12 S221,n2 1);22 : F ( n112(2) 当222时12(X Y) (12 ) : t (n1n22)Sw11n1n2其中: Sw2(n11)S12(n21)S22, SwSw2n1n22证明:(1)( n 1)S2:2(n1( n 1)S22( n21)1211),222 :12因为 S12 , S22相互独立,则由 F 分布定义( n11)S1221(n11):F (n1 1, n21)S12 S22( n2222 :

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论