第6章_数理统计的基本概念_第1页
第6章_数理统计的基本概念_第2页
第6章_数理统计的基本概念_第3页
第6章_数理统计的基本概念_第4页
第6章_数理统计的基本概念_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 从本章起,我们转入课程的第二部分从本章起,我们转入课程的第二部分 数理统计学。数理统计学与概率论是两个密切数理统计学。数理统计学与概率论是两个密切 联系的姊妹学科。联系的姊妹学科。 大体上可以这样说,大体上可以这样说,概率论是数理统计学的概率论是数理统计学的 基础,而数理统计学是概率论的重要应用。基础,而数理统计学是概率论的重要应用。 数理统计学是这样一门学科:它使用概率论 和其它数学方法,研究怎样收集怎样收集(通过试验和 观察)带有随机误差的数据,并在设定的模型 (称为统计模型)之下,对这种数据进行分析分析 (称为统计分析),以对所研究的问题作出推推 断断(称为统计推断)。 由于所收集的统

2、计数据(资料)只能反映事 物的局部特征,数理统计的任务就在于从统计数理统计的任务就在于从统计 资料所反映的局部特征以概率论作为理论基础资料所反映的局部特征以概率论作为理论基础 去推断事物的整体特征。去推断事物的整体特征。 总体、样本和统计量总体、样本和统计量 6.1.1 6.1.1 总体与样本总体与样本 在数理统计中,我们将研究对象的某项数量指标的 值的全体称为总体总体,总体中的每个元素称为个体个体. 比如,对电子元件我们主要关心的是其使用寿命. 而该厂生产的所有电子元件的使用寿命取值的全 体,就构成了研究对象的全体,即总体,显然它是 一个随机变量,常用X表示. 为方便起见,今后我们把总体与随

3、机变量为方便起见,今后我们把总体与随机变量X X等同起来看,等同起来看, 即总体就是某随机变量即总体就是某随机变量X X可能取值的全体可能取值的全体. .它客观上存在它客观上存在 一个分布,但我们对其分布一无所知,或部分未知,正一个分布,但我们对其分布一无所知,或部分未知,正 因为如此,才有必要对总体进行研究因为如此,才有必要对总体进行研究. . 按机会均等的原则随机地从客观存在的总体 中抽取一些个体进行观察或测试的过程称为随随 机抽样机抽样.从总体中抽出的部分个体,叫做总体的一 个样本样本. 从总体中抽取样本时,不仅要求每一个个体被 抽到的机会均等(代表性代表性),同时还要求每次的抽 取是独

4、立的(独立性独立性),即每次抽样的结果不影响 其他各次的抽样结果,同时也不受其他各次抽样结 果的影响.这种抽样方法称为简单随机抽样简单随机抽样.由简 单随机抽样得到的样本叫做简单随机样本简单随机样本.往后如 不作特别说明,提到“样本样本”总是指简单随机样本总是指简单随机样本 . . 从总体从总体X中抽取一个个体中抽取一个个体, ,就是对随机变量就是对随机变量X进行一次试验进行一次试验. . 抽取抽取n个个体就是对随机变量个个体就是对随机变量X进行进行n次试验次试验, ,分别记为分别记为X1, X2, , Xn.则样本就是则样本就是n n维随机变量维随机变量(X1,X2,Xn).在一次抽样以后在

5、一次抽样以后, , (X1, X2, ,Xn)就有了一组确定的值就有了一组确定的值(x1, x2, ,xn),称为称为样本观样本观 测值测值. .样本观测值样本观测值(x1, x2, ,xn)可以看成一个随机试验的一可以看成一个随机试验的一 个结果个结果, ,它的一切可能结果的全体构成它的一切可能结果的全体构成一个一个样本空间样本空间. . 称称(X1, X2, ,Xn)为样本,为样本,n为为样本容量样本容量. . 总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观察值,去推断总样本观察值,去推断总 体的情况体的情况总体分布总体分布.

6、样本是联系两者的桥梁样本是联系两者的桥梁. 总体分布决定了样本取值的概率规律,也就是样本取总体分布决定了样本取值的概率规律,也就是样本取 到样本观察值的规律,因而可以用样本观察值去推断到样本观察值的规律,因而可以用样本观察值去推断 总体总体. 总体、样本、样本观察值的关系总体、样本、样本观察值的关系 统计量的定义统计量的定义 设设X1,X2,Xn为来自总体为来自总体X的的 样本,称样本,称不含未知参数的样本的函数不含未知参数的样本的函数 g(X1,X2,Xn) 为统计量为统计量 若若x1,x2,.,xn为样本观测值,则称为样本观测值,则称 g(x1,x2,.,xn)为统计量为统计量g(X1,X

7、2,Xn)的的 观测值观测值. 统计量是处理、分析数据的主要工具对统计量统计量是处理、分析数据的主要工具对统计量 的一个最基本的要求就是可以将样本观测值代入的一个最基本的要求就是可以将样本观测值代入 进行计算,因而不能含有任何未知的参数进行计算,因而不能含有任何未知的参数 【例例】设设X1,X2,Xn是来自总体是来自总体X的样本,的样本, XN( , 2),其中,其中 、 2为未知参数,则为未知参数,则 X1, min X1,X2,Xn 均为统计量,但诸如均为统计量,但诸如 等均不是统计量,因它含有未知参数等均不是统计量,因它含有未知参数 或或 , 3 1 2 1 21 XX ,)( 1 1

8、2 n i i X n 1 X 为了用概率的方法探讨一个统计量在推断总体为了用概率的方法探讨一个统计量在推断总体 时的性能或把握推断结论的置信程度,我们必时的性能或把握推断结论的置信程度,我们必 须要知道统计量的分布或近似分布须要知道统计量的分布或近似分布. .统计量的分统计量的分 布,通常称为布,通常称为抽样分布抽样分布. . 先讨论统计量的数字特征先讨论统计量的数字特征. . 12 2 2 2 2*22 , , , 1 6.3. , (1) 2, . 1 n nn X XXXE X Var X E XVar X n n E SE S n 设()是取自总体 的一个样本, 则 () ; ()

9、= 命题 111 2 2 2 111 2 222 11 2 2 11 222 22 1 111 1 111 11 (2)()(2) 1 (2) 11 2 nnn ii iii nnn ii iii nn niii ii nn ii ii n ii ii E XEXE X nnn Var XVarXVar X nnnn SXXXX XX nn XXXnX n XXXXX nn 证明: () 1 n 22 222 11 2 22222 1 22 1 22222 *22 11 1 ( )( ) ( )( ) 1 ( ) ( ) 111 () 11 nn nii ii n iii i n ii i n

10、n E SEXXE XE X nn E XE XE XE XE XE X n Var XE XVar XE X n n nn nnn nn E SESE nn 22 n S 1. 2分布分布(为简便计,不通过(为简便计,不通过分布,直接给出分布,直接给出 2 2分布分布定义定义 ) 命题命题6.3.2 设设X1,X2,Xn为相互独立的随机变量,它们都服从标为相互独立的随机变量,它们都服从标 准正态准正态N(0,1)分布,则称随机变量分布,则称随机变量 服从服从自由度自由度为为n的的 2分布分布,记为,记为 2 2(n) 此处自由度指此处自由度指 2中包含独立变量的个数中包含独立变量的个数 可以

11、证明,可以证明, 2(n)的概率密度为的概率密度为 其中其中 ( )称为伽马函数,称为伽马函数, 22 1 n i i X 2 1 22 2 2 1 ,0 ( ) 2 ( ) 0,0 nx n n x ex fx x 0,)( 0 1 dxex x 2分布概率密度分布概率密度 o o 图图6.1 2(n)分布的概率密度曲线分布的概率密度曲线 可以看出,随着可以看出,随着n的增大图形趋于的增大图形趋于“平缓平缓”,其图形下区域,其图形下区域 的重心亦逐渐往右下移动的重心亦逐渐往右下移动 0, 0 0, )(2 1 )( 2 1 2 2 2 2 x xex xf xn n n 2分布具有下面性质:

12、分布具有下面性质: (1) (可加性可加性) 设设 是两个相互独立的随机变量,且是两个相互独立的随机变量,且 (2) 设设 证明证明 (1) 由由 2分布的定义易得证明分布的定义易得证明 (2) 因为因为 存在相互独立、同分布于存在相互独立、同分布于 N(0,1)的随机变量的随机变量X1,X2,Xn,使,使 则则 )(),(),( 21 22 2 2 12 22 21 22 1 nnnn 则则 n i i X 1 22 22 1 n i i EEX 2 1 n i i E X 1 n i i D Xn 2 2 2 1 , .2)(,),( 2222 nDnEn )(则则 ),( 22 n 由于

13、由于Xi独立,且注意到独立,且注意到N(0,1)的四阶矩为的四阶矩为3,可得,可得 英国统计学家费歇(英国统计学家费歇(R.A.Fisher)曾证明,)曾证明, 当当n较大时,较大时, 近似服从近似服从 22 1 n i i VarVar X 422 1 ( ) n ii i E XE X (3 1)2 1 n n i )(2 2 n ).1 , 12( nN 关于关于 2 2分布以及后面将要讲到的分布以及后面将要讲到的t t分布、分布、F F分布,分布, 要求做到以下两点:要求做到以下两点: (1 1)从正向理解三种分布的定义,即三种分布)从正向理解三种分布的定义,即三种分布 是由哪些分布衍

14、生出来的,什么样的随机变量是由哪些分布衍生出来的,什么样的随机变量 服从上述三种分布;服从上述三种分布; (2 2)从逆向理解三种分布的定义,即如果某随机变量)从逆向理解三种分布的定义,即如果某随机变量 服从上述三种分布之一种,则该随机变量可以写成什服从上述三种分布之一种,则该随机变量可以写成什 么样的表达式(哪种随机变量的衍生式)么样的表达式(哪种随机变量的衍生式). . 至于服从上述三种分布的随机变量的密度函数形式不要至于服从上述三种分布的随机变量的密度函数形式不要 求记忆。求记忆。 2. t分布分布 命题命题6.3.3 设设X N(0,1),Y 2(n),X与与Y独立,则称随机变独立,则

15、称随机变 量量 服从自由度为的服从自由度为的t分布分布,又称为学生氏分布,又称为学生氏分布 (Student distribution), 记为记为T t(n) 可以证明可以证明t(n)的概率密度为的概率密度为 图图6-2 t分布的概率密度曲线分布的概率密度曲线 nY X T x n x n n n xf n t ,1 2 2 1 )( 2 1 2 图图6.2 t分布的概率密度曲线分布的概率密度曲线 显然显然t分布的概率密度分布的概率密度是是x的偶函数,图的偶函数,图6.2 描绘了描绘了 n = 1,3,7时时t(n)的概率密度曲线作为比较,还描绘了的概率密度曲线作为比较,还描绘了 N(0,1

16、)的概率密度曲线的概率密度曲线 x n x n n n xf n t ,1 2 2 1 )( 2 1 2 可看出,随着可看出,随着n的增大,的增大,t(n)的概率密度曲线与的概率密度曲线与N(0,1)的概率的概率 密密 度曲线越来越接近度曲线越来越接近 可以证明可以证明t分布具有下面性质:分布具有下面性质: 即当即当n趋向无穷时趋向无穷时,t(n)近似于标准正态分布近似于标准正态分布N(0,1) 一般地,一般地, 若若 n 30,就可认为,就可认为t(n)基本与基本与N(0,1)相差无几了另外,经简相差无几了另外,经简 单积分可知,若单积分可知,若 则则 nexf x t , 2 1 )( 2

17、 2 ( )X t n 2 0(1), (2) 2 E XnVar Xn n 3. F分布分布 命题命题6.3.4 设设X 2(m),Y 2(n),且,且X与与Y独立,称随机变量独立,称随机变量 服从自由度为服从自由度为(m,n)的的F分布分布,记为,记为FF(m,n)m, n分别称为第一分别称为第一 自由度和第二自由度自由度和第二自由度. 可以证明其概率密度函数为可以证明其概率密度函数为: o Xm F Yn 21 2 2 2 ,0 ( ) 1 22 0,0 m m mn F mnm x n x fx mnm x n x 图图6.3 F分布的概率密度曲线分布的概率密度曲线 由由F分布的定义分

18、布的定义 容易看出,容易看出, 若若F F(m,n),则,则1/F F(n,m) X m F Y n 在统计推断(区间估计和假设检验)中,已知总体在统计推断(区间估计和假设检验)中,已知总体X X 的分布及某概率值的分布及某概率值,需要知道,需要知道X X小于等于哪个数的小于等于哪个数的 概率为概率为,这个数称为,这个数称为X X的的分位数,也就是,分位数,也就是, 设设XX( (n n)()(为某种分布,为某种分布,n n为有关自由度为有关自由度) ), 001,1/2的分位数,需利用对称性间接查的分位数,需利用对称性间接查1/2的分位数,对称的分位数,对称 性指的是以下三个性指的是以下三个

19、关系式,根据这三个分布的定义和特点很容关系式,根据这三个分布的定义和特点很容 易得到易得到. 11 1 1 ,( , ) ( , ) uuttF mn Fnm 0.990.05 (3)(5,4),(3,7)FF 12 22 2 (,.,)(0,1) 1 ,(0, )(1), 6.3.1 n n n XXXXN XNnSnX n S 设是来自总体 的一个 (抽样分布基本 样本 则样本均值,样本 定理) 方差并且 与 相互独立. 定理 一、单个正态总体的抽样分布一、单个正态总体的抽样分布 推论推论6.3.1 设(X1,X2,Xn)是来自总体XN(,2)的一个 样本,则 2 *2 2 1 22 ()

20、 (1) (2)(1) n i ni XX nS n 2*2 (1); nn XS S样本均值 与样本方差(修正) ()相互独立 * () =-1 (1) nn XnX nt n SS 2 12 2 (,.,)(6.3.2,) , n n X XXXN XS 设是来自总体的 一个样本与 分别为其样本均值与样本 推 方差 论 则 ) 1 , 0( )( / , ),( 2 N Xn n X n NX 即因为 2 *2 2 1 22 () (1) (1) n i ni XX nS n 又 证明:证明: 且它们表示的随机变量是相互独且它们表示的随机变量是相互独 立的立的, ,故故 * *2 2 ()

21、/ (1) (1) (1) nn n X XnXn Tt n SS nS n 解:解: ) 1 , 0( /2 N n X n X (0.05) (1 0.95)/2 0.975n ) 1 . 0|(|XP nn X n P /2 1 . 0 /2/2 1 . 0 )05. 0()05. 0 (nn95. 01)05. 0(2n 所以 解解 : *2 2 (101) (9) 4 n S *2*2*2 999 (2.622)2.62215.8995 , 444 nnn P SPSPS 查表得 2 0.25(9) 5.899 则有 *2 (2.622) 0.75 n P S 由于 二、两个正态总体

22、下的抽样分布二、两个正态总体下的抽样分布 12 2 11 *22 1 11 2 1222 *22 2 11 ,(,.,) (,): 11 ,() 1 ( ,.,)(,), 11 ,() 1 m mm imi ii n nn ini ii XYX XX XN XXSXX mm Y YYYN YYSYY nn 设总体 与 相互独立是来自 总体的一个样本 是来自总体的一个样本 12 22 12 () () (0,1) / XY N mn 结论结论1: 证证 明明: 22 12 12 (,)(,)XNYN mn 由于与独立 22 12 12 (,)X YN mn 所以 12 22 12 ()() (0

23、,1) / XY N mn 因此 12 () () (2) 11 w XY t mn S mn *2*2 2 12 (1)(1) 2 mn W mSnS S mn 其中 注注: :此结论只有在两个总体的方差相等时才成立此结论只有在两个总体的方差相等时才成立. . 12 2*2 11 2 122 *2 2 ,(,.,) (, 2(6.3.4 ), ;( ,.,)(, ): ) ,; m m n n XYX XX XNXS Y YYYN YS 设总体 与 相互独立 是来自总体的一个样本与分别为其样 本 结 均值与修正样本方差是来自总体 的一个样本与分别为其样本均值与修正 推论 样本方差 论 则 2

24、 1 (,)XN m 12 ()() (0,1) 11 XY UN mn 2 2 (,)YN n 1 *2 2 2 (1) (1) m mS m 2 *2 2 2 (1) (1) n nS n *2*2 2 22 22 (1)(1) (2) mn mSnS Vm n 12 () () (2) /(2)11 w X YU Tt m n Vm n S mn 证明证明: (1)因为 所以 (2)因为 (3)故 所以 2*222 1122 22*22 2121 1 (1,1) 1 mm nn mSSn FF mn nSmS *2 1 *2 2 (1,1) m n S FF mn S 特别,当12 =

25、22时,有 12 2*2 11112 2*2 222 ,(,.,) (,),;( ,.,) (,) 3 ,; : m mn n XYX XX XNSY YY YNS 设总体结论(推论6.3.3)与 相互独立是来 自总体的一个样本为其修正样本方差 是来自总体的一个样本为其修正样本方差 则 证明证明: 1 *2 2 2 1 (1) (1) m mS m 2 *2 2 2 2 (1) (1) n nS n 2 *2 1 2 1 *2 2 2 (1) / (1) (1,1) (1) / (1) n m mS m F mn nS n 1 2 *2 2 2 *22 1 (1,1) m n S F mn S 由F分布的构造知 即 由于 且相互独立 2 21 12 2 2 1 2 1 () (,) () 3. m i i n j j nX FF m n mY 证明与结论 类似 12 22 111222 ,(,.,) ( ,);( , ,.,) ; : (, 4 m n XYX XX XNY Y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论