概率论与数理统计_第1页
概率论与数理统计_第2页
概率论与数理统计_第3页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 统计量与抽样分布数理统计是收集数据,分析数据,并作出推断的一门学科。数据通常来源于两个方面, 一类是通过设计,安排试验获得数据,另一类是通过调查、观察、访谈等获得数据。前者可 以通过正交试验、均匀试验等方法的学习,科学合理安排实验,以较少的实验次数,找到最 佳的实验条件,提高效益;后者通过学习抽样调查技术,使获得的数据精确性高, 代表性强,费用省。不过这局部内容不是数理统计的主要内容,在下面会介绍一种最根本的抽样方法一简单随机抽样,从而获得简单随机样本。这里主要介绍统计推断的思想与方法一一参数估 计与假设检验。下面先介绍根本概念。4.1总体与样本三个分布总体是指研究对象的全体, 总体中

2、的每个元素称为 个体。如某厂在某天生产的全部元件构成 一个总体,其中的每个元件就是个体。我们可以关注元件的很多方面,如材料的成分、质量指标,元件的使用寿命等;又如,我们关心某大学2021年招收的学生,那么该校2021年入学的全体学生构成总体,每个学生就是一个个体。对于每个学生,他的身高、体重、肺活量、 高考成绩、每月生活费等等,有很多指标,我们往往只关心其中的某个指标,因此总体就是 研究对象的某个数量指标值的全体,它是有一定分布的, 于是就有了,总体是一个随机变量X,它有分布函数Fx,但是人们对分布函数并没有完全了解,甚至可能了解的信息非常少,于是就要对总体的分布提出一定的假设。例例如:生产厂

3、家声称他们生产的灯泡平均寿命不低于6000小时,如何验证厂家说法的真伪?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡进行检验,通过这局部灯泡的寿命数据来推断整批灯泡的平均寿命。以局部数据信息来推断整体未知参数,就是数理统计研究问题的根本方式。数理统计中的统计推断主要是参数方法。为了推断总体中的未知参数,需要从总体中获得数据。称Xj|,Xn是从总体X中获得的容量为n的一个简单随机样本,如果满足1独立 性,XJHXn相互独立;2代表性,Xj与X同分布,i=1,n。如何获得简单随机样 本?可以从总体中采用放回抽样取n次,那么X1JH, Xn独立同分布,Xi与总体的分布相

4、同,所以X1,lH,Xn为X的简单随机样本,实际中,当总体的元素非常多,或者是无限总体时, 常采用不放回抽样获得样本。需要注意的是,简单随机样本XjH,Xn是n个独立同分布的随机变量,一旦实施了抽样,就得到n个数值xJH,焉,称为样本观测值。例4.1.2 :有四个同学参加了?概率论与数理统计?课程考试,成绩分别为88,75,70,63.X表示这四人的成绩,1 写出总体X的分布律,数学期望和方差;2从总体中 抽取容量为2的样本,列出全部的样本值解:X88757063p1/41/41/41/4E(X) =(88 75 70 63); 4 = 74,D(X)二(88 - 74)2 (75 - 74)

5、2 (70 - 74)2 (63 - 74)2/4 = 83.5 (2)样本(Xi,X2)取值(xi,x2)有16个样本值.P(X = X2 = x2) = 16,具体(X,x2)如下表所示(88,88)(88,75)(88,70)(88,63)(75,88)(75,75)(75,70)(75,63)(70,88)(70,75)(70,70)(70,63)(63,88)(63,75)(63,70)(63,63)例,总体XN(J;2),叫二2未知,从总体获得样本 XJIIXn,要估计未知参数2 7匚,就要构造样本的函数 T(X1J|,Xn),如果T(X!|,Xn)中不包含未知参数,称T(X!,川

6、,Xn)为统计量。常见的统计量有:(1)(2)1 n -样本方差s2二 (Xj _X)2,n 1 i 吕(3)1 n样本k阶矩AkX:,n imn_样本k阶中心矩Bk =丄7 (Xj -X)k, n i =i统计量是随机变量,而总体矩E(X),D(X), E(Xk),E(X -E(X)k,如果存在的话,是数,在数理统计中,这些数往往是未知的。下面介绍统计中非常重要的三个分布。2分布设随机变量X1JH,Xn独立同分布,nX1N(0,1),那么2=vx22(n称为自由度为ni=1的2分布。其概率密度为x 0,,以下图为概率密度示意图。0,x 乞 0.图4.1自由度为2, 4, 8, 12的卡方分布

7、概率密度示意图2分布的性质:(1)假设 X 2(n),那么 E(X)二 n, D(X) = 2n。证明:由nnn2 定义,X 八 Xi2 2(n), E(X)八 E(Xi2)八 D(Xi ) =n,i -1i=4i -1nnD(X)八 D(Xj2)八E(X:) -(E(X:)2二n(3-1) = 2n ,i 4i 4/x这里 E(X:)二X3_x2 2e-3X_v2 2e2dx = 3。近2二假设 X 与 Y 相互独立,X 2 (n), Y 2(m),那么 X Y 2 (n m)。证明:由条件可以设 X1J|,Xn,Xn , JI|,Xn m是n+m个独立的同服从标准正态分布的随机nmn -m

8、变量,那么 X=7Xj2 2(n), Y 八2(m),于是 X Y 八X: 2(n m)。i 1i =1i =1称2(n)是自由度为n的2分布上分位数,如果X 2(n), P(X 2.(n) =,。2.(n) 可以通过查表或在 Excel表中。2例设总体X N(二),XjH,Xn为总体X的简单随机样本,证明:样本均值X N(),c2),n;(X)2i理c22(n)。证明:XXi是正态分布随机变量的线性函数,所以X服从正态分布,- 1E(X)E(Xi)n1 n 2D(X)D(Xi),从而n n. 2 N牡,-);因为nCT独立同服从标准正态分布,按照卡方分布定义,CT2(n)。t分布- 2X设随

9、机变量X N(0,1), Y (n) , X与Y相互独立,称T =t(n)是自由度为n的t分布,也称为学生氏分布。这是一个对称分布,其概率密度为ft(n)(X)=2(n1) 2(r X_)4n 1) 2.n二丨(n 2) n-::x ::。F图是t分布和标准正态分布概率密度示意图。图4.2 t(1),t(2),t(10)和标准正态分布概率密度示意图称 t.(n)为 t(n)的上:分位数,假设 T t(n),P(T . t.(n)二:。三.F分布设随机变量X 2(n), Y E2(m) , X与Y相互独立,称FY mF(n,m)是自由度为(n, m)的F分布。其概率密度为f (、H(nfm2(n

10、. m)n2x(n2)F(n,m)(x) - (n 2) (m 2)1 (nx m)(n m) 2F图是F分布概率密度示意图。图4.3F(10,40), F(11,3)分布概率密度示意图F 分布性质:(1) F F( n, m),= FF(m, n)。X n F (n,m),因此,证明:由定义,X 2(n), Y 2(m), X与Y相互独立,F =Y: mF (m, n)。(2) T t( n),= T2 F (1, n)。2X证明:由定义,X N(0,1) , Y 2(n), X与Y相互独立,Tt( n),因此,X 2 x 2 ix22(1),且与Y相互独立,所以,讥齐=齐F(1,n)。称F

11、一.(n, m)为F (n,m)的上分位数,假设FF(n,m), P(F . F. (n, m)二:。于是由性质(),有 R/n, m)=1F(m, n)4.2抽样分布如果总体XF(x;R,-(可,.,耳)是未知参数(如正态分布N(,2),J c2未知;均匀分布U(a,b), a,b未知;泊松分布 二(未知等),通过获得简单随机样本 X1|,Xn,对未知参数进行估计检验等。由于未知参数往往是总体均值、方差的函数,而对于未知的均值和方差,可以用样本均值和样本方差进行估计,这样估计的依据和效果在后面的两章进行分析,这其中要涉及估计量的分布,称为抽样分布,在这一节介绍。(一)正态总体的抽样分布定理4

12、21设总体XN(;2),X1,川,Xn是X的简单随机样本,X和S2分别是样本均值和样本方差。那么有(1)X N(即 X,N(0,1);0Qn(2)(n- 1)S2n (Xi -X)22(n-1),且X与S2相互独立;X t(n1),其中 S =S n证明:(1)证明见例4.1.4 ;(2 )的证明比拟复杂,略;X - 1(3)因为N(0,1),X - 1sn2 2 (n-1),且X与S相互独立,由t分布定义,(n -1) t(n -1)。定理422设有两个相互独立的总体X (叫2),丫 NC打),X1,IH,Xn和YJH,Ym分别为X和Y的两个独立的简单随机样本,X ,Y分别是样本均值,S2,

13、M分别为样本方差。那么有(4)X -Y N(叫9 打(X -丫)-(叫-2)2),即( ( 2) N(0,1);m匚2(X _YL22)t(n m-2),其中Sw; 1 - 1 n m 2 2二 5-怡(m)S2nm无(Xi - X)2+I: (Y-Y)2i 生i=1n m -2n m -2(6) F (n -1,m -1)。证明:(4)由定理421(1),X N Cl1,_ 2),YN(n2,_ 2- 2-),X,Y相互独立,所以m2X _Y N( 7- 2, 1(5)因为 J2=;2,所以(X -丫)十2)N(0,1) ,由卡方分布可加性,二 11;n m22C2(n T)S一2(n m-2),再由t分布定义,X 一丫一叫2Sw=X -丫-叫 一2十2恵 “mJ t(n m -2).X,Y分别是样本均值,s2 , &分别为样本方差。判断以下统计量的抽样分布:(1)12X5 S1,2a 区-X)2i 416Y2i 412 X _Y解:1由定理 4.2.2 4 N0,1,由定理 2,8S2分布定义,12X_Y9512X -YL8;2由定理4.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论