版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1、数理统计基础1.1随机变量观测或试验的一种结果,称为一个事件。在一定条件下进行大量重复试验 时,每次都发生的事件,称为必然事件(0);反之,每次都不发生的事件,称 为不可能事件();有时发生有时不发生的事件,称为随机事件或偶然事件(A )。随机事件的特点是在一次观测或试验中,它可能出现,也可能不出现,但 在大量重复观测或试验中呈现统计规律性。用来描述事件发生可能性大小的量 就是概率。概率的统计定义是:在相同条件下进行 n次重复试验,事件A发生了 m次, 称m为事件的频数,称m/n为事件的频率。当n足够大时,频率m/n稳定地趋 向于某一个常数p,此常数p称为事件A的概率,记为P(A) = p
2、,即:P(A)二lim(1.1 )即概率是频率的极限值。由概率的定义可归纳出概率的三个基本性质:(1) 必然事件门的概率等于1,即p()=1;(2) 不可能事件门的概率等于0,即PC:-)=0;(3) 任何事件的概率都介于0和1之间,即0W P(A) < 1小概率原理:当某一事件的概率非常接近于 0时,说明这个事件在大量的 试验中出现的概率非常小,这样的事件称为小概率事件。小概率事件虽然不是 不可能事件,但在一次连续试验中出现的可能性很小,一般可以认为不会发生, 此即为小概率原理。概率的三个定理:(1) 互补定理:某事件发生的概率与不发生的概率之和为1。当发生的概率为p,则不发生的概率为
3、1- p。全部基本事件之和为必然事件。(2) 加法定理:相互独立而又互不相容的各个事件,其概率等于它们分别出现之和。例如,A , A,An为相互独立而又互不相容的事件,其中任一事件出现的概率为各个事件概率的总和,即nP(A)=P(Ai)+P(A+ +P(A)=p(A)( 1.2 )i丄(3) 乘法定理:相互独立的事件同时发生的概率是这些事件各自发生的概 率的乘积,即nP(AA2An) =P (Ai) P (A)P (An) = P(Ai)(1.3 )i A随机变量与分布函数每次试验的结果可以用一个变量 X的数值来表示,这个变量的取值随偶然 因素而变化,但又遵从一定的概率分布规律,这种变量称为随
4、机变量。随机变量根据其取值的特征可以分为离散型随机变量和连续型随机变量。离散型随机变量试验结果的可能值可以一一列举出来,即随机变量X可取的值是间断的、可数的。连续型随机变量试验结果的可能值不能列举出来,即随机变量 X可取的值是连续充满在一个区间的。随机变量是随机现象的数量化,可以用:X = x表示某事件;P ( X = x)表示该事件出现的概率;F ( x) =P ( X v x)表示X v x的概率,并定义为随机变量X的概率分 布函数,用来描述随机变量的统计规律。连续型随机变量X的分布函数的表达式为:xF(x) = P ( X v x) = _f(x)dx(1.4)式中,f (x)称为随机变
5、量X的概率密度函数(或简称概率密度)。正态分布是连续型随机变量最常见的一种分布。正态分布的概率密度函数f(x)和概率分布函数F(x)分别为:f(x)(1.5)彳(x-M)21x2F(x)(1.6 )e 2二 dx打、2- f以X的取值x为横坐标,以概率密度函数f(x)为纵坐标,正态分布的图象如图1.1所示。图中的曲线即为概率密度函数f (x),积分区间内的曲线与横轴之间所包含的面积就是概率分布函数 F(x),亦即随机变量X的概率。图1.1正态分布示意图f (x)的图象具有如下性质:a、为随机变量X 一系列取值的中位值(或称均值),f(x)对称于直线x = 丄,且f (x) >0,曲线位于
6、横轴的上方。它向左右无限延伸,并以横轴为渐近线。b、当x = J时,f (x)取最大值:x离"越远f(x)越小,这表明对于同样长度的区间,当区间离"越远,X落在这个区间上的概率越小。C、参数C为曲线拐点的横坐标,其大小决定了正态曲线的形状特点,C愈大曲线愈平缓,C愈小曲线愈高陡。可以看出,正态分布主要取决于 J和C两个参数,称J为随机变量X的数 学期望,c2为随机变量X的方差。当随机变量X服从正态分布时,常记作 XN (卩,c2)。如令随机变量t =( x-卩)/ c,通过变量转换,可由一般正态分布推算得 随机变量t的概率密度函数(t)及相应的概率分布函数"(t)
7、:t2:(t)二1 e 2 -2-1 t -2戈2"(1.7 )(1.8 )这种分布称为标准正态分布,是正态分布中,二0,c 2= 1的特例。当随机变量服从标准正态分布时,常记作 XN (0,1)通常将t(t)制成数值表,称t为标准正态分布的分位数。如已知t,即 可从表中查得相应的G(t);反之,亦然 标准正态分布与一般正态分布具有如下关系:x . -F(x)二(-)(1.9 )因此,对于任意正态分布 N (卩,(T2),当已知x,需求相应的F (x)时,均可 通过下式变换Xtu(1.10 )算得对应于x的t值,再在标准正态分布函数数值表上查得相应的概率。正态随机变量中有三个重要的概
8、率值(见图 1.2 ),它们分别是P(卩-(T v XW 卩 + c ) =0.6826,P(卩-2 c v XW 卩 +2 c ) =0.9544,P(卩-3 c v Xw 卩 +3 c ) =0.9973。图1.2正态分布的三个重要概率值注意到第三个概率值,对于正态随机变量 X来说,它落在卩土3 c内的概率 约为99.7%,落在卩土 3 c外的概率约为0.3%。可见,在具有正态分布特征的试 验中,其数据落在卩土3 c以外的概率是很小的,可视为“小概率事件”。因此, 试验中一旦出现卩土3 c外的数据,根据“ 3c规则”,即可将其认为是“可疑数 据”而予以剔除,或是工艺过程出现异常,应予注意。
9、例1.1已知一批强度等级为 C25的混凝土,其抽样试件的抗压强度平均值为30.0MPa,标准差为5.0MPa,设该混凝土的抗压强度R服从N(30.0 , 5.0)的正态分布,试计算抗压强度高于25.0MPa的概率(即求该混凝土的强度保证率)。解P ( R > 25.0 ) =1- P ( R v 25.0)=1->(t)=1-门严一30.0)5.0=1-门(-1.0)=1-0.1587=0.8413即该批混凝土的强度保证率为 84.1%。由此可见,对于标准差为 5.0MPa的C25混凝土,即使其抗压强度平均值为30.0MPa时,仍不能达到相关规范所规定的95%勺强度保证率。例1.2
10、条件同例1.1,其试件抗压强度平均值 m为多少时,才能使该 混凝土的强度保证率达到95%解由 P ( R > 25.0 )= 1- P ( R V 25.0 )= 0.95得t = 250 m = -1.6455.0m = 25.0 + 1.645 X 5.0 = 33.2MPa上式中,t被称为强度保证率系数,它对应于 95%勺强度保证率。1.2随机变量的数字特征由上所述,利用分布函数或分布密度函数可以完全确定一个随机变量。但 在实际问题中,求分布函数或分布密度函数不仅十分困难,而且常常没有必要。 用一些数字来描述随机变量的主要特征,显得十分方便、直观、实用。描述随 机变量某种特征的量称
11、为随机变量的数字特征。数学期望数学期望又称均值,记作E (X)(正态分布的4),其计算公式为:QC当X为离散型时E(X) =Xi Pi( 1.11)i =1oO当 X为连续型时E(X)xf(x)dx(1.12)数学期望描述了随机变量的取值中心,但它不是简单的算术平均,而是以概率为权的加权平均。数学期望有如下性质(下式中c、k、b均为常数):(1) E (c )= c(1.13a )(2) E (kX)= kE (X)(1.13b )(3) E (X+b)= E (X) +b(1.13c )(4) E (kX+b)= kE (X) +b(1.13d)(5) E (X+Y = E (X) +E (
12、Y)(1.13e )(1.13f )(6) E (XY= E (X) E (Y) +Cov (X,Y)称 Cov (X, Y)为协方差,当X,丫相互独立时,Cov (X, Y)= 0,则有E(X Y) = E(X)E(Y)(1.13g)方差记作D (X)(正态分布的C2 ):(X)二 EX-E(X)2二 E(X2)-E(X)2(1.14 )方差描述了随机变量X取值对于数学期望E (X)的离散程度。1、方差的计算公式当X为离散型时D(X)八人-E(X)r Pi(1.15 )当X为连续型时QO2D(X)二x- E(X) f (x)dx_nO(1.16 )2、方差的性质(下式中a、b、c、k为常数)
13、(1) D (c) = 0(1.17a)(2) D (kX)=k2D (X)(1.17b)(3) D (X+b)=:D (X)(1.17c )(4) D (kX+b)2=k D (X)(1.17d)(5) D (X+Y =:D (X) +D (Y) -2Cov (X, Y)(1.17d )当X, Y相互独立时,协方差 Cov (X, Y) = 0,则有:D(X+Y) = D (X) +D( Y)(1.17e )1.3随机变量的基本定理(4)、(5)可推广至随机变量 X,凡。大数定理切比谢夫(Tchebyshev)定理设X,茨,Xn是独立同分布的随机变量列,且E (X)、D (X)存在,则对于任
14、何£ > 0,有(1.18 )lim px- E(Xjv式中:(1.19)上式又称切比谢夫(Tchebyshev)定理。大数定律的实际意义在于,只要 n 充分大,算术平均值X以很大的概率取值接近于数学期望,即当n充分大时,可以用算术平均值X代替真值E(XJ,以满足测量不确定度&的要求。贝努利定理设在n次独立观测中,事件 A出现的次数为m则当n足够大时,频率m/nmp n=1依概率收敛于它的概率p,即对任意的& >0,有:(1.20)n足够大,则可用lim Pnjpc贝努利定理的实际意义在于,在观测条件稳定时,如果 频率代替概率,此时频率具有很咼的稳定性。中
15、心极限定理设X1,茨,X是独立同分布的随机变量列,且 E (X)、D(X)存在,D (X)工0,则对一切实数avb,有飞 bt2lim Pav 匸丘以1 "丄(1.21 )“护,JD(XJ/n ,中心极限定理可解释为任何随机变量如果是许多同分布独立变量之和,每 变量在总和上只起不大的影响,则不论这些独立变量具有何种类型的分布,该 随机变量可以近似地认为是正态分布。随着随机独立变量的增加,它们的和就 越接近正态分布;这些独立变量的大小越接近,所需的独立变量就越少。中心极限定理扩展了正态分布的适用范围。 在扩展不确定度的评定中,将涉 及如何用中心极限定理来判断被测量 丫是否服从或接近正态
16、分布。1.4参数估计以上所述是观测次数无限大时随机变量的一些性质,即为总体的情况。由 于总体往往得不到,常常以有限次观测、即抽样的方式来估计总体的特性。总体、样本把研究对象的全体称为总体(或称母体),构成总体的每个单位为个体,通 常用N表示总体所包含的个体数。总体的一部分称为样本(或称子样) ,通常用 n表示样本所含的个体数,称为样本容量。从总体中抽取样本称为抽样。若总体中每个个体被抽取的可能性相同,这样的抽样称为随机抽样,所获得的样本为随机样本。可以证明,当样本容量 n足够大时,样本的经验分布函数近似地等于总体 分布函数,因此,可以用经验分布近似地代替总体分布函数。这是用样本推断 总体的依据
17、。参数的点估计基本概念对于一个已知其分布、但未知特征参数的随机变量X,如果得到了一组观测值,很自然的会想到用这一组观测值来估计总体的特征参数,这就是参数的 点估计,这一组观测值所构成的统计量称为总体的估计量。估计量的评价:(1) 一致性:一个好的估计量,当样本容量很大时,估计值以接近于1的 概率趋近于被估参数值。(2)无偏性:估计量总是围绕被估参数摆动,即大于被估参数和小于被估 参数的概率基本相同,估计量的数学期望等于被估参数,此时该估计量就是被 估参数的无偏估计量。(3)有效性:估计量的方差越小,波动越小,估计值接近被估参数的可能 性越大,即越有效。用上述方法和标准研究正态分布未知参数的点估
18、计,可以得出如下结论:(1)样本算术平均值-1 nXXi( 1.22)n y是总体数学期望的无偏估计量。随样本容量n增大,有效性提高。(2)样本方差21 J /_2s(Xi - x)( 1.23)n -1 id是总体方差的无偏估计量。n_注意,S2=v (Xi -X)2作为总体方差C 2的估计量是有偏的。为了使用上的 n i#方便,常将方差开方并取正值,使其与均值具有相同的量纲,称为标准差。当需要估计总体标准差时,用样本标准差s作为总体标准差C的估计量:1 n 2s 珀一z (X -X)2(1.24)- 1 y上式又称贝塞尔(Bessel)公式。143参数的区间估计在得到了总体参数的估计值后,常常要求更确切地知道这些估计值的精确 程度,即真值所在范围。这样的范围通常以区间的形式给出,同时还要给出区 间包含真值的可靠程度,这种形式的估计称为参数的区间估计。设总体分布含有一个未知参数0 ,若由样本确定的两个统计量日 1(X1,X2,,X n )及 02(X1, X2,.,xn),对于给定值 a (OVaV 1)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年寸拼音游戏教学设计
- 2025-2026学年蒙古族歌曲教学设计英语
- 2026年及未来5年中国休闲农业行业竞争格局及市场发展潜力预测报告
- 2025-2026学年教学设计音乐幼儿教案
- 2025-2026学年JQX教学设计图房子
- 2025-2026学年语音讲述活动教案
- 《冲压模具CAD、CAE、CAM综合实训》课件-项目八:拉延凹模CAM数控加工
- 2025-2026学年中班音乐秋天的教案
- 2025年兰州大学文学院聘用制(B岗)人员招聘备考题库及1套参考答案详解
- 2025-2026学年人生的境界教学设计
- 2026年春季学期红领巾广播站安排表及每周广播稿(新)
- 2026年建筑施工行业复工复产应急预案
- 广东省佛山市2024-2025学年高一下学期6月期末数学
- (2026春新版本)苏教版数学三年级下册全册教案
- 2026内蒙古地质矿产集团有限公司社会招聘65人备考题库附参考答案详解(b卷)
- 收单外包服务合作相关制度
- 中国发电企业与世界同类能源企业对标分析报告2025
- 2026年中国藏语系高级佛学院招聘应届高校毕业生笔试备考题库及答案解析
- 服务心理学(第四版)课件 项目一 任务二 了解服务工作
- 计算机二级java考试课件(1-9章)
- 年产55万吨环氧乙烷乙二醇车间环氧乙烷合成工段工艺设计
评论
0/150
提交评论