




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE1、数理统计基础1.1随机变量1.1.1随机事件和概率观测或试验的一种结果,称为一个事件。在一定条件下进行大量重复试验时,每次都发生的事件,称为必然事件();反之,每次都不发生的事件,称为不可能事件();有时发生有时不发生的事件,称为随机事件或偶然事件()。随机事件的特点是在一次观测或试验中,它可能出现,也可能不出现,但在大量重复观测或试验中呈现统计规律性。用来描述事件发生可能性大小的量就是概率。概率的统计定义是:在相同条件下进行次重复试验,事件发生了次,称为事件的频数,称/为事件的频率。当足够大时,频率/稳定地趋向于某一个常数,此常数称为事件的概率,记为=,即:==(1.1)即概率是频率的极限值。由概率的定义可归纳出概率的三个基本性质:(1)必然事件的概率等于1,即=1;(2)不可能事件的概率等于0,即=0;(3)任何事件的概率都介于0和1之间,即0≤≤1。小概率原理:当某一事件的概率非常接近于0时,说明这个事件在大量的试验中出现的概率非常小,这样的事件称为小概率事件。小概率事件虽然不是不可能事件,但在一次连续试验中出现的可能性很小,一般可以认为不会发生,此即为小概率原理。概率的三个定理:(1)互补定理:某事件发生的概率与不发生的概率之和为1。当发生的概率为,则不发生的概率为1-。全部基本事件之和为必然事件。(2)加法定理:相互独立而又互不相容的各个事件,其概率等于它们分别出现之和。例如,A1,A2,…An为相互独立而又互不相容的事件,其中任一事件出现的概率为各个事件概率的总和,即P(A)=P(A1)+P(A2)+…+P(An)=(1.2)(3)乘法定理:相互独立的事件同时发生的概率是这些事件各自发生的概率的乘积,即P(A1A2…An)=P(A1)P(A2)…P(An)=(1.3)1.1.2随机变量与分布函数每次试验的结果可以用一个变量的数值来表示,这个变量的取值随偶然因素而变化,但又遵从一定的概率分布规律,这种变量称为随机变量。随机变量根据其取值的特征可以分为离散型随机变量和连续型随机变量。离散型随机变量试验结果的可能值可以一一列举出来,即随机变量可取的值是间断的、可数的。连续型随机变量试验结果的可能值不能一一列举出来,即随机变量可取的值是连续充满在一个区间的。随机变量是随机现象的数量化,可以用:=表示某事件;(=)表示该事件出现的概率;()=(<)表示<的概率,并定义为随机变量的概率分布函数,用来描述随机变量的统计规律。连续型随机变量的分布函数的表达式为:=(<)=(1.4)式中,称为随机变量的概率密度函数(或简称概率密度)。正态分布是连续型随机变量最常见的一种分布。正态分布的概率密度函数和概率分布函数分别为:(1.5)(1.6)以的取值为横坐标,以概率密度函数为纵坐标,正态分布的图象如图1.1所示。图中的曲线即为概率密度函数,积分区间内的曲线与横轴之间所包含的面积就是概率分布函数,亦即随机变量的概率。图1.1正态分布示意图的图象具有如下性质:a、为随机变量一系列取值的中位值(或称均值),对称于直线x=μ,且>0,曲线位于横轴的上方。它向左右无限延伸,并以横轴为渐近线。b、当x=μ时,取最大值:x离μ越远越小,这表明对于同样长度的区间,当区间离μ越远,落在这个区间上的概率越小。c、参数σ为曲线拐点的横坐标,其大小决定了正态曲线的形状特点,σ愈大曲线愈平缓,σ愈小曲线愈高陡。可以看出,正态分布主要取决于μ和σ两个参数,称μ为随机变量的数学期望,σ2为随机变量的方差。当随机变量服从正态分布时,常记作~(μ,σ2)。如令随机变量t=(x-μ)/σ,通过变量转换,可由一般正态分布推算得随机变量t的概率密度函数及相应的概率分布函数:=(1.7)=(1.8)这种分布称为标准正态分布,是正态分布中μ=0,σ2=1的特例。当随机变量服从标准正态分布时,常记作~N(0,1)。通常将t~制成数值表,称t为标准正态分布的分位数。如已知t,即可从表中查得相应的;反之,亦然。标准正态分布与一般正态分布具有如下关系:=Φ(1.9)因此,对于任意正态分布N(μ,σ2),当已知x,需求相应的F(x)时,均可通过下式变换(1.10)算得对应于x的t值,再在标准正态分布函数数值表上查得相应的概率。正态随机变量中有三个重要的概率值(见图1.2),它们分别是P(μ-σ<X≤μ+σ)=0.6826,P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-3σ<X≤μ+3σ)=0.9973。图1.2正态分布的三个重要概率值注意到第三个概率值,对于正态随机变量来说,它落在μ±3σ内的概率约为99.7%,落在μ±3σ外的概率约为0.3%。可见,在具有正态分布特征的试验中,其数据落在μ±3σ以外的概率是很小的,可视为“小概率事件”。因此,试验中一旦出现μ±3σ外的数据,根据“3σ规则”,即可将其认为是“可疑数据”而予以剔除,或是工艺过程出现异常,应予注意。[例1.1]已知一批强度等级为C25的混凝土,其抽样试件的抗压强度平均值为30.0MPa,标准差为5.0MPa,设该混凝土的抗压强度服从N(30.0,5.0)的正态分布,试计算抗压强度高于25.0MPa的概率(即求该混凝土的强度保证率)。[解](≥25.0)=1-(<25.0)=1-=1-=1-=1-0.1587=0.8413即该批混凝土的强度保证率为84.1%。由此可见,对于标准差为5.0MPa的C25混凝土,即使其抗压强度平均值为30.0MPa时,仍不能达到相关规范所规定的95%的强度保证率。[例1.2]条件同[例1.1],其试件抗压强度平均值为多少时,才能使该混凝土的强度保证率达到95%?[解]由(≥25.0)=1-(<25.0)=0.95得==-1.645=25.0+1.645×5.0=33.2MPa上式中,t被称为强度保证率系数,它对应于95%的强度保证率。1.2随机变量的数字特征由上所述,利用分布函数或分布密度函数可以完全确定一个随机变量。但在实际问题中,求分布函数或分布密度函数不仅十分困难,而且常常没有必要。用一些数字来描述随机变量的主要特征,显得十分方便、直观、实用。描述随机变量某种特征的量称为随机变量的数字特征。1.2.1数学期望数学期望又称均值,记作E(X)(正态分布的),其计算公式为:当X为离散型时(1.11)当X为连续型时(1.12)数学期望描述了随机变量的取值中心,但它不是简单的算术平均,而是以概率为权的加权平均。数学期望有如下性质(下式中c、k、b均为常数):(1)E(c)=c(1.13a)(2)E(kX)=kE(X)(1.13b)(3)E(X+b)=E(X)+b(1.13c)(4)E(kX+b)=kE(X)+b(1.13d)(5)E(X+Y)=E(X)+E(Y)(1.13e)(6)E(XY)=E(X)E(Y)+Cov(X,Y)(1.13f)称Cov(X,Y)为协方差,当X,Y相互独立时,Cov(X,Y)=0,则有(1.13g)1.2.2方差记作D(X)(正态分布的):D(X)=E{[X-E(X)]2}=E(X2)-[E(X)]2(1.14)方差描述了随机变量X取值对于数学期望E(X)的离散程度。1、方差的计算公式当X为离散型时(1.15)当X为连续型时(1.16)2、方差的性质(下式中a、b、c、k为常数)(1)D(c)=0(1.17a)(2)D(kX)=k2D(X)(1.17b)(3)D(X+b)=D(X)(1.17c)(4)D(kX+b)=k2D(X)(1.17d)(5)D(X+Y)=D(X)+D(Y)-2Cov(X,Y)(1.17d)当X,Y相互独立时,协方差Cov(X,Y)=0,则有:D(X+Y)=D(X)+D(Y)(1.17e)(4)、(5)可推广至随机变量X1,X2,…,Xn。1.3随机变量的基本定理1.3.1大数定理1.3.1.1切比谢夫(Tchebyshev)定理设X1,X2,…,Xn是独立同分布的随机变量列,且E(X1)、D(X1)存在,则对于任何ε>0,有(1.18)式中:(1.19)上式又称切比谢夫(Tchebyshev)定理。大数定律的实际意义在于,只要n充分大,算术平均值以很大的概率取值接近于数学期望,即当n充分大时,可以用算术平均值代替真值,以满足测量不确定度ε的要求。1.3.1.2贝努利定理设在n次独立观测中,事件A出现的次数为m,则当n足够大时,频率m/n依概率收敛于它的概率p,即对任意的ε>0,有:=1(1.20)贝努利定理的实实际意义在在于,在观观测条件稳稳定时,如如果n足够大,则则可用频率率代替概率率,此时频频率具有很很高的稳定定性。1.3.2中中心极限定定理设X1,X2,…,Xn是独立同分布的的随机变量量列,且E(X1)、D(X1)存在,D(X1)≠0,则对一一切实数a<b,有(1.21)中心极限定理可可解释为任任何随机变变量如果是是许多同分分布独立变变量之和,每每一变量在在总和上只只起不大的的影响,则则不论这些些独立变量量具有何种种类型的分分布,该随随机变量可可以近似地地认为是正正态分布。随随着随机独独立变量的的增加,它它们的和就就越接近正正态分布;;这些独立立变量的大大小越接近近,所需的的独立变量量就越少。中心极限定理扩扩展了正态态分布的适适用范围。在在扩展不确确定度的评评定中,将将涉及如何何用中心极极限定理来来判断被测测量Y是否服从从或接近正正态分布。1.4参数估估计以上所所述是观测测次数无限限大时随机机变量的一一些性质,即即为总体的的情况。由由于总体往往往得不到到,常常以以有限次观观测、即抽抽样的方式式来估计总总体的特性性。1.4.1总总体、样本本把研究对象的全全体称为总总体,构成成总体的每每个单位为为个体,通通常用N表示总体体所包含的的个体数。总总体的一部部分称为样样本(或称称子样),通通常用n表示样本本所含的个个体数,称称为样本容容量。从总体中抽取样样本称为抽抽样。若总总体中每个个个体被抽抽取的可能能性相同,这这样的抽样样称为随机机抽样,所所获得的样样本为随机机样本。可以证明,当样样本容量n足够大时时,样本的的经验分布布函数近似似地等于总总体分布函函数,因此此,可以用用经验分布布近似地代代替总体分分布函数。这这是用样本本推断总体体的依据。1.4.2参参数的点估估计1.4.2.11基本概念念对于一个已知其其分布、但但未知特征征参数的随随机变量,如如果得到了了一组观测测值,很自自然的会想想到用这一一组观测值值来估计总总体的特征征参数,这这就是参数数的点估计计,这一组组观测值所所构成的统统计量称为为总体的估估计量。估计量的评价::(1)一致性:一个个好的估计计量,当样样本容量很很大时,估估计值以接接近于1的概率趋趋近于被估估参数值。(2)无偏性:估计计量总是围围绕被估参参数摆动,即即大于被估估参数和小小于被估参参数的概率率基本相同同,估计量量的数学期期望等于被被估参数,此此时该估计计量就是被被估参数的的无偏估计计量。(3)有效性:估计计量的方差差越小,波波动越小,估估计值接近近被估参数数的可能性性越大,即即越有效。1.4.2.22正态分布布未知参数数的点估计计用上述方法和标标准研究正正态分布未未知参数的的点估计,可可以得出如如下结论::(1)样本算术平均均值(1.22)是总体数学期望望μ的无偏估估计量。随随样本容量量n增大,有有效性提高
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机械安全考试试题及答案
- 东职大专考试试题及答案
- 俊发培训考试试题及答案
- 口腔护理考试试题及答案
- 漆艺专业考试试题及答案
- 功能医学考试试题及答案
- 社会知识考试试题及答案
- 配电保养考试试题及答案
- 2025云端数据传输专用合同
- 2025合同的性质与种类
- 买卖合同法律知识及风险防范培训课件
- 脑出血患者术后护理论文
- 9.2严格执法 (课件+视频)(部编版)
- 《运输方式和交通布局与区域发展的关系》
- 建筑电气武校刚课后参考答案
- 广东省2024年高考物理试题(附答案解析)
- 中国南水北调集团新能源投资有限公司招聘笔试题库2024
- 围手术期深静脉血栓预防的术中护理
- 工程项目成本管理的案例分析
- 合作收款合同范本
- 2024年四川省成都市中考物理试卷附答案
评论
0/150
提交评论