概率论4.4课件_第1页
概率论4.4课件_第2页
概率论4.4课件_第3页
概率论4.4课件_第4页
概率论4.4课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 随机变量的数字特征,4.4 大数定律和中心极限定理,在前面的1.5节概率的统计定义中曾经讲过,一个事件A发生的频率具有稳定性,即当试验次数n增大时,频率接近于某个常数(A的概率).,在4.1节随机变量的数学期望中又讲过,随机变量X在n次试验中所取的n个值的平均值也具有稳定性,且被稳定的那个值就是X的数学期望.,这里所谓的“稳定性”,或当n很大时“接近一个常数”等等,都是不确切的说法,只是一种直观的描述而已.,初学者常常把它理解为微积分中的变量与极限的关系,这是错误的.,因为事件的频率以及随机变量取的n个值的平均值是随着试验的结果而变的,是随机变量,不是微积分中所描述的变量.,那么究竟如

2、何用确切的数学语言来描述频率与概率、平均值与数学期望之间的关系呢?大数定律回答了这个问题.,为了讲述大数定律,下面先讲一个重要的不等式,它在实际上和理论上都有重要的应用.,4.4.1 切比雪夫(Tchebysheff)不等式,定理4.5 对任意随机变量X,若它的方差DX存在,则对任意的0有,成立.,证 设X是一个连续型随机变量,概率密度为f(x),则,当X是离散型随机变量时,只需在上述的证明中把概率密度换成分布列,把积分好换成求和号即可.,由于,故,与,等价.,式,和式,都称为切比雪夫不等式.,切比雪夫不等式给出了在随机变量X的分布未知的情况下,利用EX、DX对X的概率分布进行估计的一种方法.

3、,例如,由式,可以断言,不管X的分布是什么,对于任意的正整数k都有,当k=3时,有,由2.5节例1知,当XN(,2)时,有,比较上面的两个式子可知,切比雪夫不等式给出的估计比较粗糙;但要注意,切比雪夫不等式只利用了数学期望和方差.,例1设EX=2,DX=0.4,试用切比雪夫不等式估计 P(1X3)?,解,例2设随机变量X、Y的数学期望都是2,方差分别为1和4,而相关系数为0.5,则根据切比雪夫不等式估计,解,一般地,设Z1,Z2,Zn,是一个随机变量序列,a是一个常数,若对任意的0有,则称随机变量序列Z1,Z2,Zn,依概率收敛于a.记为,4.4.2 大数定律,定理4.6(伯努利大数定律) 设

4、在n重伯努利试验中,成功的次数为Yn,而在每次试验中成功的概率为p (00有,证 由于 YnB(n,p) 故 EYn=np,DYn=npq(q=1p) 由此得,代入切比雪夫不等式,得,故,利用式,显然可得式,的等价形式,在式,中,Yn/n是在n重伯努利试验中成功的频率,而p是成功的概率.,因此伯努利大数定律告诉我们:当试验次数n足够大时,成功的频率与成功的概率之差的绝对值不小于任一指定的正数的概率可以小于任何预先指定的正数,这就是频率稳定性的一种较确切的解释.,利用式,可以得到相应的等价解释.,根据伯努利大数定律,在实际应用中,当试验次数n很大时,可以用事件的频率来近似代替事件的概率.,定义5

5、.8 称随机变量序列X1,X2,Xn,(或简记为Xn)是相互独立的,如果对任意的n2, X1,X2,Xn 是相互独立的.此时,若所有Xi又有相同的分布函数,则称X1,X2,Xn ,是独立同分布的随机变量序列.,定理4.7(切比雪夫大数定律) 设X1,X2,Xn,是相互独立的随机变量序列,若有常数C,使DXiC, i=1,2,,则对任意的0有,或,证 因为,由切比雪夫不等式,得,令n,则得,若利用式,则可以推得式,在概率论中我们称满足式,或式,的随机变量序列X1,X2,Xn,服从大数定律.,推论 设X1,X2,Xn,是独立同分布的随机变量序列,具有有限的数学期望和方差,EXi =, DXi=2,

6、i=1,2,,则对任意的0有,或,这是因为,故由切比雪夫大数定律立即可得上面的两个式子.,容易验证伯努利大数定律的结论可以由此推论得出.,在上述的推论中,假设所讨论的随机变量的方差是存在的,但实际上,方差存在这个条件并不是必要的,现不加证明地介绍下面的定理.,定理4.8(辛钦Khintchine大数定律)设X1,X2,Xn,是独立同分布的随机变量序列,具有有限的数学期望,EXi =,i=1,2,,则对任意的0有,或,在式,中,可以被看作随机变量X在n次重复独立试验中n个观察值的算术平均值,而=EX.,因此,辛钦大数定律告诉我们:当试验次数n足够大时,,因此,辛钦大数定律告诉我们:当试验次数n足

7、够大时,平均值,与数学期望之差的绝对值不小于任一指定的正数的概率可以小于任何预先指定的正数,这就是算术平均值稳定性的一种较确切的解释.,所以,在测量中常用多次重复测得的值的算术平均值来作为被测量的近似值.,按照依概率收敛的定义,伯努利大数定律表明了频率Yn/n依概率收敛于p,即,式,所表示的关系为,式,所表示的关系为,第四章 随机变量的数字特征,4.4.3 中心极限定理,在前面大数定律中,我们讨论了独立随机变量的平均值,序列的依概率收敛问题,现在我们来讨论独立随机变量和,在随机变量的各种分布中,正态分布占有特殊重要的地位.,早在19世纪,德国数学家高斯(Gauss)在研究测量误差时,就引进了正

8、态分布.,其后,人们又发现在实际问题中,许多随机变量都近似服从正态分布.,为什么正态分布如此广泛地存在,从而在概率论中占有如此重要的地位?,数学家从关于独立随机变量和的极限分布的研究中找到了答案.,20世纪前半期,概率论研究的中心课题之一,就是寻求独立随机变量和的极限分布是正态分布的条件.因此,把这一方面的定理统称为中心极限定理.,较一般的中心极限定理表明:如果被研究的随机变量是大量的独立随机变量的和,其中每一个别随机变量对于总和只起微小作用,则可以认为这个随机变量近似服从正态分布.,这就揭示了正态分布的重要性.因为现实中许多随机变量都具有上述的性质,例如测量误差、射击弹着点的横坐标或纵坐标、

9、人的身高或体重等都是由大量的随机因素综合影响的结果,因而是近似服从正态分布的.,以下叙述一个常用的中心极限定理,定理4.9(独立同分布的中心极限定理) 如果随机变量序列X1,X2,Xn,独立同分布,并且具有有限的数学期望和方差,EXi = ,DXi=20,i=1,2,,则对一切x,有,证明需要用到随机变量的特征函数,略.,从式,可以看出,不管Xi (i=1,2,)服从什么分布,只要n充分大,随机变量,就近似地服从N(0,1),而,随机变量,近似地服从N(n,n2).,此时,我们称,渐近地服从N(0,1).,定理4.9又被称为列维林德伯格(LevyLindeberg)中心极限定理.,例1 计算机

10、在进行加法时,对每个被加数取整(取为最接近于它的整数),设所有的取整误差是相互独立的,且它们均在(0.5,0.5)上服从均匀分布.若将1500个数相加,问误差总和的绝对值不超过15的概率是多少?,解 设Xi表示第i个被加数的取整误差,i= 1,2,1500,则 XiU(0.5,0.5) 且X1,X2,X1500相互独立,故 = EXi = 0 2 = DXi =1/12.,令Z=X1+X2+ X1500,由列维林德伯格中心极限定理,得,于是,所求的概率为,定理4.10 德莫弗拉普拉斯(De MoivreLaplace)定理 设在n重伯努利试验中,成功的次数为Yn,而在每次试验中成功的概率为p(

11、0p1),q=1p,则对一切x,有,证明 设Xi表示在第i次试验成功的次数,i= 1,2,n ,则Xi的分布列为,且,由于X1,X2,Xn是独立同分布的随机变量序列分布列,且EXi=p,DXi=pq (i=1,2, ,n )有限,故满足定理4.9(独立同分布的中心极限定理)的条件,,于是由式,得,定理5.10表明二项分布以正态分布为极限分布,推论 对定理5.10中的n重伯努利试验,n充分大时,有,证 从,由定理5.10(德莫弗拉普拉斯定理)即得结论.,由推论可知,当n很大时,二项分布的概率计算问题,可以转化为正态分布来计算,这将使计算量大大减小.,例如,当n很大时,若要计算,工作量是惊人的.但

12、是,用式,只要查一下正态分布函数表就可以轻松地求出它的相当精确的近似值.,例2 重复投掷硬币100次,设每次出现正面的概率均为0.5,问“出现正面次数大于50,小于61”的概率是多少?,解 设出现正面的次数为Yn,现在,由式,得,应该指出:定理4.10及其推论中的 Yn 是仅取非负整数值0,1,2, ,n的随机变量,注意到正态分布是连续型的分布,所以在求概率 P(Ynm)(m为正整数) 时,为了得到较好的近似值,可以用下面的近似公式,例3 以X表示将一枚匀称的硬币重复投掷40次中出现正面次数,试用正态分布求P(X=20)的近似值,再与精确值比较.,解 这里n=40,p=1/2,q=1/2,故,

13、而精确解为,当然,求例3这样的概率还有德莫弗拉普拉斯局部极限定理可用,这里就不予以论述了.,由前面的讨论可见,对二项分布,当n充分大,以致npq较大时,正态近似是相当好的近似.,进一步的分析表明,当接近于0或1时,用正态近似效果不好,这时就要用到泊松近似了.,由定理2.10(二项概率的泊松逼近定理),当p(或q)很小,而np(或nq)大小适中时,泊松近似是较好的.,在实际中,一般当0.19时,用正态近似;当p0.1(或p0.9)且n10时,用泊松近似.,例4 一生产线生产的产品成箱包装,每箱的重量是随机的.假设每箱的平均重量为50千克,标准差为5千克.若用最大载重量为5吨的汽车承运,试利用中心极限定理说明,每辆车最多可以装多少箱,才能保证不超载的概率大于0.977.(2)= 0.977,其中(x)是标准正态分布函数.),解 设Xi(i=1,2,n)是装运的第i箱的重量(单位:千克),n是所求的箱数.,由条件可以把X1,X2,Xn视为独立同分布的随机变量,而n箱的总重量 Tn=X1+X2+Xn 是独立同分布随机变量之和.,由条件知,根据列维林德伯格(独立同分布的)中心极

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论