大数定律及中心极限定理_第1页
大数定律及中心极限定理_第2页
大数定律及中心极限定理_第3页
大数定律及中心极限定理_第4页
大数定律及中心极限定理_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 大数定律与中心极限定理l 随机现象的规律只有在大量随机现象的考察中才能显现出来。l 研究大量的随机现象,常常采用极限形式。l 极限定理的内容很广泛,其中最重要的有二种:大数定律与中心极限定理。1 大数定律l 事件发生的频率具有稳定性;l 大量测量值的算术平均值也具有稳定性。大数定律就是从这种稳定性的研究中得出的。定理一(契比雪夫大数定律)设随机变量序列相互独立,且具有相同的数学期望和方差:前n个随机变量的算术平均:对于任意正数,有 =则称Xn服从大数定律。证:由于由契比雪夫不等式可得:在上式中令并注意到概率不能大于1,即得:l 定理一给出了关于平均值稳定性的科学的描述。l 上式的意义:

2、是一个随机事件,等式表明,当时,这个事件的概率趋于1。即对于任意正数,当n充分大时,不等式成立的概率很大。l 还表明,当n很大时,随机变量的算术平均接近于数学期望.这种接近是在概率意义下的接近。l 说明平均结果渐趋稳定性。即单个随机现象的行为对大量随机现象共同产生的总平均效果E()几乎不发生影响。即尽管某个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,这些随机偏差相互抵消、补尚与拉平,致使总平均结果趋于稳定。例如在分析天平上称量一质量为µ的物品,以表示n次重复测量结果,经验告知,当n充分大时,其平均值对µ的偏差是很小的定义:设是一个随机变量序列,a

3、是一个常数。若对于任意正数,有:则称序列依概率收敛于a,记为:依概率收敛的序列还有以下的性质:设又设函数g(x,y)在点(a,b)连续,则:定理一又可叙述为:设随机变量相互独立,且具有相同的数学期望和方差:则序列前n个随机变量的算术平均依概率收敛于,定理二(伯努利大数定理)设nA是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数有 或: 证:因为nAb(n,p),引入随机变量: 由于X1,X2,Xn相互独立,又知Xk,k=1,2,n服从同一(01)分布:Xk0 1Pk1-p p已知 由定理一得:即伯努利大数定理表明:l 事件发生的频率依概率收敛于事件的概率P

4、,这个定理以严格的数学形式表达了频率的稳定性。l 就是说当n很大时,事件发生的频率与概率有较大偏差的可能性很小。l 由实际推断原理,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。切比雪夫大数定律的证明要求随机变量具有方差。但进一步的研究表明,方差存在这个条件有时并不是必要的,定理三就是这种情况。定理三(辛钦大数定理):设随机变量相互独立,服从同一分布,且具有数学期望,则对于任意正数,有: (证明略)显然,伯努利大数定理是辛钦定理的特殊情况。大数定理以严格的数学形式表达了随机现象最根本的性质之一:平均结果的稳定性,它是随机现象统计规律的具体表现。在理论和实际中有广泛的应

5、用。l 例如,要测量一个圆柱形工件的直径,由于仪器的测量误差、读数的偏差以及温度的变化等各种原因,使每次测量的结果是随机的。如果测量n次,得到,其算术平均值为,当n较大时,此平均值就可作为直径的一个估计,其理论依据是大数定理。l 例如,要估计某地区水稻的平均亩产量,只要收割一部分有代表性的地块,比如n块,计算它们的平均亩产,在n比较大的情况下,n块的平均亩产量就可以作为全地区的平均亩产量。其理论依据也是大数定理。例:设随机变量序列相互独立,且均服从(a,b)区间上的均匀分布,问平均值依概率收敛于何值?解:因为XkU(a,b),k=1,2,n,则由辛钦大数定理知 。 例:设随机变量序列相互独立,

6、且均服从泊松分布,试问当n很大时,可用何值估计? 解:因为由辛钦大数定理知 即当n很大时,可用值代替。具体的,若有的一组观察值。2 中心极限定理l 在实际问题中,常常需要考虑许多随机因素所产生的总的影响。例如,炮弹射击的偏差,受许多随机因素的影响:瞄准的误差、空气阻力所产生的误差、炮弹或炮身所产生的误差等。我们所关心的是这些随机因素的总影响。l 自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见。观察表明,如果一个结果是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大。则这种量一般都服从或近似服从正态分布。中心极限定理就是研究独立随机变量之和

7、所特有的规律性问题。即,当n无限大时,这个和的极限分布是什么?在什么条件下极限分布是正态的?由于无穷各随机变量之和可以取为值,故这里不研究n个随机变量之和而考虑它的标准化的随机变量的分布函数的极限。可以证明,在满足一定的条件,上述极限分布是标准正态分布。定理四(独立同分布的中心极限定理)设随机变量相互独立,服从同一分布,且具有数学期望和方差: ,则随机变量之和的标准化变量:的分布函数对于任意x满足 (证明略)这就是说,均值为,方差为的独立同分布的随机变量之和的标准化变形量,当n充分大时,有: l 中心极限定理不仅提供了计算独立随机变量之和的近似概率分布的简单方法,而且有助于解释为什么很多自然群

8、体的经验频率呈现出钟形曲线这一事实。l 在一般情况下,很难求出n个随机变量之和的分布函数,上式表明,当n充分大时,可以通过给出其近似的分布。这样,就可以利用正态分布对作理论分析或作实际计算,其好处是明显的。将上式左端改写成,这样,上述结果可以写成:当n充分大时, 或 这是独立同分布中心极限定理结果的另一个形式。这就是说,均值为,方差为的独立同分布的随机变量的算术平均,当n充分大时近似地服从均值为,方差为的正态分布。这一结果是数理统计中大样本统计推断的基础。定理五(李雅普诺夫定理)设随机变量相互独立,它们具有数学期望和方差:记,若存在正数,使得当时,则随机变量之和的标准化变量:的分布函数Fn(x

9、)对于任意x,满足(证明略)定理五表明,在定理的条件下,随机变量当n很大时,近似地服从正态分布N(0.1),由此,当n很大时,近似地服从正态分布。这就是说,无论各个随机变量服从什么分布,只要满足定理的条件,那么当n很大时,就近似地服从正态分布。在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的,可加的微小误差所合成的,它们往往近似地服从正态分布。定理六(棣莫弗拉普拉斯定理)(定理四的特殊情况),设随机变量服从参数为n,P(0<P<1)的二项分布,则对于任意x,有 证

10、:可以将分解成为n个相互独立、服从同一(0-1)分布的诸随机变量之和,即有:其中的分布律为由于,由定理四得: l 这个定理表明,正态分布是二项分布的极限分布。l 当n充分大时,可以利用(2.5)式来计算二项分布的概率。例1:一加法器同时收到20个噪声电压设它们是相互独立的随机变量,且都在区间(0,10)上服从均匀分布。记的近似值。解:易知.由定理四,随机变量:近似服从正态分布N(0,1),于是: 例2:一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于3°的概率为,若船舶遭受到90000次波浪冲击,问其中有2950030500次纵摇角度大于3°的概率是多少?解:将船舶

11、每遭受一次波浪冲击看作是一次试验,并假定各次试验是独立的。在90000次波浪冲击中纵摇角度大于3°的次数记为X,则X是一个随机变量,且有Xb(90000,1/3).其分布律为:所求的概率为:要直接计算是麻烦的,我们利用棣莫弗拉普拉斯定理来求它的近似值,即有:其中n=90000,P=1/3.即有例3 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长、1名家长、2名家长来参加会议的概率分别为0.05、0.8、0.15。若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布。(1)求参加会议的家长数X超过450的概率;(2)求有1名家长来参加会议的

12、学生数不多于340的概率。解 (1)以记第个学生来参加会议的家长数,则的分布律为 0120.050.80.15,由定理四,随机变量近似服从正态分布,于是 (2)以Y记有一名家长来参加会议的学生数,则Yb(400,0.8),由定理六得附加内容:概率论的简单应用1 池塘内鱼总数的概率估计问题是这样的,为了了解一池塘内鱼的总数,我们先捕捞一次,假定捕出r条,做上记号后放回池塘里(设记号不消失),过一段时间后,即让有记号的鱼与无记号的鱼混合匀称后,再从池塘中捕出s条,(),观察其中有t条()标有记号,试根据如此信息,估计池塘中鱼总数N的值。对于这个问题,可以有以下几种解法:解法一:依题意,池塘中有记号

13、的鱼的比例应为,即在N条中有r条记号的概率,而在捕出的s条中有记号的鱼为t条,故有记号的鱼的比例为(频率)。设想捕鱼是完全随机的,每条被捕到的机会相等,于是根据频率来近似概率的道理,便有: 即得 因N需要为整数,故可取N的估计(最大整数部分),此即为池塘中鱼总数的一种估计。其它一些类似的问题,如估计一个城市的人口总数,也可用同样的方法去考虑。2 人寿保险中赔偿金的确定问题保险机构是最早使用概率论的部门之一,保险公司为了恰当地估计企业的收支和风险,需要计算各种各样的概率,下面的赔偿金的确定问题,就是概率论在保险企业中的一个典型应用问题。据统计,某年龄的健康人在五年内死亡的概率为,某保险公司准备开

14、办该年龄段的五年人寿保险业务,预计有2500人参加保险,条件是参加保险者交保险金12元,若五年内死亡,公司支付赔偿金b元(b待定),便有以下几个问题:(1) 确定b,使保险公司期望盈利;(2) 确定b,使保险公司盈利的可能性超过99;(3) 确定b,使公司的期望盈利超过1万元;(4) 确定b,使保险盈利超过1万元的可能性大于95;(5) 若赔偿金b2000元,试确定公司盈利的期望值和盈利超过2万元的可能性;(6) 若赔偿金为b2000元,欲使保险公司盈利20万元,每位参保者至少需交保险金a为多少元?(7) 若赔偿金b2000元,欲使保险公司盈利的可能性大于99时,每位参保者至少需交保险金a为多

15、少元?上述问题的解决是:(1) 设X表示保险公司在每一个参保者身上所得的收益,则X为随机变量,服从两点分布,其分布规律为X1212bPk0.9980.002故保险公司在每一位参保者身上获的平均收益E(X)12×0.998+(12-b)×0.002=12-0.002b若要使保险公司期望盈利,则应有E(X)12-0.002b>0于是可得b<6000(元)时,保险公司期望盈利。(2) 设Y表示五年内参保者的死亡人数。若要使保险公司盈利,则应有2500×12Yb>0由此可得出死亡人数 Y<2500×r1将Y视作随机变量,若把参保者是否死亡

16、看成相互独立的随机事件,则2500人在5年内死亡人数服从参数为2500,的二项分布,即其分布律为于是,使保险公司盈利的可能性大于99,就意味着即 考虑泊松近似计算,此处即得而根据不等式,由泊松分布表查得 r112即得 元(3) 由于保险公司从每个人身上获得收益为E(X)12-0.002b,则公司从2500人身上获期望收益2500×122500×0.002b>10000从上解出b<4000元时公司期望盈利可超过1万元。(4) 欲使保险公司盈利超过1万元,须2500×12Yb>10000由此得出死亡人数故若使保险公司期望盈利超过1万元等价于Y<r2,其可能性大于95即如(2)中计算,查泊松分布表得r2=9即得 元(5) 由(1)知,当b=2000时,保险公司从个人身上获期望收益为E(X)12-0.002×20008元于是公司的期望总收益为2500×820000元又当赔偿金为2000元时,公司盈利超过2万元等价死亡人数人于是保险公司盈利超过2万元的可能性为(6) 现在确定a,而b=2000元固定,设X仍为公司从每个参保者身上获取收益,则X的分布律为Xaa-2000Pk0.9980.002期

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论