5.1大数定理与中心极限定理.ppt_第1页
5.1大数定理与中心极限定理.ppt_第2页
5.1大数定理与中心极限定理.ppt_第3页
5.1大数定理与中心极限定理.ppt_第4页
5.1大数定理与中心极限定理.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学课程,概率论与数理统计,讲座,孙雪峰,第5章,大数定律与中心极限定理,5.1大数定律,5.2中心极限定理。本章总结了大数定律和中心极限定理利用极限方法来研究大量随机现象的统计规律性。阐明大量重复实验平均结果稳定性的一系列定律被称为大数定律。证明随机变量之和(测试结果)逐渐服从某种分布的定理称为中心极限定理。在长期的实践中,已经发现大量测量值的频率和算术平均值是稳定的,也就是说,不管单个测量值如何,平均结果与单个测量值的特性无关,并且几乎不再是随机的。如何从理论上解释这个稳定性问题?这是大数定律应该解决的问题。长期观察表明,如果一个量是由大量独立的随机因素引起的,并且每个单独的因素在总的影响

2、中起着很小的作用,那么这个量通常服从或近似服从正态分布。这个结论的理论基础是中心极限定理。总之,大数定律是描述频率稳定性的理论,中心极限定理在概率论的理论研究中起着重要的作用。2.其他(等价)形式的不等式,示例1估计概率和解,5.1大数定律1。切比雪夫不等式,切比雪夫不等式只能利用随机变量的数学期望和方差来估计概率分布。从Chebyshev不等式还可以看出,对于给定的0,当方差较小时,事件|X-E(X)|发生的概率较小,即X的值更集中在E(X)附近,这进一步表明方差确实是描述随机变量的离差程度及其期望值的变量。当D(X)已知时,切比雪夫不等式给出了X和E(X)之间偏差较小的概率。(2)估计事件

3、的概率。在示例2中,电站的供电网络中有10,000个电灯,并且每个灯在晚上打开的概率是0.7。假设灯相互打开和关闭,使用切比雪夫不等式来估计夜间同时打开的灯的数量在6800和7200之间的概率。如果x代表夜间同时点亮的灯的数量,那么x服从二项式分布,n=10000,p=0.7。这时,可以从切比雪夫不等式中得到,也就是说,对于任何0,当n足够大时,不等式,定理1(切比雪夫大数定律)如果X1,X2,Xn是独立的随机变量序列,每个E(D(Xi,C 0。对于任何0,都有,并且根据概率1成立。大数定律证明X1、X2、Xn是相互独立的,因此可以从切比雪夫不等式中得到。因此,切比雪夫大数定律表明,当n足够大

4、时,独立随机变量的算术平均值和它们的数学期望之间的差是一个概率为1的无穷小,这意味着当n足够大时,它的值将被紧密地聚集在其数学期望附近。说明(1)在恒定条件下,n次重复测量可得到n个观测值,x1,x2,xn可视为服从相同分布的n个独立随机变量x1,x2,xn的测试值。(2)当n足够大时,根据概率1,x1、x2、xn的算术平均值和真值之间的误差是任意小的。(3)当n不太大时,x1、x2、xn的算术平均值与真值之间的误差可能很大。因此,在实际计算平均值时,经常采用“去掉几个最高值和几个最低值”的方法。推论1假设随机变量X1,X2,X3,Xn是独立且同分布的,并且有E(Xk)=2,D(Xk)=2,k

5、=1,2,那么当n时有任何0,因为每个实验都是独立的,X1,X2,Xn彼此独立,并且证明了And Xk服从带参数p的0-1分布,所以有E(Xk)=p,D(Xk)=p(1-p) (k=1,2,n),这是在定理2(伯努利大数定律)中,事件A在n倍伯努利检验中出现n次,并且每个检验A。定义1(概率收敛)被假设为随机变量的独立序列,并且A是常数。如果有任何正数,那么这个序列就叫做概率收敛到A。因此,从伯努利大数定律,我们可以得到:设N是N个独立实验中的事件数,P是每个实验中事件A发生的概率。例2如果在每个实验中出现A的概率是0.5,将进行1000次独立。求解原因XB(1000,0.5),E(X)=50

6、0,D(X)=250,所以P 400600=P | X-500 | 100,并且得到P | X-500 | 100,由,对于任何X,都有,E(1。定理3(Linderberg-levy)假设随机变量X1、X2、Xn彼此独立,服从相同的分布,并且具有有限的数学期望和方差,即分布函数Fn(x)满足:表明:(1)当N较大时,Yn近似服从N(0,1),即(2)当N为定理4(De Moifre-拉普拉斯中心极限定理)如果随机变量N服从具有参数N和p的二项式分布(n=1,2,0 P1),那么任何实数x将总是存在的。摘要:证明了服从二项分布的随机变量n可以看作是n个独立随机变量X1,X2,Xn的和,同参数p

7、的分布为0-1。其中,可以从独立同分布的中心极限定理中得到,表明正态分布是二项分布的极限分布。当n足够大时,服从二项分布的随机变量n的概率计算可以转化为正态随机变量的概率计算。因为当n大p小时二项式分布的计算非常麻烦,所以如果使用上述近似公式将会非常简洁。拥挤的供水室在一个大学生生活公园里有5000名学生,还有一个开水间。因为每天晚上都有很多人开放水域,学生们经常排队。因此,学生会特别提议给学校后勤部门增加一个水龙头。学校后勤部门非常重视学生的意见,并为此召开了专门的研究会议。然而,有一个关于应该增加多少额外水龙头的争议,所以我希望你能给学校后勤部门的工作人员。如果你已经调查并发现每个学生通常

8、在晚上占用一个水龙头1小时,而现有水龙头的数量是45个,我想问:1在安装新水龙头之前拥挤的概率是多少?至少应该安装多少个水龙头,以确保不拥挤,概率大于95?1.同时,5000名学生中占用水龙头的人数x服从二项分布B(5000,0.01),因此拥挤概率高达0.7611。难怪学生们抱怨很多。=n=5000,p=0.01,np=50=0.01。因此,直接计算相当麻烦。我们用泊松近似公式来计算。众所周知,我们需要安装62个水龙头。2.如果你想要M,1。至少应该安装多少个水龙头,以确保不会拥挤,概率超过99%?2如果将现有水龙头的数量改为55个,而其他条件保持不变,那么问题1和问题2的结果是什么?3如果

9、每个学生在该条件下的占用率从1%增加到1.5%,而其他条件保持不变,问题1和2的结果是什么?如果x代表500辆出租车中发生事故的车辆数量,那么x服从二项式分布,n=500,p=0.006。此时,保险公司年收入不低于20万元的事件为事件0X4,因此,例如1,一家出租车公司有500辆出租车参加保险,一年内的事故概率为0.006。一旦发生事故,保险公司将为被保险的出租车每年支付高达50000元的保险费至800元。试着用中心极限定理来计算保险公司年收入不低于20万元的概率。由此可见,保险公司年收入不低于20万元的概率为0.7781。例2:当一艘船在一个海域航行时,众所周知它每次都受到波浪的冲击,如果x

10、是在90,000次冲击中俯仰角大于6的次数,我们可以得到,撞击并询问在2950,030,500次冲击中俯仰角大于6的概率。俯仰角大于6的概率为p=1/3。如果船经受了90,000次波浪,实施例3有一批种子,良好的种子率为0.6,并且随机选择其中的1000个。在这1000粒种子中,好种子的比例在2/5到4/5之间的概率是多少?为了解决抽取好种子的问题,把抽取1000个种子看作是一个随机试验,所以抽取1000个种子看作是一个1000重量的伯努利试验。如果X代表1000个种子中的好种子数,那么X服从n=1000,p=0.6的二项式分布,所以它可以由德莫福-拉普拉斯中心极限定理得到。在例4中,当抽样检

11、查某一产品的质量时,如果发现有10个以上的次品,则拒绝接受该批产品。为了解决这个问题,需要随机选取n个产品,其中缺陷产品的数量为y,这是由德莫福-拉普拉斯中心极限定理得到的。然后,有必要做出,也就是解决,也就是说,至少应该随机选择147个产品,以确保拒绝这批产品的概率达到0.9。解决方案(1)让Xi代表第I个测量值,我代表由第I个测量引起的随机误差(I=1,2、),然后Xi=I. i U(-1,1)由标题设定。因此,在示例5中,物理量被独立地测量几次,并且由每次测量产生的随机误差在(-1,1)内服从均匀分布。(1)如果将N次测量的算术平均值作为测量结果,则获得其与真值之差小于正数的概率;(2)当n=36,=1/6时,计算概率的近似值;(3)要使上述概率不小于0.95,需要进行多少次测量?从标题可知,X1,Xn是独立且同分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论