试验十三二项分布的计算与中心极限定_第1页
试验十三二项分布的计算与中心极限定_第2页
试验十三二项分布的计算与中心极限定_第3页
试验十三二项分布的计算与中心极限定_第4页
试验十三二项分布的计算与中心极限定_第5页
免费预览已结束,剩余4页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验十三 二项分布的计算与中心极限定实验目的1. 研究用Poisson逼近与正态逼近进行二项分布近似计算的条件2. 检验中心极限定理 1引言.项分布在概率论中占有很重要的地位。N次Bernoulli实验中正好出现K次成功的概率有下式给出b k; n, pCri pk 1,k=0,1,2,.n.二项分布的值有现成的表可查,这种表对不同的n及p给出了 b(k;n.p)的数值。在实际应用中。通常可用二项的Poisson逼近与正态逼近来进行二项分布的近似计算。在本实验中,我们来具体地研究在什么条件下,可用Poisson逼近与正态逼近来进行二项分布的近似计算。在概率论中,中心极限定理是一个很重要的内容,

2、在本实验中,我们用随即模拟的方法来检验一个重要的中心极限定理Liderberg-Levi中心极限定理。 2实验内容与练习1. 1二项分布的Poisson逼近用 Mathematica 软件可以比较方便地求出二项分布的数值。例如 n=20;p=0,1;TableB in omial n, k*pAk*(1-p)( n-k),k,0,20给出了b(k;20,0.1)(k=0,1,2,.,20)的值。联系 1 用 Mathematica 软件给出 了 b(k;20,0.1),b(k;20,0.3)与 b(k;20,0.5)(k=0,1,2,.,20)的值。我们可用Mathematica软件画出上述数

3、据的散点图,下面的语句给出了b(k;20.0.1)的(连线)散点图(图 13。1):LISTpOLTtableBi nomi al20,k*0.1Ak*0.9A(20-k),b k; n, pk kCn pk 1k,0,20,PlotJoi ned-True图 13.1b(k;20,0.1)(k=1,1,2,20)的散点图练习 2 绘出 b(l;20,0.3) 与 b(k;20,0.5)(k=0,1,2,20)的散点图根据下面的定理,二项分布可用Poisson分布来进行近似计算。定理13。1在Bernoulli实验中,以Pn代表事件A在试验中出现的概率,它与试验总 数有关.如果npn入,则当n

4、is时,kb k; n, p e k由定理13 ,1在 n很大,p很小,而入=np大小适中时,有b k; n.pc k pk 1n.,100) 与练习 3 用 Poisson 逼近给出 b(k;100,0.01)(k=0,1,2, b(k;1000,0.001)(k=0,1,2,1000)的近似值,并与它们的精确值比较,表13, 1二项分布的Poisson逼近kB1(k)B2(k)P(k)R1(k)R2(k)03.6603210-13.6769510-13.6787910-11.8510-31.8410-413.6973010-13.6806310-13.6787910-11.8510-31.

5、8410-421.8486510-11.8403210-11.8349010-19.2510-49.2010-536.0999210-26.1282510-26.1316210-23.1410-43.0710-541.4941710-21.5290010-21.5328310-23.8710-43.8310-552.8977910-33.0488110-33.0656610-31.6810-41.6910-564.6345110-45.0610010-45.1094410-44.7510-54.8410-676.2863510-57.1938110-57.2992010-51.0110-51.

6、0510-687.3816910-68.9382610-69.1239910-61.7410-61.8610-797.6219510-79.8618110-71.0137810-62.5210-72.7610-8107.0060410-89.7828410-81.0137810-73.1310-83.5510-9表 13。1 给出了 b(k;100.0.01)(k=0,1,2,10)(表 中即位 b1(k) 与b(k;1000,0.001)(k=0,1,2,.10)(记为 b2(k)的 Poisson 逼近的近似值记为 p9k)与它们的精确值的比较,其中 r1(k)=/b1(k)-p9k) /

7、,r2(k)=/b2(k)-p(k)/从表 13。1 可以看出,用Poisson 分布来计算 b(k;1000,0.001) 比 b(k;100,0.01)的效果好得多,我们可以画出它们的散点图(图 13。2)来观察近似计算的效果,下面的程序给出了b(k;20,0.1)Clear n, k,l,p,b ;bk_. n_. p_Bi no mialn, kpA klp al2.0; n20;pl n;t1Tablek,Nb k, n,pJk, 0,20 ;g1ListPlott1,PlotJoi nedTrue,PlotStyleGrayLevel0.2,Thicknes0.001PlotRa

8、nge0.20 ,0,0.3pas k_, n_,p_ :lA kkExp 1t2Tablek,Npas k,n,p,k,0, 20 ;g2listPlott2,PlotJoi nedtrue,PlotStyleDashi ngPlotRa ngeShow g1, g2 ;0.1GrayLevel0.002, Thickness0.010, 20 ,0, 0.3;似计算的精确值的比较图13。2b(k;20,0.1) 的Poisson近似计算的精确值的比较练习4绘出b(k;1OO,O.O1) 与b(k;1OOO,O.OO1)的近似计算与精确计算的散点图。那么n,p,入。到底取何值时,我们可以用P

9、oisson分布来近似计算二项分布的值呢?我们可以用误差来作为衡量标准评价缉私的效果若n与p给定,则b(k;n,p)与其Piosson逼近的误差是的k函数;根据上式可以定义二项分布的Poisson逼近的误差定义13。2若n,p给定,我们定义二项分布b(k;n,p)(k=0,1,p)的Poisson逼近的误差为;差通过简单的程序运算我们可以求得;p100,0.01=1.85*10-3 p1000,0.00仁1.84*10-4练习5通过编程求出在 n=10,100,1000 与10000,入=0.1,1 与10时,二项分布的Poisson逼近的误差,填入表 13, 2;表13。2二项分布的Pois

10、son逼近的误差表n入0.11.010.0101001.8510-310001.8410-410000你能从中发现什么规律那?在一定条件下我们可以认为,若绝对误差p10-3,不能接受计算结果,即此时不能用Poisson逼近来缉私计算二项分布的值,若n=1000,p=0.001,贝U p1000,0.00仁1.8410-4=10-3,必须n=185练习6在入=0.1,0.5,2.0,5.0,10.0 时,n取何值,可使绝对误差p=10-3 ?图13。3Poisson逼近的误差(入=1)练习7若误差标准该为p :时,有1-1 k npexp2 1cnkpkqknpq2npq图13.4b(k;20,

11、0.1)的正态逼近近似计算与精确的比较。图13。5用另一种图13。4是b(k;20,0.1) 的正态逼近的近似值与精确的比较的散点图 方式更直观地显示出逼近的效果。图13。5中,阶梯函数给出概率Gkpkqn-k,而曲线则给出对应的正态分布密度函数。其Mathematica程序如下:n20; p0.1;q 1p;tabTableBino mialn, kpA k1p an k ,k, 0.20f k_: GraphicsGrayLevel0.5,Recta nglek0.5,0 ,k 0.5,tabk 1g1JTable f kk,0, 20Jh x_:1 Sqrt2Pi n pqExpxpSq

12、rt np q a 22.0Jg2Plot h x ,x,2.0,15JPlotRa nge2, 15 ,0, 0.3;Show g1, g2, PlotRange2, 15 ,0, 0.3, Axes True由于n的取值比较小,我们可以看出,近似的效果不是很好。练习 9 用正态逼近给出 b(k;100,0.01)(k=0,1,2,100)与 b(k;1000,0.001)(k=0,1,2,1000)的近似值,与它们的精确值作比较。做出近似计算与精确计算的散点图。练习10 做出b(k;100,0.01) 与b(k;1000,0.001)的阶梯函数与对应的正态分布密度函=数曲线,观察其效果。若

13、n与p给定,我们也可以定义二项分布b(k;n,p) (k=0,1,2,n)的正态逼近的误差为:Nk,p =maxN,p(k)=max|Cnkpkqn-k-(1/. npq )(1/. 2)exp(-(1/2)(k-np)/ . npq A2)是、式中 q=1-p.练习11 若分别取0.1,0.5,1.0,2.0,5.0,10.0,n取何值时,可使绝对误差”=10人-3?练习12 n ,p取何值时,可以用正态逼近来近似计算二项分布的值。练习13 比较二项分布的 Poisson逼近与正态逼近的优劣。2. 3中心极限定理的验证1. 正态分布的假设检验在实际应用中,有许多随机数据都可以看作来自于正态分

14、布。那么,如何检验一批数 据是否来自于正态分布呢?按照国家标准,我们采用D检验来判断随机数据的正态性。下面通过一个例子介绍 D检验的过程。例下面是某种刀具生产的合格零件个数(已用 Mathematica语句的形式给出),判断它们是否满足正态分布:t=459,362,624,509,584,433,748,815,505,612,452,434,982,640,742,565,706,593,680,926,653,164487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697

15、,515,628,954,771,609,402,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,339,280,246,687,539,790,581, 62,724,531,512,577,496,468,499,544,645, 764,558,378,765,666,763,217,715,310,851,解 (1)将100个数据按非减次序排列:X (1) =X( 2) = =X 100)(2) 计算统计量(其中n=100,X是数据样本的均值):计算统计量;Y

16、=D0.28209479)0.02998598(4) 给定检验水平a =0.05,查表得临界值 Za/2,; =-2.54 及乙一 “/2 =1.31.(5) 若Z a/2YZ- a/2.,则接受正态分布假设,否则拒绝正态分布假设。经计算得Y=-1.2933,显然-2 .54-1.29331.31,接受正态分布假设.D检验的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,dada=Sortdada1,N=Le ngthdada;Mea n=Sumdadak,k,1, n/n;D1= Sum(k- (n+1)/2)*dadak,k,1, n;D2=(S

17、qrt n)ASqrtSum(dadak-mea n)A2,k,1, n;D=d1/d1;Y=Sqrt n *(d-0.28209479)/0.02998598;Result=lfz1yz2,1,0;Returnresult;Ft运行该程序(运行程序前已将题给数据 t输入),得ft的结果为1,表示通过正态检验。 当 然,我们可将程序中 Ifz1yz2 ,1,0 语句改为lfz1yz2,Print “succeed ”,Print“fail ” 来输入是否通过检验的信息。D检验的几个常用的临界值见表13.3表13.3 D检验的临界值表a /n0.0050.0250.050.950.9750.99

18、5100-3.57-2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25练习14用Mathmatica软件产生2000个标准正态分布的伪随机数(参见实验十二),用D检验的方法检验其正态性。2 中心极限定理的检验F面我们来研究一个重要的中心极限定理。定理13.3(Liderberg_Levi) 设& 1, e 2,e n,是一串相互独立相同分布的随机变量,且.2EE i=m, D E =,对于标准化随机变量之和E n=1/(T

19、 E( E i-m),2在0 b 时,有-t2/2LimP E nx=1/2 / e dt.我们先讨论相互独立的随机变量E i (每个E i服从二项分布b (k; 20, 0.1 ) (1=1,2,)之和的极限情况。已知 EE i =m=2, DE i =b 2=1.8, 考虑标准化随机变量之和E n=1/ b 刀(E i-m).对于固定的n,我们每次Mathematica软件模拟100个分布E n的随机数,然后D用检验来判 定其是否能通过正态分布检验 . 重复一定的次数 ,观测其能通过正态分布检验的比率 .在下面 的程序中 , 我们取 n=30( 程序中的 number)Statistics

20、 Disstributions rndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j=whole,j+,A=;ForI=1,ITrue,PlotStyle-Graylever0.1,Dashi ng0.02,Thickn ess0.01,PlotRa nge-0,20,0,0.3;上述语句中PlotStyle 的三个选项的含义: Graylever0.5图形的灰度值为0.5.(2) Dash

21、in g0.02图形为虚线,其中虚线长度为0.02.(3) Thickness0.01图形为粗线,线的宽度值为0.01. D=(3) 计算统计量;Y=0.28209479)0.02998598(4) 给定检验水平a =0.05,查表得临界值 Za/2,; =-2.54 及乙一 a/2 =1.31.(5) 若Z a/2YZ- a/2.,则接受正态分布假设,否则拒绝正态分布假设。经计算得Y=-1.2933,显然-2 .54-1.29331.31,接受正态分布假设.D检验的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,dada=Sortdada1,N=L

22、e ngthdada;Mea n=Sumdadak,k,1, n/in;D1= Sum(k- (n+1)/2)*dadak,k,1, n;D2=(Sqrt n)ASqrtSum(dadak-mea n)A2,k,1, n;D=d1/d1;Y=Sqrt n *(d-0.28209479)/0.02998598;Result=Ifz1yz2,1,0;Returnresult;Ft运行该程序(运行程序前已将题给数据 t输入),得ft的结果为1,表示通过正态检验。 当 然,我们可将程序中 Ifz1yz2 ,1,0 语句改为lfz1yz2,Print “succeed ”,Print“fail ” 来输入是否通过检验的信息。D检验的几个常用的临界值见表13.3表13.3 D检验的临界值表a /n0.0050.0250.050.950.9750.995100-3.57-2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25练习14用Mathmatica软件产生2000个标准正态分布的伪随机数(参见实验十二),用D检验的方法检验其正态性。2 中心极限定理的检验下面我们来研究一个重要的中心

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论