常用分布概率计算的Excel应用(共14页)_第1页
常用分布概率计算的Excel应用(共14页)_第2页
常用分布概率计算的Excel应用(共14页)_第3页
常用分布概率计算的Excel应用(共14页)_第4页
常用分布概率计算的Excel应用(共14页)_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上上机实习 常用分布概率计算的Excel应用利用Excel中的统计函数工具,可以计算二项分布、泊松分布、正态分布等常用概率分布的概率值、累积(分布)概率等。这里我们主要介绍如何用Excel来计算二项分布的概率值与累积概率,其他常用分布的概率计算等处理与此类似。§3.1 二项分布的概率计算一、二项分布的(累积)概率值计算用Excel来计算二项分布的概率值Pn(k)、累积概率Fn(k),需要用BINOMDIST函数,其格式为:BINOMDIST (number_s,trials, probability_s, cumulative)其中 number_s: 试验成

2、功的次数k;trials: 独立试验的总次数n;probability_s: 一次试验中成功的概率p;cumulative: 为一逻辑值,若取0或FALSE时,计算概率值Pn(k);若取1或TRUE时,则计算累积概率Fn(k),。即对二项分布B(n,p)的概率值Pn(k)和累积概率Fn(k),有 Pn(k)=BINOMDIST(k,n,p,0); Fn(k)= BINOMDIST(k,n,p,1)现结合下列机床维修问题的概率计算来稀疏现象(小概率事件)发生次数说明计算二项分布概率的具体步骤。例3.1 某车间有各自独立运行的机床若干台,设每台机床发生故障的概率为0.01,每台机床的故障需要一名维

3、修工来排除,试求在下列两种情形下机床发生故障而得不到及时维修的概率 :(1)一人负责15台机床的维修;(2)3人共同负责80台机床的维修。 原解:(1)依题意,维修人员是否能及时维修机床,取决于同一时刻发生故障的机床数。设X表示15台机床中同一时刻发生故障的台数,则X服从n=15,p=0.01的二项分布: XB(15,0.01),而 P(X= k)= C15k(0.01)k(0.99)15-k ,k = 0, 1, , 15故所求概率为P(X2)=1-P(X1)=1-P(X=0)-P(X=1)=1-(0.99)15-15×0.01×(0.99)14=1-0.8600-0.1

4、303=0.0097 (2)当3人共同负责80台机床的维修时,设Y表示80台机床中同一时刻发生故障的台数,则Y服从n=80、p=0.01的二项分布,即YB(80,0.01)此时因为 n=8030, p=0.010.2所以可以利用泊松近似公式: 当n很大,p较小时(一般只要n30,p0.2时),对任一确定的k,有(其中l=np)来计算。由l=np=80×0.01=0.8, 利用泊松分布表,所求概率为P(Y4)=0.0091我们发现,虽然第二种情况平均每人需维修27台,比第一种情况增加了80%的工作量,但是其管理质量反而提高了。 Excel求解:已知15台机床中同一时刻发生故障的台数XB

5、(n,p), 其中n=15, p=0.01,则所求概率为P(X2)=1-P(X1)=1-P(X=0)-P(X=1)=1- P15(0)-P15(1)利用Excel计算概率值P15(1)的步骤为:(一)函数法:在单元格中或工作表上方编辑栏中输入“= BINOMDIST(1,15,0.01,0)” 后回车,选定单元格即出现P15(1)的概率为0.(图3-1)。图3-1 直接输入函数公式的结果(函数法)(二)菜单法:1. 点击图标“fx” 或选择“插入”下拉菜单的“函数”子菜单,即进入“函数”对话框(图3-2);2. 在函数对话框中,“函数分类”中选择“统计”,“函数名字”中选定“BINOMDIST

6、”,再单击“确定”;(图3-2)图3-2 “插入”下的“函数”对话框2. 进入“BINOMDIST”对话框(图3-3),对选项输入适当的值:在Number_s窗口输入:1(试验成功的次数k);在Trials窗口输入:15(独立试验的总次数n);在Probability_s窗口输入:0.01(一次试验中成功的概率p);在Cumulative窗口输入:0(或FALSE,表明选定概率值Pn(k));图3-3 “BINOMDIST”对话框 4最后单击“确定”,相应单元格中就出现P15(1)的概率0.。类似地若要求P15(0)的概率值,只需直接输入“= BINOMDIST(0,15,0.01,0)”或利

7、用菜单法,在其第3步选项Number_s窗口输入0,即可得概率值0.,则 P(X2)= 1- P15(0)-P15(1)=1-0.-0.=0.00963。另外,P(X2)=1-P(X1)=1-F15(1),即也可以通过先求累积概率F15(1)来求解。而要求出F15(1)的值,只需在单元格上直接输入“= BINOMDIST(1,15,0.01,1)”回车即可;或利用上述菜单法步骤,在第3步的选项Cumulative窗口输入:1,即得到累积概率F15(1)的值0.99037,故有P(X2)=1-P(X1)=1- F15(1)=1-0.99037=0.00963。对于例3.1,Y表示80台机床中同一

8、时刻发生故障的台数,则Y服从n=80、p=0.01的二项分布,即YB(80,0.01)。所求概率为P(Y4)=1- P(Y3)=1- F80(3)利用Excel,在单元格上直接输入“= BINOMDIST(3,80,0.01,1)”回车或与上述菜单法类似操作可得累积概率F80(3)=0.,故所求概率的精确值为 P(Y4)=1- P(Y3)=1- F80(3)=1-0.=0.00866。(注意:例3.1原解中的结果是泊松近似值)对于泊松分布、正态分布、指数分布等的概率计算步骤与上述二项分布的概率计算过程类似,只需利用函数法正确输入相应分布的函数表达式即得结果;或在菜单法的第2步选择POISSON

9、、NORMDIST、EXPONDIST等函数名,根据第3步对话框的指导输入相应的值即可。下面我们列出这些常用分布的统计函数及其应用。§3.2 泊松分布的概率计算一、泊松分布的(累积)概率值计算在Excel中,我们用POISSON 函数去计算泊松分布的概率值和累积概率值。其格式为:POISSON(x,mean,cumulative)其中 x: 事件数;Mean: 期望值即参数l。Cumulative: 为逻辑值,若取值为1或 TRUE,则计算累积概率值P(Xx),若取值为0或 FALSE,则计算随机事件发生的次数恰为 x的概率值P(X=x)。即对服从参数为l的泊松分布的概率值P(X=k

10、)和累积概率值P(Xk),有 P(X=k)=POISSON(k,l,0);P(Xk)= POISSON(k,l,1)。例如,在例3.1(2)的原解的泊松近似计算中,Y近似服从l=np=80×0.01=0.8的泊松分布P(l),需求P(Y4)。则在Excel中,利用函数POISSON(3,0.8,1)就可得到累积概率分布P(Y3)的值0.99092,则所求概率为 P(Y4)=1- P(Y3)=1-0.99092=0.00908。§3.3 正态分布的概率计算一、NORMDIST函数计算正态分布N(m,s2)的分布函数值F(x)和密度值f(x)在Excel中,用函数NORMDIS

11、T计算给定均值m和标准差s的正态分布N(m,s2)的分布函数值F(x)P(Xx)和概率密度函数值f(x)。其格式为:NORMDIST(x,mean,standard_dev,cumulative)其中 x: 为需要计算其分布的数值;Mean: 正态分布的均值m;standard_dev: 正态分布的标准差s;cumulative: 为一逻辑值,指明函数的形式。如果取为1或TRUE,则计算分布函数F(x)P(Xx);如果取为0或FALSE,计算密度函数f(x)。即对正态分布N(m,s2)的分布函数值F(x)和密度函数值f(x),有 F(x)=NORMDIST(x,m,s,1);f(x)=NORM

12、DIST(x,m,s,0)说明:如果 mean=0且standard_dev=1,函数 NORMDIST将计算标准正态分布N(0,1)的分布函数F(x)和密度j(x)。Excel求解例3.2 (1):对零件直径XN(135,52),应求概率P(130X150)= F(150)-F(130)在Excel中,输入 “=NORMDIST(150,135,5,1)” 即可得到(累积)分布函数F(150)的值“0.”,或用菜单法进入函数“NORMDIST”对话框,输入相应的值(见图3-4)即可得同样结果。图3-4 “NORMDIST”对话框再输入“=NORMDIST(130,135,5,1)”(或菜单法

13、)得到F(130)的值“ 0.”,故P(130X150)= F(150)-F(130)= 0.-0.=0.。二、NORMSDIST函数计算标准正态分布N(0,1)的分布函数值F(x) 函数NORMSDIST是用于计算标准正态分布N(0,1)的(累积)分布函数F(x)的值,该分布的均值为 0,标准差为 1,该函数计算可代替书后附表所附的标准正态分布表。其格式为NORMSDIST(z)其中 z:为需要计算其分布的数值。即对标准正态分布N(0,1)的分布函数F(x),有F(x)= NORMSDIST(x)。例3.3 设ZN(0,1), 试求P(-2Z2)。则输入“= NORMSDIST(2)” 可得

14、F(2)的值“ 0.”,输入“= NORMSDIST(-2)” 可得F(-2) 的值“0.”,故P(-2Z2)=F(2)-F(-2)=0.-0.=0.。三、NORMSINV函数计算标准正态分布N(0,1)的分位数函数NORMSINV用于计算标准正态分布N(0,1)的(累积)分布函数的逆函数F-1(p)。即已知概率值F(x)=p,由NORMSINV(p)就可以得到x(=F-1(p)的值,该x就是对应于p=1-a的标准正态分布N(0,1)分位数Z1-a。函数NORMSINV的格式为NORMSINV(probability)其中 probability: 标准正态分布的概率值p。则对标准正态分布N(

15、0,1)的分位数Za,有Za= NORMSINV(1-a)。Excel求解例3.2(2):在例3.2(2)原解的计算中,已求得,则由Excel中,NORMSINV(0.9)= 1.,得 ,故 s = 5/1.=3.。§3.4 指数分布的概率计算一、指数分布分布函数值和密度值的计算在Excel中,函数EXPONDIST用于计算指数分布的(累积)分布函数值F(x)和概率密度函数值f(x)。其格式为:EXPONDIST(x,lambda,cumulative)其中 x: 为需要计算其分布的数值;Lambda : 指数分布的参数值l。Cumulative: 为逻辑值,指定函数形式。

16、若取 1或TRUE,将计算分布函数F(x);若 取0或 FALSE,则计算密度函数f(x)。即对指数分布的分布函数值F(x)和密度函数值f(x),有 F(x)= EXPONDIST(x,l,1);f(x)= EXPONDIST(x,l,0)Excel求解例3.4:因X服从l=1/1000=0.001的指数分布,由EXPONDIST(1000,0.001,1)可得分布函数F(1000)=P(X1000)的概率值0.,故所求的概率为P(X>1000)=1- P(X1000)=1- F(1000)=1-0.=0.。§3.5 c2分布的概率计算一、CHIDIST函数计算c2分布的概率值

17、在Excel中CHIDIST函数用于计算c2分布的单侧概率值a= P(c2>x)。其格式为CHIDIST(x, deg_freedom)其中: x   用来计算c2分布单侧(尾)概率的数值。Deg_freedom   c2分布的自由度n。说明:如果参数deg_freedom 不是整数,将被截尾取整。即对c2(n)分布单侧概率值P(c2>x),有P(c2(n)>x)= CHIDIST(x,n)。例如 已知c2c2(15),要计算P(c2>20)的概率值,则只要在Excel中,输入函数“=CHIDIST(20,15)”即可得到所求值0

18、.。即P(c2>20)= 0.。二、CHIINV函数计算c2分布的上侧a分位数CHIINV函数用于计算c2分布的上侧a分位数c2a(n), 也就是计算单侧概率的CHIDIST函数的逆函数,即如果a=CHIDIST(x,n),则 CHIINV(a,n)=x。该函数的计算可代替概率统计书后所附的c2分布表。其格式为CHIINV(a ,deg_freedom)其中 a   为c2分布的单侧概率a。Deg_freedom   c2分布的自由度n。说明: 如果参数deg_freedom 不是整数,将被截尾取整。即对c2分布的上侧a分位数c2a(n),有c2a

19、(n)= CHIINV(a,n)。例如,对a=0.05,n=10时, 要求上侧a分位数c20.05(10)的值,只要在Excel中输入“=CHIINV(0.05,50)”即可得到“18.”,即c20.05(10)= 18.。§3.6 t分布的概率计算一、TDIST函数计算t分布的概率值在Excel中TDIST函数用于计算t分布的单侧概率值a=P(t>x)和双侧概率值a=P(|t|>x)。其格式为TDIST(x, deg_freedom, tails)其中 x   为需要计算t分布的数字。deg_freedom  t分布的自由度n。tails&

20、#160;  指明计算的概率值是单侧还是双侧的。若 tails=1计算单侧概率值a=P(t>x);若 tails=2,则计算双侧概率值a=P(|t|>x)。说明 参数 deg_freedom 和 tails不是整数时将被截尾取整。即对t(n)分布的单侧概率值P(t>x)和双侧概率值P(|t|>x),有P(t(n)>x)= TDIST(x,n,1);P(|t(n)|>x)= TDIST(x,n,2)。例如:要计算P(|t(60)|>2)的概率值,用“TDIST(2,60,2)”即得 0.。 即 P(|t(60)|>2)= 0.。二、TIN

21、V函数计算t分布双侧a分位数TINV函数用于计算t分布的满足P(|t|> ta/2(n)= a (即 P(t>ta/2(n) =a/2) 的双侧a分位数ta/2(n), 也就是计算双侧概率值函数TDIST(a,n,2)的逆函数,即如果a=TDIST(x,n,2),则TINV(a,n)=x。该函数的计算可代替书后t分布表(附表6)。其格式为TINV(a, deg_freedom)其中 a   为对应于t分布的双侧概率值;Deg_freedom   为t分布的自由度n。说明:如果 deg_freedom 不为整数时将被截尾取整。注意,函数 TIN

22、V(a,n)的值是ta/2(n),如果需要计算t分布的上侧a分位数ta(n),应由“=TINV(2*a,n)”得到,即ta(n)=TINV(2a,n)例如,对n=10时, t0.025(10)可由“=TINV(0.05,10)”得,其值为2.;而 t0.05(10)应由“=TINV(0.05*2,10)”得,其值为1.。对a=0.05,n=50时, t0.05(50) 由“=TINV(0.05*2,50)”得,其值为1.。而 TINV(0.05,50)=2.00856,是t0.025(50)(Z0.025=1.96)的值。§3.7 F分布的概率计算一、FDIST函数计算F分布的概率值

23、在Excel中FDIST函数用于计算F分布的单侧概率值a=P(F>x)。其格式为FDIST(x,deg_freedom1,deg_freedom2)其中: x   用来计算F分布单侧概率的数值;Deg_freedom1   F分布的第一(分子)自由度n1;Deg_freedom2   F分布的第二(分母)自由度n2。说明:如果参数deg_freedom1 或 deg_freedom2 不是整数,将被截尾取整。即对F(n1,n2)分布的单侧概率值PF(n1,n2)>x,有 PF(n1,n2)>x=FDIST(x,n1,

24、n2)。例如,对FF(10,5),需求概率值P(F>0.3),则在Excel中由“= FDIST(0.3,10,5)得0.,故 P(F(10,5)>0.3)= 0.。二、FINV函数计算F分布的上侧a分位数FINV函数用于计算F分布的上侧a分位数Fa(n1,n2), 也就是计算单侧概率的FDIST函数的逆函数,即如果a=FDIST(x,n1,n2),则 FINV(a,n1,n2)=x。FINV函数的计算可代替书后所附的F分布表。其格式为FINV(a,deg_freedom1,deg_freedom2)其中 a     对应于F分布的单侧概率值;Deg_freed

25、om1   F分布的第一(分子)自由度n1;Deg_freedom2   F分布的第二(分母)自由度n2。说明:如果 deg_freedom1 或 deg_freedom2 不是整数,将被截尾取整。即对F分布的上侧a分位数Fa(n1,n2),有Fa(n1,n2)= FINV(a,n1,n2)。例如,对a=0.05,F0.05(10,5)可由“=FINV(0.05,10,5)”得,其值为4.;而 F0.05(5,10)则由“=FINV(0.05,5,10)”得,其值为3.。另外,F0.95(10,5)可由“=FINV(0.95,10,5)”直接求得,其值为

26、0.。最后我们给出Excel中常用连续型分布统计函数的简明意义对照表,供查阅。分 布Excel统计函数对应概率值Excel统计函数对应分位数正态分布N(m,s2)NORMDIST(x,m,s,0) NORMDIST(x,m,s,1)正态密度f(x)P(Xx)F(x)NORMINV(p,m,s)X1-p=F-1(p)标准正态分布N(0,1)NORMSDIST(x)PZx=F(x)NORMSINV(p)Z1-p(=F-1(p))c2分布c2(n)CHIDIST(x,n)Pc2(n)>xCHIINV(a,n)c2a(n)T分布t(n)TDIST(x,n,1) TDIST(x,n,2)Pt(n)

27、>x P|t(n)|>xTINV(a,n) TINV(a*2,n) ta/2(n) ta(n)F分布F(n1,n2)FDIST(x,n1,n2)PF(n1,n2)>xFINV(a,n1,n2)Fa(n1,n2)上机训练题三1. 一电子仪器由200个元件构成,每一元件在一年的工作期内发生故障的概率为0.001。设各元件是否发生故障是相互独立的,且只要有一元件发生故障,仪器就不能正常工作。利用Excel中的统计函数来求:(1)仪器正常工作一年以上的概率;(2)一年内有2个以上(2)元件发生故障的概率。 2. 已知X服从l=4的泊松分布P(l),试用Excel求P(X<6)。

28、 3. 已知X(1.5, 22),试用Excel中的统计函数来求: (1) P(2<2.5);(2) P(<5);(3) P(|X-1.5|>2)。4利用Excel中的统计函数来计算下列各值(1)c20.99(10),c20.90(12),c20.01(60),c20.05(16); (2)t0.90(4),t0.01(10),t0.05(12),t0.025(60);(3)F0.01(10, 9),F0.05(10, 9),F0.90(28, 2),F0.95(10, 8)。5用Excel求以下各分布的概率值(1)P (c2(21)10); P (c2(21)15);(2)

29、P(t(4)3); P(|t(4)| 1.5);(3)P (F(4,12) 5); P(F(4,12)>3)。上机实习四 用Excel求正态总体参数的置信区间首先我们列出求解单个总体常用参数的置信区间简要结果表,可供查阅。表4-1 单个总体参数的100(1a)%置信区间总 体参 数条 件100(1a)%置信区间正态分布均 值 ms2已知s2未知s2未知(大样本n30)方 差 s2m未知标准差sm未知m未知(大样本n30)下面讨论用Excel软件来求正态总体的总体均值和方差的常用置信区间问题。§4.1 用Excel求s2已知时总体均值的置信区间总体方差s2已知时,求总体均值m的1

30、00(1a)%的置信区间公式为: 即 。例4.1 设某药厂生产的某种药片直径X是一随机变量,服从方差为0.82的正态分布。现从某日生产的药片中随机抽取9片,测得其直径分别为(单位:mm)14.1,14.7,14.7,14.4,14.6,14.5,14.5,14.8,14.2,试求该药片直径的均值m的95%置信区间。解:对药片直径X,已知X服从N(m, 0.82)。对于1a=0.95,则a=0.05,查标准正态分布分位数表得临界值Za/2 =Z0.025=1.96,又已知s=0.8,n=9, 故所以,该药片直径的均值m的95%置信区间为(13.98,15.02)。在Excel中,利用样本均值函数

31、AVERAGE和置信区域函数CONFIDENCE就可以分别得到和的值,由此即可得到置信区间的上、下限。其中统计函数AVERAGE和CONFIDENCE的格式分别为:AVERAGE(number1,number2, .) 返回参数平均值(算术平均值)。其中 Number1, number2, . 要计算平均值的 130 个参数。参数可以是具体数字,或者是涉及数字的名称、数据范围或引用。CONFIDENCE(alpha, st_dev, size),返回总体均值的置信区域,即样本均值任意一侧的区域大小。其中 alpha   显著水平a,对应的置信度等于100*(1-a)%,亦即

32、,如果 alpha 为 0.05,则置信度为 95%。st_dev   数据区域的总体标准差s,假设为已知。size   样本容量n。现以例4.1的求解来说明已知方差s2时,用Excel构造总体均值的置信区间的具体步骤。Excel求解例4.1:为构造例4.1所求的置信区间,我们在工作表中输入下列内容:A列输入例4.1的样本数据;C列输入指标名称;D列输入计算公式即可得到所需估计的95%置信区间上、下限(见图4-1)。由图4-1中计算结果知,所求药片直径均值m的95%置信区间为(13.98,15.02)。图4-1 说明:(1)在图4-1中,F列为D列的计算

33、显示结果,当输入完公式后,回车即显示出F列结果,这里只是为了看清公式,才给出了D列的公式形式。(2)对于不同的样本数据,只要输入新的样本数据,再对D列公式中的样本数据区域相应修改,置信区间就会自动给出。如果需要不同的置信水平,只需改变置信区域函数CONFIDENCE的相应数值即可。§4.2 用Excel求s2未知时总体均值的置信区间总体方差s2未知时,求总体均值m的100(1a)%的置信区间公式为: 即 。例4.2 设有一组共12例儿童的每100ml血所含钙的实测数据为(单位:微克):54.8,72.3,53.6,64.7,43.6,58.3,63.0,49.6,66.2,52.5,

34、61.2,69.9, 已知该含钙量服从正态分布,试求该组儿童的每100ml血平均含钙量的90%置信区间。解:由实测数据的计算可得到: =59.14, S2=74.15 ,8.61又对于 1a=0.90,a=0.1,而自由度n-1=11, 查t分布表得临界值ta/2(n-1) = t0.05(11)=1.796则 故所求平均含钙量的90%置信区间为(54.68,63.6)。在Excel中,利用“数据分析”菜单的“描述统计”计算结果中“平均”和“置信度”,就可分别得到和的值,由此即可得到所求置信区间。Excel求解例4.1:现以例4.1的求解来说明求置信区间的具体操作步骤: 1 输入数据:将例4.

35、1样本数据输入到工作表中的A1:A12(见图4-3); 2在菜单中选取“工具数据分析描述统计”,点击“确定”; 3当出现“描述统计”对话框后,指定参数:(图4-2) 在“输入区域”方框内键入A1:A12; 在“分组方式”圆点内选择逐列;在“输出选项”中选择“输出区域”为C1;选定“汇总统计”;选定“平均数置信度”,并将置信度改为“90”%;6点击“确定”。如下列图4-2所示图4-2由此即可得到样本数据的描述性统计量的结果,如图4-3所示图4-3根据描述统计量计算结果中样本均值(平均)=59.142和置信区间半径(置信度)=4.464,就可得所求平均含钙量的90%置信区间为(59.142-4.464

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论