几种常见的概率分布率 (1)_第1页
几种常见的概率分布率 (1)_第2页
几种常见的概率分布率 (1)_第3页
几种常见的概率分布率 (1)_第4页
几种常见的概率分布率 (1)_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、离散型概率分布 二项分布(binomial distribution) 泊松分布(poisson distribution) 超几何分布(hypergeometric probability distritution) 负二项分布(Negative binomial distribution)u贝努利试验(Bernoulli trial) : 我们把只有两种可能观测值(每次试验只可能是两个对立事件之一)的随机试验统称为贝努利试验。这种试验在实际中广泛存在,如观察某一实验动物的卵孵化与否、某一实验动物是雌性还是雄性、实验反应是阴性还是阳性等。un次独立地贝努利试验称为n重贝努利试验,其试验结果的

2、分布(一种结果出现x次的概率是多少的分布)即为二项分布。 u应用二项分布的重要条件是:每一种试验结果在每次试验中都有恒定的概率,各试验之间是重复独立的。3.1 二项分布 B(nB(n, p), p) 例:例3.1注意:1)放回式抽样适用于二项分布,非放回式抽样适用于超几何分布;2)通式为:n = 试验次数; x = 在n次试验中事件A出现的次数p= 事件A发生的概率(每次试验都是恒定的)1p= 事件 发生的概率P(x) = X 的概率函数为 P(X=x); F(x) = P( Xx )AxnxxnppcxP-=)1 ()(例3.1 从雌雄各半的100只动物中抽样(放回式抽样),抽样共进行10次

3、,问其中包括3只雄性动物的概率是多少?包括3只及3只以下的概率是多少?即求P(X3)和P(X3) 此例中:n=10, x=3,p=0.5,求P(3) 和F(3)。则,将x0,1,2,3代入通式,可得到出现0,1,2,3只雄性动物的概率。 P(0) 0.0009766 P(1) 0.0097656 P(2) 0.0439453 P(3) 0.1171876所以,抽到3只和3只以下雄性动物的概率为: F(3)P(0)P(1)P(2)P(3)0.1718751 733105 . 015 . 03-= CP一、 服从二项分布的随机变量的特征数平均数平均数:np , p (用比率表示时) 方差方差: (

4、用比率表示时) 偏斜度:偏斜度:峭度:峭度:从以上公式可以看出二项分布决定于两个参考数:试验次数n 和概率P,因此其图形变化趋势与这两个参数有关。npppnp)1 ( ),1 (22-=-=)1 (211pnpp-=npnp6)1 (12-=n=10,p0.0100.20.40.60.810246810n=100,p0.0100.10.20.30.40.50255075100n=500,p0.0100.10.20.30.40.50100200300400500n=10,p0.1000.10.20.30.40.50246810n=100,p0.1000.050.10.150.2025507510

5、0n=500,p0.1000.020.040.060.080.10100200300400500n=10,p0.5000.10.20.30246810n=100,p0.5000.020.040.060.080.10255075100n=500,p0.5000.010.020.030.040.050100200300400500例3.2 用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔杂交,F1代为黑色正常毛长的家兔(BbRr), F1代自交,F2代表型比为:9/16B_R_ : 3/16B_rr : 3/16bbR_ : 1/16bbrr。问最少需要多少F2代家兔,才能以99的概率得到一

6、个棕色短毛兔(bbrr)? 解解: 设设p为非棕色短毛兔出现的概率,则为非棕色短毛兔出现的概率,则1p就为棕色短毛就为棕色短毛兔出现的概率。兔出现的概率。 在在p(1p)n的展开式中只有第一项的展开式中只有第一项pn无棕色短毛兔无棕色短毛兔出现,因此出现,因此n值可由值可由pn10.99求出。求出。 pn (15/16)n 0.01 n(lg15lg16) lg0.01 -0.02803n 2.00000 n 71.4二、 二项分布应用实例二项分布的应用条件有三: (1)各观察单位只具有互相对立的一种结果,如阳性或阴性, 生存或死亡等, 属于二项分类资料; (2)已知发生某一结果 (如死亡)

7、的概率为p,其对立结果的概率则为1-p=q,实际中要求 p 是从大量观察中获得的比较稳定的数值; (3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。3. 2 泊松分布P() 在生物学研究中,有许多事件出现的概率很小,而样本容量或试验次数却往往很大,即有很小的p值和很大的n值。这时二项分布就变成另外一种特殊的分布,即泊松分布。 如,显微镜视野内染色体有变异的细胞计数、单位容积的水中细菌数目的分布、作物种子内杂草的分布以及样方内少见植物的个体数等都属于泊松分布。 其概率函数可由二项分布的概率函数推导。一、泊松分布概率函数的推导xnxxnxxnxxnpp

8、xxnnnnppxnxnppcxp-=-=-=)1 (!) 1()2)(1()1 ()!( !)1 ()((将系数的分子分母同乘以(将系数的分子分母同乘以nx)!)1 ()()11 ()11 ( 1xpnpnxnxnx-=xnxpx-=)1 (!)(1)1(!xnppxpx-=ep)(1lim ,z)(1lime p10pz10z=-=-=exx!平均数:平均数:=方差:方差: 2 = 偏斜度:偏斜度:峭度:峭度: 概率函数内的概率函数内的 ,不但是它的平均数,而且是不但是它的平均数,而且是它的方差。它的方差。 很大时,很大时, 1和和2则接近于则接近于0,这时的泊松分布近,这时的泊松分布近似

9、于正态分布。似于正态分布。 二、 服从泊松分布的随机变量的特征数 1 1 = = 12= =三、 泊松分布应用实例例3.5 在麦田中,平均每10m2有一株杂草,问每100m2麦田中,有0株、1株、2株、杂草的概率是多少? 解: 先求出每100m2麦田中,平均杂草数 100/10 10株 将代入泊松分布的概率密度函数中, p(x) = 10 x/(x!e10),( e=2.71828) 即可求出x 0,1,2, 时所相应的概率。 例:为监测饮用水的污染情况, 现检验某社区每毫升饮用水中细菌数 , 共得400个记录如下: 试分析饮用水中细菌数的分布是否服从泊松分布,计算每毫升水中细菌数的概率及理论

10、次数并将頻率分布与泊松分布作直观比较。 解:经计算得每毫升水中平均细菌数为0.500 x 0.5,s20.496,两者相接近,可认为服从泊松分布 代入泊松分布公式1ml水中细菌数0123合计次数f2431203164005.0!5.0)(-=ekkxPk 注意,二项分布的应用条件也是泊松分布的应用条件。比如二项分布要求n 次试验是相互独立的,这也是泊松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不符合泊松分布的应用条件。1ml水中细菌数0123合计实际次数f243120316400频率0.60750.30000.07750.015

11、01.00概率0.60650.30330.07580.01441.00理论频数242.60121.3230.325.764003. 3 正态分布 在生物统计学中,正态分布占有极其重要的地位。许多生物学现象所产生的数据,都服从正态分布。一、 正态分布(xN (,2))的密度函数与分布函数正态曲线正态分布的规律是数据分布集正态分布的规律是数据分布集中在平均数附近,并且在平均中在平均数附近,并且在平均数的两侧成对称分布。正态分数的两侧成对称分布。正态分布布密度函数密度函数的图像,称为正态的图像,称为正态曲线。曲线。密度函数:密度函数:分布(累积)函数:分布(累积)函数:0,21)(222)( -=

12、=- - - xexfxdueduufxXpxFxxu-=222)(21)()()(正态分布密度曲线特点: 密度曲线以x=直线为对称; x=和x=-所确定的点为曲线的两个“拐点”; 曲线向左、向右无限延伸,以x轴为渐近线; x= 时,f(x) 具有最大值,其值为 ; 的大小,决定曲线的“胖”、“瘦”程度(展开程度),越小,曲线越“瘦”,数据越集中,越大,曲线越“胖”,数据越分散。 固定时,值决定曲线的位置,当增大时曲线向右平移,当减少时曲线向左平移,但曲线形状不变。 21二、 标准正态分布-=udeuUPuF2221)()(=0,=1时的正态分布称为时的正态分布称为标准正态分布标准正态分布。密

13、度函数:密度函数:分布函数:分布函数:-=-ueufu,21)(22-=xu标准正态分布有以下特性: =0时,概率密度值最大; 概率密度曲线向左、向右无限延伸,以x轴为渐近线;左右对称 u =1和u =1是概率分布曲线的两个拐点; 曲线与横坐标轴所夹的图形面积为1; 累积分布函数曲线从到0平稳上升,围绕点(0,0.5)对称; 标准正态分布的偏斜度1和峭度2均为零。以下一些特征值很重要: P P(-1u-1u1 1)=0.6826=0.6826 P P(-2u-2u2 2)=0.9545=0.9545 P P(-3u-3u3 3)=0.9973=0.9973以下一些特征值很重要: P(-1.96

14、u1.96)=0.95P (-2.58u2.58) =0.99三、 正态分布表的查法 对于标准正态分布,其累积分布函数值F(u)可直接查表(书p315附表1)得到,其值等于标准正态曲线与横坐标轴从到u所夹的面积,该曲线下的面积即表示随机变量U 落入区间(,u)的概率; 标准正态分布查表常用的几个关系式:P(0U u1)=F(u1)=1F(u1)P(Uu1)=2F(u1)P(Uu1)=1 2F(u1)P(u1U u2)=F(u2)F(u1) x=5= 109.2正态分布正态分布u=0 = 10.42标准正态分布标准正态分布v对于一般正态分布,要先进行标准化,再查表对于一般正态分布,要先进行标准化

15、,再查表; 标准化的公式为:标准化的公式为:-=xu例3.7 查标准正态分布u-0.82 及u1.15时的F(u)的值例3.8 随机变量u服从正态分布N(0,1),问随机变量u的值落在(0,1.21)区间的概率?例3.9 已知随机变量u服从正态分布N(0,1),问随机变量u的值落在(-1.96,1.96)区间的概率是多少?例3.10 已知某高粱品种的株高X服从正态分布N(156.2,4.822),求:00. 182. 42 .156161= =- -= =- - x62. 182. 42 .156164= =- -= =- - x20. 182. 42 .156162= =- -= =- -

16、x87. 082. 42 .156152- -= =- -= =- - x利用公式利用公式P(0Uu)=F(u)0.5利用公式利用公式 P( U u)=1 2F(u) 或或 P(u1Uua)=时的ua值;下侧分位数: P(uua/2 )=时的ua值(从附表2中以 /2查出的ua即可);大数定律与中心极限定理的应用 样本容量越大,样本统计数与总体参数之差越小。 对于容量大于30的样本,样本均值的分布可以较好地用一个正态分布近似(其中均值为 ,即,样本均值的平均值,标准差为 ,即,样本均值的标准差)样本容量越大,近似的效果越好。 如果原始总体就是正态分布,则对于任意样本容量n,样本均值都将是正态分

17、布的。n EXCEL在本章内容的应用在本章内容的应用EXCELEXCEL电子表格提供的粘帖函数电子表格提供的粘帖函数BINOMDIST 计算二项式分布的概率值NORMDIST 计算正态分布的累积函数NORMINV 计算正态分布累积函数的逆函数NORMSDIST 计算标准正态分布的累积函数NORMSINV计算标准正态分布累积函数的逆函数POISSON 计算泊松分布的概率AVERAGE计算算术平均值GEOMEAN 计算几何平均数MAX 计算最大值MEDIAN计算一组给定数字的中位数STDEV计算样本标准差STDEVP计算样本总体的标准差VAR计算样本的方差VARP计算样本总体的方差各种分布函数计算

18、1、二项分布工具mnmmnqpCmP-=)()!( !mnmnCmn-=平均数、方差和标准差np=npq=2npq=二项分布的概率函数为二项分布函数的概率及累积概率的计算实例二项分布函数的概率及累积概率的计算实例 已知某种猪病的死亡率为30%,现有10头病猪,如不给予治疗,问死亡4头及死亡4头和4头以下的概率为多少?解:死亡4头的概率计算公式为:200. 07 . 03 . 0)4(64410= CP死亡4头和4头以下累积概率的计算公式为:85. 0)()4()4(40=xxPxPF用粘帖函数 BINOMDIST 计算死亡4头的概率计算本计算在编缉栏中为本计算在编缉栏中为BINOMDISTBI

19、NOMDIST(4 4,1010,0.300.30,FALSEFALSE) 死亡4头和4头以下概率的计算本计算在编缉栏中为BINOMDIST(4,10,0.30,TRUE) 利用BINOMDIST函数和填充柄计算2 2、泊松分布工具、泊松分布工具 泊松分布的概率函数 为常数,它等于平均数等于方差 -=ekkPk!)(=2 泊松分布概率的计算实例泊松分布概率的计算实例 已知某一地区,出现怪胎的事件服从泊松分布P(2),请计算该地区出现3次怪胎的概率,及出现3次和3次以下怪胎的概率为多少? 出现3次怪胎概率的公式为:出现3次和3次以下怪胎的概率计算公式为:1804. 0! 32)3(23=-eP8

20、571. 0! 32! 22! 12! 02)() 3(2322212030=-=eeeekPkPk用用POISSONPOISSON粘帖函数计算粘帖函数计算出现3次怪胎概率的计算本计算在编缉栏中显示POISSON(3,2,FALSE) 出现3次和3次以下怪胎的概率计算本计算编缉栏中显示POISSON(3,2,TRUE) 3 3、正态分布工具、正态分布工具 用符号N(,2) 表示(1)、正态分布的概率函数为:222)(21)(-=xexf0,-xNORMDIST粘帖函数:计算累积函数粘帖函数:计算累积函数 NORMINV粘帖函数:计算逆函数粘帖函数:计算逆函数 已知某品种成年猪体重的总体平均数=100kg,总体标准差=20kg。试计算成年猪体重在70kg以下的概率。计算公式如下: -=70202)100(0668. 02201)70(22dxexPx用正态分布粘帖函数的计算用NORMDIST粘帖函数计算概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论