生物统计学第三章概率论.ppt

上传人：o*** IP属地：四川上传时间：2020-10-07 格式：PPT 页数：64 大小：3.58MB 积分：15 举报 版权申诉

已阅读5页，还剩59页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、概率论授课教师：王天慧,Tel:66132665 E.mail:,第三章概率与概率分布,第一节概率的基本概念第二节常用的概率分布第三节统计数的分布,第一节概率的基本概念,事件、概率、频率概率的计算概率分布,一、事件频率概率,事件(event)：在自然界中一种事物，常存在几种可能出现的情况，每一种可能出现的情况称为事件。,确定现象必然事件（）：一定条件下必然出现的现象不可能事件（）：一定条件下必然不出现的现象不确定现象随机事件：一定条件下可能发生，也可能不发生。,下面用棉田发生盲椿象为害的情况来说明这一问题。,频率：在相同条件下进行n次重复试验,如果随机事件A发生

2、的次数为m，那么m/n称为随机事件A的频率概率：当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值 p , 那么就把 p称为随机事件A的概率,P(A)=pm/n （n充分大）,统计学上通过大量实验而估计的概率称为实验概率或统计概率，用公式表示为：,式中P代表概率，P(A)代表事件A的概率。 P(A)的取集范围为：0 P(A) 1。随机事件的概率表现了事件的客观统计规律性，它反映了事件在一次试验中发生可能性的大小，概率大表示事件发生的可能性大，概率小表示事件发生的可能性小。,概率的性质 1、对于任何事件A，有0P（A）1； 2、必然事件的概率为1，即P（）=1； 3、不可能

3、事件的概率为0，即P（）=0。,二、概率的计算,1.和事件：“事件A与B至少有一个发生”，记作AB=A+B,n个事件A1, A2, An至少有一个发生，记作,2.积事件:A与B同时发生，记作 ABAB,n个事件A1, A2, An同时发生，记作 A1A2An,3.互斥的事件：AB V,4. 对立事件A+BU, 且AB V,5. 完全事件系,若事件A1、A2、An两两互斥，且每次试验结果必发生其一，则称A1、A2、An为完全事件系。例如，仅有三类花色：黄色、白色和红色，则取一朵花，“取到黄色”、“取到白色”和“取到红色”就构成完全事件系。,6. 事件的独立性,若事件A发生与否不影响事件B发生的

4、可能性，则称事件A和事件B相互独立。例如，事件A为“花的颜色为黄色”，事件B为“产量高”，显然如果花的颜色与产量无关,则事件A与事件B相互独立。,1.互斥事件的加法假定两互斥事件A和B的概率分别为P(A)和P(B)，则 P(A+B)=P(A)+P(B) 例如：调查某玉米田一穗株的概率，P(A)=0.65,双穗株的概率P(B)=0.18，则一穗和双穗株的概率为： P(A+B)=P(A)+P(B)=0.65+0.18=0.83,概率的计算法则,2.独立事件的乘法假定P(A)和P(B)是两个独立事件A与B各自出现的概率，则： P(AB)=P(A)P(B) 例：现有4粒种子，其中3粒是黄色、1粒

5、是白色，采用复置抽样。试求下列两事件的概率(1)第一次抽到黄色，第二次抽到白色；(2)两次都抽到黄色。,先求出抽到黄色种子的概率为3/4=0.75，抽到白色种子的概率为1/4=0.25. P(A)=P(第一次抽到黄色种子)P(第二次抽到白色种子)=0.750.25=0.1875 P(B)= P(第一次抽到黄色种子) P(第二次抽到黄色种子)=0.750.75=0.5625,3.对立事件的减法若事件A的概率为P(A)，那么其对立事件的概率为：P( )=1P(A) 4.完全事件系的概率例如上例，黄色种子和白色种子构成完全事件系，其概率为1。,1、离散型随机变量变量x的取值可用实数表示，且x取

6、某一值时，其概率是确定的，这种类型的变量称为离散型随机变量。将这种变量的所有可能取值及其对应的概率一一列出所形成的分布，称为离散型随机变量的概率分布：变量xi x1 x2 x3 xn 概率P(y=yi) P1 P2 P3 Pn,三. 概率分布,2、连续型随机变量变量x的取值仅为一范围，且x在该范围内取值时，其概率是确定的，这种类型的变量称为连续型随机变量,式中，f(x)称为x的概率密度函数或分布密度,第二节常见的理论分布,离散型变量的概率分布二项分布泊松分布连续型变量的概率分布正态分布,一、二项分布,对立事件 A p q (q=1-p) 重复性独立性,（一）二项分布概率的计算

7、,例：在由具有一对基因差异的亲本杂交形成的F2代群体中，出现黄色子叶的概率为0.75，出现青色子叶的概率为0.25，如果从这种总体抽取3粒，那么得到1粒是黄子叶的概率是多少呢？,抽取三粒种子(以Y代黄子叶，以G代青子叶)，即n=3，有两粒黄子叶种子，即x=2，这时有3种不同组合： GGY，GYG，YGG。出现第一粒，第二粒和第三粒种子是互不影响的，因此这三个事件是独立事件，由乘法法则可得：,由于这三个事件都是相互互斥的，所以出现两粒黄子叶种子(x=2)的概率为这三种概率之和：,上述结果也可以表示为：,即复合事件的概率必等于该事件出现的组合数目乘以单个事件的概率；而这一复合事件的可能组合数目则相

8、当于从n(3)个物体中任取其x(2)个物体的组合数。数学上的组合公式为：,（二）二项分布的概率函数,的牛顿二项式展开式为：,二项式中包含两项，这两项的概率为p、q，并且p+q=1，可推知变量x的概率函数为：,累积函数F(x)：变量小于等于x的所有可能取值的概率之和,理论次数：对于任意x，理论次数=NP(x),这一分布律也称贝努里( Bernoulli )分布，并有,例：某种昆虫在某地区的死亡率为40%，现对这种害虫用一种新药进行治疗试验，每次抽10头作为一组治疗。试问如新药无疗效，则在10头中死3头、2头、1头，以及全部愈好的概率为多少？,8头愈好，2头死去的概率为：,7头愈好，3头死去的概率

9、为：,9头愈好，1头死去的概率为：,10头全部愈好的概率为：,若计算10头中不超过2头死去的概率为多少？,若计算10头中不超过2头死去的概率为多少？则应该应用累积概率，即：,若期望有0.99的概率获得1头或1头以上的死去的，至少应该调查多少头？,若期望有0.99的概率获得1头或1头以上的死去的，至少应该调查多少头？解：应调查的头数应该满足 P(0)=1-0.99=0.01 P(0)=Cn0p0qn=0.01 0.6n=0.01 nlg0.6=lg0.01 n=(lg0.01)/(lg0.6)=-2/(-0.222)=9头,当p=q，二项式分布呈对称状，如pq，则表现偏斜状。,受害株数( x)

10、,受害株数(x),图1 棉株受盲蝽害的概率分布图(p=0.35，n=5),（三）二项分布的形状和参数,二项分布的几点性质 (1) 当p值较小且n不大时，分布是偏倚的。但随着n的增大，分布逐渐趋于对称 (下图1) (2) 当 p 值趋于0.5，分布趋于对称(下图2) (3) 对于固定的n及p，当k增加时，Pn(k)先随之增加并达到其极大值，以后又下降 (4) 在n较大，np、nq 较接近时，二项分布接近于正态分布；当n时，二项分布的极限分布是正态分布,平均数：方差：标准差：,从而，上述棉田受害率调查结果，n=5，p=0.35，可求得总体参数为： =50.35=1.75株，株。,二项分布的

11、应用条件 (1) 各观察单位只具有互相对立的一种结果，如阳性或阴性，生存或死亡等,属于二项分类资料； (2) 已知发生某一结果(如死亡)的概率为p，其对立结果的概率则为1-p=q，实际中要求p是从大量观察中获得的比较稳定的数值； (3) n个观察单位的观察结果互相独立，即每个观察单位的观察结果不会影响到其它观察单位的观察结果,二、泊松分布,泊松分布是一种可以用来描述和分析随机发生在单位空间或时间里的稀有事件的概率分布。要观察到这类事件，样本含量 n 必须很大。,其中=np；e=2.7182 是自然对数的底数，则称 x 服从参数为的泊松分布，记为 xP()。,泊松分布的性质 (1) 平均数和方

12、差相等，都等于常数，即 =2=,(2) 值愈小分布愈偏倚，随着的增大，分布趋于对称。当= 20时分布接近于正态分布当=50时,可以认为泊松分布呈正态分布当 20时就可以用正态分布来近似地处理泊松分布的问题。,例：为监测饮用水的污染情况，现检验某社区每毫升饮用水中细菌数 ,共得400个记录如下表。试分析饮用水中细菌数的分布是否服从泊松分布。若服从，按泊松分布计算每毫升水中细菌数的概率及理论次数并将频率分布与泊松分布作直观比较。,经计算得每毫升水中平均细菌数为0.500,方差S2=0.496。两者很接近,故可认为每毫升水中细菌数服从泊松分布。以0.500代替，得,解:,从结果可以看出细菌数

13、的频率分布与=0.5的泊松分布是相当吻合的,进一步说明用泊松分布描述单位容积(或面积)中细菌数的分布是适宜的。,二项分布的极限正态分布,P=0.5,n=5的二项分布,p=0.5,n=20的二项分布,三、正态分布,正态分布（normal distribution）具有如下概率密度函数的随机变量称为正态分布随机变量：, = 期望 2 = 方差,（可以证明这个函数满足概率密度函数的3个条件）,正态分布概率密度函数的几何表示,正态曲线,f (x),x,曲线下某区间的面积即为随机变量在该区间取值的概率,正态分布的特点只有一个峰，峰值在x = 处，峰值= 曲线关于x = 左右对称，因而平均数=众数=中

14、位数 x轴为曲线向左、右延伸的渐进线曲线在x=处各有一个拐点，即曲线在(-,-)和(+,+) 区间上是下凹的，在-,+区间内是上凸的；由两个参数决定：平均数和标准差决定曲线在x 轴上的位置决定曲线的形状,正态分布,平均数的影响,标准差的影响,正态分布资料的分布表现为多数次数位于算术平均数附近，在x-3以上其次数极少，在实际应用中，y通常在 3范围之内取值，这就是6法则。,0.0,0.1,0.2,0.3,0.4,0.5,0,1,2,3,4,5,-1,-2,-3,-4,f (y),y,正态曲线与横轴之间的面积等于1，因此曲线下横轴的任何定值，等于介于这两个面积占总面积的成数。下面是几

15、组常用值： 1 概率=0.6827 2 概率=0.9545 3 概率=0.9973 1.960 概率=0.9500 2.576 概率=0.9900,计算正态分布曲线区间概率的方法,在正态分布曲线下，x的定值从x=a到x=b间的概率可用曲线区间的面积表示：,计算曲线下从-到x0的面积，公式如下：,FN(x)称为正态分布的累积函数。,为了便于使用，通常是将正态分布3 分成很小的距离单位，比如0.01，进行积分，然后制成概率分布表。使用者只需查表，而无需进行复杂的积分运算。一个首先需要解决的问题是，正态分布是一个曲线簇，而非单一的曲线，用曲线簇进行制表几乎是无法完成的事情。因此要设法将其转化为一条

16、曲线。,由于正态曲线受和的制约，曲线随这两个参数的变化而改变。构造一个新变数，这个变数要消去和的影响。假定新变数用u来表示，则：,u称为正态离差，由之可将正态方程标准化为：,上式为标准化正态分布方程，它是参数=0 ，2=1时的正态分布，记作N(0，1)。,有了标准曲线之后，就可以将u值从-3到3范围内的FN(u)的值，以0.01的间隔列于附表1(P260)。计算一定区间的概率值，只要查表就可以了。,例假定y是一随机变数具有正态分布，平均数=30，标准差=5，试计算小于26，小于40的概率，介于26和40区间的概率以及大于40的概率。,首先计算：P(y26)=FN(26) 先将y转换成u值： u=(y- )/ =(26-30)/5=0.8 查附表1，当u=0.8时 FN(26)=0.2119 同样计算：P(y40)=FN(40) u=(y- )/ =(40-30)/5=2.0 查附表1，当u=2.0时 FN(40)=0.9773 计算：P(26y40)= FN(40)- FN

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

生物统计学第三章概率论.ppt

文档简介

温馨提示

最新文档

评论

生物统计学第三章概率论.ppt

文档简介

温馨提示

最新文档

评论

相关文档