第5章二项分布与Poisson分布.ppt_第1页
第5章二项分布与Poisson分布.ppt_第2页
第5章二项分布与Poisson分布.ppt_第3页
第5章二项分布与Poisson分布.ppt_第4页
第5章二项分布与Poisson分布.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第五章 二项分布与Poisson分布,预防医学教研室,2,目的及要求 了解二项分布(binomial distribution)与Poisson分布( Poisson distribution)的概念 掌握二项分布的特点、均数与标准差的计算,Poisson分布与二项分布和正态分布的关系;总体均数可信区间的估计、假设检验及适用条件 重点是二项分布的应用,难点是三种分布的区别与联系,3,一.概念: 为率的抽样分布,各种情况的概率等于二项式展开后的各项。 X=0.1.2.n,例:设小鼠接受某种毒物一定剂量时,其死亡率为80%,若随机用三只小鼠作试验,问出现各种死亡情况的概率?,二项分布,4,5,

2、(0.8 + 0.2)3=(0.2)3 + 3(0.8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3 三生 二生一死 一生二死 三死,二. 应用条件:,Bernoulli试验: 在只有两种可能结果(成功与失败)的随机试验,每次试验时出现成功的概率是恒定的,而且各次试验相互独立。这种试验在统计学上称之为贝努里试验( Bernoulli trial)。,6,(1)二项分类资料:结果为A或非A (成功与失败) 。 (2)每次试验的条件不变:每次试验A的发生概率均为。 (3)各次试验独立:每个观察单位的观察结果不会影响到其 他观察单位的结果。,在Bernoulli试验中,取得成功的次数

3、X(X=0,1,2,n)的概率呈二项分布。其概率计算式:,所以二项分布的应用条件就是Bernoulli试验的条件,即:,式中:n、为二项分布的参数。 若随机变量X服从以n、为参数的二项分布记为XB( n.)。,7,(2)至少有k例阳性的概率:,(3)至多有k例阳性的概率:,X= 0, 1, 2, kn,三. 概率的计算:,(1)恰有k例阳性的概率:,从一个阳性率为的总体中,随机抽取含量为n的样本,则样本中阳性数X或阳性率p服从二项分布B ( n、)。,8,例: 已知某地玉米的黄曲霉污染率近年为20%, 若抽取10个样品作检查,求 污染样品数为3个的概率。 污染样品数不超过一个的概率。 污染样品

4、数在9个以上的概率。,9,污染样品数为3个的概率:,污染样品数不超过一个的概率:, 污染样品数在9个以上的概率:,10,例5.2 经统计,某省用“中药阑尾炎合剂”治疗急性阑尾炎性腹 膜炎的有效率为86%,试分别估计: 治疗10例中至少9例有 效的概率; 治疗10例中至多7例有效的概率。 本例有效例数XB(10. 0.86),依题意,10例患者中,,因此,10例患者中至少9例有效的概率为0.581,至多7例有效的概率为0.155。,11,四. 二项分布的图形,12,(1)离散型 (2)当=1-=0.5时,两边对称 (3)当0.5时,呈偏态分布。当0.5时,呈左偏态分布;当0.5时,呈右偏态分布。

5、 (4)当n增大,二项分布逐渐逼近正态分布,二项分布的特点:,成功率P=X/n的概率分布图形与成功次数的概率分布图形是完全一样的,只需要把横轴上的X变换成X/n就行了。,一般认为,n 和 n( 1-) 5时, 可近似看作正态分布。,13,14,15,五. 二项分布的均数与标准差,2.若用率表示,则:,p为率的标准误 表示率的抽样误差,当未知时,常以样本率P来估计:,1.若XB(n , ), 则X 的均数和标准差为:,16,X的均数在这里可以理解为n次试验中结果A期望出现的次数,而X的标准差则是衡量结果A出现次数的变异程度。 例5.3 求例5.1中平均死亡鼠数及其标准差。 根据死亡鼠数XB(3,

6、0.8)得到 平均死亡鼠数 只 标准差,若用率表示,则,17,二项分布的应用 二项分布是一种常用的离散型分布,具有广泛的应用价值。在实际问题中特别要注意判定一个变量是否服从二项分布。凡具有贝努利试验序列3个特点的变量,一般可认为服从二项分布。 1)总体率的区间估计 总体率估计包括点估计和区间估计。点估计是直接用样本率来估计总体率。区间估计是根据样本提供的信息按一定的概率(即可信度)来估计总体率的可能范围。 总体率的可信区间根据n和P的大小一般有两种估计方法。,18,a正态近似法 当n足够大,P和1-P均不太小时(可通过nP与n(1-P)均大于判断), 样本率P近似正态分布,这时可以利用正态分布

7、理论来估计总体率的可信区间。 可信度为1-的可信区间:,19,例: 某医院用复方当归注射液静脉滴注治疗脑动脉硬化症188例,其中显效83例,试估计等量齐观方当归注射液显效率的95%和99%可信区间。 复方当归注射液静95%可信区 (0.44151.960.036,0.44151.960.036) =(0.3709,0.5121)=(37.09% ,51.21%),20,B查表法 如果n,p不符合上述要求,当n50,特别是P很接近0或1时,样本资料呈二项分布,可用二项分布法估计总体率的可信区间。该法计算繁杂,附表3列出了总体率的95%和99%可信区间, 例5.5 从某学校随机抽取26名学生,发现

8、有4名感染沙眼,试求该校沙眼感染率95%可信区间。 本例n=26,X=4,查附表3的可信度为95%的可信区间为(0.04,0.35),即(4%,35%)。,21,注意: 附表3中X值只列出 时, 可以用n-X查表,然后以100%减去查的区间即为所求的可信区间 例5.6 某县抽查了10名人员的乙型肝炎表面抗原(HBsAg)携带情况,阴性者8人,求该县人群HbsAg阴性率的95%可信区间为 若x n/2 ,则按n-x 查表得?,然后100-? 例:上题若 X=8,则 n-x=10-8=2 查表得:3% 56% 然后100-?得:44% 97%,22,(2)样本率与总体率比较,1)直接计算概率法,H

9、0: 1 = 0 =0.01 H1: 1 0 =0.01 单侧 = 0.05,P,按=0.05水准,不拒绝H0,故不能认为该地新生儿染色体异常率低于一般新生儿。,23,例如5.7 一种鸭通常感染某种传染病的概率是0.2,现将一种药物注射到25只鸭后发现有1只鸭发生感染,试推断这种药对预防感染是否有效 Ho: 此药物对预防感染无效 即=0.2 H1: 此药物对预防感染有效 即 0.2 单侧=0.05 在Ho成立的前提下,25只鸭发生感染的只数XB(25,0.2)则有,24,2)近似正态法: n 和n( 1-) 5时,H0: 1 = 0 =0.2 H1: 1 0 =0.2 单侧 = 0.05,25

10、,(3)两样本率比较(近似正态法) n1 p1、n1( 1-p1)和n2 p2、n2( 1-p2) 5时,例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研究者随机抽取该地80名男生和85名女生,查得感染人数男生23人,女生13人。请作统计分析。,H0: 1 = 2 H1: 1 2 = 0.05,26,Poisson分布,一.概念:,是二项分布的特例。当很小,而n很大时,则二项分布逼近Poisson分布。,例如:,每毫升水中大肠杆菌数的分布。 粉尘在单位容积内计数的分布。 放射性物质在单位时间内放射出质点数的分布。 单位空间中某些野生动物或昆虫数的分布。 一定人群中某种患病率很低的非传染性

11、疾病患病数或死亡数的分布。,一般用于研究单位容积(或面积、时间)内某事件发生数。(小概率事件出现的规律性),27,二. Poisson分布的概率:,= n为Poisson分布的总体均数;,X=0,1,2,,式中:,X为单位时间(或面积、容积等)某事件发生数;,e为自然对数的底,e2.71828,从式中可知,为Poisson分布的唯一参数。,X服从以为参数的Poisson分布,可记为XP()。,递推公式:,28,例:据以往经验,新生儿染色体异常率一般为1%,试分别用二项分布及Poisson分布原理,求100名新生儿中发生X例(X=0,1,2,)染色体异常的概率。,1.按二项分布原理求P(X),同

12、理,可求得P(2),P(3)等。,29,(2)按Poisson分布原理求P(X):,=n=1000.01=1,同理,可求得P(4),P(5)等。,(1)递推公式:,30,(2)公式:,31,由表可见,对很小,n很大的同一资料用二项 布法与Poisson分布法计算结果是很接近的。但 Poisson分布的 P(X)的计算较为简便。,32,三. Poisson分布的图形:,根据,按式 可计算出的所有可能取值时的概率(),以其为纵轴,可绘制出poisson分布概率分布列的图形,可见,poisson分布图形形状完全取决于的大小。当时图形基本对称,随的增大,图形渐近于正态分布。,33,四. Poisson

13、分布的特性和应用条件:,离散型分布 .Poisson分布只有一个参数,即参数; Poisson分布可看成二项分布的特例,其应用条件也就是二项分布的应用条件。,3. 方差等于均数:即2= 。为Poisson分布的重要特征。 4. Poisson分布在不大时呈左偏态分布,随着的增大而逐渐趋于对称。当20时,可认为近似正态分布,问题: (1)具有传染性的罕见疾病的发生率能否用Poisson分布来分 析? (2)细菌在牛奶中呈集落状存在能否用Poisson分布来分析?,5. Poisson分布的可加性。,34,若X1, X2, Xk相互独立,且它们分别服从以1,2, k为参数的Poisson分布,则T

14、=X1+ X2+ +Xk也服从Poisson分布,其参数为1+2+ k。,Poisson分布的可加性:,例如:某放射物质每.s放射粒子数服从均数为.的poisson分布,现随机取次观测结果进行研究,这次观测结果分别为每.s反射,及个粒子数,问每.s放射粒子数为多少?并指出其服从于均值为多少的poisson分布。 本例X1=2,X2=3,X3=4,利用poisson分布的可加性原理得到 X1X2X3=2349个 均值为2.2+2.2+2.2=6.6 每.s放射粒子数为个,每.s放射粒子数服从于均值为.的poisson分布,35,poisson分布与二项分布 及正态分布的关系 poisson分布可

15、视为二项分布的特例若某种现象的发生率甚小,而样本例数甚多时,则二项分布逼近poisson分布 . poisson分布的正态近似一般在实际应用中,当时,poisson分布近似正态分布,资料可根据正态分布原理处理,从而简化计算,36,poisson分布的应用,poisson分布的应用条件 凡具有贝努利实验序列个特点且很小n大时,其相应的变量一般认为服从poisson分布. 实际工作中,往往是未知的,当poisson分布的观察单位为n时,常用样本计数(样本均数)作为的点估计值,相应的样本标准差的计算式为: 标准误的计算式为:,37,当poisson分布的观察单位为n1时,常用样本均数n作为的点估计值

16、,相应的样本标准差的计算公式: 标准误的计算公式为: 例.某研究者取m纯净水培养,得细菌数个,试分别估计m和m纯净水中细菌数的标准差和均值 本例以每m纯净水为一个poisson分布观察单位,此时n1,利用式(.6)得样本标准差,,样本均值x=60,38,以每1m纯净水为一个poisson分布观察单位此时n5,利用式(.)得样本标准差为, 样本均数为个m 个m,39,1. 总体均数可信区间估计 1)查表法:X50,尤其p0 或 1时 例7.13:将一个面积为100cm2的培养皿置于某病室中,1小时后取出,培养24小时,查得8个菌落,求该病室平均1小时100cm2细菌数的95%可信区间。 查附表7

17、,x=8 得:3.4 15.8 故该病室平均1小时100cm2细菌数的95%可信区间为(3.4, 15.8) 例5.15 对某地居民饮用水进行卫生学检测中,随机抽查1mL水样,培养大肠杆菌2个,试估计该地区水中每毫升所含大肠杆菌的95%和99%可信区间。本例 x=2 95%可信区间得 (0.2,7.2),问题: 若求该病室平均1小时50cm2细菌数的95%可信区间? 将上述的上下限各除以2即可。,40,41,2)正态近似法: 当 X 50 时,例7.14:用计数器测得某放射性物质半小时内发出的脉冲数为360个。试估计该放射性物质每30分钟平均脉冲数的95%可信区间。,X样本计数,即该放射性物质

18、每30分钟平均脉冲数的95%可信区间为 322.8397.2个。,42,当Poisson分布的观察单位为n1时,其总体均数1-的可信区间计算公式为 若欲求该放射物质每分钟平均脉冲数的95%可信区间,因该放射物质每分钟总平均脉冲数为每30min总体平均数的1/30,故只需将每30min总体平均脉冲数的95%可信区间的下、上限322.8和397.2分别除以30,即可求得该放射物质每分钟平均脉冲数的95%可信区间为(10.76,13.24),43,2. 样本均数与总体均数比较 1)直接计算概率法 例 7.15: 据以往大量观察但某溶液中平均每毫升有细菌3个。某研究者想了解该溶液放在5冰箱中3天,溶液

19、中细菌是否会增长。现采取已放在5冰箱中3天的该溶液1毫升,测得细菌5个。请作统计推断。,H0: =3 H1: 3 单侧 = 0.05,P(X5),不拒绝H0,尚不能认为放在5冰箱中3天该溶液中细菌会增长。,44,直接计算概率法 根据Poisson分布的概率分布计算概率或积累概率,并依据小概率事件原理作出统计推断 某罕见非传染性疾病的患病率一般为15/10万,现在某地区调查1000人,发现阳性者2人问此地区患病率是否高于一般。 单侧 =0.05 本例 ,n=1000 , 0=15/10万,0=n0=0.15,则在Ho成立的前提下,所调查的1000人中发现的阳性数XP(0.15),则有 在=0.0

20、5的检验水平上 接受H1,认为此地区患病率高于一般,2. 样本均数与总体均数比较,45,2)近似正态法: 20时,例 7.16: 某溶液原来平均每毫升有细菌80个,现欲研究某低剂量辐射能否杀菌。研究者以此低剂量辐射该溶液后取1毫升,培养细菌40个。请作统计推断。,H0: =80 H1: 80 单侧 = 0.05,P 0.01, 拒绝H0,接受H1。可认为此低剂量辐射能杀菌。,46,3. 两样本均数比较(近似正态法, 20时) 1)两样本的观察单位数相等(n1=n2),例7.17:为研究两个水源被污染的情况是否相同,在每个水源各取10ml水作细菌培养,甲水源共生长890个菌落,乙水源共生长785

21、个菌落,请作统计推断。,H0: 1=2 H1: 12 = 0.05,P 0.01, 拒绝H0,接受H1。可认为两个水源被污染的情况不同,甲水源污染较重。,47,2)两样本的观察单位数不相等(n1n2),例7.18:某车间在生产工艺改革前测三次粉尘浓度,每次测一升空气,分别测得38,29和36颗粉尘;改革后测取两次,分别有25,18颗粉尘。请据此推断改革前后粉尘浓度是否相同。,n1=3, X1=38+29+36=103; n2=2,X2=25+18=43。,48,例 某城市在连续5年中因交通事故而伤亡的总人数为152人。经采取安全措施后的两年中因交通事故而伤亡的总人数为44人,这个城市在这两个时

22、期的人口数基本不变。试评价安全措施的效果(单侧)?,H0: 1=2 H1: 1 2 单侧 = 0.05,n1=5, X1=152; n2=2,X2=44,49,小 结,二项分布常用于描述二项分类变量两种观察结果的出现率,Poisson分布是二项分布的特例,常用于分析小概率事件的发生规律。 1.二项分布的概念:二项分布(Binomial distribution)贝努里试验(j. Bernoulli.1713)分布.是一种最重要的离散型分布.它是用于说明结果只能出现 两种情况的n 次实验中发生某种结果为 x 次的概率分布.理论上说:若离散型随机变量X的概率分布满足于下式: x=0, 1, 2,.

23、n,50,2、二项分布的特点: (1)二项分布是离散型的,因而具有离散型的共同特点:图形为独立的一些线段,线段的高度代表概率的大小; (2)二项分布由两个参数决定,即n和; (3)二项分布的均数恰为两个参数的乘积,而 方差为均数的(1)倍,即有 , , 率表示则有 ; (4 )当p=q=0.5时分布对称,pq时为左偏态,pq时为右偏态 (5) 当n足够大,且不太靠近0或1时,二项分布 趋于正态分布; (6)当n.0(如0.01)时,二项分布趋Poisson分布。,51,根据二项分布的第(3)个特点,可以算得其率的标准误为: 样本率估计得到 3、二项分布的累计概率 通常计算如下两种累计概率 最多

24、有k例阳性的概率(下侧累计概率) 最少有k例阳性的概率(上侧累计概率) 注意(1)下侧累计概率也就是其分布函数F(X); (2)F(X)与Q(X)两者相加并不等于1,因为两者都累加了等于k时的概率。,52,4、二项分布的应用条件 (1)两分类性:各观察单位只能具有相互对立 的两种结果之一; (2)独立性:各观察结果互相独立; (3)已知:知道一种结果(如阳性) 的概率为,另一种为1。,53,.二项分布的应用 二项分布的应用主要在于区间估计和假设检验两个方面(详见表8.1)。这里强调两点: 1)、总体率区间估计的查表法实际上是根据二项分布公式解 方程(8.4),(8.5)得到,因此是一种精确计算

25、,相 当于假设检验(样本率与总体率比较)中的直接计算概 率法。 求上限 求下限 2)总体率可信区间估计中要计算双侧的上下限,而假设检验 中一般只计算单侧,问是否高于总体(或一般)时计算上 侧概率,而问是否低于总体(或一般)时计算下侧概率。,54,3)无论是假设检验还是可信区间估计,正态近似法都是一种近似算法,只有当服从近似的条件(一般认为np5,n(1-p)5)时才能采用。 4)无论是样本率与总体率的比较还是两样本率比较的u检验,均可用2检验来完成,二者是等价的(u2=2)一般来说,如给出的是四格表的观察数资料,用2检验方便一些;而给出的是率的资料,则用u 检验方便一些,55,Poisson分

26、布的概念及应用条件 1.Poisson分布的概念: Poisson分布也是一种重要的离散型分布。它是二项分布在n 很大而很小时的特殊情况,同样两分类资料在n次实验中发生X次某种结果的概率分布。其准确的定义为,若离散型随机变量X的概率分布满组下式 .n 则称X服从Poisson分布,56,2、Poisson分布的特点 (1)Poisson分布是离散型的,因而同样具有上述离散型 的共同特点; (2)Poisson分布只有一个参数,即参数; (3)Poisson分布的均数正巧等于其方差; (4)当较大时,Poisson分布趋于正态分布; (5)Poisson分布分布具有可加性。 3、Poisson分

27、布的累计概率 同二项分布,同样可计算上 下两侧累计概率。 4、Poisson分布的应用条件 因为Poisson分布是二项分布的特殊情况,因此使用Poisson分布既要满足前述二项分布的三个应用条件,还要求n很大而很小。,57,poison分布的 应用 poisson分布的 应用同样在于区间估计和假设检验两个方面(详见表8.1)。这里强调两点 .总体率区间估计的查表法实际上是根据poison 分布公式解方程(8.),(8.)得到,因此是一种精确计算,相当于假设检验(样本率与总体率比较)中的直接计算概率法。 求上限 求下限,58,2.总体率可信区间估计中要计算双侧的上下限,而假设检 验中一般只计算

28、单侧,问是否高于总体(或一般)时计 算上侧概率,而问是否低于总体(或一般)时计算下侧 概率。 3. Poisson分布中的x具有率的含义(视这n=1时的率) 4.利用正态近似法来处理Poisson分布将资料较为简便,但同样应满足正态近似的条件(一般认证 20),若不满足可利用可加性将若干观察 位合并 5.两均数比较时需 观察单位(时间.面积.人口.基数等)相同,若不同需 化为相同,而且只能大单位化小单位(如5万人化为 1万人),59,两种分布的关系,说明n个观察数中恰好发生X个 某事件的概率,说明一定观察单位内发生某事件 数为X 的概率,n.,60,无,有,61,62,二项分布与Poisson分布的SPSS演示,二项分布的累积概率计算:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论