版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、常用离散型变量概率分布常用离散型变量概率分布及应用及应用二项分布和泊松分布二项分布和泊松分布第一节第一节 二项分布和总体率的估计二项分布和总体率的估计一、二项分布一、二项分布(一)二项分布的概念(一)二项分布的概念 在生命科学研究中,经常会遇到一些事物,在生命科学研究中,经常会遇到一些事物,其结果可分为两个彼此对立的类型,如一个病其结果可分为两个彼此对立的类型,如一个病人的死亡与存活、动物的雌与雄、微生物培养人的死亡与存活、动物的雌与雄、微生物培养的阳性与阴性等,这些都可以根据某种性状的的阳性与阴性等,这些都可以根据某种性状的出现与否而分为非此即彼的对立事件。这种非出现与否而分为非此即彼的对立
2、事件。这种非此即彼事件构成的总体,就称为二项总体此即彼事件构成的总体,就称为二项总体(binomial populationbinomial population)。)。 第一节第一节 二项分布和总体率的估计二项分布和总体率的估计 二项分布二项分布(binomial distribution)(binomial distribution)就就是对这种只具有两种互斥结果的离散型是对这种只具有两种互斥结果的离散型随机变量的规律性进行描述的一种概率分随机变量的规律性进行描述的一种概率分布。由于这一种分布规律是由瑞士学者贝布。由于这一种分布规律是由瑞士学者贝努里努里( (Bernoulli) )首先发
3、现的,又称贝努里首先发现的,又称贝努里分布。分布。 二项分布有两个基本假设:二项分布有两个基本假设: 1.1.各事件是相互独立的,即任一事件各事件是相互独立的,即任一事件的发生与否,不影响其它事件的发生的发生与否,不影响其它事件的发生概率;概率; 2.各个随机事件只能产生相互排斥的各个随机事件只能产生相互排斥的两种结果。两种结果。 定理:几个相互独立事件同时发生定理:几个相互独立事件同时发生的概率等于各独立事件的概率之积。的概率等于各独立事件的概率之积。 定理:在几个互不相容的事件中,定理:在几个互不相容的事件中,任一事件发生的概率等于这几个事任一事件发生的概率等于这几个事件的概率之和。件的概
4、率之和。 抓中两黑一白的概率:抓中两黑一白的概率:P(2)=30.125=0.375抓中三个黑球的概率:抓中三个黑球的概率:P(3)=0.50.50.5=0.125 各种可能发生的结果对应的概率相当各种可能发生的结果对应的概率相当于展开后的各项数值,即:于展开后的各项数值,即: 前例:前例:=0.8,1-=0.2,n=3nnxxnnnnnxnxnn)1 ()1 ()1 ()!( !/!)1 ()1 (113211233)2 . 0()2 . 0()8 . 0(3)2 . 0()8 . 0(3)8 . 0(2 . 08 . 0二项分布的概率公式二项分布的概率公式 如果一个事件如果一个事件A,在,
5、在n次独立试验中,次独立试验中,每次试验都具有概率每次试验都具有概率 ,那么,这一事件,那么,这一事件A将在将在n次试验中出现次试验中出现x次的概率为:次的概率为: 式中:式中: 称二项系数。称二项系数。)!( !xnxnCxn).3 , 2 , 1( ,)1 ()(nxCxPxnxxn(二)二项分布的应用条件(二)二项分布的应用条件 1. 各观察单位只能具有互相对立的一种结各观察单位只能具有互相对立的一种结果,属于二项分类资料;果,属于二项分类资料; 2. 已知发生某一结果的概率为已知发生某一结果的概率为,其对立结,其对立结果的概率则为果的概率则为1- 。实际工作中要求。实际工作中要求是从是
6、从大量观察中获得的比较稳定的数值;大量观察中获得的比较稳定的数值;3. n个观察单位的观察结果互相独立,即每个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观个观察单位的观察结果不会影响到其它观察单位的结果。察单位的结果。 (三)二项分布的性质(三)二项分布的性质 1.二项分布的均数和二项分布的均数和 标准差标准差 二项分布的平均数:二项分布的平均数:=n 上式的意义:做上式的意义:做n次独立试验,某事件平均次独立试验,某事件平均出现的次数为出现的次数为n次,这一结果较为符合人们的次,这一结果较为符合人们的直观想法。如果,生男孩这一事件的概率是直观想法。如果,生男孩这一事件
7、的概率是1/2,则则100个新生儿中可期望有个新生儿中可期望有n =1001/2=50个是个是男孩。男孩。 当用率表示时,当用率表示时, (三)二项分布的性质(三)二项分布的性质 二项分布的标准差:二项分布的标准差: 标准差表示标准差表示x取值的离散度或变异的大小。取值的离散度或变异的大小。如如n=5,=5/6,1-=1-5/6,则:,则:)1 (n8333. 061655)1 (n(三)二项分布的性质(三)二项分布的性质 二项分布的标准误二项分布的标准误 若以比值或百分数表示,则标准误为若以比值或百分数表示,则标准误为 : p被称为率的标准误(被称为率的标准误(standard error
8、of rate),),用来反映随机抽样获得的样本率用来反映随机抽样获得的样本率p与总体与总体之间之间的抽样误差大小。的抽样误差大小。 np)1 ((三)二项分布的性质(三)二项分布的性质 二项分布的标准误二项分布的标准误 若以比值或百分数表示,则标准误为若以比值或百分数表示,则标准误为 :实际工作中常用实际工作中常用p作为作为 的估计值,得:的估计值,得:np)1 (nppsp)1 ( (三)二项分布的性质(三)二项分布的性质 2.二项分布的累计概率二项分布的累计概率常用的有左侧累计和右侧累计常用的有左侧累计和右侧累计2种方法。种方法。从阳性率为从阳性率为 的总体中随机抽取的总体中随机抽取n个
9、个体,则个个体,则(1)最多有最多有k例阳性的概率例阳性的概率P(xk)=P(0) + P(1) + P(k)(2)最少有最少有k例阳性的概率例阳性的概率P(xk)=P(k) + P(k+1) + P(n) =1- P(xk-1)(三)二项分布的性质(三)二项分布的性质 3.二项分布的图形二项分布的图形 二项分布的图形,取决于两个方面,其一为二项分布的图形,取决于两个方面,其一为事件发生的概率事件发生的概率 ,其二为样本含量,其二为样本含量n。当当 =1- =1/2时,二项分布的图形是对称的;时,二项分布的图形是对称的;当当 1/2时,二项分布的图形呈右偏态;时,二项分布的图形呈右偏态;当当与
10、与1- 不变时,即使不变时,即使 1- ,但随着,但随着n的增大,的增大,二项分布的的偏态程度会逐渐降低而趋于对称。二项分布的的偏态程度会逐渐降低而趋于对称。 二项分布总体不同样本例数时的抽样分布二项分布总体不同样本例数时的抽样分布 二、二、二项分布的应用二项分布的应用 (一一 )、总体率的估计、总体率的估计 有点值估计和区间估计。有点值估计和区间估计。1 1 查表法查表法:当当n较小,如较小,如n50时,特别是时,特别是p很接近于很接近于0或或1时,可由附表时,可由附表6百分率的置百分率的置信区间表直接查出。信区间表直接查出。P709 or p817例:某地对例:某地对13名输卵管结扎的育龄
11、妇女经壶名输卵管结扎的育龄妇女经壶腹部吻合术后,观察其受孕情况,发现有腹部吻合术后,观察其受孕情况,发现有6人受孕,据此估计该吻合术妇女的受孕人受孕,据此估计该吻合术妇女的受孕的的95%可信区间可信区间 此例:此例:n=13,x=6 查表得查表得95%CI为:为:19%75%。 二、二、二项分布的应用二项分布的应用 (一一 )、总体率的估计、总体率的估计 1 1 查表法查表法:附表附表6百分率的置信区间表直接百分率的置信区间表直接列出了列出了Xn n/2/2的部分的部分。其余部分可以查。其余部分可以查n-x的阴性部分的的阴性部分的QLQU再相减得再相减得PLand pU PL=1-QL 1-Q
12、U例:例:某地调查某地调查50名儿童蛔虫感染情况,发现有名儿童蛔虫感染情况,发现有10人大便人大便中有蛔虫卵,问儿童蛔虫感染率的中有蛔虫卵,问儿童蛔虫感染率的95%置信区间是多少?置信区间是多少? 此例:此例:n=50,x=10 查表得查表得95%CI为:为:10%34%。 二项分布的应用二项分布的应用 2 2 正态近似法正态近似法:应用条件:应用条件:np及及n(1p)均均5pusp 例:在某地随机抽取例:在某地随机抽取329人,做人,做HBsAg检验,得阳性检验,得阳性率为率为8.81%,求阳性率,求阳性率95%置信区间。置信区间。 已知:已知:p=8.81%,n=329,故:,故: 95
13、%CI:8.811.961.56;即;即5.75%11.87%。 %56. 10156. 0329/ )0881. 01 (0881. 0/ )1 (nppsp二项分布二项分布 下表是用下表是用P PU Ua as sp p时要求的时要求的P P值值与与N N的大小参考数字。的大小参考数字。 P P n n n nP P 0.5 30 15 0.5 30 15 0.4 50 20 0.4 50 20 0.3 80 24 0.3 80 24 0.2 200 40 0.2 200 40 0.1 600 60 0.1 600 60 0.05 1400 70 0.05 1400 70二项分布的应用二项
14、分布的应用(二二 )差异的显著性检验差异的显著性检验1 直接法直接法例例 某医院用甲药治疗某病,其治愈率为某医院用甲药治疗某病,其治愈率为70%,今用乙药治疗该病今用乙药治疗该病10人,治愈人,治愈9人,问甲乙两药人,问甲乙两药疗效有无差别?疗效有无差别?已知:已知: =0.7,1- =0.3,假设两药疗效无差别,假设两药疗效无差别,则治愈与非治愈的概率应符合二项分布,即:则治愈与非治愈的概率应符合二项分布,即: 10 3 . 07 . 0)1 (n如果甲乙两药疗效无差别,按甲药的治愈率如果甲乙两药疗效无差别,按甲药的治愈率(70%)用用乙药治疗乙药治疗10人应治愈人应治愈7人,实际治愈人,实
15、际治愈9人,相差人,相差2人。人。双侧检验,计算相差双侧检验,计算相差2人及人及2人以上的总概率,即人以上的总概率,即x9和和x5的概率之和:的概率之和:P=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:或:P=1-(0.200121+0.266828+0.233474)=0.299577028248. 0121061. 0233474. 0266828. 0200121. 0102919. 0036757. 0009002. 0001447. 0000138. 0000006
16、. 0)3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0()3 . 0()7 . 0(3 . 07 . 0010101019910288103771046610555106441073310822109111010001010CCCCCCCCCCC P=0.2995770.05,差异无统计学意义,尚,差异无统计学意义,尚不能认为乙药疗效优于甲药。不能认为乙药疗效优于甲药
17、。 本例如采用单侧检验,即要求判断本例如采用单侧检验,即要求判断乙药疗效乙药疗效优于甲药?此时只需计算相差优于甲药?此时只需计算相差2人及以上的人及以上的总概率:总概率:P=P(9)+P(10)=0.121061+0.028248=0.149309P0.05,差异无统计学意义,尚不能认为乙药差异无统计学意义,尚不能认为乙药疗效优于甲药。疗效优于甲药。3.研究疾病的家族聚集性研究疾病的家族聚集性 例例 某单位发生乙肝暴发流行,经调查某单位发生乙肝暴发流行,经调查4口之家共口之家共288户,其中无病例的户,其中无病例的167户,发生户,发生1例的例的51户,户,2例的例的50户,户,3例的例的17
18、户,全家发病的户,全家发病的3户,问乙肝的发户,问乙肝的发病是否具有家族集聚性?病是否具有家族集聚性? =214/1152=0.1858,1-=0.8142 计算发病数计算发病数x=0,1,2,3,4时的理论概率时的理论概率和理论户数。列表,比较实际户数与理论户数差和理论户数。列表,比较实际户数与理论户数差别有无显著性意义。别有无显著性意义。 二项分布展开计算表二项分布展开计算表发病人数发病人数展开式展开式概率概率理论户数理论户数实际户数实际户数xCxn x(1-)n-xPT=P288A0C04 (0.1858)0(0.8142)40.4395126.571671C14 (0.1858)1(0
19、.8142)30.4011115.52 512C24 (0.1858)2(0.8142)20.1373 39.54 503C34 (0.1858)3(0.8142)10.0209 6.02 174C44 (0.1858)4(0.8142)00.0012 0.35 3二项分布拟合优度的二项分布拟合优度的2检验检验发病人数发病人数实际户数实际户数理论户数理论户数(A-T)2(A-T)2xATT0167126.571634.5812.911 51115.524162.8336.042 50 39.54 109.41 2.773 17 6.02 120.5620.034 3 0.35 7.0220.0
20、62=91. 81,按,按=组数组数-2=5-2=3查查2界值表得:界值表得: 20.01(3)=11.345,故故P50时时(有人认为当有人认为当20),泊松分布,泊松分布就近似于正态分布。就近似于正态分布。 =0.5010020030040050060070001234频率=101002003004000123456频率=50501001502000246810121416频率=200306090120579 11 13 15 17 19 21 23 25 27 29 31 33 35 37频率Poisson分布总体均数不同时的抽样分布分布总体均数不同时的抽样分布 (三)(三)Poisso
21、n分布的性质分布的性质 当当n很大,很大,p很小,很小,np=为一常为一常数时,二项分布近似于泊松分布。数时,二项分布近似于泊松分布。p愈小,近似程度愈好。愈小,近似程度愈好。 例:据以往经验,新生儿染色体异常例:据以往经验,新生儿染色体异常率为率为1%,试分别用二项分布和泊松,试分别用二项分布和泊松分布原理,求分布原理,求100名新生儿中发生名新生儿中发生x例例(x=1,2,3.)染色体异常的概率。)染色体异常的概率。 二项分布与泊松分布的比较二项分布与泊松分布的比较 由上表可见,二者计算结果非常接近,当由上表可见,二者计算结果非常接近,当n愈大其接愈大其接近程度愈好,但泊松分布的近程度愈好
22、,但泊松分布的P(X)计算较为简便。计算较为简便。 XP(X) 二项分布二项分布 泊松分布泊松分布 0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合计合计1.0000 1.0000 5. Poisson分布的可加性分布的可加性 如果相互独立的如果相互独立的k个随机变量都服从个随机变量都服从泊松分布,则它们之和仍服从泊松分布,泊松分布,则它们之和仍服从泊松分布,且其均数为且其均数为k个随机变量的均数之和。此个随
23、机变量的均数之和。此称为泊松分布的可加性。称为泊松分布的可加性。 例:已知某放射性物质每例:已知某放射性物质每10分钟放射脉分钟放射脉冲数呈泊松分布,冲数呈泊松分布,5次测量的结果分别为次测量的结果分别为35、34、36、38、34次,那么,次,那么,50分钟总分钟总计的脉冲数计的脉冲数177次,亦呈泊松分布。因此,次,亦呈泊松分布。因此,泊松分布资料可利用可加性原理使泊松分布资料可利用可加性原理使20,这样就可以用正态近似法处理。这样就可以用正态近似法处理。 Poisson分布的应用分布的应用 置信区间的估计置信区间的估计 对于小样本资料的泊松分布置信区间估计,对于小样本资料的泊松分布置信区
24、间估计,可以查附表可以查附表7。p448 例例 由一份混合好的自来水中取由一份混合好的自来水中取1ml水样,培养得水样,培养得细菌细菌5个,请估计原水中每个,请估计原水中每ml细菌数细菌数95%的置信的置信区间。区间。查附表查附表7:样本计数:样本计数X=5,95%CI:1.611.7。Poisson分布的应用分布的应用 置信区间的估计置信区间的估计 对于大样本资料(对于大样本资料(X50)的置信区间估计,)的置信区间估计,可以近似地运用正态分布法进行,即:可以近似地运用正态分布法进行,即:95%置信区间为:置信区间为:99%置信区间为:置信区间为:例例 同一份样品分别用同一份样品分别用10个
25、平皿进行培养,共数个平皿进行培养,共数得菌落数得菌落数1460个,试估计该样品菌落数个,试估计该样品菌落数95%置置信区间。信区间。本例:本例:X=1460/10=146(个)(个) 95%CI: ,即,即122.32169.68。 XX96. 1XX58. 214696. 1146 Poisson分布的应用分布的应用 泊松分布的配合泊松分布的配合 例:将培养皿中的细菌稀释液置于血球计上,数例:将培养皿中的细菌稀释液置于血球计上,数出小方格中的细菌数,共计出小方格中的细菌数,共计128个方格,计数结果个方格,计数结果见下表。问此分布是否符合泊松分布?见下表。问此分布是否符合泊松分布? 表表 细
26、菌在计数小方格中的分布细菌在计数小方格中的分布 每小格细菌数(每小格细菌数(X) 观察的方格数(观察的方格数(f) 01234264038177Poisson分布的应用分布的应用计算过程:计算过程:求出样本均数求出样本均数 以以 代替代替,按照泊松分布的概率公式求出,按照泊松分布的概率公式求出 X=0,1,2,3,4 时的概率时的概率P(X)。本例本例=1.5234,代入公式得:,代入公式得: P(0)=e- x/x!= e- 1.5234(1.5234)0/0!=0.2180 P(1)=e- 1.5234(1.5234)1/1!=0.3321 P(2)=e- 1.5234(1.5234)2/
27、2!=0.2529 P(3)=e- 1.5234(1.5234)3/3!=0.1284 P(3)=e- 1.5234(1.5234)4/4!=0.0489 x5234. 1128195ffxx也可按下面的递推公式计算:也可按下面的递推公式计算: 0489.0)3(45234.1)4(1284.0)2(35234.1)3(2529.0)1(25234.1)2(3321.0)0(15234.1)1(2180.0!)0()1()(PPPPPPPPexePxPxxPx 验算:验算:P(0)+P(1)+P(2)+ +P(n)=1 本例:本例:0.2180+0.3321+0.2529+0.1284+0.0
28、489=0.9803 以各组的概率以各组的概率P(X)乘以乘以n即为即为X=0,1,2,3,4按泊松按泊松分布的理论频数。分布的理论频数。 将理论频数与实际频数比较将理论频数与实际频数比较(2-test),判断此分,判断此分布是否符合泊松分布。布是否符合泊松分布。 Poisson分布拟合优度检验计算表分布拟合优度检验计算表 2=(A-T)2/T=1.3606 因拟合泊松分布时用了因拟合泊松分布时用了n和和,故,故=组数组数-2=5-2=3。查查2界值表得界值表得20.05(3)=7.81,故,故P0.05 结论:实际分布与理论分布差别无统计学意义,可结论:实际分布与理论分布差别无统计学意义,可
29、认为符合泊松分布。认为符合泊松分布。 xATA-T(A-T)2(A-T)2T0123426403817727.9042.5032.3716.446.26-1.90-2.505.630.560.743.61046.265131.64580.31380.54600.12940.14740.97750.01910.1872Poisson分布资料的差异显著性检验分布资料的差异显著性检验 例:某种生物制剂的异常反应发生率一般在例:某种生物制剂的异常反应发生率一般在1/万左右,今试用该生物制剂新制品,在受试者万左右,今试用该生物制剂新制品,在受试者100人中发现人中发现1人有异常反应,问该生物制剂的人有异
30、常反应,问该生物制剂的异常反应率是否高于一般?异常反应率是否高于一般? 假设新制品反应率与一般反应率相同,则假设新制品反应率与一般反应率相同,则100人中反应的平均数为:人中反应的平均数为: H0: = 0 =1001/10000=0.01 本例本例 =0.0001,很小,很小,n=100,很大,可用泊松,很大,可用泊松分布作近似计算,分布作近似计算,100人中人中1例异常反应也不出例异常反应也不出现的概率为:现的概率为: Poisson分布资料的差异显著性检验分布资料的差异显著性检验100人中人中1例异常反应也不出现的概率为:例异常反应也不出现的概率为: 出现出现1例及例及1例以上的概率:例
31、以上的概率:P(x1)=1-P(0) =1-0.990050=0.009950 P50,可用正态近似法进行泊松分布,可用正态近似法进行泊松分布的检验。的检验。 H0:两种培养基的菌落数相同,:两种培养基的菌落数相同, H1:两种培养基的菌落数不同。:两种培养基的菌落数不同。 =0.05。 Poisson分布资料的差异显著性检验分布资料的差异显著性检验 在对泊松分布资料进行显著性检验时,如两样本在对泊松分布资料进行显著性检验时,如两样本观察单位数相同,则采用下式:观察单位数相同,则采用下式: x1、x2分别为两样本各观察单位的计数之和。分别为两样本各观察单位的计数之和。 如两样本观察单位数不等,则检验时用下式:如两样本观察单位数不等,则检验时用下式: 221121/nxnxxxu2121XXXXuPoisson分布资料的差异显著性检验分布资料的差异显著性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 对口医学技能试题及答案
- 2025~2026学年云南省昆明市云南民族大学附属高级中学高一上学期期中诊断测试数学试卷
- 读书节启动仪式发言稿9篇
- 建设工程招投标制度研究
- 家用电冰箱维修工安全知识宣贯竞赛考核试卷含答案
- 公司硝酸铵中和工岗位工艺技术规程
- 公司铁合金电炉冶炼工职业健康及安全技术规程
- 轧制备品工风险识别水平考核试卷含答案
- 2025年西宁近期面试真题及答案
- 安全防护协同设计-洞察与解读
- 期货交易分析法解读
- 生态文明教育在初中生物教学中的有效途径与策略探究
- 呼兰河传教学课件
- 企业网络安全管理制度范本
- 设备运行参数管理办法
- 吹膜机操作规程
- DB11∕T 512-2024 建筑装饰工程石材应用技术规程
- 拔牙术后感染处理
- 羊水栓塞的治疗指南讲课件
- JG/T 217-2007建筑幕墙用瓷板
- 演出单位安全管理制度
评论
0/150
提交评论