《卫生统计学》第五章 常用概率分布(6版)课件_第1页
《卫生统计学》第五章 常用概率分布(6版)课件_第2页
《卫生统计学》第五章 常用概率分布(6版)课件_第3页
《卫生统计学》第五章 常用概率分布(6版)课件_第4页
《卫生统计学》第五章 常用概率分布(6版)课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章常用概率分布分布桂立辉新乡医学院公共卫生学系流行病与卫生统计学教研室第五章 常用概率分布分布 二项分布 Poisson分布 正态分布第一节 二项分布一、二项分布的概念和特征(一)二项分布的概念 在生命科学研究中,经常会遇到一些事物,其结果可分为两个彼此对立的类型,如一个病人的死亡与存活、动物的雌与雄、微生物培养的阳性与阴性等,这些都可以根据某种性状的出现与否而分为非此即彼的对立事件。这种非此即彼事件构成的总体,就称为二项总体(binomial population)。 第一节 二项分布二项分布(binomial distribution)就是对这种只具有两种互斥结果的离散型随机变量的规律

2、性进行描述的一种概率分布。由于这一种分布规律是由瑞士学者贝努里(Bernoulli)首先发现的,又称贝努里分布。 第一节 二项分布二项分布有两个基本假设: 1.各事件是相互独立的,即任一事件的发生与否,不影响其它事件的发生概率; 2.各个随机事件只能产生相互排斥的两种结果。 二项分布的概率函数 如果一个事件A,在n次独立试验中,每次试验都具有概率 ,那么,这一事件A将在n次试验中出现x次的概率为: 式中: 称二项系数。二项分布的应用条件 1. 各观察单位只能具有互相对立的一种结果,属于二项分类资料; 2. 已知发生某一结果的概率为,其对立结果的概率则为1- 。实际工作中要求是从大量观察中获得的

3、比较稳定的数值;3. n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的结果。 (二)二项分布的特征 1.二项分布的图形 二项分布的图形,取决于两个方面,其一为事件发生的概率 ,其二为样本含量n。当 =1- =1/2时,二项分布的图形是对称的;当 1/2时,二项分布的图形呈右偏态;当与1- 不变时,即使 1- ,但随着n的增大,二项分布的的偏态程度会逐渐降低而趋于对称。 (二)二项分布的特征 2.二项分布的均数和标准差 二项分布的平均数:=n 上式的意义:做n次独立试验,某事件平均出现的次数为n次,这一结果较为符合人们的直观想法。如果,生男孩这一事件的概率是1/2

4、,则100个新生儿中可期望有n =1001/2=50个是男孩。 当用率表示时, (二)二项分布的特征 二项分布的标准差 若以比值或百分数表示,则标准差为 : p被称为率的标准误(standard error of rate),用来反映随机抽样获得的样本率p与总体之间的抽样误差大小。 实际工作中常用p作为 的估计值,得:二、 二项分布的应用1. 概率估计2. 累计概率计算常用的有左侧累计和右侧累计2种方法。从阳性率为 的总体中随机抽取n个个体,则(1)最多有k例阳性的概率P(Xk)=P(0) + P(1) + P(k)(2)最少有k例阳性的概率P(Xk)=P(k) + P(k+1) + P(n)

5、 =1- P(Xk-1)二、二项分布的应用 总体率的估计(查表法):当n较小,如n50时,特别是p很接近于0或1时,可由附表6.1百分率的置信区间表直接查出。例:某地调查50名儿童蛔虫感染情况,发现有10人大便中有蛔虫卵,问儿童蛔虫感染率的95%置信区间是多少? 此例:n=50,X=10 查表得95%CI为:10%34%。 二、二项分布的应用总体率的估计(正态近似法)应用条件:np及n(1p)均5pusp 例:在某地随机抽取329人,做HBsAg检验,得阳性率为8.81%,求阳性率95%置信区间。 已知:p=8.81%,n=329,故: 95%CI:8.811.961.56;即5.75%11.

6、87%。 二、二项分布的应用假设检验例 某医院用甲药治疗某病,其治愈率为70%,今用乙药治疗该病10人,治愈9人,问甲乙两药疗效有无差别?已知: =0.7,1- =0.3,假设两药疗效无差别,则治愈与非治愈的概率应符合二项分布,即: 二、二项分布的应用二、二项分布的应用 P=0.2995770.05,差异无统计学意义,尚不能认为乙药疗效优于甲药。 本例如采用单侧检验,即要求判断乙药疗效优于甲药?此时只需计算相差2人及以上的总概率: P=P(9)+P(10)=0.121061+0.028248=0.149309 P0.05,差异无统计学意义,尚不能认为乙药疗效优于甲药。第一节 二项分布研究疾病的

7、家族聚集性 例 某单位发生乙肝暴发流行,经调查4口之家共288户,其中无病例的167户,发生1例的51户,2例的50户,3例的17户,全家发病的3户,问乙肝的发病是否具有家族集聚性? =214/1152=0.1858,1-=0.8142 计算发病数x=0,1,2,3,4时的理论概率和理论户数。列表,比较实际户数与理论户数差别有无显著性意义。 二项分布拟合优度的2检验发病人数实际户数理论户数(A-T)2(A-T)2XATT0167126.571634.5812.911 51115.524162.8336.042 50 39.54 109.41 2.773 17 6.02 120.5620.034

8、 3 0.35 7.0220.062=91. 81,按=组数-2=5-2=3查2界值表得: 20.01(3)=11.345,故P50时(有人认为当20),泊松分布就近似于正态分布。 二、 Poisson分布的特征当n很大,p很小,np=为一常数时,二项分布近似于泊松分布。p愈小,近似程度愈好。 例:据以往经验,新生儿染色体异常率为1%,试分别用二项分布和泊松分布原理,求100名新生儿中发生X例(X=1,2,3.)染色体异常的概率。 二项分布与泊松分布的比较 由上表可见,二者计算结果非常接近,当n愈大其接近程度愈好,但泊松分布的P(X)计算较为简便。 XP(X) 二项分布 泊松分布 012345

9、6780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合计1.0000 1.0000 二、 Poisson分布的特征Poisson分布的总体均数和总体方差相等 对于符合泊松分布的资料,其n很大,而很小,因此,泊松分布的平均数为:=n 当 0,(1-)1时,泊松分布的标准差为: 即泊松分布的总体均数与它的方差相等:=2二、 Poisson分布的特征Poisson分布的可加性 如果相互独立的k个随机变量都服从泊松分布,则它们之和仍服

10、从泊松分布,且其均数为k个随机变量的均数之和。此称为泊松分布的可加性。例:已知某放射性物质每10分钟放射脉冲数呈泊松分布,5次测量的结果分别为35、34、36、38、34次,那么,50分钟总计的脉冲数177次,亦呈泊松分布。因此,泊松分布资料可利用可加性原理使20,这样就可以用正态近似法处理。 三、Poisson分布的应用概率估计累计概率的计算常用的有左侧累计和右侧累计2种方法。累计概率为单位时间或空间内某事件发生的次数。(1)最多有k例阳性的概率P(Xk)=P(0) + P(1) + P(k)(2)最少有k例阳性的概率P(Xk)=P(k) + P(k+1) + P(n) =1- P(Xk-1

11、)三、Poisson分布的应用 置信区间的估计 对于小样本资料的泊松分布置信区间估计,可以查附表7。 例 由一份混合好的自来水中取1ml水样,培养得细菌5个,请估计原水中每ml细菌数95%的置信区间。查附表8:样本计数X=5,95%CI:1.611.7。三、Poisson分布的应用置信区间的估计 对于大样本资料(X50)的置信区间估计,可以近似地运用正态分布法进行,即:95%置信区间为:99%置信区间为:例 同一份样品分别用10个平皿进行培养,共数得菌落数1460个,试估计该样品菌落数95%置信区间。本例:X=1460/10=146(个) 95%CI: ,即122.32169.68。 三、Po

12、isson分布的应用 泊松分布的配合 例:将培养皿中的细菌稀释液置于血球计上,数出小方格中的细菌数,共计128个方格,计数结果见下表。问此分布是否符合泊松分布? 表 细菌在计数小方格中的分布 每小格细菌数(X) 观察的方格数(f) 01234264038177三、Poisson分布的应用计算过程:求出样本均数 以 代替,按照泊松分布的概率公式求出 X=0,1,2,3,4 时的概率P(X)。本例=1.5234,代入公式得: P(0)=e- X/X!= e- 1.5234(1.5234)0/0!=0.2180 P(1)=e- 1.5234(1.5234)1/1!=0.3321 P(2)=e- 1.

13、5234(1.5234)2/2!=0.2529 P(3)=e- 1.5234(1.5234)3/3!=0.1284 P(3)=e- 1.5234(1.5234)4/4!=0.0489 三、Poisson分布的应用也可按下面的递推公式计算: 三、Poisson分布的应用 验算:P(0)+P(1)+P(2)+ +P(n)=1 本例:0.2180+0.3321+0.2529+0.1284+0.0489=0.9803 以各组的概率P(X)乘以n即为X=0,1,2,3,4按泊松分布的理论频数。 将理论频数与实际频数比较(2-test),判断此分布是否符合泊松分布。 Poisson分布拟合优度检验计算表

14、2=(A-T)2/T=1.3606 因拟合泊松分布时用了n和,故=组数-2=5-2=3。查2界值表得20.05(3)=7.81,故P0.05 结论:实际分布与理论分布差别无统计学意义,可认为符合泊松分布。 XATA-T(A-T)2(A-T)2T0123426403817727.9042.5032.3716.446.26-1.90-2.505.630.560.743.61046.265131.64580.31380.54600.12940.14740.97750.01910.1872Poisson分布资料的差异显著性检验 例:某种生物制剂的异常反应发生率一般在1/万左右,今试用该生物制剂新品,在

15、受试者100人中发现1人有异常反应,问该生物制剂的异常反应率是否高于一般?假设新制品反应率与一般反应率相同,则100人中反应的平均数为: =1001/10000=0.01 本例 =0.0001,很小,n=100,很大,可用泊松分布作近似计算,100人中1例异常反应也不出现的概率为: Poisson分布资料的差异显著性检验100人中1例异常反应也不出现的概率为: 出现1例及1例以上的概率:P(x1)=1-P(0) =1-0.990050=0.009950 P50,可用正态近似法进行泊松分布的检验。 H0:两种培养基的菌落数相同, H1:两种培养基的菌落数不同。 =0.05。 Poisson分布资料的差异显著性检验 在对泊松分布资料进行显著性检验时,如两样本观察单位数相同,则采用下式: X1、X2分别为两样本各观察单位的计数之和。 如两样本观察单位数不等,则检验时用下式: Poisson分布资料的差异显著性检验 本例是在相同条件下培养计数菌落数,因此可认为观察单位数相等。X1=100、X2=150,则: Z0.01=2.58,故P20的条件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论