二项分布及其应用(一、二)--医学统计学_第1页
二项分布及其应用(一、二)--医学统计学_第2页
二项分布及其应用(一、二)--医学统计学_第3页
二项分布及其应用(一、二)--医学统计学_第4页
二项分布及其应用(一、二)--医学统计学_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、二项分布及其应用二项分布Binomial distribution在医学上常遇到一些事物,其结局只有两种互相对立的结果。如在毒理试验中,动物的生存与死亡;在动物诱癌试验中,动物的发癌与不发癌;在临床治疗中,病人的治愈与未愈;理化检验结果的阴性与阳性等等。均表现为两种互相对立的结果,每个个体的观察结果只能取其中之一。为了解这些随机现象的规律性,在相同条件下进行屡次试验。发现其共同特点:(1)对立性(2)独立性(3)重复性满足这些条件的n次重复独立试验为n重贝努利试验,简称贝努利Bernoulli试验或贝努利试验模型。应用条件二项分布的定义XB(n,):随机变量X服从以n,为参数的二项分布。任意一

2、次试验中,只有事件A发生和不发生两种结果,发生的概率分别是: 和1 假设在相同的条件下,进行n次独立重复试验,用X表示这n次试验中事件A发生的次数,那么X服从二项分布,记做 XB(n,),也叫Bernoulli分布。二项分布的概率例2.12:假设小白鼠接受一定剂量的毒物时,其死亡概率是80%。对每只小白鼠来说,其死亡事件A发生的概率是0.8,生存事件A的发生概率是0.2。试验用3只小白鼠,请列举可能出现的试验结果及发生的概率。Page21所有可能结果每种结果的概率死亡数生存数不同死亡数的概率甲、乙、丙XnX生 生 生0.20.20.2=0.2303生 生 死0.20.20.8=0.80.22生

3、 死 生0.20.80.2=0.80.2212死 生 生0.80.20.2=0.80.22生 死 死0.20.80.8=0.820.2死 生 死0.80.20.8=0.820.221死 死 生0.80.80.2=0.820.2死 死 死0.80.80.8=0.83301.0001.000三只小白鼠存亡的排列和组合方式及其概率的计算 死亡1个死亡0个死亡2个死亡3个( 0.2 +0.8 )3 = (0.2)3+3(0.2)2(0.8)+3(0.2)(0.8)2+(0.8)3 三生 二生一死 一生二死 三死 事件A死亡发生的次数X1,2,3.n的概率P:如已知n=3,=0.8,则恰有例阳性的概率P

4、(1)为: 二项分布的性质假设XB(n,):X的总体均数为X的方差为X的标准差为均数与标准差假设均数与标准差不用绝对数而用相对数即率表示时,即对原式分别除以n:样本率的总体标准差,又称样本率的标准误,反映样本率的抽样误差的大小。当未知时,常以样本率p来估计:样本率的总体均数例:某地钩虫感染率为,如果随机抽查该地150人,记样本钩虫感染率为p,求p的抽样误差p。本例n150,累计概率结果A最多有K次发生的概率:结果A最少有K次发生的概率:从阳性率为的总体中随机抽取n个个体,那么递推公式:例:据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85,今有5个患者用该药治疗,问:至少3人有效的

5、概率为多少?最多1人有效的概率为多少?本例=0.85,1-=0.15,n=5P(X3)=P(X=3)+P(X=4)+P(X=5)那么二项分布的图形在正态分布或其他连续性分布中,常用分布曲线下的面积表示某区间的概率;在二项分布中,那么用线段的长短表示取某变量值时的概率。二项分布图形形状取决于n和的大小。当时,分布对称;当时,分布呈偏态;当时,分布呈正偏态;当 时,分布呈负偏态。特别是当n不是很大时,偏离越远,分布越偏随着n的增大,二项分布逐渐接近正态分布。一般地说,如果常可用正态近似原理处理二项分布问题,以简化计算。二项分布的应用条件各观察单位只能有互相对立的两种结果之一。 如阳性或阴性,生存或

6、死亡等,不允许考虑“可疑等模糊结果,属于二分类资料。观察单位数n必须事先确定。发生某一结果的概率不变,其对立结果的概率那么为1- 。 实际工作中要求是从大量观察中获得的比较稳定的数值。n次试验在相同条件下进行,且各观察单位的结果互相独立。即每个观察单位的观察结果不会影响到其他观察单位的结果。 如要求疾病无传染性、无家族聚集性等。二项分布的应用统计推断:总体率的区间估计样本率和总体率的比较两样本率的比较总体率的区间估计1.查表法当n50,p很接近0或1时,查附表6。例:某医生用某药物治疗31例脑血管堵塞患者,其中25例患者治疗有效,试求该药物治疗脑血管堵塞有效概率的95可信区间。n=31,X=2

7、5n/2,n-X=6查表得可信区间:(1-37.5%, 1-7.5%)=(62.5%,92.5%)Page392.正态近似法例:从某地人群中随机抽取144人,检查乙型肝炎外表抗原携带状况,阳性率为,求该地人群的乙型肝炎外表抗原阳性率的95可信区间。 n=144,p=9.03%95%可信区间为即,单个总体率的假设检验目的:推断样本所代表的总体率与一个总体率0是否相等。1.直接计算概率法根据二项分布的概率分布计算概率或累计概率,依据小概率事件原理,作出统计推断。例:新生儿染色体异常率为,随机抽取某地400名新生儿,发现1名染色体异常,请问当地新生儿染色体异常是否低于一般?H0 : H1 : 按照的

8、水准不拒绝H0,不能认为当地新生儿的染色体异常低于一般。例:一种鸭通常感染某种传染病的概率是,现将一种药物注射到25只鸭后发现有1只鸭发生感染,试判断这种药物对预防感染是否有效。H0 :此药物对预防感染无效,即 H1 :此药物对预防感染有效,即 单侧在H0成立的前提下,25只鸭中感染的只数XB(25,0.2),那么有按照的水准拒绝H0,接受H1。2.正态近似法根据二项分布的正态近似原理,得到检验统计量为Page72两个总体率的假设检验目的:通过在两个总体中分别进行抽样所得的样本率p1和p2来推断总体率1和2是否相等。根据二项分布的正态近似原理,得到检验统计量为合并率Page72例: 某医院肿瘤

9、科3 年中共治疗乳腺癌患者n=131例,每例均观察满5年,其中单纯手术治疗组观察n1=84例,存活x1=57例,存活率p1,联合治疗(手术+术后化疗)组观察n2=47例,存活x2=39例,存活p2,问两组存活率有无差异? H0 : 1 = 2H1 : 1 2用正态近似检验,检验统计量u为:式中p1、p2分别为两样本率,为率差的标准误;n1、n2分别为两样本例数;pc为两样本合计率,pc=(x1+x2)/ (n1+n2)。 按照的水准拒绝H0,不拒绝H0,差异无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差异。,Poisson分布Poisson分布也是一种离散型分布,用以

10、描述罕见事件发生次数的概率分布。Page22每升水中大肠菌群数的分布/单位空间中某些野生动物或昆虫数的分布单位体积内粉尘的计数/单位面积内细菌计数放射性物质单位时间内的放射次数每天交通事故发生数的分布 血细胞或微生物在显微镜下的计数人群中患病率很低的非传染性疾病的患病数例如:Poisson分布可以看作是发生的概率或未发生的概率1-很小,而观察例数n很大时的二项分布。除二项分布的三个根本条件以外,Poisson分布还要求或1-接近于0或1。有些情况和n都难以确定,只能以观察单位时间、空间、面积等内某种稀有事件的发生数X来表示,如每毫升水中的大肠杆菌数,只要细菌在观察单位内的分布满足以上条件,就可

11、以近似视为Poisson分布。Poisson分布的定义如果某事件的发生是完全随机的,那么单位时间或单位空间内,随机事件X发生0次、1次、2次的概率为:那么称该事件的发生服从参数为的Poisson分布,记为XP()。P22:Poisson分布的总体均数X:观察单位内某稀有事件的发生次数e:自然对数的底,Poisson分布的图形Poisson分布的形状取决于的大小。Poisson分布为正偏态分布,且愈小分布愈偏;随着的增大, =20时分布逐渐趋于对称;当50时,Poisson分布近似正态分布,可按正态分布原理处理。Poisson分布的性质分布的总体均数与总体方差相等,均为,即:即为均数,表示单位空

12、间或单位时间内事件平均发生的次数,又称强度参数。当未知时,常用样本均数X/n作为的估计值,那么 n表示单位空间或单位时间数分布具有可加性观察某一现象的发生数时,如果它呈Piosson分布,那么把假设干个小单位合并为一个大单位后,其总计数亦呈Piosson分布。如果X1P1, X2P2, XKPK,那么X=X1+ X2+ +XK , 1 2 k ,那么XP。因此Poisson分布资料可利用可加性原理使50,然后用正态近似法处理。分布与二项分布及正态分布的关系Poisson分布是二项分布的特例,某现象的发生率很小,而样本例数n很大时,那么二项分布接近于Piosson分布。此时可用 Piosson替

13、代二项分布来简化计算。Possion分布的累积概率计算常用的有左侧或右侧累计概率。单位空间或时间内事件发生的次数 最多为k次的概率: 最少为k次的概率: 计算时可借助以下递推公式。 ,P(X+1)= P(X) /(X+1 )Poisson分布的应用条件由于Piosson分布是二项分布的特例,所以,二项分布的三个条件也就是Poisson分布的适用条件。 “大量、有或无 “小概率、重复 “独立性另外,单位时间、面积或容积、人群中观察事件的分布应该均匀,才符合Poisson分布。如细菌在牛奶中成集落存在,钉螺在繁殖期成窝状散步时,不服从Poisson分布。Poisson分布的应用统计推断:总体均数的

14、区间估计(p41)样本均数和总体均数的比较(p83)两样本均数的比较P41,p83总体均数的区间估计1.正态近似法X502.查表法附表7X50例 用计数器两次测得某放射性物质5分钟内发出的脉冲数分别为42和48个。假设单位时间内发射的脉冲数符合Poisson分布,试估计该放射性物质每5分钟平均发射脉冲数的95%可信区间。(90,90,108.6) 那么每单位时间(5分钟)该放射性物质平均发出脉冲数为个/5分钟,其95%CI 为:个/5分钟。用公式(4.15)计算,结果一样。 解:由X=42+48=90 ,得例4.7 从一份混合均匀的自来水中取1升水样,检出3个大肠菌群。试估计自来水中平均每升水

15、中大肠杆菌数的95可信区间。 查附表7,得平均每升自来水中大肠杆菌群的95可信区间为:个/升 单个总体均数的假设检验1.直接计算概率法2.正态近似法50例:某溶液原来平均每毫升有细菌80个,现想了解某低剂量辐射能的杀菌效果。研究者以此剂量照射该溶液后取1毫升,培养得细菌40个。请问该剂量的辐射能是否有效?解:一、建立检验假设,确定检验水准H0 : = 80H1 : 1.645, P0.05,按 拒绝H0,接受H1。可以认为该剂量的辐射能有效。两个总体均数的假设检验两个样本观察单位相同时,计算统计量两个样本观察单位不同时,计算统计量例7.12 分别用甲、乙两种培养基对同一水样作细菌培养,每份水样

16、均取1ml,各培养8次,得细菌个数如下:甲培养基分别为8,6,7,8,5,6,4,7;乙培养基分别为10,8,11,11,9,8,9,9。试比较两种培养基的效果有无差异? 解:一、建立检验假设,确定检验水准H0:两培养基效果相同,12;H1:两培养基效果不同,12。= 。二计算检验统计量据题意,本例为观察单位相同(均为1ml水样)的有重复试验,且重复次数亦相同(n1 = n2 =8)。故 解:三、确定P值,下结论。 u,P, 按 水准拒绝H0,接受H1,差异有统计学意义。故可认为两种培养基效果不同,结合资料可认为乙培养基培养效果较好。 例7.13 某车间在改革生产工艺前,测取三次粉尘浓度,每升空气中分别有38、39、36颗粉尘;改革生产工艺后,测取两次,分别有25、28颗粉尘。问工艺改革前后粉尘颗粒有无差异? 解:一、建立检验假设,确定检验水准 H0:工艺改革前后粉尘颗粒无差异,12; H1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论