第六章二项分布和Poisson分布_第1页
第六章二项分布和Poisson分布_第2页
第六章二项分布和Poisson分布_第3页
第六章二项分布和Poisson分布_第4页
第六章二项分布和Poisson分布_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 二项分布和poisson分布chapter 6 binomial distribution and poisson distribution 医学数据处理与sas软件应用medical data processing and the application of sas生物医学工程研究所 张玉华第六章 二项分布和poisson分布n6.1 二项分布n6.1.1 二项分布函数n6.1.2 样本率与总体率的比较n6.1.3 两个样本率比较的u检验n6.2 poisson分布n6.2.1 poisson分布的概率函数n6.2.2 样本均数与总体均数比较n6.2.3 两个样本均数比较6.1 二

2、项分布n定义:若一个随机变量x,它的可能取值是0,1, ,n,且相应的取值概率为 则称此随机变量x服从以n、为参数的二项分布,记为xb(n,)。n二项分布成立的条件:每次试验(bernoulli trial)只能是互斥的两个结果之一;每次试验的条件不变;各次试验独立。 6.1 二项分布n度量指标 xb(n,) nx的均数 nx的方差 nx的标准差n分布特性 n可加性:如果 x1,x2, xk相互独立,且它们分别服从以 ni(i=1,2, ,k) ,p为参数的二项分布,则 x=x1x2xk服从以n (n=n1+n2+nk) ,p为参数的二项分布。n近似分布n正态近似:当 n 较大,不接近 0也不

3、接近 1时,二项分布b(n,)近似正态分布。 npoisson分布近似:当 n很大,很小, 为一常数时,二项分布近似于poisson分布。 6.1 二项分布n总体率的区间估计 n查表法当n50 时可以通过查表求总体率的95和99可信区间。 n正态近似法当二项分布满足近似正态分布的条件时(n 较大,样本率p 不接近0 也不接近1),可用正态近似法求总体率的1-可信区间:样本率的标准差,即率的标准误6.1.1 二项分布函数n又称为二项式概率分布函数n在sas中的表达为 probbnml(p, n, r)np为事件的发生率nn为样本含量nr为阳性事件个数n其意义是发生阳性事件数r的概率cdf or

4、pdf ?6.1.1 二项分布函数实例例6.1n给大鼠注射某微生物作致死试验,以同窝同性别大鼠每4只为一组。如致死概率为1/2,则生存概率也为1/2。试计算此4只大鼠死亡2只及两只以下的概率。 data jin; p=probbnml(0.5,4,2); q=1-p;proc print;run;求概率为0.5,样本含量为4,r2的概率 死亡2只以上的概率 6.1.1 二项分布函数实例例6.2设p=0.5,n=4,求r=0,1,2,3,4的概率。 如要求出r=0,1,n各数值的概率,可用probbnml(p,n,r)递次减出的方法。 p(k=2)=p(k2)- p(k1)p(k=0)=p(k0

5、)6.1.1 二项分布函数实例例6.2data binom4; do r=0 to 4; p=probbnml(0.5,4,r); q=1-p; if r=0 then d=p; else d=probbnml(0.5,4,r)-probbnml (0.5,4,r-1); output; end;proc print;run;把每一求出的p,q,d值输出到数据集,以免前一数值为后一数值所代替 避免r-1为负值 6.1.1 二项分布函数实例例6.26.1.1 二项分布函数实例例6.2n结果说明:np为各r的p值,如p(r=0)=0.0625,p(r1)=0.3125,. nq=(1-p)nd为各

6、r的p值,即p(0)=0.0625,p(1)=0.25,p(2)=0.375.6.1.2 样本率与总体率的比较 应用二项分布的概率计算公式计算事件(一般指x取某给定值一侧的所有值)发生的概率,再比较其与检验水准大小,推断样本所在的总体率与给定总体率的关系。 6.1.2样本率与总体率的比较实例例6.3n题目:据报道,对输卵管结扎了的育龄妇女实施壶腹部壶腹部吻合术后,受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部峡部吻合术,结果有9人受孕。问行峡部吻合术的受孕率是否高于壶腹部壶腹部吻合术?n程序说明:h0: =0.55, h1: 0.55.本例需计算在受孕率为0.55时,10个人中有大

7、于8人受孕的概率是多少,然后比较是否大于5%。 6.1.2样本率与总体率的比较实例例6.3data a; d=probbnml(0.55,10,8); p=1-d;proc print; var p;run;6.1.2样本率与总体率的比较实例例6.3结果说明:由于p=0.023260.05,说明两个样本率的差别无统计学意义,所以尚不能认为该职业人群颈椎病的发病有性别差异。6.2 poisson分布npoisson分布:若离散型随机变量x 的取值为0,1,n,且相应的取值概率为 则称随机变量x服从以为参数的 poisson分布,记为xp()。npoisson分布成立的条件:平稳性:x的取值与观察

8、单位的位置无关,只与观察单位的大小有关;独立增量性:在某个观察单位上x的取值与前面各观察单位上x的取值无关;普通性:在充分小的观察单位上 x 的取值最多为1。n此分布主要用以描述在单位时间(空间)中稀有事件的发生数 6.2 poisson分布n分布参数 xp() nx的均数nx的方差 nx的标准差n分布特性 n可加性: 如果 x1,x2,xk相互独立,且它们分别服从以i(i=1,2, ,k)为参数的 poisson分布,则 x=x1x2xk服从以(=1+2+k)为参数的poisson分布。 n近似分布 :当20,其分布接近正态分布。 当50,可认为是正态分布6.2 poisson分布n总体均数

9、的区间估计 n查表法n当样本计数x50 时,可用查表法求得总体均数的95或99可信区间。n正态近似法n当样本计数x50 时,可利用poisson分布的正态近似性,计算其总体均数(1-)可信区间如下:6.2.1 poisson分布的概率函数npoisson(,n)函数是poisson分布的概率函数n其中是总体均数,n为已知的发生情况,该函数根据和n,可计算得到来自poisson分布的随机变量n的概率。n利用该函数可对服从poisson分布的数据进行分析。6.2.1 poisson分布概率函数实例例6.5n题目:有人观察红细胞在计数池中400个小格,数出每小格中红细胞数,其均数为3.6175,试计

10、算每格中有细胞数5个的概率。n分析:要求出每格中有细胞数5个的概率,则需分别求出n5及n4的概率,然后计算两者的差即可。 6.2.1 poisson分布概率函数实例例6.5data poisson1; p=poisson(3.6175,5)-poisson(3.6175,4);proc print;run;6.2.2 样本均数与总体均数比较 样本均数与总体均数比较的目的是推断此样本所代表的未知总体均数是否等于已知总体均数0。n6.2.2.1 直接法(直接计算概率法)。 n6.2.2.2 正态近似法6.2.2.1直接法n当总体均数较小时,可采用直接计算概率法进行比较。n注意:样本均数与总体均数比

11、较时,应以x取大于等于(样本均数大于总体均数时)或小于等于(样本均数小于总体均数时)样本均数的所有值的概率总和同检验界值进行比较,切不可仅以x取样本均数的概率同检验界值进行比较。6.2.2.1直接法实例例6.6n题目:已知在某培养液中,有细菌数为每毫升3个,今采集放在5冰箱的1ml培养液得细菌数5个,能否说培养液中细菌数有增加?n分析:n本例提问为“是否有增加”,故为单侧检验。n细菌在液体中随机分布时为poisson分布。nh0: =3, h1: 3n应计算=3,n5的概率与=0.05比较。n要求p(n5)可用1-p(n4)。 6.2.2.1直接法实例例6.6data poisson3; p=

12、1-poisson(3,4);proc print;run;6.2.2.1直接法实例例6.7 某山区采制的蜂蜜发现有毒,经分析为含有雷公藤花粉粒,经反复取20g毒蜜溶解,离心后的沉淀物在显微镜下观察,每玻片内含雷公藤花粉粒平均为2颗。另外,从该地某个养蜂户采集的蜂蜜中取20g作检验,同样操作后观察一个玻片并未找到雷公藤花粉颗粒。据此能不能说此养蜂户蜂蜜所含雷公藤花粉颗粒低于该山区平均水平? 6.2.2.1直接法实例例6.7data poisson3; p=poisson(2,0);proc print;run;由于p=0.13534 0.05,故不能认为该养蜂户的蜂蜜中所含雷公藤花粉低于该山区

13、的平均水平。h0: =2, h1: 26.2.2.2正态近似法n当总体均数较大时(20时),可用正态近似法进行统计推断。此时 poisson 分布近似正态分布,故可计算标准正态统计量u, n通过u 值得出相应的概率,推断样本均数与总体均数的关系。 00xu6.2.2.2正态近似法实例例6.8 ( 20时)有研究表明,一般人群精神发育不全的发生率约为3。今调查了有亲缘血统婚配关系的后代25000人,发现123人精神发育不全。问有亲缘血统婚配关系的后代其精神发育不全的发生率是否要高于般人群? 6.2.2.2正态近似法实例例6.8 ( 20时)data prg6_8; input n x pai ;

14、 s=n*pai; u=(x-s)/sqrt(s); p=(1-probnorm(abs(u)*2;cards;25000 123 0.003proc print; var u p;run;6.2.2.2正态近似法实例例6.8结果说明:u检验的检验统计量的值为5.54256,所对应的p值为2.9808e-8,远远小于0.05,说明样本和总体之间的差异有统计学意义,可以认为有亲缘血统婚配关系的后代其精神发育不全的发生率高于一般人群 。6.2.3两个样本均数比较6.2.3.1 两个样本观察单位相同6.2.3.2 两个样本观察单位不相同6.2.3.1两个样本观察单位相同实例例6.9某卫生检疫机构对两

15、种纯净水各抽验了1ml水样,分别培养出大肠杆菌4个和7个,试比较这两种纯净水中平均每毫升所含大肠杆菌数有无差异? 6.2.3.1两个样本观察单位相同实例例6.9data prg6_9; x1=4; x2=7; u=(abs(x1-x2)-1)/sqrt(x1+x2); p=(1-probnorm(u)*2;proc print; var u p;run; xl和x2为两个样本均数,u为检验统计量,由于所得的样本均数均0.05,说明两个样本的差异无统计学意义不能认为这两种纯净水中平均每毫升所含大肠杆菌数有差异。6.2.3.2两个样本观察单位不同实例例6.10n题目:某研究者为分析一种罕见非传染性疾病发病的地域差异,对甲地区连续观察了4年,发现有32人发病;对乙地区连续观察了3年,发现有12人发病。指定甲、乙两地区在观察期内人口构成相同,人口基数相近且基本不变,试作统计推断。n分析:本例中疾病的发病人数服从poisson分布,但两个样本观察单位不相同,对甲地区连续观察了4年,而对乙地区只连续观察了3年。6.2.3.2两个样本观察单位不同实例例6.10data prg6_10; input x1 x2 n1 n2 ; u=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论