雷静《卫生统计学》第五章 常用概率分布.ppt_第1页
雷静《卫生统计学》第五章 常用概率分布.ppt_第2页
雷静《卫生统计学》第五章 常用概率分布.ppt_第3页
雷静《卫生统计学》第五章 常用概率分布.ppt_第4页
雷静《卫生统计学》第五章 常用概率分布.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章 常用概率分布,二项分布 泊松分布 正态分布,二项分布及其应用,二项分布的概念与特征 二项分布的应用,二项分布的概念,在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。 二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。,只有两种可能结果的随机试验,当成功的概率()是恒定的,且各次试验相互独立,这种试验在统计学上称为贝努里试验(Bernoulli trial)。如果进行n 次贝努里试验,取得成功次数为X(X=0,1,n)的概率可用下面的二项分布概率公式来描述:,二项分布的概念,二项分布的概念,二项分布的概率函数:,式中的n为独立试验的次数, 为成功的概率,(1-)为失败的概率, X为在n次试验中出现成功的次数, 二项系数:表示在n次试验中出现X的各种组合情况。 该式含义为:含量为n的样本中,恰好有X例阳性的概率。,P63例5-1、5-2,二项分布的概念,二项分布的应用条件: 各观察单位只能具有相互对立的一种结果(互斥的两分类资料) 已知发生某一结果的概率为,其对立结果的概率为1-,实际工作中要求是从大量观察中获得比较稳定的数值。 n次试验在相同条件下进行,且观察结果相互独立。如要求疾病无传染性、无家族性等。,二项分布的特征,二项分布的图形及其正态近似性: 已知和n,就能按公式计算X=0,1,n时的P(X)值。以X为横坐标,以P(X)为纵坐标作图,即可绘出二项分布的图形,如图5-1,图 5-2; 二项分布的高峰在=n处。当接近0.5时,图形是对称的;离0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。 当n较大,nP和n(1P)都大于5时,二项分布近似于正态分布。,二项分布的特征,二项分布的均数和标准差: =n = (原理见P64例5-3) 用率表示时,即上式分别除以n,得 p= p= sp=,二项分布的应用,从阳性率为的总体中随机抽取含量为n的样本,则有: 概率估计:可计算恰好有X例阳性的概率 累积概率的计算: (1)最多有k例阳性的概率,其中,X=0,1,2,k,n。,(2)最少有k例阳性的概率,P63例5-2 P81 思考与练习4.5,小结,二项分布的特征 二项分布的均数和标准差 二项分布的正态近似条件,泊松分布,泊松分布的概念与特征 泊松分布的应用,Poisson分布,用于研究单位时间、单位人群、单位空间内,某罕见事件发生次数的概率分布。是描述小概率事件出现规律性的一种重要的离散型分布。 如某种细菌在单位容积空气或水中出现的情况,某段时间特定人群中某种恶性肿瘤患者的分布或出生缺陷的发病情况,放射性物质在单位时间内的放射次数,单位空间某种昆虫数的分布等等。,Poisson分布的概念,Poisson分布的应用条件: 事件发生的概率不变 每个事件的发生是相互独立的,Poisson分布的概念,Poisson分布的概率函数: X=1,2,3 意义:单位时间(单位人群、单位空间内,单位容积)内,某罕见事件发生次数的概率分布 Poisson分布的特征由参数确定。,Poisson分布的特征,Poisson分布的图形:已知 ,就可按公式计算得出X= 0,1,2,时的P(X)值,以X为横坐标,以P(X)为纵坐标作图,即可绘出Poisson分布的图形,如图5-3。,Poisson分布的特征,Poisson分布的形状取决于的大小。值越小,分布越偏,随着的增大,分布越趋于对称,当=20时,分布接近正态分布。,1.Poisson分布是一种单参数的离散型分布,其参数为,它表示单位时间或空间内某事件平均发生的次数,又称强度参数。 2. Poisson分布的总体方差2与总体均数相等,即2=。 3. Poisson分布的观察结果有可加性。若从总体均数为1的Poisson分布总体中随机抽出一份样本,其中稀有事件的发生次数为X1,再独立地从总体均数为2的Poisson分布总体中随机抽出另一份样本,其中稀有事件的发生次数为X2,则它们的合计发生数T =(X1+ X2)也服从Poisson分布,总体均数为(1 + 2)。,Poisson分布的特性:,上述性质还可以推广到多个Poisson分布的情形。例如,从同一水源独立地取水样5次,进行细菌培养,每次水样中的菌落数分别为Xi,i=1,5,均服从Poisson分布,分别记为 (i) , i=1,5,那么把5份水样混合,其合计菌落数 也服从Poisson分布,记为(1 + 2 + 5 ) 医学研究中常利用其可加性,将小的观察单位合并,来增大发生次数X,以便用后面讲到的正态近似法作统计推断。,1.概率估计:可求出单位时间(单位人群、单位空间内,单位容积)内,某罕见事件发生次数为X的概率大小 X=1,2,3,Poisson分布的应用,P68:例5-7、例5-8,2.累积概率的计算: 单位时间或空间内事件发生的次数最多为k次的概率: X=0,1,2,3k,Poisson分布的应用,P68:例5-9、例5-10,2.累积概率的计算: 单位时间或空间内事件发生的次数最少为k次的概率:,Poisson分布的应用,P69:例5-10 P81 思考与练习6.,小结,泊松分布的均数和标准差 泊松分布的正态近似条件,正态分布,正态分布的概念与特征 正态分布的应用,图5.1 频数分布逐渐接近正态分布示意图,正态分布的概念与特征,正态分布的概念与特征,1.正态分布的图形: 正态分布密度函数方程 当方程中的两个参数确定后,即可绘出正态分布的图形,正态分布的概念与特征,2.正态分布的特征 1)正态曲线在横轴上方,均数处最高; 2)以均数为中心,左右对称。对称轴 3)正态分布由两个参数决定,即均数和标准差。均数为位置参数,标准差为变异参数。当标准差恒定时,均数越大,曲线沿横轴越向右移;反之则向左移。当均数恒定时,标准差越大,数据越分散,曲线最高点越向下. 4)正态曲线下的面积分布有一定的规律。,正态曲线下面积的分布规律:,标准正态分布,将正态分布的方程作如下变量变换 即将原正态分布曲线图的原点移到的位置,横轴尺度以为单位,就可将正态分布变换为标准正态分布(standard normal distribution),用 N(0,1) 表示,称为标准正态变量或标准正态(离)差(standard normal deviate)。其密度函数为:,实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或估计观察值落在该区间的概率。 正态曲线下一定区间的面积可以通过P466附表1求得。表内所示数据表示取不同值时值左侧标准正态曲线下面积,记作(), ()称为标准正态分布的分布函数。 对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概率估计。,正态曲线下面积的分布规律,例:已知成年男子红细胞数服从正态分布, 其总体均数为4.781012/L,标准差为 0.341012/L,求红细胞数在41012/L 以下的人所占的比例。,1.不少医学现象服从正态分布或近似正态分布, 可用来估计正态分布资料的频数分布。 如: 同性别同年龄儿童的身高;实验中的随机误差; 同性别健康成人的红细胞数、血红蛋白、血小板计数; 很多呈偏态分布的医学资料,经变量变换可转换为正态分布。,正态分布的应用,2.估计医学参考值范围: “医学参考值范围”,它是指特定的“正常”人群的解剖、生理、生化等指标的波动范围。 制定参考值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了对所研究指标有影响的疾病和有关因素的同质人群; 其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值。 还要根据资料的分布特点,选用恰当的计算方法。,正态分布的应用,常用方法有:(以95%参考值范围为例) 正态分布法:适用于正态或近似正态分布的资料 双侧界值: 单侧上界: 或单侧下界:,例1: 某地200例正常成人血铅含量的频数分布如下表。 (1)简述该资料的分布特征。 (2)若资料近似呈对数正态分布,试估计该地正常成人血铅值的95%参考值范围。,表1. 某地200例正常成人血铅含量(mol/L)的频数分布,例2. 某地144例3045岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。试估计该地3045岁成年男子血清总胆固醇的95%参考值范围;血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?,百分位数法:常用于偏态分布资料以及 资料中一端或两端无确切数值的资料 双侧范围:(P2.5,P97.5) 单侧上界:P95以下(如血铅、血汞等有害物质) 或单侧下界:P5以上(如肺活量),3.质量控制:随机测量误差及随机抽样误差虽可引起某项指标的波动,但往往服从正态分布,此时若出现系统误差,则观察结果不再服从正态分布。据此原理,通过绘制控制图,可以及时发现系统误差的出现。 常以 作为上下警戒值, 以 作为上下控制值。如图5-10,正态分布的应用,4.二项分布、泊松分布的正态分布近似 1)当n较大,n和n(1-)都大于5时,二项分布近似于正态分布; 2)当20时,Poisson分布接近正态分布。 此时可利用正态近似原理计算累积概率,正态分布的应用,小结,医学参考值范围的计算方法 二项分布、泊松分布及正态分布之间的关系,P81 思考与练习7.,后面内容直接删除就行 资料可以编辑修改使用 资料可以编辑修改使用,主要经营:网络软件设计、图文设计制作、发布广告等 公司秉着以优质的服

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论