第05章常用概率分布_第1页
第05章常用概率分布_第2页
第05章常用概率分布_第3页
第05章常用概率分布_第4页
第05章常用概率分布_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 常用概率分布常用概率分布 常用概率分布常用概率分布 二项分布二项分布(binomial distribution) Poisson分布分布(Poisson distribution) 正态分布正态分布(normal distribution)概率分布概率分布描述随机变量各种可能取值及其概率大小的表格、描述随机变量各种可能取值及其概率大小的表格、图形或公式图形或公式第一节第一节 二项分布二项分布一、二项分布的概念一、二项分布的概念 实例:设小白鼠接受某种毒物一定剂量时,实例:设小白鼠接受某种毒物一定剂量时,其死亡率其死亡率80%。则对每只小白鼠来说,其。则对每只小白鼠来说,其死亡概

2、率为死亡概率为0.8, 生存概率为生存概率为0.2 。 若每组各用甲乙丙三只小白鼠逐只做实若每组各用甲乙丙三只小白鼠逐只做实验,观察验,观察每组小白鼠死亡情况每组小白鼠死亡情况。小白鼠结果生存 死亡排 列 方 式甲 乙 丙3 0生 生 生2 1 生 生 死生 死 生死 生 生1 2生 死 死死 生 死死 死 生0 3死 死 死每种排列的概率每种排列的概率0.20.2 0.20.2 0.20.20.20.2 0.20.2 0.80.80.20.2 0.80.8 0.20.20.80.8 0.20.2 0.20.20.20.2 0.80.8 0.80.80.80.8 0.20.2 0.80.80.

3、80.8 0.80.8 0.20.20.80.8 0.80.8 0.80.822 . 08 . 03 2 . 02 . 08 . 02 . 08 . 02 . 08 . 02 . 02 . 0) 1(1:只小白鼠死亡的概率为那么,只有XP1、二项分布的定义 在n次独立实验中,每次只有两个对立的结果(如阳性或阴性,生存或死亡),如果阳性结果发生的概率为,则阳性结果发生数X所服从的概率分布称为二项分布(binomial distribution) 。 记作:X B(n,)2、条件 (1) 观察结果只能有两种可能的结果,且互相对立。 (2) 已知发生某一结果的概率为,则对立结果的概率为1-。 (3)

4、 观察结果相互独立,即每个观察结果不会影响其他观察结果。XnXXnCXP)1 ()()!( !XnXnCXn其中,3、恰有X例阳性的概率为例5-2 临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中两例有效的概率是多大?432. 0)6 . 01 (6 . 0)23(223C二、二、二项分布的特征二项分布的特征1、二项分布的图形特征 图5-1 =0.5时,不同n值对应的二项分布 n=3,=0.500.10.20.30.4012345678910 11 12 13xP(x)n=10,=0.500.10.20.30.4012345678910 11 12 13xP(x)图5-2

5、=0.3时, 不同n值对应的二项分布 n=3,=0.300.10.20.30.40.5012345678910 11 12 13 14 15xP(x)n=6,=0.300.10.20.30.40.5012345678910 11 12 13 14 15xP(x)n=10,=0.300.10.20.30.40.5012345678910 11 12 13 14 15xP(x)n=20,=0.300.10.20.30.40.5012345678910 11 12 13 14 15xP(x) (1)二项分布图形取决于与n,高峰=n处。 (2)接近0.5时,图形是对称的;离0.5愈远,对称性愈差。 (

6、3)随着n的增大,分布趋于对称。 (4)当n 和和n(1 )都大于都大于5时,二项分布近似于正态分布。 (5)二项分布是一种离散型分布。特征总结:2、二项分布的均数和标准差总体均数:方差:标准差: n)1 (2 n)1 (n 如果将出现阳性结果的频率记为 则p的总体均数与标准差为: 总体均数: 标准差: nXppnp)1(nppSp)1 ( 三、二项分布的应用三、二项分布的应用(一)概率估计 例5-5 如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大? 感染人数X服从n=150,=0.13的二项分布,可以得出150人中有10人感染钩虫的概率为0055. 087

7、. 013. 0)!10150( !10!150)10(14010XP1、二项分布出现阳性的次数至多为k次的概率为kXXPkXP0)()(nkXXPkXP)()(2、出现阳性的次数至少为k次的概率为(二)单侧累积概率计算 例5-6 例4-5中某地钩虫感染率为13%,随机抽查当地150人,其中至多有2名感染钩虫的概率有多大?至少有2名感染钩虫的概率有多大?至少有20名感染钩虫的概率有多大? 至多有2名感染钩虫的概率为20)()2(XXPXP1502)()2(XXPXP 至少有2名感染钩虫的概率为 至少有20名感染钩虫的概率为15020)()20(XXPXP第二节第二节Poisson分布分布一、一

8、、Poisson分布的概念分布的概念 Poisson分布也是一种离散型分布,分布也是一种离散型分布,用以描述罕见事件发生次数的概率分布。用以描述罕见事件发生次数的概率分布。医学上人群中出生缺陷、多胞胎、染色体医学上人群中出生缺陷、多胞胎、染色体异常等事件等都是罕见的。异常等事件等都是罕见的。 Poisson分布可以看作是发生的概率很小,而观察例数n很大时的二项分布。除二项分布的三个基本条以外,Poisson分布还要求或(1)接近于0或1。 很多情况下, 和n都难以确定,而是以观察单位时间(或单位空间、单位面积等)内稀有事件的发生数X来表示。二、二、Poisson分布的特征分布的特征1、恰有X例

9、稀有事件的发生的概率为: 式中, 为Poisson分布的总体均数,X为观察单位内稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。 !)(XeXPXn=100.10.20.30.40246810121416182022xP(x)=300.10.20.30.40246810121416182022xP(x)图5-3 取不同值时的Poisson分布图 2、图形特征当总体均数值小于5时为偏峰,愈小分布愈偏,随着增大,分布趋向对称。3、Poisson分布的特性:(1)Poisson分布的总体均数与总体方差相等,均为。(2)Poisson分布的观察结果有可加性。三、三、Poisson分

10、布的应用分布的应用(一)概率估计 例5-7 如果某地新生儿先天性心脏病的发病概率为8,那么该地120名新生儿中有4人患先天性心脏病的概率有多大? =n=1200.008=0.96 014. 0! 496. 0)4(496. 0eXP(二)单侧累计概率计算如果稀有事件发生次数的总体均数为,那么该稀有事件发生次数至多为k次的概率 kXkXXXeXPkXP00!)()() 1(1)(kXPkXP发生次数至少为k次的概率 例5-8 例5-7中,至多有4人患先天性心脏病的概率有多大?至少有人患先天性心脏病的概率有多大? 404096.0!96.0)()4(XXXXeXPXP)4(1)5(XPXP至多有4

11、人患先天性心脏病的概率至少有人患先天性心脏病的概率为第三节第三节 正态分布正态分布(Normal distribution)一、正态分布的概念一、正态分布的概念在医学卫生领域中有许多变量的频数分布是中间(靠近均数处)频数多,两边频数少,且左右对称。这种指标的频数分布规律往往可以用概率论中的一种重要随机变量的分布正态分布来描述。图5-4 体模“骨密度”测量值的分布接近正态分布示意图1.27701.26501.25301.24101.2290Frequency403020100正态曲线正态曲线(Normal cure):是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线

12、钟形曲线。二、正态分布密度函数及表达222)(21)(xexf通常用记号N(,2)表示:均数为 , 标准差为的正态分布。其中,,为总体均数,为总体标准差),(:,2NXX记为的正态分析标准差为服从均数为随机变量三、正态分布曲线的特点(1)关于x= 对称。(2)在x=处取得该概率密度函数的最大值,在 处有拐点,表现为钟形曲线。(3)位置参数决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之,减小,曲线沿横轴向左移。(4)形态参数决定曲线的形状,当恒定时,越大,数据越分散,曲线越矮胖;越小, 数据越集中,曲线越瘦高。见图4-5。x-6-5-4-3-2-10123456不同均数321 -3-2-1

13、0123不同标准差321四、正态曲线下面积的分布规律四、正态曲线下面积的分布规律 1.96 2.58五、标准正态分布五、标准正态分布作如下的标准化变换,也称Z变换XZ则Z服从总体均数为0、总体标准差为1的正态分布。我们称此正态分布为标准正态分布(standard normal distribution),表示为:),(2NX)1 , 0( NZ 统计学家编制了标准正态分布曲线下面积分布表(附表1)。 表内所列数据表示Z取不同值时标准正态分布的分布函数值,此值大小相当于Z值左侧标准正态曲线下面积,记作 。 )(z 例5-12 某地1986年120名8岁男孩身高均数为 =123.02cm ,标准差

14、为S=4.79cm,试估计(1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;(2)身高在120cm128cm者占该地8岁男孩总数的百分比;(3)该地80%的男孩身高集中在哪个范围? X (1) 求Z值: 查表: 理论上该地8岁男孩身高在130cm以上者占该地8岁男孩总数的7.21%。 46. 179. 402.123130Z0721. 0)46. 1( (2) 先计算120 和128所对应的Z值: 正态曲线下区间(0.63,1.04)上的面积等于 63.079.402.1231201201SXz04.179.402.1231281282SXz2643. 0)63. 0(850

15、8. 01492. 01)04. 1(1)04. 1 (5865. 02643. 08508. 0)63. 0()04. 1 ( (3) 查附表1,标准正态分布曲线下左侧面积为0.10所对应的Z值为1.28, 80%的8岁男孩身高集中在 区间内,即116.9cm与129.2cm之间。 SX28. 1六、正态分布的应用六、正态分布的应用(一)确定医学参考值范围医学参考值范围(reference ranges):是指特定的“正常”人群数据中大多数个体的取值所在的范围。人们习惯用该人群95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。 (二二)、医学参考值范围的制定方法、医学参考值范围的

16、制定方法估计的方法:估计的方法:1 1、正态分布法、正态分布法2 2、百分位数法、百分位数法应用条件应用条件: :正态分布或近似正态分布资料正态分布或近似正态分布资料 计算计算 95% 95% 正常值正常值( (医学参考值)范围公式:医学参考值)范围公式: 双侧:即双侧:即 单下单下: : 单上单上: :例如:某地正常成年男子红细胞数的例如:某地正常成年男子红细胞数的95%95%的参考值范围。的参考值范围。 1、正态分布法、正态分布法)96. 196. 1(sxs,xsx96. 1sxsx645. 1645. 12、百分位数法、百分位数法 应用条件 : 偏态分布资料 计算公式: 双侧界值:P 2.5 P 97.5 单侧 上界: P 95 单侧 下界: P 5 例: 调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布, (g/L), (g/L),试估计该地健康女性血红蛋白的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论