




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 常用概率分布一、二项分布的概念和特征概念分布:随机变量的取值规律 分布函数:描述分布的规律变量类型连续型变量离散型变量 如:正态分布如:二项分布,泊松分布思考例1.假设有5只实验小白鼠,要求它们同种属、同性别、体重 相近,且给小白鼠注射一定剂量的毒物时,他们有相同的死 亡率80%,存活率为20%。那么这5只小白鼠实验后全部死亡 的概率是多少?有一只白小鼠存活的概率是多少?2只小白 鼠存活的概率是多少?例1.假设有5只实验小白鼠,要求它们同种属、同性别、体重相近, 且给小白鼠注射一定剂量的毒物时,他们有相同的死亡率80%, 存活率为20%。那么这5只小白鼠实验后全部死亡的概率是多少? 有
2、一只白小鼠存活的概率是多少?2只小白鼠存活的概率是多少? P 死=0.8 P 活=0.2 P 1=0.8×0.8×0.8×0.8×0.8 P 2 = P 3 = 1 5C 2 5C 0.2×0.8 4 =0.082 0.2 2 ×0.8 3 =0.020 =0.8 5 =0.328该实验有三个特点:1.各次实验是彼此独立的;2.每次实验只有二种可能的结果,或死亡或生存;3.每次实验小白鼠死亡和生存的概率是固定的。具备以上三点,即从阳性率为的总体中随机抽取大小为n的样本, 则出现“阳性”数为X的概率分布即呈现二项分布,记作B(n,p。概
3、率分布函数二项分布的概率函数P (X 可用公式X n X XnC X P - - = 1 ( ( p p 其中 !( ! ! X n X n C Xn - = 对于任何二项分布,总有 ( 1= å = nX X P例2.临床上用针灸治疗某型头疼,有效的概率为60%,现以 该疗法治疗3例,其中2例有效的概率是多大?分析:治疗结果为有限和无效两类,每个患者是否有效不受其他病例的影响,有 效概率均为0.6,符合二项分布的条件。X n X XnC X P - - = 1 ( ( p p ( ( 432 . 0 6 . 0 1 6 . 0 !2 3 ! 2 ! 3 1
4、 ( 2 3 2 2 3 2 23 2 ( = = - - = p p C P 因此,2例有效的概率是0.432。二项分布的特征B (n,p n = 3, = 0.5 n = 10, = 0.5 = 0.3时,不同 n 值对应的二项分布二项分布的特征1. n,是二项分布的两个参数,所以二项分布的形状取决于n,。2. 当=0.5时分布对称,近似对称分布。3. 当 0.5时,分布呈偏态,特别是 n 较小时, 偏离0.5越远,分 布的对称性越差,但只要不接近1和0时,随着 n 的增大,分布逐 渐逼近正态。4. 当 或 1 不太小,而 n 足够大,通常 n 和 n(1
5、3; 均大于或 等于5,我们常用正态近似的原理来处理二项分布的问题。例3.临床上用针灸治疗某型头痛,有效的概率为60%,现以该疗法治疗3例,求有效人 数的均数和方差。二项分布的均数和标准差分析:n = 3,p =0.60 1 2 30.064 0.288 0.432 0.216 根据总体均数(又称数学期望和方差的定义,有效人数的均数为: ( 80 . 1 216 . 0 3 432 . 0 2 288 . 0 1 064 . 0 0 ( = ´ + ´ + ´ + ´ = å = X XP X E 方差为: 22 222 (0 1.800.06
6、4(1 1.800.288.(3 1.800.216 0.72V a r X E X E X X E X P X =-=- =-´+-´+-´ = å对于任何一个二项分布B(n,如果每次试验出现“阳性” 结果的概率均为,则在 n 次独立重复实验中,出现 X 次阳 性结果总体均数为 标准差为pm n=( pps-= 1n二项分布的均数和标准差如果以率表示,将阳性结果的频率记做为 则P 的总体均数总体标准差为 式中是频率P 的标准误,反映阳性频率的抽样误差的大小。 p m = P ( nP p p s - = 1 P s nX P =例4. 已知某地钩虫感染
7、率为6.7%,如果随机抽查150人,记 样本钩虫感染率为 P ,求 P 的标准误 。本例 ,n =150,P =6.7% 0 . 2 020 . 0 150067 . 0 1 ( 067 . 0 = = - = P s小结:1. 二项分布的条件:1每次实验结果,只能是两个互斥的结果之一。2相同的实验条件下,每次实验中事件A的发生具有相同的概率。3各次实验独立,各次的实验结果互不影响。2. 二项分布的分布特征:1二项分布的形状取决于n,。2当 =0.5时分布对称,近似对称分布。3当 0.5时,分布呈偏态,特别是 n 较小时, 偏离0.5越远,分布的 对称性越差,但只要不接近1和0时,随着 n 的
8、增大,分布逐渐逼近正态。3.二项分布的均数和标准差对于任何一个二项分布B (n ,均数:标准差: 对于以率表示的二项分布,总体均数:总体标准差 小结:p m n = ( p p s - = 1 n p m = P ( nP p p s - = 1第四章 常用概率分布二、二项分布的应用1. 二项分布的条件:1 每次实验结果,只能是两个互斥的结果之一。2 相同的实验条件下,每次实验中事件A的发生具有相同的概率 。3 各次实验独立,各次的实验结果互不影响。2. 二项分布的分布特征:1 二项分布的形状取决于n,。2 当=0.5时分布对称,近似对称分布。3 当0.5时,分布呈偏态,特别是n 较小时,偏离
9、0.5越远,分布的 对称性越差,但只要不接近1和0时,随着 n 的增大,分布逐渐逼近正态。3. 二项分布的均数和标准差对于任何一个二项分布B (n ,均数: 标准差: 对于以率表示的二项分布总体均数: 总体标准差: n = m p ( 1 n =- s p p P = m p( nP p p s - = 1在生物医学研究中,我们经常要处理这样一类问 题:(1每次试验只有两种互斥的结果。如生化检验的结果(阴性或阳 性,毒性试验的结果(存活或死亡,或者每次试验我们只关心某事 件是否发生,即要么事件发生,要么事件不发生。(2为了找到这些试验结果的规律性,通常需要在相同条件下独立重复 作 n 次,如对
10、 n个患者用完全相同的治疗方案进行治疗,对 n只动物进 行剂量相同的毒性试验等。(3我们只关心的是 n次试验中阳性结果的数目,如 n 个患者治疗后的 治愈数,n 只动物毒性试验的存活数等等。1.概率估计例1.如果某地钩虫感染率为13%,随机观察当地150人,其中 恰好有10人感染钩虫的概率有多大?分析:(1钩虫感染只有两个互斥的结果,即感染与非感染;(2每个人被钩虫感染的概率相同;(3人与人之间钩虫感染可假设为相互独立的,所以感染钩虫的人数 X 可认为服从 n= 150,= 0.13的二项分布。1.概率估计例1.如果某地钩虫感染率为13%,随机观察当地150人,其中 恰好有10人感染钩虫的概率
11、有多大?10140 150! (100.130.870.0055 10!(15010!P X =´= - Xn X Xn C X P - - = 1 ( ( p p二项分布出现阳性次数至少为 k 次的概率为 2. 累计概率计算( ( ( ( ! 1 ! nn n XX X k X k n P X k P X X n X - = ³=- - åå p p 阳性次数至多为 k 次的概率为( ( ( ( 00 ! 1 ! kk n XX X X n P X k PX X n X - = £=- - åå p p2.累计概率计算例2
12、.如果某地钩虫感染率为13%,随机观察当地150人,其 中至多有2人感染钩虫的概率有多大?至少有2人感染钩虫 的概率有多大?至少有20人感染钩虫的概率有多大? 至多有2名感染的概率为:( ( ( ( 22 00 ! 21 ! n XX X X n P X PX X n X - = £=- - åå p p ( ( ( ( ( ( 150149 01 148 7 012 150!150! 0.1310.130.1310.13 0!150!1!149!150! 0.13210.13 2!148!P P P - + =-+- +-至少有2名感染的概率为:至少有20名感染
13、的概率为:( ( ( ( ( 120 21 1011nX X P X PX P X P P = ³=- =-+» éù ëû åå ( ( ( ( ( ( 19200 201 10119 0.4879n X X P X P X P X P P P = ³=- =-+ éù ëû = åå L3.其它应用1. 二项分布的正态近似根据中心极限定理,在 n 较大,n 与 n (1均大于或等于5时,二项分布接近与正态分布。当 n 无穷大时,二
14、项分布B (n ,的极限分布是总体均数为, 总体标准差为 的正态分布 , 此时可用该正态分布进行估计。n = m p ( 1 n =- s p p ( ( ,1 N n n - p p p3. 其它应用2. 总体率的区间估计3. 样本率与总体率的比较4. 两样本率的比较5. 研究非遗传性疾病的家族聚集性6. 率的抽样调查的样本量估计4.小 结1. 二项分布的应用条件1 每次实验结果,只能是两个互斥的结果之一。2 相同的实验条件下,每次实验中事件A的发生具有相同的概率 。3 各次实验独立。各次的实验结果互不影响。2.二项分布的正态近似条件在 n较大,n 与 n(1 均大于或等于5时,
15、可用 的正态分布近似估计。3.二项分布可以用于概率估计,统计推断等( ( ,1N n n-p p p第四章 常用概率分布三、Poisson分布的概念与特征一、Poisson分布的概念Poisson分布是一种离散型分布,用于描述单位时间、空间、面积等的罕见事件发生次数的概率分布。如:n每毫升水中的大肠杆菌数、n单位时间(如1分钟内放射性质点数、n每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出 现的例数、n 注意:Poisson分布要求观察结果相互独立,发生的概率p不变。如,人群中传染性疾病首例出现后便成为传染源,会增加 后续病例出现的概率,因此病例数的分布不能看作是Poisson 分
16、布;又如,污染的牛奶中细菌成集落存在,单位容量牛奶中细 菌数不能认为服从Poisson分布。二、Poisson 分布的特征Poisson 分布一般记作P (l ,其概率函数为:式中,l =n为Poisson 分布的总体均数;X 为观察单位内某稀有事件的发生次数; e 为自然对数的底,为常数,约等于2.71828。( !XP X eX ll- =例1 如某地20年间共出生短肢畸形儿10名,平均每年 0.5名。试估计该地每年出生此类短肢畸形儿的人数为0, 1, 2,的概率P (X。X0 1 2 3 4 5 0.607 0.303 0.076 0.013 0.002 0.000(P X 20.50.
17、5(20.076 2!P e- = 10.50.5(10.303, 1!P e- = 00.50.5(00.607, 0!P e- =随着l的增大,Poisson分布逐渐趋于对称分布。当l>20时,Poisson分布可视为近似正态分布。图1 l取不同值时的Poisson分布图Poisson 分布具有以下特性: (1总体均数与总体方差相等:均为l 。 (2可加性:从总体均数分别为l 1 和l 2 的两个Poisson 分布总体中各 自随机抽出一份样本,其中稀有事件的发生次数分别为 X 1 和X 2 ,则合计发生数T =X 1 +X 2 也服从Poisson 分布,总 体均数为l 1 +l
18、2。水源P (l 1 P (l 2 P (l 3 P (l 1 +l 2 +l 3 +l 4 +l 5P (l 4 P (l 5可加性可推广到多个Poisson 分布。 正态近似若随机变量X服从Poisson分布,Y=2X是否服从Poisson分布?否!n若服从Poisson分布的随机变量可能取值为0,1,2,;但Y的 可能取值为0,2,4,与Poisson分布随机变量的可能取值不 符。n若X的总体均数和方差为,则Y的总体均数为2,总体方差为4, 总体均数总体方差。三、Poisson 分布的应用1、概率估计:如果某地新生儿先天性心脏病的发病概率为8,那么 该地120名新生儿中有4人患先天性心脏
19、病的概率有多大?( ( 41.96 1200.0080.96!0.96 40.014 4!Xn P X e X P e l l p l - - =´= =2、累积概率计算如果稀有事件发生次数的总体均数为,那么该稀有事件发生次数至多为k 次的概率为00 ( ! Xk k X X P X k P X e X l l - = £= åå 发生次数至少为k 次的概率为(1(1P X k P X k ³=-£-660616222 00 6666 (3( !0!1!2! = 0.062 X X X e e e e P X P X X - = &l
20、t;=+ åå 606166 (11(0(11 0!1!0.983 e e P X P X P X - >=-=-=- = 例2某100cm 2 的培养皿中平均菌落数为6个。今用100cm 2 的培养皿进行培养,试估计每一个培养皿中菌落数小于3个的概率,大于1个的概率。该培养皿菌落数小于3个的概率为菌落数大于1个的概率为例3 某放射性物质半小时内发出的脉冲数服从Poisson 分布,平均为 360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。4000.5360 (4001(4001(1(2.1350.0164 360P X P X +- >=-£»-F =-F = 该放射性物质半小时内发出的脉冲数大于400个的概率为0.0164。二项分布 Poisson 分布 正态分布 n 很大很小l 20n p 5,且n (1p 5第四章 常用概率分布四、正态分布的概念与特征正态分布是自然界最常见的分布之一,例如测量的误差、人体许多生化 指标的测量值等等都可认为近似正态分布。此外,正态分布具有许多良好的 性质,许多理论分布在一定条件下可用正态分布近似,一些重要的分布可由 正态分布导出。可以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 14092.4-2025机械产品环境条件第4部分:海洋
- 2025年技术转移评估师笔试模拟题
- 电商平台入驻协议注意事项
- 2025年食堂采购员招考模拟题库解析集
- 2025年农业机械操作员职业知识考核试卷及答案解析
- 2025年礼仪培训讲师认证考试试题及答案解析
- 2025年外事办西语翻译面试常见题及答案
- 2025年机械设计师资格认证考试试题及答案解析
- 2025年互联网金融风控师资格考试试题及答案解析
- 2025年动画设计师职业技能等级考试试题及答案解析
- EPC项目设计管理实施策划书(模板)
- 陕西省公路工程通用表格
- GA 1801.4-2022国家战略储备库反恐怖防范要求第4部分:火炸药库
- 实测实量测量表格优质资料
- 读书笔记 -《提高利润的78个方法》
- GB/T 4623-2006环形混凝土电杆
- GB/T 14273-1993旋转轴唇形密封圈性能试验方法
- GB/T 12247-2015蒸汽疏水阀分类
- 期权风险管理课件
- 《护理伦理学》教学大纲(本科)
- 安全标准化班组汇报课件
评论
0/150
提交评论