卫生统计学04章 常用概率分布.ppt_第1页
卫生统计学04章 常用概率分布.ppt_第2页
卫生统计学04章 常用概率分布.ppt_第3页
卫生统计学04章 常用概率分布.ppt_第4页
卫生统计学04章 常用概率分布.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter4ProbabilityDistributions常用概率分布 BinomialDistribution二项分布 1 1Conceptandfeature 概念与特征 例4 2临床上用针灸治疗某型头痛 有效的概率为60 现以该法治疗3例 其中0例有效的概率是多大 1例有效的概率是多大 2例有效的概率是多大 3例有效的概率是多大 UrnModel瓮模型 一个袋子里有5个乒乓球 其中2个黄球 3个白球 我们进行摸球游戏 每次摸1球 然后放回再摸 先后摸100次 请问摸到零次黄球的概率有多大 1 每次摸到白球的概率 0 6 2 第1次摸到白球的概率 0 6第2次摸到白球的概率 0 6 第100次摸到白球的概率 0 6 3 100次摸到零次黄球的概率 0 6 0 6 0 6 0 6 100 UrnModel 先后100次 摸到3次黄球的概率有多大 1 每次摸到黄球的概率 0 4 2 黄黄黄白白白白白白 白概率 0 4 3 0 6 97黄白黄黄白白白白白 白概率 0 4 3 0 6 97黄白黄白黄白白白白 白概率 0 4 3 0 6 97 3 100次摸到3次黄球的概率 0 4 3 0 6 97 0 4 3 0 6 97 0 4 3 0 6 97先后100次 摸到x次黄球的概率 ntimes resultinxevents Binary 二分类 每次摸球只有二种可能的结果 或黄球或白球 Independent 独立 各次摸球是彼此独立的 Repeat 重复 每次摸到黄球或白球的概率是和1 先后n次 摸到x次黄球的概率 一般地 若随机变量取值x的概率为其中 则称此随机变量服从二项分布 称为二项分布的概率函数 二分类 独立 重复试验 若每次出现某事物的概率为 则n次中有X次出现该事物的概率服从二项分布 BinomialDistribution Newton sBinomialExpansion ThegeneraltermoftheBinomialExpansion 例4 2临床上用针灸治疗某型头痛 有效的概率为60 现以该法治疗3例 其中2例有效的概率是多大 2例以上有效的概率是多大 3例都无效的概率是多大 图4 1 0 5时 不同n值对应的二项分布 图4 2 0 3时 不同n值对应的二项分布 1 2FeaturesofBinomialDistribution 1 2 1 PlotsofBinomialdistributionB n 取决于 与n均数在 n 处 接近0 5时 图形是对称的 离0 5愈远 对称性愈差随着n的增大 分布趋于对称n 时 只要 不太靠近0或1 二项分布近似于正态分布 n 和n 1 都大于5时 1 2 MeanandstandarddeviationofB n 出现阳性结果的次数X总体均数总体方差总体标准差出现阳性结果的频率总体均数总体标准差 1 2 1Estimationoftheprobability例4 5如果某地钩虫感染率为13 随机观察当地150人 其中有10人感染钩虫的概率有多大 分析 二分类 感染 不感染 独立 假定互不影响 重复 n 150人 每人钩虫感染率均为 13 感染钩虫的人数X服从二项分布B 150 0 13 1 2ApplicationofBinomialDistribution 单侧累积概率计算单纯计算二项分布X恰好取某值的概率没有太大意义经常需要计算的是二项分布的累积概率 例4 6某地钩虫感染率为13 随机抽查当地150人 其中至多有2名感染钩虫的概率有多大 至少有20名感染钩虫的概率有多大 2 Poissondistribution泊松分布 2 1ConceptofPoissonPoissondistribution 描述罕见事件发生次数的概率分布 例 出生缺陷 多胞胎 染色体异常 癌症患病数或死亡数的分布 Poissondistribution可以看作是二项分布的特例 独立 重复的次数n很大很大每次出现某事件的概率 很小 或未出现某事件的概率1 很小 可以证明 当 时 定义 若随机变量X的的概率函数为则称此变量服从Poisson分布 记为 其中参数是总体均数 例 1毫升水样品中大肠杆菌数目X的分布 将1毫升水等分为n个微小体积 这里n很大 每一个微小体积中大肠杆菌是否出现 互相独立 每一个微小体积中大肠杆菌出现的概率都是 且很小每毫升水中大肠杆菌数目的分布服从Poisson分布 例 放射性物质一定时间内放射出质点数的分布 时间 n很大 独立 概率都是 且很小 的二项分布 Poisson分布 若每次观察互不独立 发生概率不等 则不能看作Poisson分布 观察结果不独立 例如 传染性疾病首例出现后便成为传染源 会增加后续病例出现的概率 又如 污染的牛奶中细菌成集落存在 钉螺在繁殖期一窝一窝地散布等等这些现象均不能用Poisson分布处理 2 2Plotandfeature 图4 3取不同值时的Poisson分布图 PropertiesofPoissondistribution 1 总体均数 总体方差 2 观察结果有可加性IfX1andX2areindependenteachother then 例 从同一水源独立地取水样5次 进行细菌培养 第一次水样中的菌落数X1 1 第二次水样中的菌落数X2 2 第五次水样中的菌落数X5 5 把5份水样混合 合计菌落数也服从Poisson分布X1 X2 X5 1 2 5 医学研究中常利用其可加性 将小的观察单位合并 来增大发生次数X 以便用后面讲到的正态近似法作统计推断 2 3ApplicationofPoissondistribution 2 3 1Estimationoftheprobability例4 8如果某地居民脑血管疾病的患病率为150 10万 那么 该地1000名居民中 2人患脑血管疾病的概率多大 150 10万 n 1000 则患病人数X服从二项分布 因为150 10万较小 n 1000较大 将1000名居民看作是一个观察单位 平均有1000 150 10万 1 5个患者 可以认为1000名居民中患脑血管疾病的人数近似地服从Poisson分布 n 1000 0 0015 1 5 2 3 2Calculationofcumulativeprobability与二项分布问题相同 Poisson分布也经常需要计算累积概率 稀有事件发生次数至多为k次的概率为发生次数至少为k次的概率为 例4 9实验显示某100cm2的培养皿平均菌落数为6个 试估计该培养皿菌落数小于3个的概率 大于1个的概率 该培养皿菌落数小于3个的概率为菌落数大于1个的概率为 3 NormalDistribution正态分布 3 1ConceptofNormaldistribution正态分布是自然界最常见的一种分布测量的误差 人体的尺寸 许多生化指标等等都近似服从正态分布 许多其它分布可用正态分布近似共同点 变量的数值 中间多 两边渐少 近似对称 图4 4体模 骨密度 测量值的分布 接近正态分布 频率密度 频率 组距 正态分布概率密度函数 频率密度 1 2 3 正态概率密度曲线的位置与形状具有如下特点 1 关于X 对称 2 钟形曲线 X 处最大值 处有拐点 3 曲线下面积为1 4 决定曲线在横轴上的位置 5 决定曲线的形状N 2 表示均数为 标准差为 的正态分布 图4 6正态分布曲线下的面积分布 若X服从正态分布N 2 可作如下的标准化变换 称Z变换 则Z服从正态分布N 0 1 称为标准正态分布统计学家编制了标准正态分布曲线下面积表 附表1 标准正态分布N 0 1 standardnormaldistribution 例4 11某地1986年120名8岁男孩身高均数 123 02cm 标准差 4 79cm试估计 1 该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比 2 身高在120cm 128cm者占该地8岁男孩总数的百分比 3 该地80 的男孩身高集中在哪个范围 1 计算130对应的Z值后查表 2 身高在120cm 128cm者的百分比 先计算120和128所对应的Z值 120对应的Z值为128对应的Z值为正态曲线下区间 0 63 1 04 上的面积等于 3 80 的8岁男孩身高集中在哪个范围 标准正态分布曲线下左侧面积为0 10所对应的Z值为 1 28 所以80 的8岁男孩身高集中在 3 3Additiveproperty 不论X1和X2是否独立 X1 X2仍服从正态分布当X1和X2独立时 3 4ApplicationofNormaldistribution 3 4 1Determinethereferenceranges 参考值范围 特定的 正常 人群中大多数个体的取值范围 大多数个体 习惯上指95 的个体1 若变量服从正态分布正态分布变量X在区间上取值的概率为0 95 例4 12调查某地120名健康女性血红蛋白 直方图显示 其分布近似于正态分布 试估计该地健康女性血红蛋白的95 参考值范围 双侧95 参考值范围 2 若变量不服从正态分布找出和双侧95 参考值范围 0 025 0 025 P2 5 P97 5 必须注意 1 医学参考值范围在临床上只能作为参考 不能作为诊断标准 2 确定医学参考值范围必须抽取足够例数的样本 3 若测定值在性别间或年龄组间差别明显 应分 层 确定参考值范围 3 4 2Controlchart 控制图 质量控制的一种重要工具基本原理 如果某一波动仅仅由个体差异或随机测量误差所致 那么观察结果服从正态分布 例4 13骨密度测量的质量控制 通常在每天开机后首先对固定在机器内的 体模 进行测量 将每天的 体模 测定值点在控制图上 一旦出现8种情形之一 说明仪器需要调整 1 有一个点距中心线的距离超过3个标准差 位于控制限以外 2 在中心线的一侧连续有9个点 3 连续6个点稳定地增加或减少 4 连续14个点交替上下 5 连续3个点中有两个点距中心线距离超过2个标准差 6 连续5个点中有4个点距中心线距离超过1个标准差 7 中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内 8 中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围 1 2 6 3 7 8 4 有一个点距中心线的距离超过3个标准差5 连续3个点中有两个点距中心线距离超过2个标准差 2 在中心线的一侧连续有9个点 6 连续5个点中有4个点距中心线距离超过1个标准差 3 连续6个点稳定地增加或减少 7 中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内 4 连续14个点交替上下 8 中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范 5 3 4 3 NormalapproximationofBinomialdistributionandPoissondistribution 当n 和n 1 都大于5时 二项分布近似于正态分布 例4 14某地钩虫感染率为13 如果随机抽查当地150人 至少有20人感染钩虫的概率有多大 至少有20人感染钩虫的概率为50 当 20时 Poisson分布近似于正态分布N 例4 15实验显示某放射性物质半小时内发出的脉冲数服从Poisson分布 平均为360个 试估计该放射性物质半小时内发出的脉冲数大于400个的概率 Summary Discretevariable BinomialdistributionPoissondistributionContinuousvariable Normaldistribution1 BinomialdistributionPossiblevalues 0 1Probabilityofpositiveeventinonetrial Probabilityofnegativeeventinonetrial 1 IndependentlyrepeatntimesTotalnumberofpositiveevent2 PoissondistributionWhen or 1 isverysmall nverylarge thebinomialdistributionapproximatestoPoissondistribution 3 Normaldistribution veryimporta

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论