




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章第二节二项分布 p67 在医学领域的随机事件中 最简单的是只有两种互斥可能结果随机事件 称为二项分类变量 dichotomousvariable 如接受治疗后的结果是有效 还是无效 某种化验的结果是阳性 还是阴性 手术后是生存 还是死亡 对这类问题的研究 不仅要确定2个可能出现的随机事件的概率 有时还要计算在独立 重复地进行N次相同的观察下 某一事件出现k次的概率 二项分布 binomialdistribution 就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布 二项分布的概念 瑞士数学家JamesBernoulli对只有两种可能结果的随机试验进行研究 当成功的概率 是恒定的 且各次试验相互独立 这种试验在统计学上称为贝努里试验 Bernoullitrial N次独立 重复的Bernoulli试验也就称为n重Bernoulli试验 满足以下条件 1 每次试验只有两个互斥的一种结果 记为A和 所以如阳性或阴性 生存或死亡等 属于两分类资料 2 独立是指各次试验出现的结果之间是无关的 3 重复是指每次试验的条件不变 保证了在各次试验中结果发生的概率不变 二项分布描述的是在n次贝努里试验中 结果A出现k次 这一随机事件的取值及其概率 如果用随机变量X X 0 1 n 表示在Bernoulli试验中 结果A出现的次数 则X服从二项分布 记为x服从 概率可用下面的二项分布概率公式来描述 例题 已知用某种药物治疗某一非传染疾病的有效率为60 今用该药治疗该病患者20人 试计算其中12人有效的概率 解 根据题意 以X表示 所用药物治疗该病有效的人数 X服从二项分布 已知n 20 0 6 x 12 二项分布的特征 1 二项分布的图形已知 和n 就能按公式计算X 0 1 n时的P X 值 以X为横坐标 以P X 为纵坐标作图 即可绘出二项分布的图形 二项分布的形状取决于 和n的大小 高峰在 n 处 当 接近0 5时 图形是对称的 离0 5愈远 对称性愈差 但随着n的增大 分布趋于对称 当n 时 只要 不太靠近0或1 特别是当nP和n 1 P 都大于5时 二项分布近似于正态分布 0 5时 不同n值对应的二项分布 0 3时 不同n值对应的二项分布 2 二项分布的均数与标准差 二项分布的总体均数 方差 标准差 如果将出现阳性结果的频率记为p p的取值为则p的总体均数为 标准差为 p是样本率的标准误的理论值 当 未知时 常用样本率p作为 的估计值 由以上得知 样本率的标准差即率的标准误 可以用来描述样本率的抽样误差 率的标准误越小 则说明率的抽样误差越小 总体均数 总体标准差 总体率的标准误 二项分布的累计概率 cumulativeprobability 常用的有左侧累计和右侧累计两种方法 从阳性率为 的总体中随机抽取含量为n的样本 则 1 最多有k例阳性的概率 2 最少有k例阳性的概率 其中 X 0 1 2 k n 一 总体率的区间估计总体率的估计也有点 值 估计和区间估计 点估计是简单地用样本率来估计总体率 区间估计是求出总体率的可能范围 样本率的理论分布和样本含量n 阳性率p的大小有关 所以需要根据n和p的大小不同 分别选用下列两种方法 二项分布的应用 一 查表法 当样本含量n较小 如n 50 特别是p很接近于0或1时 按二项分布的原理估计总体率的可信区间 因为其计算过程较复杂 统计学家已经编制了百分率的可信区间 附表 可直接根据样本含量n和阳性数X查出总体率的可信区间 例题从某学校随机抽取26名学生 发现有4名感染沙眼 试求该校沙眼感染率95 的可信区间 本例n 26 X 4 查附表7的可信度为95 的可信区间为 0 04 0 35 即 4 35 见p438 二 正态近似法 当样本含量n足够大 且样本率p或1 p均不太小 如np与n 1 p 均大于5时 样本率p的抽样分布近似正态分布 总体率 的可信区间可按下式进行估计 例题 某研究者测得 158名正常男性HBgAg 其阳性率为15 35 试计算出样本率的抽样误差及总体阳性率的95 可信区间 解 本例p 0 1535n 158 代入 总体率95 可信区间为 p 1 96Sp 0 1535 1 96 0 0287 0 0972 0 2097 即 9 72 20 97 二 样本率与总体率比较 比较目的 推断样本率所代表的总体率 与某已知总体率 0是否相等 1 直接概率法 当或时 1 检验假设 2 直接计算概率P值当时 当时 3 做出推断结论当 在 0 05检验水准拒绝 接受 可以认为两总体率不同 当 在 0 05检验水准不拒绝 尚不能认为两总体率不同 抗生素治疗小儿上呼吸道感染 支气管炎 有效率为85 问在5人中 二人有效的概率是多少 甲乙丙丁戊无效无效无效无效有效0 150 150 150 150 85无效无效无效有效无效0 150 150 150 850 15无效无效有效无效无效0 150 150 850 150 15无效有效无效无效无效0 150 850 150 150 15有效无效无效无效无效0 850 150 150 150 15 5人中有0 1 2 3 4 5人有效的概率分别为二项展开式中的各项 有效人数每种组合情况概率值 上式中最多2例有效的概率为 P X 2 0 000075938 0 002151563 0 024384375 0 026611876上式中至少有2例有效的概率为 P X 2 0 024384375 0 138178125 0 391504687 0 443705312 0 997772499 2 正态近似法 当 时若不太靠近0或1时 当样本含量n足够大 样本率的抽样分布逼近正态分布 可用u检验计算其样本检验统计量 公式为 P为样本率 0为已知总体率 常为理论值或标准值 n为样本含量 例题 一般人群中精神发育不全者约为3 今调查有亲缘血统婚配关系的后代25000人 有精神发育不全者123人 问有亲缘血统婚配关系的后代中精神发育不全的发生率是高于一般人群 H0 0 已知 0 0 003 P 0 01拒绝H0 差别有极显著意义 结论 有亲缘血统婚配关系的后代中精神发育不全的发生率显著地高于一般人群 三 两样本率比较 比较目的 推断两个样本各自代表的两总体率是否相等 当两个样本满足正态近似条件且样本含量较大时 可用u检验 其公式为 例题对从事工农业生产高血压患病率 50岁以上男性 的研究 调查了首钢工人1281人 高血压患者386人 患病率为30 13 石景山区农民387人 血压血患者65人 患病率为16 80 试问从事工农业生产的男性患病率有无差别 H0 1 2 工人与农民的患病率总体上相同 综合患病率 P 386 65 1668 0 2704 综合未患率Q 1 0 2704 0 7296 计算 P 0 01拒绝H0 差别有极显著意义 结论 不同职业的高血压患病率有极显著统计学意义 工人的高血压患病率显著高于农民 Poisson分布更多地专用于研究单位时间 单位人群 单位空间内 某罕见事件发生次数的分布 如某种细菌在单位容积空气或水中出现的情况 某段时间特定人群中某种恶性肿瘤患者的分布或出生缺陷的发病情况 放射性物质在单位时间内的放射次数 单位空间某种昆虫数的分布等等 Poisson分布的概念与特征 Poisson分布在 很小 样本含量n趋向于无穷大时 二项分布的极限形式 当试验中成功事件出现的概率很小 如 0 05 试验的次数n很大 时 用二项分布计算成功事件出现的次数X X 0 1 2 n 的概率很困难 用Poisson分布可简化计算 Poisson分布发展成为描述小概率事件出现规律性的一种重要的离散型分布 Poisson分布的概率函数 X 1 2 3 式中 n 为Poisson分布的总体均数 总体中没单位中的平均阳性数 X为单位时间或单位空间内某事件的发生数 阳性数 e为自然对数的底 约等于2 71828 意义 单位时间 单位人群 单位空间内 单位容积 内 某罕见事件发生次数的概率分布 Poisson分布的性质 1 Poisson分布是一种单参数的离散型分布 其参数为 它表示单位时间或空间内某事件平均发生的次数 又称强度参数 2 Poisson分布的方差 2与均数 相等 即 2 3 Poisson分布是非对称性的 在 不大时呈偏态分布 随着 的增大 迅速接近正态分布 一般来说 当 20时 可以认为近似正态分布 Poisson分布资料可按正态分布处理 4 Poisson分布的累计概率常用的有左侧累计和右侧累计两种 单位时间或空间内事件发生的次数 最多为k次的概率 X 0 1 2 最少为k次的概率 X 0 1 2 Poisson分布的图形 Poisson分布的形状取决于 的大小 值越小 分布越偏 随着 的增大 分布越趋于对称 当 20时 分布接近正态分布 当 50时 可以认为Poisson分布呈正态分布N 按正态分布处理 当总体均数值 小于5时为偏峰 愈小分布愈偏 随着 增大 分布趋向对称 取不同值时 Poisson分布是二项分布的极限形式二项分布中 当 很小而n很大 n 时 二项分布趋于Poisson分布 Poisson分布的观察结果有可加性若从总体均数为 1的Poisson分布总体中随机抽出一份样本 其中稀有事件的发生次数为X1 再独立地从总体均数为 2的Poisson分布总体中随机抽出另一份样本 其中稀有事件的发生次数为X2 则它们的合计发生数T X1 X2 也服从Poisson分布 总体均数为 1 2 Poisson分布的应用条件 Poisson分布的应用条件与二项分布相同 即要求事件的发生是相互独立的 发生的概率相等 结果是二分类的 Poisson分布主要用于研究单位时间或单位空间内某事件的发生数 理论上单位时间或单位空间内的发生数可为无穷大 而用于研究单位人群中某疾病发生数的分布时 单位人群的人数要求大一些 比如以1000人或更多作为单位人群 某些发病率极低的疾病要求更多 Poisson分布的应用 一 总体参数的估计由样本均数 样本计数 X估计总体均数 也有点 值 估计和区间估计 区间估计的方法 需视样本计数 样本均数 X的大小而定 X小时用查表法 X大时用正态近似法 一 查表法当样本计数X 50时 用X值查附表Poisson分布 的可信区间 可得总体均数 的95 或99 可信区间 二 正态近似法当样本计数X 50时 可按正态近似原理用下式求总体均数 的95 或99 可信区间 二 样本均数与总体均数的比较 样本均数与总体均数作比较的目的是推断样本所代表的未知总体均数是否与某已知总体均数相等 三 两组独立样本资料的Z检验当X1 20 X2 20时 依据Poisson分布近似正态分布的原理 可以应用Z检验对其总体均数进行推断 检验假设 当 1 当两样本观测单位数相等时 检验统计量为 例题甲 乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量 每张血片均观察200个视野 结果甲计数到嗜碱性白细胞26个 乙计数到29个 试问两位检验师检查结果是否一致 1 建立检验假设 2 计算统计量 3 确定P值和作推断 所以P 0 5 按 0 05水准不能拒绝H0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老厂退休考试题及答案
- 教师招聘之《幼儿教师招聘》能力提升试题打印含答案详解(典型题)
- 2025年教师招聘之《幼儿教师招聘》题库试题含答案详解(b卷)
- 课程改革考试题及答案
- 绢纺精炼操作工主管竞选考核试卷及答案
- 咖啡学徒考试题及答案
- 课件无法播放显示要登陆问题
- 警示标识考试题及答案
- 课件文案制作指南
- 集群通信系统机务员专业知识考核试卷及答案
- 高中通用技术会考试题及详解
- 肝性脑病(课件)
- 【名校】《三思而后行》 完整版课件
- 公司内部程序文件(格式模版)
- 泛光施工招标文件
- 旅游策划实务整套课件完整版电子教案课件汇总(最新)
- DB23∕T 2661-2020 地热能供暖系统技术规程
- 人工挖孔桩施工监测监控措施
- 国家职业技能标准 (2021年版) 6-18-01-07 多工序数控机床操作调整工
- 办公楼加层改造施工组织设计(100页)
- 渗透检测培训教材(1)
评论
0/150
提交评论