




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
宋曼殳 首都医科大学 公共卫生学院 流行病与卫生统计学系,医学统计学,概率分布,概率分布 (probability distribution),概率分布:描述随机变量值xi 及这些值对应概率P(X=xi)的表格、公式或图形 连续型随机变量概率分布 正态分布 离散型随机变量概率分布 二项分布 Poisson分布,随机变量及其概率分布概述,连续型随机变量(continous random variable)数据间无缝隙,其取值充满整个区间,无法一一列举每一可能值 例如: 身高、体重、血清胆固醇含量 离散型随机变量(discrete random variable) 数据间有缝隙,其取值可以列举 例如:抛硬币10次,正面的可能取值x为0、1、2、 3、4、5、6、7、8、9、10,一、正态分布,正态分布概念、特征 正态曲线下的面积分布规律 标准正态分布 正态分布的应用 估计频数分布 制定医学参考值范围 质量控制 统计方法的理论基础,概率分布,正态分布的概念和特性,正态分布及其应用,图3-1临产母亲体重频率密度图,图3-2 概率密度曲线示意图,频率密度直方图就近似地反映了一个变量的分布,当样本量n越来越大,而组距越来越小时,就得到该连续变量所在总体的概率分布。可以设想,如果观察例数逐渐增多,组段数也不断增多,就会形成一条光滑曲线图(3),称为正态分布曲线。,正态分布的概念和特性,这条呈中间高、两边低、左右基本对称的“钟形”曲线数学上称为正态分布曲线 由于纵坐标相当于概率密度,故叫做正态分布的概率密度曲线,正态分布及其应用,图3-2 概率密度曲线示意图,正态分布曲线略呈钟形,中间高,两头低,以均数为中心,左右对称,均数处最高 正态分布的曲线在横轴上方,向两侧逐渐减低,两侧都以横轴为其渐近线 正态分布有两个参数,即均数 和 标准差,正态分布的特性,正态分布及其应用,把服从正态分布的变量表示为: XN(,2),正态分布的特性,正态分布曲线的参数的意义均数(位置参数) 表示正态分布曲线峰(集中趋势)的位置 固定时,增大,曲线沿横轴向右移动 减小,曲线沿横轴向左移动,正态分布及其应用,正态分布的特性,正态分布曲线的参数标准差 (变异度参数) 表示正态变量取值的离中程度 固定时,越大,曲线越宽,表示数据越分散 越小,曲线越窄,表示数据越集中,正态分布及其应用,正态分布的概率密度函数,正态分布及其应用,式中,为总体均数;为总体标准差;=3.14159为圆周率;e为自然对数的底(e2.71828), X为变量,服从正态分布的变量X的概率密度函数f (x)为,图1 正态分布的概率密度函数与分布函数,X 取值落在区间(-, x)内的累积概率为概率密度曲线下位于(-, x)的图形面积,等于其概率密度函数f (x)在-到 x上的积分,记作,为正态分布 的分布函数。其值表示变量X落在区间(-, x)内的概率,对应于从-到x概率密度曲线下的阴影面积(常称为左侧尾部面积),图1 正态分布的概率密度函数与分布函数,图1 正态分布的概率密度函数与分布函数 图2 正态分布的概率,利用分布函数 可以计算正态分布变量取值在任意区间 a, b)的概率为P (aXb)=F (b) -F (a) (其几何意义如图2中阴影部分所示)。 由图可得P (Xb) =1- P (Xb)= 1- F (b),正态分布曲线下面积的分布规律,正态分布及其应用,服从正态分布的随机变量在一区间上曲线下的面积与该随机变量在同一区间内取值的概率相等 正态曲线与横轴所夹面积为1,正态分布曲线下面积的规律,正态分布及其应用,1)正态曲线与横轴所夹的面积为1 2)位于(-1.64, +1.64)内的面积为0.90,说明正态变量在1.64范围内取值的概率为0.9,在该区间以外取值的概率(两侧的阴影面积之和)为0.1,左右两侧各0.05 3)位于(-1.96, +1.96)内的面积为0.95,说明正态变量在1.96范围内取值的概率为0.95,在该区间以外取值的概率(两侧的阴影面积之和)为0.05,左右两侧各0.025 4)位于(-2.58, +2.58)内的面积为0.99,说明正态变量在2.58范围内取值的概率为0.99,在该区间以外取值的概率(两侧的阴影面积之和)为0.01,左右两侧各0.005,正态分布曲线下面积分布规律示意图,正态分布曲线下的面积分布规律,正态分布曲线下的面积分布规律,正态分布及其应用,正态分布下的概率计算,方法一:利用统计软件计算,方法二:转化为标准正态分布查表计算,曲线下面积的求法:定积分法和标准正态分布法,标准正态分布,当参数 和 已知时,依据正态分布N( , 2)的分布函数公式,正态变量取值落在各区间的概率 都归结为正态分布曲线下的面积,只需知道分布函数 F(x) 在区间端点处的函数值 就可以算出,但要通过该公式计算F(x)是困难的 实际应用中,要把服从一般正态分布N( , 2)的随机变量X作如下标准化变换: 变换后新的随机变量 z 服从, = 0, = 1的正态分布,即 ZN( 0,1 ),正态分布及其应用,标准正态分布,指数据经标准化变换后, = 0, = 1时的正态分布 标准正态分布(又称Z分布): ZN( 0,1 ) 公式 任何一个正态分布,都可以通过变换,成为标准正态分布,正态分布及其应用,X N(m , s2),X,- m,s,Z =, N(0 , 1),正态分布及其应用,标准正态分布,图中阴影部分的面积表示标准正态变量Z落在(-, z)内的概率即为分布函数 的值,标准正态分布的概率密度曲线与分布函数示意图,正态分布及其应用,标准正态分布,图中阴影部分的面积表示标准正态变量Z落在(-, z)内的概率即为分布函数 的值,标准正态分布的概率密度曲线与分布函数示意图,正态分布的应用,1、估计频数分布 标准正态分布,正态分布及其应用,查 标准正态分布表(附表C1)得标准正态变量z落在(-, z)内的概率值,表C1 标准正态分布(z-分布)密度曲线下的面积(z)值 自-到-z的面积(-, -z),(z, +)=1-(-,-z),正态分布曲线下面积分布规律示意图,正态分布曲线下的面积分布规律,正态分布的应用,1、估计频数分布,例:140名成年男子红细胞均数和标准差分别为 4.781012/L和 0.371012/L,求红细胞数在4 1012/L5.3 1012/L范围内所占的比例?,正态分布及其应用,正态分布的应用,练习:假定一组男孩的体重呈正态分布,体重均数40kg、体重的标准差4kg,请回答以下问题: (1)体重低于46.6kg的男孩占百分之几? (2)体重大于什么值的男孩占10%?,正态分布及其应用,以z11.65查表,得(z1)0.04950.05 (z2) 10.050.95 即体重低于46.6kg的男孩占95%,z1 0 z2 40 46.6,?%,z1 0 z2 40,10%,X ?,(2)以(z)10%0.10先查表,得z11.28 z2 z1 z21.28,X401.28445.12 (kg) 即体重大于45.12kg的男孩占10%,2、制定医学参考值范围 医学参考值,又称正常值范围,医学上包括绝大多数正常人的某指标值的波动范围 确定范围:一般以95%参考值范围最常用 按资料特点选取不同方法计算正常值范围的上下限,正态分布的应用,正态分布及其应用,单侧下限-过低异常,单侧上限-过高异常,双侧-过高、过低均异常,根据指标含义决定单、双侧范围,正态分布的应用,2、制定医学参考值范围 依据资料的分布类型有以下两种的常用方法: 1)正态近似法 适用于服从正态分布或近似正态分布的资料 双侧 参考值范围 单侧 参考值范围,或,正态分布的应用,2、制定医学参考值范围 依据资料的分布类型有以下两种的常用方法: 1)正态近似法 对于正态分布或近似正态分布的资料,只要样本含量足够大(n100)时,可用: 作为95%的正常值范围(双侧),正态分布及其应用,例: 估计例3-4中该地正常成年女子的血清总蛋白 ( g/L, g/L)的95%参考值范围。 解:由于该地正常成年女子血清总蛋白近似服从正态分布,可用正态分布法计算。因血清总蛋白过多或过少均属异常,所以应取双侧,即计算95%参考值范围的上下限。 下限为: (g/L) 上限为: (g/L) 故该地正常成年女子血清总蛋白的95%参考值范围为65.3580.25 (g/L)。,正态分布的应用,正态分布及其应用,正态分布的应用,2、制定医学参考值范围 2)百分位数法 适用于偏态分布资料、分布型未知的资料以及分布末端有不确定值的资料 双侧 95%参考值范围 单侧95%参考值范围,正态分布及其应用,或,正态分布的应用,例:某地调查110名健康成年男子的第一秒肺通气量(近似服从正态分布)得: 均数为4.2(L) 标准差为0.7(L) 请据此估计该地成年男子第一秒肺通气量的95%正常值范围?,正态分布及其应用,正态分布的应用,因第一秒肺通气量仅过低属异常,故此正常值范围属仅有下限的单侧正常值范围 又因此资料近似正态分布,故可用正态分布法 即该地成年男子第一秒肺通气量的95%正常值范围不低于3.05(L),正态分布及其应用,例 测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的95%参考值范围。,表 282名正常人尿汞值( )测量结果,单侧上限,常用参考值范围的制定,正态分布的应用,3、质量控制 绘出质量控制图,正态分布及其应用,上、下警戒限,上、下控制限,各测定值均在警戒限以内,且随机地分布在中心线的两侧,说明质量在控制中,正态分布的应用,3、质量控制 例如,某实验室对同一控制血清作尿酸定量测定,连续观察20天,得20个数据如下(mg/dl):,正态分布及其应用,正态分布的应用,4、统计方法的理论基础 许多统计方法(如t检验、方差分析等)都要求指标服从正态分布 有些统计量的分布(如 t 分布等)都是在正态分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年城市照明电力安装与改造合同
- 2025版汽车租赁合同范本(含环保)
- 2025版生猪养殖环境监测与保护合同
- 2025年文化旅游区招商引资合作协议范本
- 2025版水渠工程劳务派遣合同示范文本
- 2025年绿色装修贷款服务合同样本
- 2025年度能源行业财务顾问合同-成本分析与优化
- 2025年度高端全屋定制家具设计施工合同范本
- 2025茶楼承包合同范本:含茶楼环保设施建设协议
- 2025版禽类产品电商平台合作合同
- 实验室生物安全管理手册
- 国自然申请攻略
- 锂电池pack生产线可行性报告
- 中蜂饲养管理与常见病防治
- 2025年度砂石料生产加工与设备租赁合同3篇
- 2024年05月辽宁中国工商银行辽宁分行校园招考笔试历年参考题库附带答案详解
- 供应商准入培训
- DME糖尿病黄斑水肿
- DB1305∕T 45-2022 小麦品种冀麦325节水高产栽培技术规程(邢台市)
- 《中国传统文化课件》课件
- 水利信息化水质监测系统单元工程质量验收评定表、检查记录
评论
0/150
提交评论