




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
频数分布表 图 分组划计 原始资料 分布类型 数值变量统计描述小结 算术均数与标准差 对数转换 几何均数与对数值标准差的反对数 中位数与四分位数间距 1 第四章第四节正态分布及其应用 流行病与卫生统计学系何保昌 3 正态分布及其应用 Normaldistribution 一 正态分布的概念和特征二 正态曲线下面积的分布规律三 标准正态分布的性质四 正态分布的应用 4 此图的纵坐标为频率 横坐标为肺活量 称此图为频率直方图每一个直方条的面积 频率 各组段的频率之和 1 所以这个直方图的面积为1如果样本量越大 每个组段的频率就越稳定 也就趋向概率 由此我们可得到 随机抽一个9岁男孩 其肺活量落在各个组段的概率 5 假定各组段的概率如下 由此可知 如果一个区间由若干组段构成 计算肺活量落在某个区间的概率等于计算这个区间的中各个直方条图的面积之和 只能计算给定区间概率 不能计算任意区间概率 对于上述直方图 组距越小 组段越多 能够计算的概率区间就越多 当组距逐渐减小 上述计算方法仍然成立 7 随人数逐渐增多 组段不断分细 则频数分布图中的直条逐渐变窄 就会逐渐形成一条高峰位于中央 均数所在处 两侧逐渐降低且左右对称 不与横轴相交的光滑曲线 近似于数学上的正态分布曲线 8 在医学卫生领域中 许多变量的频数分布是中间 靠近均数处 频数多 两边频数少 且左右对称 如人体的许多生理 生化指标等 这种变量的频数分布规律可用概率论中的一种重要的随机变量分布 正态分布 Normaldistribution 加以描述 一 正态分布的概念和特征1 正态分布的概念 9 医学资料中有许多指标的频数分布都呈正态分布 身高体重脉搏血红蛋白血清总胆固醇 10 正态分布曲线呈对称的钟形 在均数处最高 两侧逐渐低下 两端在无穷远处与横轴无限接近 若变量x的频率曲线对应于数学上的正态分布曲线 则称该变量服从正态分布 11 2 正态分布的特征 正态分布曲线的密度函数为 X 则称X服从正态分布 记作x N 2 正态分布的参数 为总体均数 为总体标准差 固定常数 为圆周率 e为自然对数的底变量 X 2 正态分布的特征 图形特点 钟型 均数处最高均数为中心的左右对称正态分布有两个参数曲线下面积分布有规律 13 2相等 不等的正态分布图示 1 2 3 14 相等 2不等的正态分布图示 1 2 3 15 二 正态密度函数曲线下的面积规律 正态密度函数曲线与横轴间的面积恒等于1或100 正态分布是一种对称分布 其对称轴为直线X X 与X 范围内曲线下的面积相等 各占50 X轴 S X X X S X S X 16 二 正态密度函数曲线下的面积规律 曲线下在区间 的面积为68 27 曲线下在区间 1 64 1 64 的面积为90 曲线下在区间 1 96 1 96 的面积为95 曲线下在区间 2 58 2 58 的面积为99 17 68 27 士 范围内的面积占正态曲线下面积的68 27 也就是说有68 27 的变量值分布在此范围内 18 士1 64 范围内的面积占正态曲线下面积的90 也就是说有90 的变量值分布在此范围内 19 士1 96 范围内的面积占正态曲线下面积的95 也就是说有95 的变量值分布在此范围内 20 士2 58 范围内的面积占正态曲线下面积的99 也就是说有99 的变量值分布在此范围内 21 曲线下的面积的计算 对于任意一个区间的曲线下面积 在知道变量值x对应的概率密度函数f x 后 都可以根据微积分的方法求出其面积的大小 22 实际工作中 常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数 以便估计该区间的例数占总例数的百分数 频数分布 或观察值落在该区间的概率 对于不同的参数 和 会产生不同位置 不同形状正态分布 x1 x2 范围内的面积也不同 计算起来很麻烦 23 为了计算方便 对于正态或近似正态分布的资料 只要得出均数和标准差 可通过标准转化 转化成求标准正态曲线下横轴自 到z的面积 为了便于应用 统计学家按 z 编制了标准正态分布曲线下的面积表 由此表可查出曲线下某区间的面积 这样就可对符合正态分布资料的频数分布作出估计 三 标准正态分布 24 1 标准化变换若x服从正态分布N 2 则z就服从均数为0 标准差为1的正态分布 这种正态分布称为标准正态分布或z分布 记为N 0 12 这一变换也称为标准化变换 N 2 N 0 1 从一般的正态分布转变为标准的正态分布 26 标准正态分布的密度函数为 27 对上式求积分可得到标准正态变量Z的分布函数 由于积分计算繁琐 统计学家按标准正态分布的累积概率分布函数 Z 编制了附表2 P315 标准正态分布曲线下的面积 由表可查出曲线下某区间的面积 28 标准正态分布曲线下面积 Z Z0 00 0 02 0 04 0 06 0 08 3 00 00130 00130 00120 00110 0010 2 50 00620 00590 00550 00520 0049 2 00 02280 02170 02070 01970 0188 1 90 02870 02740 02620 02500 0239 1 60 05480 05260 05050 04850 0465 1 00 15870 15390 14920 14460 1401 0 50 30850 30150 29460 28770 28100 00 50000 49200 48400 47610 4681 0 Z 29 标准正态分布查表 2 62 Z 2 62 StandardizedNormalProbabilityTable p261 P 0 0044 概率 30 查附表2时注意事项 曲线下横轴上的总面积为100 或1 表中曲线下面积为 到Z的面积 对于服从正态分布的变量x 先进行标准化变换 然后借助标准正态分布表可得到任意 x1 x2 范围内的面积或频数比例 31 图4 7查表法求标准正态曲线下面积示意图 Z1Z2 计算正态曲线下面积实例 例4 21 已知z1 1 76 z2 0 25 欲求标准正态下 1 76 0 25 范围的面积 查表 1 76 0 0392 0 25 0 4013则D 0 25 1 76 0 3621 例4 22 已知z1 1 20 z2 1 60 欲求标准正态下 1 20 1 60 范围的面积 查表 1 20 0 1151 1 60 1 0 0548 0 9452则D 1 60 1 20 0 8301 曲线下面积分布规律 35 四 正态分布的应用 估计频数分布制定医学参考值范围质量控制是许多统计方法的理论基础 36 1 估计频数分布 例1 某项目研究婴儿的出生体重服从正态分布 其均数为3150g 标准差为350g 若以2500g作为低体重儿 试估计低体重儿的比例 37 首先计算标准正态离差z 查标准正态分布表 1 86 结果 估计低体重儿所占比例为 38 39 2 制定医学参考值范围 medicalreferenceinterval 又称正常值范围 normalrange 40 什么是医学参考值范围 是绝大多数正常人的的解剖 生理 生化等指标的波动范围绝大多数 90 95 99 等 正常人 的定义 排除了影响所研究的指标的疾病和有关因素的同质的人群 41 确定医学参考值范围的意义 作为判断正常与异常的参考标准 42 确定参考值范围的注意事项 确定观察对象和抽取足够的观察单位测定方法应统一 准确应采用得到公认的或权威机构推荐的标准方法 以利于结果的评价和比较 判断是否分组 性别 年龄组 单 双侧问题选择百分界值 90 95 根据资料特点 选用恰当计算方法 43 根据医学专业知识确定单双侧 单侧下限 过低异常单侧上限 过高异常双侧 过高 过低均异常 单侧下限 肺活量 IQ 单侧上限 转氨酶 尿铅 双侧 红细胞计数 血清总胆固醇 44 计算医学参考值范围常用的方法 正态分布法 适用于正态或近似正态分布资料 双侧界值 单侧上界 单侧下界 对数正态分布法 适用于对数正态分布资料双侧界值 百分位数法 常用于偏态分布资料双侧界值 P2 5和P97 5 单侧上界 P95 或单侧下界 P5 45 表4 6参考值范围的制定 46 例4 24某地调查正常成年男子200人的红细胞数 得均数 55 26 1012 L 标准差S 0 38 1012 L 试估计该地正常成年男子红细胞数的95 参考值范围 47 解 该地正常成年男子红细胞数的95 参考值范围为下限 1 96S 55 26 1 96 0 38 54 52 1012 L 上限 1 96S 55 26 1 96 0 38 56 00 1012 L 48 正常人 病人 假阳性率 假阴性率 病人 正常人与病人的数据分布重叠示意图 双侧 49 例4 252005年某市进行的小学生体质评价研究中 测定了120名9岁男孩的肺活量 1 672L S 0 298L 试估计9岁男孩的肺活量的95 参考值范围 50 解 因肺活量仅过低属异常 故取单侧下限 肺活量的95 参考值范围为 下限 即该地估计该地小学生中9岁男孩的肺活量的95 参考值范围为不低于1 183L 51 例 测得某年某地282名正常人的尿汞值如下表所示 试制定正常人尿汞的95 参考值范围 52 表1 某年某地282名正常人的尿汞值 g L 测量结果 53 解 正常人的尿汞值为偏态分布 且过高为异常 故用百分位数法计算 且取单侧上限 其95 参考值范围为 上限 即该地正常人尿汞的95 参考值范围为不高于43 6 g L 54 正常人 病人 假阳性率 假阴性率 正常人与病人的数据分布重叠示意图 单侧 55 3 质量控制 意义监控日常工作 科研过程 生产过程中误差的变化 分析变化的趋势是否出现异常 从而引起警觉和注意 以便分析原因 并及时采取措施 依据 实验中的检测误差服从正态分布 56 质量控制图 qualitycontrolchart UCL 上控制限 UWL 上警戒限 CL 中心线 LWL 下警戒限 LCL 下控制限 样本编号 取样时间 2 58SD 1 96SD 1 96SD 2 58SD 57 4 正态分布是许多统计方法的理论基础 t检验 F检验及相关回归等多种统计方法均要求分析的指标服从 近似 正态分布 另有部分统计方法 如秩和检验 其一些检验统计量 在样本含量足够大时也近似正态分布 5 如何判断一组数据是否符合正态分布 1 根据文献报道例如 文献报道中学生的体重 肺活量服从正态分布 则可沿用文献的作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 私人房产买卖合同范本(含税费装修)
- 交通运输用地租赁安全协议及交通安全责任书
- 物业公司代为管理住宅小区健身房合同样本
- 专业绿化养护公司苗木种植及生态恢复服务合同
- 《不离家离婚子女成长环境维护协议》
- 物联网设备数据保密协议范本(智能设备数据安全)
- 基于离婚协议的子女抚养权及赡养费用调整合同
- 离婚协议中的子女赡养协议书起草指南
- 企业孵化器物业场地租赁及增值服务合同
- 神东能源劳务派遣工同工同酬实施管理措施合同
- GA 1808-2022军工单位反恐怖防范要求
- GB/T 14536.1-2022电自动控制器第1部分:通用要求
- GB/T 882-2008销轴
- GB 3452.1-1992液压气动用O形橡胶密封圈尺寸系列及公差
- 洁普利康抗HPVβ乳球蛋白高分子生物肽冷敷凝胶课件
- 工程建设项目绿色建造施工水平评价申请表
- 鸡的呼吸道疾病与防治课件
- 八年级英语完形填空解题技巧课件
- 插头插座尺寸标准
- 《基因工程》课件第一章 基因工程概论
- 德国凯尔锚固技术公司石陶幕墙设计和施工中的应用
评论
0/150
提交评论