第二章计量资料的统计描述.ppt_第1页
第二章计量资料的统计描述.ppt_第2页
第二章计量资料的统计描述.ppt_第3页
第二章计量资料的统计描述.ppt_第4页
第二章计量资料的统计描述.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章计量资料的统计描述流行病与卫生统计学系 内容 频数分布集中趋势的描述离散趋势的描述正态分布医学参考值范围的制定 第一节频数分布 一 频数分布表 frequencytable 例2 1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇 mmol L 的测量结果如下 试编制频数分布表 编制步骤如下 1 求极差 极差 range 也称全距 即最大值和最小值之差 记作R 本例 2 确定组距 i 组段数通常取组10 15组本例组距3 写组段 组下限 L 每个组段的起点组上限 U 每个组段的终点 组段2 30 2 60 2 90 3 20 5 60 5 90 变量X值的归组统一定为 4 分组段划记并统计频数 二 频数分布图 三 频数表和频数分布图用途 1 描述频数分布的类型 1 对称分布 若各组段的频数以频数最多组段为中心左右两侧大体对称 就认为该资料是对称分布 频数表 由各组段及其频数所构成的统计表 用途 2 偏态分布 1 右偏态分布 skewedtotherightdistribution 也称正偏态分布 positiveskewnessdistribution 右侧的组段数多于左侧的组段数 频数向右侧拖尾 2 左偏态分布 skewedtotheleftdistribution 也称负偏态分布 negativeskewnessdistribution 左侧的组段数多于右侧的组段数 频数向左侧拖尾 2 描述频数分布的特征 变异的范围在2 30 5 90 mmol L 有明显的统计分布规律 数据主要集中在3 50 4 70 mmol L 之间 尤以组段的人数3 80 4 10 mmol L 最多 且上下组段数的频数分布基本对称 3 便于发现一些特大或特小的可疑值 4 便于进一步做统计分析和处理 第二节集中趋势的描述 统计上使用平均数 average 这一指标体系来描述一组变量值的集中位置或平均水平 常用的平均数有 算术均数几何均数中位数 一 算术均数 算术均数 简称均数 mean 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值 1 计算方法 1 直接计算法公式 式中X1 X2 Xn为所有观察值 n为样本含量 希腊字母 读作sigma 为求和的符号 例2 2用直接法计算例2 1某单位101名正常成年女子的血清总胆固醇的均数 2 加权法 公式 计算4 4 4 6 6 8 8 8 10的均数 例2 3利用表2 1计算101名正常成年女子的血总胆固醇的均数 式中k表示频数表的组段数 及分别表示各组段的频数和组中值 如表2 1第1个组段的组中值为 余类推 见表2 1的第 3 栏 在这里 频数起到了 权 weight 的作用 即某个组段频数多 权数就大 其组中值对均数的影响也大 反之 影响则小 2 应用 适用于对称分布 特别是正态分布资料 二 几何均数 几何均数 geometricmean 可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平 1 计算方法 1 直接计算法公式 或 例2 4某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为 10 20 40 40 160 求几何均数 2 加权法 公式 例2 569例类风湿关节炎 RA 患者血清EBV VCA lgG抗体滴度的分布见表2 4第 1 2 栏 求其平均抗体滴度 故69例类风湿关节炎患者血清EBV VCA lgG抗体的平均滴度为 1 150 6 2 应用 适用于成等比级数的资料 特别是对数正态分布资料 三 中位数与百分位数 一 中位数中位数 median 是将变量值从小到大排列 位置居于中间的那个变量值 例 1 3 7 5 100中位数为多少 计算 公式 n为奇数时n为偶数时 例2 67名病人患某病的潜伏期分别为2 3 4 5 6 9 16天 求其中位数 本例n 7 为奇数例2 78名患者食物中毒的潜伏期分别为1 2 2 3 5 8 15 24小时 求其中位数 本例n 8 为偶数 应用 适用于 1 各种分布类型的资料2 特别是偏态分布资料和开囗资料 一端或两端无确切数值的资料 二 百分位数 百分位数 percentile 是一种位置指标 用来表示 一个百分位数将全部变量值分为两部分 在不包含的全部变量值中有的变量值比它小 变量值比它大 1 直接计算法 设有x个原始数据从小到大排列 第x百分位数的计算公式为 当为带有小数位时 当为整数时 例2 9对某医院细菌性痢疾治愈者的住院天数统计 名患者的住院天数从小到大的排列如下 试求第5百分位数和第99百分位数 患者 住院天数 n 120 120X5 6 为整数 例2 9对某医院细菌性痢疾治愈者的住院天数统计 名患者的住院天数从小到大的排列如下 试求第5百分位数和第99百分位数 患者 住院天数 带有小数 取整后trunc 118 8 118 2 频数表法 公式 式中和分别为第X百分位数所在组段的下限 组距和频数 为小于各组段的累计频数 n为总例数 例2 10某地118名链球菌咽喉炎患者的潜伏期频数表见表2 5第 1 2 栏 试分别求中位数及第25 第75百分位数 第三节离散趋势的描述 例2 11三组同龄男孩的身高值 cm 常用统计指标 极差 四分位数间距 方差 标准差和变异系数 一 极差极差 用R表示 即一组变量值最大值与最小值之差 二 四分位数间距 四分位数间距 用QR表示 QR 下四分位数 上四分位数 例2 12续例2 10 已知P25 39 2 P75 67 7 计算118名链球菌咽喉炎患者潜伏期的四分位数间距 天 四分位数间距可以看成一半变量值的极差 三 方差与标准差 1 方差 variance 也称均方差 meansquaredeviation 反映一组数据的平均离散水平 总体方差用表示 计算公式为 样本方差用表示 2 总体标准差用s表示公式 样本标准差用表示公式 标准差的公式还可以写成 利用频数表计算标准差的公式为 例2 12续例2 10 计算三组资料的标准差 甲组 同理得 乙组 s 3 16 cm 丙组 s 2 92 cm 例2 13计算表2 1中101名正常成年女子的血清总胆固醇 mmol L 的标准差 四 变异系数 变异系数 coefficientofvariation 记为CV 多用于观察指标单位不同时 如身高与体重的变异程度的比较 或均数相差较大时 如儿童身高与成人身高变异程度的比较 某地7岁男孩身高的均数为123 10cm 标准差为4 71 体重均数为22 59kg 标准差为2 26kg 比较其变异度 观察指标单位不同 身高体重 均数相差较大时 第四节正态分布 正态分布 又称为Gauss分布 Gaussiandistribution 设想当原始数据的频数分布图的观察人数逐渐增加且组段不断分细时 图2 4中的直条就不断变窄 其顶端则逐渐接近于一条光滑的曲线 这条曲线形态呈钟形 两头低 中间高 左右对称 一 正态分布的概念和特征 1 正态分布曲线的数学函数表达式如果随机变量的分布服从概率密度函数 2 正态分布的特征 1 在直角坐标上方呈钟型曲线 两端与X轴永不相交 且以X m为对称轴 左右完全对称 2 在X m处 取最大值 其值为 X越远离m 值越小 3 正态分布有两个参数 即位置参数m和形态参数s 若固定s 改变值m 曲线沿着X轴平行移动 其形状不变 见图2 5 若固定m s越小 曲线越陡峭 反之 s越大 曲线越平坦 见图2 6 4 正态曲线下的面积分布有一定的规律 对公式 2 17 积分 1X轴与正态曲线所夹面积恒等于1或100 2区间的面积为68 27 3区间的面积为95 00 4区间的面积为99 00 见图2 7 二 标准正态分布 正态分布是一个分布族 对应于不同的参数m和s会产生不同位置 不同形状的正态分布 为了应用方便 令 根据公式 2 21 可制成附表1 欲求一定区间标准正态分布曲线下的面积只需查表即可 且有 例2 14对例2 1 例2 3和例2 13已计算出101名正常成年女子的血清总胆固醇均数 标准差S 0 654mmol L 试估计该单位正常女子血清总胆固醇在4 00mmol L以下者及5 00mmol L以下者占正常女子总人数的百分比 由于此例样本含量大 故用代替 代替 将测量值分别代入公式 2 19 得 正态分布除了可估计频数分布外 还是许多统计方法的基础 并可应用于质量控制及制定医学参考值范围 第五节医学参考值范围的制定 一 基本概念医学参考值 referencevalue 是指包括绝大多数正常人的人体形态 机能和代谢产物等各种生理及生化指标常数 也称正常值 由于存在个体差异 生物医学数据并非常数 而是在一定范围内波动 故采用医学参考值范围 medicalreferencerange 作为判定正常和异常的参考标准 医学参考值范围涉及到采用单侧界值还是双侧界值的问题 这通常依据医学专业知识而定 双侧 血清总胆固醇无论过低或过高均属异常白细胞数无论过低或过高均属异常单侧 1 血清转氨酶仅过高异常2 肺活量仅过低异常 医学参考值范围有 等 最常用的为 计算医学参考值范围的常用方法 1 正态分布法2 百分位数法 二 方法 1 正态分布法 许多生物医学数据服从或近似服从正态分布 如同年龄同性别儿童的身高值 体重值 同性别健康成人的红细胞数等 有些医学资料虽然呈偏态分布 但若能通过适当的变量变换转换为正态分布 也可采用正态分布法制定参考值范围 适用 正态分布资料公式 双侧1 参考值范围 单侧1 参考值范围 式中为均数 为标准差 u值可由表2 6查出 例2 15估计例2 1某单位101名正常成年女子血清总胆固醇的95 参考值范围 因血清总胆固醇过多或过少均为异常 故按双侧估计正常成年女子血清总胆固醇的95 参考值范围 已知血清总胆固醇均数 公式 双侧1 参考值范围 单侧1 参考值范围 2 百分位数法 适用 各种分布资料特别是偏态分布资料 例2 17测得某年某

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论