卫生统计学secondlesson课件_第1页
卫生统计学secondlesson课件_第2页
卫生统计学secondlesson课件_第3页
卫生统计学secondlesson课件_第4页
卫生统计学secondlesson课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学 第二章 定量资料的统计描述 关英辉 沈阳何氏医学院管理系 电话邮箱: 第二讲 频数分布图表、定量资料集中趋 势的统计指标 Outline 主要内容 n统计图表:频数分布表、频数分布图 n统计指标: 描述集中趋势的统计指标 回顾 n什么是定量指标? n统计分析包括哪两部分内容? 统计描述 统计推断 n 把握资料的基本特征 n 为统计推断打下基础 统计描述 -从资料中获取信息最基本的方法 例2-2 抽样调查某地120名18岁35岁健康男性 居民血清铁含量(mol/L),数据如下: 乱七八糟的原始数据 一些 杂乱无章的拼图 块,我们无法知道他 们究竟是什么? 让我们动手把他们重新 排列组合、整理一下 乱七八糟的拼图块 原来如此 第一节 频数分布表、频数分布图 原因:由于个体变异的存在,医学研究中某些 指标在各个体上的观察结果不是恒定不变的,但 也不是杂乱无章的,而是有一定规律的分布。 解决:频数分布表的基本思想 将原始数据按一定的标准划分若干组,合计各组 的频数,得到频数分布表,再将频数分布表绘制 成频数分布图。 频数分布表(frequency distribution table), 又称频数表 一、 离散型定量变量的频数分布 例2-1 1998年某山区96名孕妇产前检查次数资 料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6, 5,1,3,3,4,7 直条图(bar chart) 横坐标:产前检查次数; 纵坐标:频率, 检查k次的妇女所占的比例(%) 等宽矩形长条:高度相当于检查次数的频率 二、连续型定量变量的频数分布 例2-2 抽样调查某地120名18岁35岁健康男性 居民血清铁含量(mol/L),数据如下: 连续型变量频数表(frequency table) 的编制 1.求全距(range)R 找出观察值中的最大值与最小值,其差值即为全距 (或极差),用R表示。R=最大值-最小值 2. 确定组段和组距 根据样本含量的大小确定“组段”数,一般设8-15个 组段;各组段的起点和终点分别称为下限和上 限,组距。组距=R/预计的组段数 3.列表 确定组段界限,清点各组段内数据的例数(频数) 列于表 直方图(频率直方图) 横轴:血清铁含量 纵轴:频率密度 = 频率/组距 面积 = 频率 注:组距相等时,矩形直条的高度与相应组段 的频率成正比。 图2-2 120例健康成年男子血清铁含量分布 单峰、对称 - 对称分布 图2-3 某地居民238人发汞含量(mol/kg)分布 单峰,不对称 - 偏峰分布 正偏峰分布:峰偏向左侧 负偏峰分布:峰偏向右侧 第二节 定量资料的统计描述 定量地描述集中趋势与离散趋势是统计描述的重 要内容 一、 描述集中趋势的统计指标 对于连续型定量变量,描述集中趋势常用的统计 量为算术均数、几何均数和中位数。 1. 算术均数 简称均数(mean,),适合描述对称分布资料的集 中位置(也称为平均水平)。其计算公式为 n:样本含量 X1,X2,Xn:观察值 或 :观察之和 例2-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含 量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42 ,3.38。试求其算术均数。 按式(2-1),算术均数为 2. 几何均数(geometric mean,G) 适用于观察值变化范围跨越多个数量级的资料 频数图一般呈正偏峰分布 例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资料 为1:16,1:32,1:32,1:64, 1:64,1:128,1:512。试 计算其几何均数。 3. 中位数(median,M) 可用于各种分布的定量资料 总体中有一半个体的数值低于这个数,一半个体的数 值高于这个数。 基于样本资料 将n例数据按升序排列,第i个数据记为 n为奇数时 n为偶数时 例2-7 某药厂观察9只小鼠口服高山红景天醇提取物 (RSAE)后在乏氧条件下的生存时间(分钟)如下: 49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6, 69.0。试求其中位数。 4、百分位数(percentile) 总体中, 数值小于它的个体恰有X%,大于它的个 体恰有1-X% 样本估计:按照升序排列的数列里, 其左侧(即 小于它)的个体数在整个样本中所占百分比为 X%。 4. 众数(mode) 总体中出现机会最高的数值。 样本估计:在样本中出现次数最多的数值。 例2-1 1998年某山区96名孕妇产前检查次数资料 : 0,3,2,0,1,5,6,3,2,4,1,0,6,5 ,1,3,3,4,7 众数为4(次) 定量资料集中趋势统计指标 指标意义应用 算术均数, 反映全部观察值的平均 数量水平 适用于对称分布资料, 尤其是正态分布或近似 正态分布 几何均数G 反映一组含多个数量级 数据的集中位置 适用于原始观察值分布 不对称,但经对数转换 后呈对称分布的资料, 如对数正态分布资料。 观察值呈倍数关系,或 变化范围跨越多个数量 级 中位数M 位次居中的那个数,一 半观察值低于这个数, 一半观察值高于这个数 适用于各种资料,特别 是偏锋分布资料、分布 末端无确定值的资料等 众数M。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论