医学统计课件人卫6版第二章定量数据的统计描述_第1页
医学统计课件人卫6版第二章定量数据的统计描述_第2页
医学统计课件人卫6版第二章定量数据的统计描述_第3页
医学统计课件人卫6版第二章定量数据的统计描述_第4页
医学统计课件人卫6版第二章定量数据的统计描述_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 4 19 西安医学院公共卫生系 定量数据的统计描述 2020 4 19 西安医学院公共卫生系 一 频数分布 频数表 描述计量资料的频数分布反映观察值的分布规律 2020 4 19 西安医学院公共卫生系 频数表 医学统计学P8 表2 2某地140名正常男子红细胞数的频数表 红细胞数 1012 L 划记组中值频数频率 3 80 3 9021 44 00 4 1064 34 20 4 30117 9 5 80 6 005 9010 7 2020 4 19 西安医学院公共卫生系 1 频数表的编制 找最大值 最小值 求极差 按极差大小决定组段数 组段 组距一般设10 15个组段常用极差的1 10取整作组距要求 第一组段包括最小值最后一个组段包括最大值每个组段的起点称 下限 lowlimit 终点称 上限 upperlimit 对于连续性资料 各组段从下限开始 不包括本组段上限 最末一个组段应同时写出其下限和上限 列表划记 求频数 f 2020 4 19 西安医学院公共卫生系 例 某地40例中年健康男子血清总胆固醇值 mmol L 测定结果如下 4 773 376 143 953 564 234 314 714 564 375 396 305 217 225 543 395 185 774 795 125 205 104 704 744 384 896 255 324 504 633 614 444 473 403 912 704 604 095 965 481 编制频数分布表并绘制直方图2 估计其频数分布的类型3 计算均数 标准差S 变异系数CV4 计算中位数M 并与比较 2020 4 19 西安医学院公共卫生系 表2某地40例健康成年男子血清胆固醇值的频数表 组段划记频数2 70 13 20 43 70 44 20 104 70 95 20 65 70 36 20 26 70 07 20 7 701 合计40 2020 4 19 西安医学院公共卫生系 直方图 P9图2 1 更直观的反映频数分布的类型 2020 4 19 西安医学院公共卫生系 直方图 2020 4 19 西安医学院公共卫生系 2 频数分布的两个特征 集中趋势 离散趋势3 频数分布的类型 对称分布偏态分布正偏态负偏态不同类型的分布 应采用相应的统计分析方法4 频数表的用途 作为陈述资料的形式 反映分布特征 分布类型 便于以后的计算指标及统计分析处理 便于发现可疑值 及时查正 当样本含量较大时 可用各组段的频率作为概率的估计值 2020 4 19 西安医学院公共卫生系 二 集中趋势的描述 平均数 average 是描述一组观察值的集中位置或平均水平的统计指标常作为一组数据的代表值用于分析和组间比较常用的有 均数 几何均数 中位数等 2020 4 19 西安医学院公共卫生系 1 算术均数 arithmeticmean 简称均数总体均数用 表示样本均数用表示反映一组观察值在数量上的平均水平 2020 4 19 西安医学院公共卫生系 1 计算方法 直接法 式中 希腊字母 读作sigma 表示求和 X1 X2 Xn为各观察值 n为样本含量 即观察值的个数 2020 4 19 西安医学院公共卫生系 加权法 频数表资料或相同观察值较多时式中 X1 X2 Xk与f1 f2 fk分别为频数表资料中各组段的组中值和相应组段的频数 或相同观察值与其对应的频数 2020 4 19 西安医学院公共卫生系 2 均数的两个重要特性 各离均差的总和等于零 离均差的平方和小于各观察值X与任何数a 而a 均数 之差的平方和即均数是一组观察值最理想的代表值 3 均数的应用 最适用于对称分布 特别是正态分布资料不适于偏态分布资料 2020 4 19 西安医学院公共卫生系 2 几何均数 geometricmean G用于滴度 细菌计数等等比资料 明显偏态 集中趋势的描述 反映其平均增减的倍数 2020 4 19 西安医学院公共卫生系 1 计算方法 直接法或 加权法 相同观察值的个数较多时 2020 4 19 西安医学院公共卫生系 2 应用于 等比资料如抗体的平均滴度 平均发展速度人口的几何增长 增长速度 或用于对数正态分布资料 注意 观察值不能有零 观察值不能同时有正值和负值同一组资料几何均数小于均数 2020 4 19 西安医学院公共卫生系 3 中位数 百分位数中位数 median M 是将一组观察值从小到大排列 位次居中的观察值 百分位数 percentile 位置指标 Px 将总体或样本的全部观察值分为两部分 理论上有x 的观察值比它小 有 100 x 的观察值比它大 P50分位数即是中位数 2020 4 19 西安医学院公共卫生系 1 计算方法 1 直接由原始数据计算中位数先按大小排序n为奇数时n为偶数时 式中下标 为有序数列的位次 为相应位次的观察值 2020 4 19 西安医学院公共卫生系 2 用频数表计算M和Px步骤 按所分组段 由小到大计算累计频数和累计频率 按下式求M Px式中fx为Px所在组段频数i为该组段的组距L为其下限 fL为小于L各组段的累计频数 2020 4 19 西安医学院公共卫生系 2 中位数和百分位数的应用 1 中位数常用于描述偏态分布资料的集中位置 反映位次居中的观察值的水平 只受居中变量值波动的影响 对末端无确定数据的分布 不能直接求均数和几何均数时 可求中位数 在对称分布资料中 中位数与均数在理论上数值是相同的 2 百分位数用于描述样本或总体观察值序列在某百分位位置的水平 最常用的是P50 P5 P95等 2020 4 19 西安医学院公共卫生系 3 百分位数常用于确定医学参考值范围 正常值范围 习惯上是确定只包括95 或90 99 等 的人的界值 双侧参考值范围P2 5 P97 5 如血压 心率 单侧参考值范围P95或P5 如尿铅 汞 血铅 可用于任何分布的资料 特别是非特定分布的资料如非正态分布资料 4 一般 分布中部的百分位数相对稳定 代表性好 而两端的只在n足够大时才较稳定 当样本例数n不够多时 不宜取太近两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论