雷静《卫生统计学》第二章定量资料的统计描述一.ppt_第1页
雷静《卫生统计学》第二章定量资料的统计描述一.ppt_第2页
雷静《卫生统计学》第二章定量资料的统计描述一.ppt_第3页
雷静《卫生统计学》第二章定量资料的统计描述一.ppt_第4页
雷静《卫生统计学》第二章定量资料的统计描述一.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定量资料的统计描述 之一 频率分布表与频率分布图 集中趋势的描述,频率分布表:即对各变量值出现的频率列表。用来描述定量资料的频数分布,反映观察值的分布类型及分布特征。 频率分布图,离散型定量变量的频率分布,频率表的编制:直接清点各变量值及相同变量值出现的频率列表即可。 如:例2-1,即可列成表2-1的形式 其频率分布图如图2-1的形式,频数表 表1. 某地140名正常男子红细胞数的频数表,红细胞数(1012/L) 划记 组中值 频数 频率(%),3.80 3.90 2 1.4 4.00 4.10 6 4.3 4.20 4.30 11 7.9 . 5.806.00 5.90 1 0.7,连续型定量变量的频率分布,频率分布表的编制: 找最大值、最小值,求极差 按极差大小决定组段数、组段、组距 一般设10-15个组段 常用极差的1/10取整作组距 要求:第一组段包括最小值 最后一个组段包括最大值 每个组段的起点称“下限“(low limit) 终点称“上限“(upper limit) 对于连续性资料,各组段从下限开始, 不包括本组段上限。 最末一个组段应同时写出其下限和上限。 列表划记,求频数(f),例:某地40例中年健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 1)编制频率分布表并绘制分布图 2)估计其频率分布的类型 3)计算均数 、标准差S、变异系数CV 4)计算中位数M,并与 比较。,表2 某地40例健康成年男子血清胆固醇值的频数表,组段 划记 频数 2.70 1 3.20 4 3.70 4 4.20 10 4.70 9 5.20 6 5.70 3 6.20 2 6.70 0 7.207.70 1,合计 40,频率分布表(图)的用途: 作为陈述资料的形式,反映资料的分布类型; 对称分布 偏态分布 正偏态 负偏态 描述分布的两个特征:集中趋势、离散趋势 便于发现可疑值,及时查正; 便于以后的计算指标及统计分析; 当样本含量较大时,可用频率作为概率的估计值。 直方图:P14图2-2,图2-3, 更直观的反映频数分布的类型。,集中趋势的描述,平均数(average) 是描述一组观察值的集中位置或平均水平的统计指标 常作为一组数据的代表值用于分析和组间比较 常用的有:算术均数、几何均数、中位数,1.算术均数(arithmetic mean) 简称均数 总体均数用表示 样本均数用 表示 反映一组观察值在数量上的平均水平,(1)计算方法 直接法: 式中,希腊字母(读作sigma)表示求和; X1,X2,Xn为各观察值; n为样本含量,即观察值的个数。,频率表法:频率表资料或相同观察值较多时 式中,X0与f分别为频数表资料中各组段的组中值和相应组段的频数(或相同观察值与其对应的频数)。,(2)均数的两个重要特性 各离均差的总和等于零 离均差的平方和小于各观察值X与任何数a (而a均数)之差的平方和 即均数是一组观察值最理想的代表值 (3)均数的应用: 最适用于对称分布,特别是正态分布资料 不适于偏态分布资料,2.几何均数(geometric mean) G 用于等比(或明显偏态)资料集中趋势的描述,反映其平均增减倍数。,(1)计算方法 直接法 或 频率表法:相同观察值的个数较多时,(2)应用于: 等比资料如抗体的平均滴度、平均发展速度人口的几何增长(增长速度);或用于对数正态分布资料。 *注意 观察值不能有零 观察值不能同时有正值和负值 同一组资料几何均数小于均数,3.中位数 中位数(median,M)是将一组观察值从小 到大排列,位次居中的观察值。 百分位数(percentile),位置指标,Px,将 总体或样本的全部观察值分为两部分, 理论上有x%的观察值比它小,有 (100-x)%的观察值比它大。 P50分位数即是中位数,(1)计算方法* 1)直接由原始数据计算中位数 先按大小排序 n为奇数时 n为偶数时,式中下标 、 、 为有序数列的位次。 、 、 为相应位次的观察值。,2)用频数表计算M和Px 步骤:按所分组段,由小到大计算 累计频数和累计频率; 按下式求M、Px 式中fx 为Px 所在组段频数 i 为该组段的组距 L为其下限 fL为小于L各组段的累计频数,(2)中位数和百分位数的应用: 1)中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值的水平。只受居中变量值波动的影响。 对末端无确定数据的分布,不能直接求均数和几何均数时,可求中位数。在对称分布资料中,中位数与均数在理论上数值是相同的。 2)百分位数用于描述样本或总体观察值序列在某百分位位置的水平。最常用的是P50、P5、P95等,3)百分位数常用于确定医学参考值范围(正常值范围),习惯上是确定只包括95%(或90%、99%等)的人的界值。 双侧参考值范围 P2.5P97.5(如血压、心率) 单侧参考值范围 P95或P5(如尿铅/汞、血铅) 可用于任何分布的资料,特别是非特定分布的资料如非正态分布资料。 4)一般,分布中部的百分位数相对稳定,代表性好,而两端的只在n足够大时才较稳定,当样本例数n不够多时,不宜取太近两端的百分位数。,众数(mode):指总体中出现机会最高的数值。样本众数指在样本中出现次数最多的数值。 多用于离散型定量资料的描述。,小结,计量资料集中趋势的描述常用 均数、几何均数、中位数 均数适用于对称分布的资料 几何均数适用于等比资料或对数正态分布资料 中位数可用于任何分布的资料,但原则上,适合用均数或几何均数的资料,不采用中位数来描述其集中趋势。,后面内容直接删除就行 资料可以编辑修改使用 资料可以编辑修改使用,主要经营:网络软件设计、图文设计制作、发布广告等 公司秉着以优质的服务对待每一位客户,做到让客户满意!,致力于数据挖掘,合同简历、论文写作、PPT设计、计划书、策划案、学习课件、各类模板等方方面面,打造全网一站式需求,感谢

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论