医学统计学 孙振球 第二章 计量资料的统计描述_第1页
医学统计学 孙振球 第二章 计量资料的统计描述_第2页
医学统计学 孙振球 第二章 计量资料的统计描述_第3页
医学统计学 孙振球 第二章 计量资料的统计描述_第4页
医学统计学 孙振球 第二章 计量资料的统计描述_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章计量资料的统计描述

DescriptionsofMeasurementData

ContentFrequencydistributionDescriptionofcentraltendencyMeasuresofdispersionNormaldistributionRangeofreferencevalue第一节频数分布

一、频数分布表(frequencytable):例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇()的测量结果如下,试编制频数分布表。

编制步骤如下:1.求极差

:

极差(range)也称全距,即最大值和最小值之差,记作R。本例:。

2.确定组距(i):组段数通常取组

10-15组本例组距

3.写组段:组下限(L):每个组段的起点组上限(U):每个组段的终点

2.30~

2.60~

2.90~

3.20~

…5.60~5.902.30~2.60~

4.分组段划记并统计频数

2.30~2.60~

频数表:由各组段及其频数所构成的统计表。二、频数分布图三、频数表和频数分布图用途

1.描述频数分布的类型

(1)对称分布:若各组段的频数以频数最多组段为中心左右两侧大体对称,就认为该资料是对称分布

(2)偏态分布:1)右偏态分布(skewedtotherightdistribution)也称正偏态分布(positiveskewnessdistribution):右侧的组段数多于左侧的组段数,频数向右侧拖尾

2)左偏态分布(skewedtotheleftdistribution)也称负偏态分布(negativeskewnessdistribution):左侧的组段数多于右侧的组段数,频数向左侧拖尾

2.描述频数分布的特征

①变异的范围在2.30~5.90②有明显的统计分布规律,数据主要集中在3.50~4.70之间,尤以组段的人数3.80~4.10最多,且上下组段数的频数分布基本对称。

3.便于发现一些特大或特小的可疑值

4.便于进一步做统计分析和处理第二节

集中趋势的描述

统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:

算术均数几何均数中位数

一、算术均数算术均数:简称均数(mean)可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。1、计算方法(1)直接计算法

公式:例2-2用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。

(2)加权法:公式:计算4,4,4,6,6,8,8,8,10的均数?

例2-3利用表2-1计算101名正常成年女子的血总胆固醇的均数。

式中k表示频数表的组段数,及分别表示各组段的频数和组中值,如表2-1第1个组段的组中值为,余类推(见表2-1的第(3)栏)。在这里,频数起到了“权”(weight)的作用,即某个组段频数多,权数就大,其组中值对均数的影响也大;反之,影响则小

2、应用

适用于对称分布,特别是正态分布资料。二、

几何均数

几何均数(geometricmean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。1、计算方法(1)、直接计算法

公式:或例2-4某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,10,20,40,40,160,求几何均数。(2)加权法公式:例2-569例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。

故例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为:1:150.6。

2、应用:

适用于成等比级数的资料,特别是对数正态分布资料。三、

中位数与百分位数(一)中位数中位数(median):是将变量值从小到大排列,位置居于中间的那个变量值。例:1,3,7,5,>100

中位数为多少?计算公式:n为奇数时

n为偶数时

例2-67名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。本例n=7,为奇数

例2-78名患者食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。本例n=8,为偶数

应用

适用于:1、各种分布类型的资料

2、特别是偏态分布资料和开囗资料(一端或两端无确切数值的资料)。

(二)百分位数

百分位数(percentile)是一种位置指标,用来表示。一个百分位数将全部变量值分为两部分,在不包含的全部变量值中有的变量值比它小,变量值比它大。

1.直接计算法

设有x个原始数据从小到大排列,第x百分位数的计算公式为:当为带有小数位时:

当为整数时:例2-9对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。

者:

住院天数:

n=120,120X5%=6,为整数:

例2-9对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。

者:住院天数:,带有小数,取整后trunc(118.8)=1182.频数表法

公式:式中XL、Xi和Xf分别为第X百分位数所在组段的下限、组距和频数,LfS为小于XL各组段的累计频数,n

为总例数。

例2-10某地118名链球菌咽喉炎患者的潜伏期频数表见表2-5第(1)、(2)栏,试分别求中位数及第25、第75百分位数。

第三节

离散趋势的描述

例2-11三组同龄男孩的身高值(cm)

常用统计指标:

极差、四分位数间距、方差、标准差和变异系数。

一、

极差极差,用R表示:即一组变量值最大值与最小值之差。

二、四分位数间距

四分位数间距,用QR表示:QR=下四分位数:上四分位数:

例2-12续例2-10。已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。

(天)请回答:四分位数间距可以看成大小在中间的一半变量值的全距(R)。

四分位数间距可以看成一半变量值的极差。三、方差与标准差

1、方差(variance)也称均方差(meansquaredeviation),反映一组数据的平均离散水平。

样本方差用表示

2、公式:样本标准差用表示公式:

标准差的公式还可以写成:利用频数表计算标准差的公式为例2-12续例2-10,计算三组资料的标准差。

甲组:

四、

变异系数

变异系数(coefficientofvariation)记为CV,多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。

某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,

比较其变异度?

(观察指标单位不同)均数相差较大时:第四节

正态分布

正态分布:又称为Gauss分布(Gaussiandistribution)。

设想当原始数据的频数分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论