计量资料的统计描述.ppt_第1页
计量资料的统计描述.ppt_第2页
计量资料的统计描述.ppt_第3页
计量资料的统计描述.ppt_第4页
计量资料的统计描述.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 计量资料的统计描述,第一节 频数分布 (frequency distribution),1,2,101名正常成年女子的血清总胆固醇(mmol/L ),频数分布表,求极差 极差(range)也称全距,即最大值和最小值之差,记作R。本例: R = 5.71 - 2.35 = 3.36 (mmol/L) 确定组数与组距 根据原始数据多少,组段数通常取组 8 15组 组距 i = 全距 R / 组数 k ,本例 i=3.36/10=0.3360.30 确定组限 资料中的每一个数据都必须能够归属于某一组,且只能归属于该组。 统计频数编制频数表,3,4,5,6,7,三、频数分布表的用途,可代替繁杂的原始资料,便于进一步分析。 便于观察数据的分布类型。 便于发现资料中某些远离群体的特大或特小的可疑值。 当样本含量较大时,可用各组段的频率作为概率的估计值。,8,图2-2 115名正常成年女子的血清转氨酶的频数分布,右偏态分布或正偏态分布,图2-3 101名正常人的血清肌红蛋白的频数分布,左偏态分布或负偏态分布,第二节 集中趋势的描述,9,10,平 均 数(average),平均数是描述一组观察值集中位置和平均水平的统计指标。常用的平均数包括: 算数均数(mean) 几何均数(geometric mean) 中位数(median)和百分位数(percentile),11,算 数 均 数,直接法 加权法 均数的应用 适用用于对称分布或偏度不大的资料,能够很好的反映数据的集中位置和平均水平。 算数均数容易受到频数分布尾端极大或极小值的影响。,101名正常成年女子的血清总胆固醇 直接法: 加权法:,12,13,几何均数(geometric mean),观察值间按倍数变化的资料可以计算几何均数(G)以描述其平均水平。 计算公式为: 加权法为:,14,15,注意点:,适用于数据呈等比分布或呈对数正态分布的资料。 数据中出现0或负数时,需对数据进行转换。,16,中位数和百分位数,中位数 一组观察值按从大到小顺序排列,居中心位置的数即为中位数(median)。 将所以n 个观察值按升序排列, n为奇数时:中位数 n为偶数时:中位数,17,百分位数,百分位数(percentile)是一种位置指标,用PX来表示。 直接法 当nX%为带有小数位时:PX=X(trunc(nX%)+1) 当nX%为整数时: PX=1/2(X(nX%)+X(nX%+1),18,频数表法 计算公式:,19,L、iX、fX分别为PX所在组段的下限、组距和频数,fL为PX所在组段之前各组段的累计频数。,20,21,注意点: 算术均数,几何均数以及中位数都能反映一组数据的集中趋势和水平。 算术均数适用对称分布的计量资料,几何均数适用于呈等比分布计量资料,中位数适用于任何频数分布资料。 中位数对于对称分布资料,没有均数稳定,不便于进行统计运算。 多个百分位数结合使用常可以说明某一特定的问题。,第三节 离散趋势的描述,22,23,对甲乙2名高血压患者连续观察5天,测得的收缩压分别为: 甲患者(mmHg) 162 145 178 142 186 ( ) 乙患者(mmHg) 164 160 163 159 166 ( ),甲乙患者收缩压的均数很相似,但是甲患者的血压波动范围较大。,24,衡量离散趋势的指标,大体分为2大类: 按间距计算:极差和四分位数间距 按平均偏差计算:离均差平方和、方差、标准差和变异系数,25,极差和四分位数间距 极差(range):观测值中最大值和最小值之差,用R表示。 R甲 = 186 - 142 = 44 (mmHg) R乙 = 166 - 159 = 7 (mmHg) 四分位数间距(quartile):百分位数P75和P25之间的差。 Q = P75 P25,表2-6中,已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。 QR = 67.7 - 39.2 = 28.5(天) 四分位数间距主要用于衡量明显偏态分布资料的变异程度。,26,27,离均差平方和(sum of square,SS),方差(mean of square,MS) 离均差平方和再取平均,其结果为方差。 对于样本资料,分母 取n 1 作为自由度(degree of freedom,df),式中MS为样本方差,方差越大说明数据的变异越大。,28,标准差(standard deviation,SD)方差的平方根称为标准差。 SD越大说明其变异程度越大。 如果是频数表资料,可用以下的公式:,29,29,例如对于前例经计算有 甲患者: 乙患者:,30,标准差的量纲与原变量一致。 标准差可以直接用于代数运算。 标准差与均数结合能够完整地概括一个正态分布。 标准差越大意味着个体差异越大。,31,变异系数(coefficient of variation,CV) 某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg, 比较其变异度? 身高 体重 不同量纲的变量间变异程度的比较。 均数差别较大的变量间变异程度的比较。,第四节 正 态 分布,32,正态分布首先由德国数学家和天文学家德莫阿弗尔(A. de Movre, 1667-1754)于1733年提出。德国数学家Gauss将其运用于天文学研究中,从而使正态分布为世人所知。 因此,正态分布又称为Gauss分布。,33,A. de Movre,Gauss,34,将血清总胆固醇的横坐标用变量X表示,第i组的组距和人数分别为Xi 和 fi 表示,n为总观察例数,则在 X, X + Xi )区间内每单位血清总胆固醇的频率为: f ( X ) = ( fi / n ) / Xi,35,各矩形的面积恰好等于红细胞在区间内的频率( f ( X ) Xi = f i / n ) 面积的总和为1。,36,假设观察的人数增多,组段不断细分,则直方图将逐渐接近于一条均匀连续的曲线,这条曲线所描述的分布,简称为正态分布。,37,正态分布的密度函数,曲线方程为:, 和 e 是圆周率和自然对数的底,其近似值分别为3.14159和2.71828。 和是正态分布的两个参数,分别是总体的均数和标准差。,总体的自由度是 n 而不是 n - 1,38,正态分布的特征 正态分布以均数为中心,左右对称。 正态分布曲线下面积集中在以均数为中心的中心部分,越远离中心曲线下面积越小。 正态分布曲线下面积分布有一定的规律。,正态分布曲线下面积的计算可以通过对其概率密度函数积分来实现:,39,40,正态分布完全由参数和决定。,标准正态分布及曲线下面积,41,标准正态分布 (Standard Normal Distribution) 对任何参数的正态分布,都可以通过一个简单的变量变换 化成 = 0 和 s = 1的标准正态分布。通常,可以利用标准正态分布表求出与原始变量 X 有关的概率值。,42,代入:,43,查附表1 (-1.96)= ? (-2.58)= ?,44,成年男性的红细胞数近似服从正态分布,假设其均数为4.781012/L,标准差为0.381012/L,想知道红细胞数在41012/L以下所占的比例。,然后查附表1得 (-2.05)=0.0202,表明红细胞数在41012/L以下所占的比例为总体的2%。,45,正态分布的应用 利用正态分布可以很容易确定资料中任意数值出现的概率,医学参考值范围的估计。 准确地进行误差分析和质量控制。 正态分布是以后学习各种统计推断方法的理论基础。,第五节 医学参考值范围的制定,46,47,医学参考值范围的概念 正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。 目的: 基于临床事件,着眼于个体,作为划分正常人和异常人的界限。 基于预防医学实践,着眼于人群,制定各种生理指标的等级标准。,48,医学参考值范围的制定方法 选择足够数量的正常人作为参照样本。 对选定的正常人进行准确的测定。 决定取单侧范围还是双侧范围值。 血清总胆固醇,过高或过低均属异常取双侧。 血清转氨酶仅过高属异常,取单侧。 肺活量仅过低属异常,取单侧。,49,选择适当的百分范围。,50,正态分布法计算医学参考值范围。 单侧: 双侧:,51,百分位数法计算医学参考值范围。,52,百分位数法与正态分布法 前者适合任何分布类型的资料,实际中最为常用。后者仅适用于正态分布资料,适用范围较狭窄。 前者必须有较大的样本含量,否则结果不稳定。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论