计量资料的统计描述_第1页
计量资料的统计描述_第2页
计量资料的统计描述_第3页
计量资料的统计描述_第4页
计量资料的统计描述_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 计量资料的统计描述,第一节 频数分布第二节 集中趋势的描述第三节离散趋势的描述第四节 正态分布第五节 医学参考值范围的制定,第一节 频数分布,一、频数分布表(frequency table),例2-1 测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。,编制频数表的步骤,编制频数表步骤流程图,(1)求极差(range):即最大值与最小值之差,又称为全距。R84 57 =27(次/分)(2) 决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为815个组。组距=极差/组数,为方便计,组距为极差的十分之一, 再略加调整。27/10=2.7 3 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56 59 80 8385(4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。,频数表的编制步骤,表2-1 130名健康成年男子脉搏(次/分)的频数分布表,Nf,二、频数分布图,三、频数表和频数分布图用途,1描述频数分布的类型(对称分布、偏态分布) (1)对称分布 :若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布,是否为对称分布?,是否为对称分布?,(2)偏态分布 : 1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。,表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布,2)左偏态分布(负偏态分布):,左侧的组段数多于右侧的组段数,频数向左侧拖尾。,表2-3 101名正常人的血清肌红蛋白含量分布,2描述频数分布的特征,表21数据的频数分布特征:数据变异(离散)的范围在5784 (次/分 )数据集中(平均)的组段在6873 (次/分)之间,尤以组段的人数71(次/分)最多。且上下组段的频数分布基本对称。,3便于发现一些特大或特小的可疑值,4便于进一步做统计分析和处理,第二节 集中趋势的描述,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median)与百分位数(percentile) 众数(mode),一、算术均数,算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。,1、计算方法,(1)直接计算法 公式 :,举例:试计算4,4,4,6,6,8,8,8,10的均数?,例2-1 测得130健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。,(2)加权法(利用频数表):,公式 :,k:频数表的组段数, f :频数, X:组中值。,表2-2 130名健康成年男子脉搏(次/分)的频数分布表,Nf,fX,fX2,2、应用,均数适用于对称分布,特别是正态分布资料。,二、 几何均数(geometric mean),可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。,几何均数(geometric mean),几何均数:变量对数值的算术均数的反对数。,其他对数(如自然对数)变换获得相同的几何均数,例2-5 有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。,平均抗体效价为: 1:57,(2)加权法,公式:,例2-6 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。,2、应用:,适用于成等比数列的资料,特别是服从对数正态分布资料。,三、中位数与百分位数,11个大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60平均存活天数?(一)中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。,计算,公式: n为奇数时 n为偶数时,例2-3 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,求其中位数。,频数表资料的中位数,下限值L,上限值U,i; fm,中位数M,例21频数表中位数的计算,Nf,中位数71+3x(130x50%59)/2671.69,应用,1、各种分布类型的资料2、特别适合大样本偏态分布资料或者一端或两端无确切数值的资料。,百分位数示意图,(二)百分位数(percentile),例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。,患 者:住院天数: (1)n=120, ,为整数:,2频数表法,公式:,当 时,公式(2-9)即为中位数的计算公式,例2-9 试分别求例21频数表的第25、第75百分位数。,P2565+3x(130x25%19)/1565.90P7574+3x(130x75%85)/1974.66,设有甲、乙、丙三名医生,分别对相同的5份血样进行红细胞计数(万/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,见下图2,三名医生的计数结果得到的均数均为500,5个数值之和均为2500。,第三节 离散趋势的描述,甲医生得出的5个观察值间的差异(离散程度)较大,而丙医生得出的5个观察值间的差异(离散程度)较小。,常用统计指标:极差、四分位数间距、方差、标准差和变异系数。,一、极差(Range) 极差,用R表示:即一组变量值最大值与最小值之差。 对于书中例2-1数据,有,简单,但仅利用了两端点值,稳定性差。,二、四分位数间距(quartile range),四分位数间距,用Q表示: Q=下四分位数: 上四分位数:,例21数据P2565+3x(130x25%19)/1565.90P7574+3x(130x75%85)/1974.66,三、方差与标准差,1. 方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 总体方差 样本方差,离均差平方和SS,2、公式: 样本标准差用 表示 ,其度量单位与均数一致,所以最常用。公式:,离均差平方和SS,标准差的公式还可以写成 :利用频数表计算标准差的公式为,例2-11 对例2-1的前10个数据: 75,76,72,69,66,72,57,68,71,72, 用直接法计算标准差。,例2-12 利用表2-2中的数据和频数表法计算标准差。,Nf,fX,fX2,标准差的意义和用途,说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差; .。 标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。用于计算变异系数用于计算标准误(见第四章)结合均值与正态分布的规律,估计参考值的范围(见第五节)。,四、变异系数,变异系数(coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。,某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,比较其变异度?,第四节 正态分布,正态曲线(normal curve)的发现de Moivre(1667-1754),published in 1733Laplace(1749-1827)Gauss(1777-1855)正态分布: 又称高斯分布(Gaussian distribution),一、正态分布的概念和特征,1正态分布曲线的数学表达式(概率密度函数,probability density function,pdf ) ,,2正态分布的特征,正态曲线下面积分布有一定的规律,总面积=1。,累积面积规律:,图2-7 正态曲线面积分布示意图,二、标准正态分布,见P404405,ZN(0,1)2,例2-1的130名健康成年男子脉搏资料的均数、标准差分别为:71.32与5.80 (次/分);问在正态分布假定下,脉搏在6575(次/分)之间有多少人?,一、基本概念,第五节 医学参考值范围的制定,1.意义:医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。 由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准,但不是“金标准”。,2.单、双侧问题,常依据医学专业知识而定,双侧 :如:血清总胆固醇、血液白细胞数无论过低或过高均属异常单侧上限 :如:血清转氨酶、 体内有毒物质过高异常(越低越好, P5 ),3. 有90%、95%、99% 等医学参考值范围,最常用的是95% 。计算医学参考值范围的常用方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论