计量资料的统计描述全科医师.ppt_第1页
计量资料的统计描述全科医师.ppt_第2页
计量资料的统计描述全科医师.ppt_第3页
计量资料的统计描述全科医师.ppt_第4页
计量资料的统计描述全科医师.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第二章 数值变量资料的统计分析 Descriptive Statistics,2,统计描述 统计分析 统计推断,2019/7/13,3,【例7-1】某地用随机抽样的方法对130名健康成年男性红细胞数进行了检测,资料如表1,请描述男性红细胞的情况。,2019/7/13,表1 某地130名正常成年男子红细胞数( 1012/L ),2019/7/13,4,问题?,表1的130个数据,无论多认真审视,也说不清这些人红细胞的情况怎样、特征如何。 你应该如何着手整理,整理的目的是什么? 结合学过的知识,你认为用什么方式描述这份资料能让人对资料内容一目了然? 统计描述就是解决此问题的方法,即用统计表、统计图和统计指标来描述样本数据的特征,2019/7/13,5,第一节 计量资料的统计描述,频数表与频数分布 平均指标(算术均数、几何均数、中位数、众数) 变异指标(极差、百分位数与四分位间距、方差、标准差、变异系数),2019/7/13,6,一、频数表与频数分布 (frequency table and frequency distribution),频数(frequency): 变量值出现的次数,即例数 频数表(frequency distribution table): 反映变量值与频数之间关系的统计表,2019/7/13,7,表1 某地130名正常成年男子红细胞数( 1012/L ),2019/7/13,8,1. 频数表的编制步骤,(1)求极差(range):即最大值与最小值之差,又称为全距。 本例极差: R=5.88-3.79=2.09(1012/L)。 (2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一, 再略加调整。 本例i= R /10=2.09/10=0.2090.2。 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。,2019/7/13,9,622.8,130,合计,5.8,5.8,1,5.75.9,22.4,5.6,4,5.5,48.6,5.4,9,正,5.3,88.4,5.2,17,正正正,5.1,105,5.0,21,正正正正,4.9,120,4.8,25,正正正正正,4.7,101.2,4.6,22,正正正正,4.5,70.4,4.4,16,正正正,4.3,37.8,4.2,9,正,4.1,16.0,4.0,4,3.9,7.2,3.8,2,3.7,fX (5)= (3)(4),组中值,X (4),频数,f (3),划 记 (2),组段 (1),表2 某地130名正常成年男子红细胞数频数分布,2019/7/13,10,2019/7/13,11,2. 频数表的分布特征,集中趋势(central tendency):变量值集中位置。本例在组段“4.74.9”。 平均水平指标 离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。本例4.35.1,共有101人,占77.7;离“中心”位置越远,频数越小;且围绕“中心”左右对称。 变异水平指标,2019/7/13,12,二、平均指标,总称为平均数(average)反映了资料的集中趋势( central tendency )。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3.中位数 (median),2019/7/13,13,1. 均数(mean),为求和符号,读成sigma 适用条件:资料呈正态或近似正态。,(1)直接法,(2)加权法(频数表法)基本思想: 以组中值代表组内的变量值(近似法),简化计算,2019/7/13,14,表2 某地区130 名正常成年男子红细胞数( 1012/L ) 的均数和标准差的加权计算,2019/7/13,15,均数623.0/1304.794,2. 几何均数(geometric mean),2019/7/13,16,几何均数的适用条件与实例,适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料,血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。,此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数均数,2019/7/13,17,2019/7/13,18,19,3.中位数(median) 百分位数(percentile),中位数:一组观察值按大小顺序排列,位置居中的那个数值称为中位数,记为M。 百分位数:一组数据从小到大排列,并分成100等份,第x等份之分割位置的数值称为第x百分位数,记为Px 例如:x=50,记为P50,读作“第五十百分位数”(即中位数),2019/7/13,20,适用情形: 适用于任意分布,常用于 : 偏态分布(如发汞、尿铅); 一端或两端无确定数值; 分布情况不明。,2019/7/13,21,常用百分位数: P50,P25,P75,P5,P95,P2.5,P97.5 怎样求解中位数和百分位数?,2019/7/13,(1)中位数计算公式与实例,先将观察值按从小到大顺序排列,再按以下公式计算:,特点:仅仅利用了中间的12个数据,2019/7/13,22,例 题,某患病者5人的潜伏期分别为2,3,4,5,3天,求其中位数? 若再加一名患者,其潜伏期为9天,又如何计算?,2019/7/13,23,24,(2)中位数和百分位数的频数表法:,L为百分位数对应组段的下限值,i为该组段的组距,fx为该组段频数,fL为前一组累计频数,2019/7/13,表2 某地区130 名正常成年男子红细胞数( 1012/L ) 中位数的加权计算,2019/7/13,25,中位数4.7+0.2x(130x50%-53)/254.796,例 题,某校70例急性食物中毒患者潜伏期见下表,求急性食物中毒的平均潜伏期? 该资料能否计算均数、几何均数,为什么?,2019/7/13,26,2019/7/13,27,均数、中位数的关系,正态分布时: 均数中位数 正偏态分布时:均数中位数 负偏态分布时:均数中位数,2019/7/13,28,三、变异(variation)指标,反映数据的离散度( Dispersion )。即个体观察值的变异程度。常用的指标有: 1.极差(Range) (全距) 2.百分位数与四分位数间距(Percentile and Quartile range) 3. 方差 (Variance) 4.标准差(Standard Deviation) 5.变异系数(Coefficient of Variation),2019/7/13,29,例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3),甲,乙,丙,2019/7/13,30,1.极差(Range) (全距),优点:简便 缺点: 1. 只利用了两个极端值 2.n大,R也会大 3.不稳定,120,40,20,2019/7/13,31,2.百分位数与四分位数间距 Percentile and quartile range,百分位数 :数据从小到大 排列;在百分尺度下,所占百分比对应的值。记为Px。 四分位间距: QRP75 P25 四分位半间距quartile deviation:QDQR/2,P100(max) P75 P50(中位数) P25 P0(min),Px,2019/7/13,32,33,(2)中位数和百分位数的频数表法:,L为百分位数对应组段的下限值,i为该组段的组距,fx为该组段频数,fL为前一组累计频数,2019/7/13,表2 某地区130 名正常成年男子红细胞数( 1012/L ) 中位数的加权计算,P254.5+0.2x(130x25%-31)/224.51 P754.9+0.2x(130x75%-78)/215.09 QR5.09-4.510.58,2019/7/13,34,2019/7/13,35,百分位数的应用,确定医学参考值范围 (reference range) 如95参考值范围P97.5P2.5; 表示有95正常个体的测量值在此范围。 中位数Md与四分位半间距QD一起使用,描述偏态分布资料的特征,2019/7/13,36,3.方 差,方差 (variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。,2019/7/13,37,4.标准差,标准差 (standard deviation)即方差的正平方根;其单位与原变量X的单位相同。,2019/7/13,38,标准差的计算,2019/7/13,39,表2 某地区130 名正常成年男子红细胞数( 1012/L ) 的均数和标准差的加权计算,2019/7/13,40,5. 变异系数(coefficient of variation,CV),适用条件:观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊,2019/7/13,41,【例】 某地40名7岁儿童身高均数为121.48cm,标准差为4.65cm;体重均数为22.18kg,标准差2.35kg。试比较其身高和体重的变异程度。,身高CV=3.83%,体重CV=10.60%,2019/7/13,42,变异指标小结,1极差较粗,适合于任何分布 2标准差与均数的单位相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论