




已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量资料的统计描述 第二军医大学卫生统计学教研室 孟 虹,本章的内容和重点,第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值的制定 重点: 掌握概念、方法的用途和适用条件 熟悉统计符号和公式,统计描述的意义,社会活动看似杂乱无章,对个体来说有很多不确定性,但总体上都是服从一些统计规律的。 医学工作有很多数据,统计学描述就是对这些数据进行加工和提炼,找出规律、预测未知。 统计描述是最简洁有力的语言。,第二章 计量资料的统计描述,概念:即用少量几个统计指标刻画出原始数据的特征称为统计描述。 计量资料的统计描述方法: (单变量) 1. 通过频数表描述数据特征 2.用统计指标 定量描述数据的特征。,表 100例高血压患者治疗后临床记录,编号 年龄 性别 治疗组 舒张压 体温 疗效 X1 X2 X3 X4 X5 X6 1 37 男 A 11.27 37.5 显效 2 45 女 B 12.53 37.0 有效 3 43 男 A 10.93 36.5 有效 4 59 女 B 14.67 37.8 无效 100 54 男 B 16.80 37.6 无效,第一节 频数分布,一 、频数分布表 频数分布表:将变量值分为不同数量的组段,清点各组段的例数。 意义:概括了解变量值在各组段的分布和规律。 例: 表2-1,例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L )的测量结果,计量资料频数表的编制步骤,例2-1数据 1.确定全距(R)=最大值 最小值 2.定组数(8-15组)和组距: 例: 3.36/10=0.3360.3 3.写出组段的下限:第1组段值小于或等于最小变量值,并以整数(0,5或2,4,6,8)较好。如2.3 4.划计并计数:变量(x)归为L xU(见表2-1),组距(i)=全距(R)/组数,表2-1 101名正常成年女性血清总胆固醇频数表,组段 频数(f) f(%) 2.3- 1 1.0 2.6- 3 3.0 2.9- 6 6.0 3.2- 8 8.0 3.5- 17 17.0 3.8- 20 20.0 4.1- 17 17.0 4.4- 12 12.0 4.7- 9 9.0 5.0- 5 5.0 5.3- 2 2.0 5.6- 5.9 1 1.0 合计 101 100.0,二 频数表及分布图的用途,1. 通过频数表了解数据的分布特征。 X值分布情况:偏态或正态分布 取值情况:变量值取值范围 集中趋势:变量值集中位置。 2.便于发现资料中的可疑值。 3.组段的频率作为概率的估计。,例:表2-1资料频数分布图直方图,图2-1 101名正常成年女性血清总胆固醇频数分布,频数,血清总胆固醇,正态分布,图2-2 59名链球菌咽喉炎患者潜伏期,正偏态分布,讲义表2-4数据,图2-3 负偏态分布,例:某院出院患者住院天数的频数表,组段(天) 频数(f) 0- 6 5- 21 10- 14 15- 13 20- 6 25- 2 30- 3 35- 1 40及以上 13 合计 79,第二节 集中趋势的描述,平均数指标的概念和作用 概念:平均数表示一组同质计量数据集中趋势的位置和平均水平。 作用:是一组计量数据平均水平的代表值;可作为不同组间的比较值。 医学中常用的平均数指标有: 算数均数、几何均数、中位数,一、算术均数( mean) 简称均数,用 表示.,公式适用频数为正态或近似正态分布的计量资料.,基本公式(2-1,2-2),加权法公式(例数多),适用条件,表2-1 101名正常成年女性血清总胆固醇频数表,组段 频数(f) 组中值X fX 2.3- 1 2.45 2.45 2.6- 3 2.75 8.25 2.9- 6 3.05 18.30 3.2- 8 3.35 3.5- 17 3.65 3.8- 20 3.95 4.1- 17 4.25 4.4- 12 4.55 4.7- 9 4.85 5.0- 5 5.15 5.3- 2 5.45 5.6- 5.9 1 5.75 合计 101 409.7,加权法公式计算,频数(f)作为X值的权数,二、几何均数 (Geometric mean),适用条件:X值呈倍数增长或部分数据偏离过大偏态分布(正偏态)资料。 计算公式:,直接法,例数较少用(2-3),加权法,(2-4),或,例2-4 某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度分别为1/10,1/20,1/40,1/80,1/160,求几何均数。,结论:平均抗体滴度为1:34(几何均数法),表2-5 69例RA患者血清EBV-lgG抗体测定结果,几何均数计算,例2-5 :例数合计,结论:69例RA患者血清EBV-lgG抗体平均滴度为1:150.6,三、中位数和百分位数,(一)中位数( Median, M):适用于描述偏态分布资料的平均水平。如潜伏期、病程资料。 计算定义: 将一组变量值由小到大依次排列,居以中间位次的观察值即为中位数,为这组数据的平均数。 X: 5, 5, 6, 7, 20(d) 位次 1 2 3 4 5,中位数的计算,1.例数较少(公式2-5,2-6),n为偶数,n为奇数,中位数优点:不受数据中极大或极小值的影响,取决于中间位置的数。,(二)百分位数,百分位数(percentile)是一种位置指标,用 表示。例 计算定义:将一组变量值由小到大依次排列, 为第x百分位数的秩次, 其对应的变量值(x)为第x百分位数,记为Px。,X: 1 5 8 10 48. 105 秩次 1 2 3 4 50 100 x% 1% 2% 3% 4% 50% 100%,一组数据(n=100),由小到大排列,例:,百分位数计算方法,1.直接法(不要求) 将样本值由小到大排队,用 确定Px的位次和PX。 当 为带有小数位时用式2.7: 当 为整数时 用式2.8,trunc(a)表示对数字取其整数。,式2.8,式2.7,例:8位患者某病的住院天数: 2 2 2 3 3 4 5 6 求50%位数和80%位数。 解:第50%位次:nX%=80.5=4,用式2.8 中位数=P50=3(天) 第80%位次:nX%=80.8=6.4,用公式2.7,2.频数表法(例数较多),Lx :第X%位数所在组段的下限值 ix :第X%位数所在组段的组距 fx :第X%位数所在组段的频数 : 第X%位数所在组段上个组段的累计频数,式中:,(2-9),表2-5 118名链球菌咽喉炎患者的潜伏期,中位数所在组段,计算频数表资料P25、P50和P95,1.计算x=25%和50%的位次,2.按公式2-9计算 Px,百分位数计算结果的应用,1.常计算P25、P50 、P75、和P95,为临床治疗提供依据。 例2-9:120名细菌性痢疾治愈的住院天数 P5=3.5(天),即只有5%的人住院低于3.5天。 P95=15(天) 2.确定医学指标的参考值,如P25=39.2天,P50=51天(中位数),118名链球菌咽喉炎患者的潜伏期,第三节、离散趋势的描述,描述计量资料数据间离散(变异)程度的指标 变异指标,例2-11 三组同龄男孩的身高(cm),R 甲组 90 95 100 105 110 100 20 乙组 96 98 100 102 104 100 8 丙组 96 99 100 101 104 100 8,三组男孩身高值的变异一样吗?,三个指标测定值分布变异不同,变异的大小反映某组指标的稳定性,几个常用的变异指标,一、极差(Range):用(R)表示 即 R=最大值 最小值 意义: R值越大,表示该组数据的变异越大。 缺点: 数据利用不全,部分信息损失,在例数少时结果不稳定。,极差、四分位数间距、方差、标准差、变异系数,二、四分位数间距(quartile range),四分位数间距:常用QR表示 常计算: QR=P75%-P25% 作为变异指标比极差稳定。常用于表示偏态分布资料的变异。 例:QR= P75%-P25% =67.739.2=28.5天 表示方法:Md(QR) M=51天,(QR=28.5天),三、标准差和方差 (Standard deviation and variance),公式,总体方差(2),(2-11),(2-12),总体标准差(),样本标准差(s),(2-13),标准差的简化计算公式:,(2-14)例数较少,(2-15) 频数表资料,例2-11 甲组5名同龄男孩的身高值(cm),X X2 90 8100 95 9025 100 10000 105 11025 110 12100,标准差的计算,表2-1 101名正常女子血清胆固醇值,409.75 1705.09,合计,101,统计描述:某地101名正常女子血清胆固醇值平均为4.06(mmol/L),标准差为0.654 (mmol/L),例2-10 三组同龄男孩的身高值(cm) R S 甲组 90 95 100 105 110 100 20 7.91 乙组 96 98 100 102 104 100 8 3.16 丙组 96 99 100 101 104 100 8 2.92 标准差的意义: 反映一组变量值变异程度,组间单位相同时,S越小,表示数据的变异程度越小。,四、变异系数(CV),应用:1.组间单位不同时变异程度的比较。,2.比较组单位相同,但均数相差悬殊 的组 间变异程度.,意义:CV越大,表示数据变异越大。常用于衡量方法、仪器的精密度。,公式:,(2-16),1.单位不同时组间变异程度的比较。,某地7岁年龄组男童身高与体重 指标 S CV(%) 身高(cm) 123.10 4.71 3.83 体重(kg) 22.29 2.26 10.14 结论: 7岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标。,某地不同年龄组男童身高(cm) 年龄组 S CV% 1-2月 56.3 2.1 3.73 5-6月 66.5 2.2 3.31 3-3.5岁 96.1 3.1 3.22 5-5.5岁 107.8 3.3 3.06 结论:随着年龄增加,身高的变异变小。,2.比较组单位相同,但均数相差悬殊的组间变异程度比较,计量数据的统计描述小结,1. 在医学杂志中正态或近似正态的资料,常以 的形式表达,描述和比较数据的平均水平和离散程度。 两组患者年龄(岁)的比较 组别 n 范围值 试验组 12 45.9 3.7 35-57 对照组 10 50.5 13.0 18-83 两组患者基线情况的比较,2.偏态分布或特定资料(生存时间、病程、潜伏期时间等) 1)用中位数和四分位间距描述。 表达形式:M,四分位数间距(QR) 例2-9 :118名链球菌咽喉炎患者的中位潜伏期为51天,QR为28.5天。 2)用百分位数的P25%、P50%、P75%描述分布位置。,3.等比数据和正偏态数据可用几何均数和几何标准差描述 表达形式:GSG,SHIFT 第二功能键 MODE 计算模式选择键 LR 计算相关回归选择键 SD 统计功能选择键 Min 单独数据储存键 MR 取出储存数据键 Kin(1-6)单独数据储存键 Kout(1-6)取出储存数据键 X2 数据平方键 1/X 倒数键 Log 以Lo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机场电气建设方案(3篇)
- 工厂后勤招标方案(3篇)
- 花园隐蔽水池清理方案(3篇)
- 废弃果园管护方案(3篇)
- DB23-T3020-2021-气象为农服务效益专家评估技术规范-黑龙江省
- DB23-T3002-2021-第二积温带水稻灌溉技术操作规程-黑龙江省
- DB23-T2887-2021-小黑杨萌蘖更新技术规程-黑龙江省
- 外包软件项目管理制度
- 农村畜禽养殖管理制度
- 厂区接待车队管理制度
- JY-T 0467-2015 初中体育器材设施配备标准
- 3D扫描与模型重建
- 幼儿园安全教育课件:《私自离园危险多》
- 县政府工作调动文件范本
- 特种设备风险管控清单
- 配电箱产品质量保证书
- 现代企业管理理论与实务
- 一年级100以内计算练习题(口算、竖式)-100以内的计算题
- 中亚高校汉语国际教育发展现状研究
- 《新求精德语强化教程 中级Ⅱ》(第三版)学习指南【词汇短语+单元语法+课文精解+全文翻译+练习答案】
- 苏教版六年级下册数学《3、可能性》课件
评论
0/150
提交评论