医学统计学课件--第一章-计量资料的统计描述_第1页
医学统计学课件--第一章-计量资料的统计描述_第2页
医学统计学课件--第一章-计量资料的统计描述_第3页
医学统计学课件--第一章-计量资料的统计描述_第4页
医学统计学课件--第一章-计量资料的统计描述_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020/6/1,医学统计学,第一篇基本统计方法,第一章计量资料的统计描述第二军医大学卫生统计学教研室孟虹,2020/6/1,医学统计学,本章的内容和重点,第一节频数分布第二节集中趋势的描述第三节离散趋势的描述第四节正态分布第五节医学参考值的制定重点:掌握概念、方法的用途和适用条件熟悉统计符号和公式,2020/6/1,医学统计学,统计描述的意义,社会活动看似杂乱无章,对个体来说有很多不确定性,但总体上都是服从一些统计规律的。医学工作有很多数据,统计学描述就是对这些数据进行加工和提炼,找出规律、预测未知。统计描述是最简洁有力的语言。,2020/6/1,医学统计学,第二章计量资料的统计描述,概念:即用少量几个统计指标刻画出原始数据的特征称为统计描述。计量资料的统计描述方法:(单变量)1.通过频数表描述数据特征2.用统计指标定量描述数据的特征。,2020/6/1,医学统计学,表100例高血压患者治疗后临床记录,编号年龄性别治疗组舒张压体温疗效X1X2X3X4X5X6137男A11.2737.5显效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效10054男B16.8037.6无效,2020/6/1,医学统计学,第一节频数分布,一、频数分布表频数分布表:将变量值分为不同数量的组段,清点各组段的例数。意义:概括了解变量值在各组段的分布和规律。例:表2-1,2020/6/1,医学统计学,例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果,2020/6/1,医学统计学,计量资料频数表的编制步骤,例2-1数据1.确定全距(R)=最大值最小值2.定组数(8-15组)和组距:例:3.36/10=0.3360.33.写出组段的下限:第1组段值小于或等于最小变量值,并以整数(0,5或2,4,6,8)较好。如2.34.划计并计数:变量(x)归为LxU(见表2-1),组距(i)=全距(R)/组数,2020/6/1,医学统计学,表2-1101名正常成年女性血清总胆固醇频数表,组段频数(f)f(%)2.3-11.02.6-33.02.9-66.03.2-88.03.5-1717.03.8-2020.04.1-1717.04.4-1212.04.7-99.05.0-55.05.3-22.05.6-5.911.0合计101100.0,2020/6/1,医学统计学,二频数表及分布图的用途,1.通过频数表了解数据的分布特征。X值分布情况:偏态或正态分布取值情况:变量值取值范围集中趋势:变量值集中位置。2.便于发现资料中的可疑值。3.组段的频率作为概率的估计。,2020/6/1,医学统计学,例:表2-1资料频数分布图直方图,图2-1101名正常成年女性血清总胆固醇频数分布,频数,血清总胆固醇,正态分布,2020/6/1,医学统计学,图2-259名链球菌咽喉炎患者潜伏期,正偏态分布,2020/6/1,医学统计学,讲义表2-4数据,图2-3负偏态分布,2020/6/1,医学统计学,例:某院出院患者住院天数的频数表,组段(天)频数(f)0-65-2110-1415-1320-625-230-335-140及以上13合计79,2020/6/1,医学统计学,第二节集中趋势的描述,平均数指标的概念和作用概念:平均数表示一组同质计量数据集中趋势的位置和平均水平。作用:是一组计量数据平均水平的代表值;可作为不同组间的比较值。医学中常用的平均数指标有:算数均数、几何均数、中位数,2020/6/1,医学统计学,一、算术均数(mean)简称均数,用表示.,公式适用频数为正态或近似正态分布的计量资料.,基本公式(2-1,2-2),加权法公式(例数多),适用条件,2020/6/1,医学统计学,表2-1101名正常成年女性血清总胆固醇频数表,组段频数(f)组中值XfX2.3-12.452.452.6-32.758.252.9-63.0518.303.2-83.353.5-173.653.8-203.954.1-174.254.4-124.554.7-94.855.0-55.155.3-25.455.6-5.915.75合计101409.7,2020/6/1,医学统计学,加权法公式计算,频数(f)作为X值的权数,2020/6/1,医学统计学,二、几何均数(Geometricmean),适用条件:X值呈倍数增长或部分数据偏离过大偏态分布(正偏态)资料。计算公式:,直接法,例数较少用(2-3),加权法,(2-4),或,2020/6/1,医学统计学,例2-4某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度分别为1/10,1/20,1/40,1/80,1/160,求几何均数。,结论:平均抗体滴度为1:34(几何均数法),2020/6/1,医学统计学,表2-569例RA患者血清EBV-lgG抗体测定结果,2020/6/1,医学统计学,几何均数计算,例2-5:例数合计,结论:69例RA患者血清EBV-lgG抗体平均滴度为1:150.6,2020/6/1,医学统计学,三、中位数和百分位数,(一)中位数(Median,M):适用于描述偏态分布资料的平均水平。如潜伏期、病程资料。计算定义:将一组变量值由小到大依次排列,居以中间位次的观察值即为中位数,为这组数据的平均数。X:5,5,6,7,20(d)位次12345,2020/6/1,医学统计学,中位数的计算,1.例数较少(公式2-5,2-6),n为偶数,n为奇数,中位数优点:不受数据中极大或极小值的影响,取决于中间位置的数。,2020/6/1,医学统计学,(二)百分位数,百分位数(percentile)是一种位置指标,用表示。例计算定义:将一组变量值由小到大依次排列,为第x百分位数的秩次,其对应的变量值(x)为第x百分位数,记为Px。,X:1581048.105秩次123450100 x%1%2%3%4%50%100%,一组数据(n=100),由小到大排列,例:,2020/6/1,医学统计学,百分位数计算方法,1.直接法(不要求)将样本值由小到大排队,用确定Px的位次和PX。当为带有小数位时用式2.7:当为整数时用式2.8,trunc(a)表示对数字取其整数。,式2.8,式2.7,2020/6/1,医学统计学,例:8位患者某病的住院天数:22233456求50%位数和80%位数。解:第50%位次:nX%=80.5=4,用式2.8中位数=P50=3(天)第80%位次:nX%=80.8=6.4,用公式2.7,2020/6/1,医学统计学,2.频数表法(例数较多),Lx:第X%位数所在组段的下限值ix:第X%位数所在组段的组距fx:第X%位数所在组段的频数:第X%位数所在组段上个组段的累计频数,式中:,(2-9),2020/6/1,医学统计学,表2-5118名链球菌咽喉炎患者的潜伏期,中位数所在组段,2020/6/1,医学统计学,计算频数表资料P25、P50和P95,1.计算x=25%和50%的位次,2.按公式2-9计算Px,2020/6/1,医学统计学,百分位数计算结果的应用,1.常计算P25、P50、P75、和P95,为临床治疗提供依据。例2-9:120名细菌性痢疾治愈的住院天数P5=3.5(天),即只有5%的人住院低于3.5天。P95=15(天)2.确定医学指标的参考值,2020/6/1,医学统计学,如P25=39.2天,P50=51天(中位数),118名链球菌咽喉炎患者的潜伏期,2020/6/1,医学统计学,第三节、离散趋势的描述,描述计量资料数据间离散(变异)程度的指标变异指标,2020/6/1,医学统计学,例2-11三组同龄男孩的身高(cm),R甲组909510010511010020乙组96981001021041008丙组96991001011041008,三组男孩身高值的变异一样吗?,2020/6/1,医学统计学,三个指标测定值分布变异不同,变异的大小反映某组指标的稳定性,2020/6/1,医学统计学,几个常用的变异指标,一、极差(Range):用(R)表示即R=最大值最小值意义:R值越大,表示该组数据的变异越大。缺点:数据利用不全,部分信息损失,在例数少时结果不稳定。,极差、四分位数间距、方差、标准差、变异系数,2020/6/1,医学统计学,二、四分位数间距(quartilerange),四分位数间距:常用QR表示常计算:QR=P75%-P25%作为变异指标比极差稳定。常用于表示偏态分布资料的变异。例:QR=P75%-P25%=67.739.2=28.5天表示方法:Md(QR)M=51天,(QR=28.5天),2020/6/1,医学统计学,三、标准差和方差(Standarddeviationandvariance),公式,总体方差(2),(2-11),(2-12),总体标准差(),样本标准差(s),(2-13),2020/6/1,医学统计学,标准差的简化计算公式:,(2-14)例数较少,(2-15)频数表资料,2020/6/1,医学统计学,例2-11甲组5名同龄男孩的身高值(cm),XX2908100959025100100001051102511012100,标准差的计算,2020/6/1,医学统计学,表2-1101名正常女子血清胆固醇值,409.751705.09,合计,101,2020/6/1,医学统计学,统计描述:某地101名正常女子血清胆固醇值平均为4.06(mmol/L),标准差为0.654(mmol/L),2020/6/1,医学统计学,例2-10三组同龄男孩的身高值(cm)RS甲组9095100105110100207.91乙组969810010210410083.16丙组969910010110410082.92标准差的意义:反映一组变量值变异程度,组间单位相同时,S越小,表示数据的变异程度越小。,2020/6/1,医学统计学,四、变异系数(CV),应用:1.组间单位不同时变异程度的比较。,2.比较组单位相同,但均数相差悬殊的组间变异程度.,意义:CV越大,表示数据变异越大。常用于衡量方法、仪器的精密度。,公式:,(2-16),2020/6/1,医学统计学,1.单位不同时组间变异程度的比较。,某地7岁年龄组男童身高与体重指标SCV(%)身高(cm)123.104.713.83体重(kg)22.292.2610.14结论:7岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标。,2020/6/1,医学统计学,某地不同年龄组男童身高(cm)年龄组SCV%1-2月56.32.13.735-6月66.52.23.313-3.5岁96.13.13.225-5.5岁107.83.33.06结论:随着年龄增加,身高的变异变小。,2.比较组单位相同,但均数相差悬殊的组间变异程度比较,2020/6/1,医学统计学,计量数据的统计描述小结,1.在医学杂志中正态或近似正态的资料,常以的形式表达,描述和比较数据的平均水平和离散程度。两组患者年龄(岁)的比较组别n范围值试验组1245.93.735-57对照组1050.513.018-83两组患者基线情况的比较,2020/6/1,医学统计学,2.偏态分布或特定资料(生存时间、病程、潜伏期时间等)1)用中位数和四分位间距描述。表达形式:M,四分位数间距(QR)例2-9:118名链球菌咽喉炎患者的中位潜伏期为51天,QR为28.5天。2)用百分位数的P25%、P50%、P75%描述分布位置。,2020/6/1,医学统计学,3.等比数据和正偏态数据可用几何均数和几何标准差描述表达形式:GSG,2020/6/1,医学统计学,SHIFT第二功能键MODE计算模式选择键LR计算相关回归选择键SD统计功能选择键Min单独数据储存键MR取出储存数据键Kin(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论