医学统计学02个体变异.ppt_第1页
医学统计学02个体变异.ppt_第2页
医学统计学02个体变异.ppt_第3页
医学统计学02个体变异.ppt_第4页
医学统计学02个体变异.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,复习和回顾-绪论,什么是统计学?什么是医学统计学?为什么要学医学统计学?医学研究的三个步骤统计资料的类型一些重要的基本概念如何学好医学统计学?培养医学统计学思维,2,研究数据的收集、整理、分析的一门学科。Statisticsisthesciencedealingwiththecollections,analysis,interpretationandpresentationofmassesofnumericaldata.(Webster国际大词典)Statisticsisthescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresult.,统计学是什么?WhatisStatistics?,3,医学统计学,医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。,4,医学研究的三个步骤,1.研究设计,3.结论,2.资料分析,统计学推断,专业推断,结合,假设,实验或调查获得数据,运用医学统计学的起点,也是高质量地完成整个研究的重要基础。,在数据分析的基础上,应用统计学处理的结果,进行统计学推断;同时,依据相应的专业知识,作出专业性的结论。,在研究设计基础上,通过实验(试验)或调查,将所得数据进行统计学处理的过程。,5,第一种分类(三类资料),(1)定量资料(quantitativedata)(2)定性资料(qualitativedata)(3)等级资料(rankeddata,ordinaldata),6,数值变量资料(numericalvariable)分类资料(categoricalvariable),第二种分类(两类资料),7,数学上的分类,连续性资料(continuousdata)离散型资料(discretedata),8,一些重要的基本概念,1.同质和异质2.变异3.总体与样本4.随机5.参数和统计量6.频率和概率7.抽样误差,9,医学统计学思维,归纳型思维推理型思维从样本到总体从个别到一般,个体变异(individualvariation),因为变异,世界才变得如此丰富多彩!,11,Outline,个体变异频数分布表和频数分布图频数图和频数表的信息资料的统计描述描述集中趋势的指标:平均数描述离散趋势的指标:变异度正确应用总结,12,个体变异,个体变异(individualvariation)是同质观察对象间表现出的差异。变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。就每个观察单位而言,其观察指标的变异是不可预测的,或者说是随机的(random)。就总体而言,个体变异是有规律的。,13,个体变异是统计学应用的前提,个体变异,抽样误差,统计推断,14,例1:个体变异的表现,某地所有20岁健康男生的血红蛋白某地所有20岁健康男生和女生的血红蛋白江苏和西藏所有20岁健康男生的血红蛋白某地所有20岁健康男生和女生的白细胞计数,15,个体变异,生物体的变异是普遍存在的,是客观事实,无法准确预测。这种变异是有规律的,是可以认识的。,16,HeterogeneityorIndividualvariation?,Thereare1.23%differentchromosomesbetweenhumanandjocko.(Science,2002),17,例2:乱七八糟的原始数据,某市1997年12岁男童120人的身高(cm)资料如下。142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9,18,频数分布,原因:由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。现状:医学研究得到的原始数据(rawdata)往往是庞大的、混乱的。解决:频数分布的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组的频数,得到频数分布表;在将频数表绘制成频数分布图。,19,频数表的编制,找出极大值和极小值,并计算极差R此例R=160.9-125.9=35依R分组,确定组数组距组段,常取8-15组,用1/10R取整作组距。这里取4计算频数,20,计量资料的频数、频率分布,组段频数频率12410.008312820.0167132100.0833136220.1834140370.3083144260.2167148150.125015240.033315620.016716010.0083合计1201.0000,21,计量资料的频数分布,xFreq.1241*1282*13210*13622*14037*14426*14815*1524*1562*1601*Total120,22,124128132136140144148152156160,计量资料的频数分布,23,计量资料的频数分布图,24,计量资料的频数分布图,图某市120名12岁男童身高的频数分布,25,定性资料的频数分布,血型频数频率(%)O20540.43A11222.09B15029.59AB407.89合计507100.00,表507名傣族人血型的频数分布,26,分类资料的频数分布图,O,A,B,AB,27,EXCEL制作的频数图,血型,人数,图507名傣族人血型的频数分布,28,EXCEL制作的频率图,血型,比例,图507名傣族人血型的频率分布,29,频数分布与频率分布,频数(率)分布用于表达观察指标的分布规律。分布规律:变异规律。,30,频数分布所提供的信息,频数分布图用以表示数据的分布规律考察分布的类型对称分布非对称分布skewness(偏态分布)左偏态(负偏态)右偏态(正偏态)“偏”是偏离的意思,表示个别观察值偏离均数较远,而不是“集中位置偏”;“正偏”是指个别数据偏在均数右侧,其与均数之差为“正”;“负偏”是指个别数据偏在均数左侧,其与均数之差为“负”;正偏分布的偏度系数为正,负偏分布的偏度系数为负。,31,频数(率)分布实例(对称分布),32,频数(率)分布实例(偏态分布1),正(右)偏态分布,33,频数(率)分布实例(偏态分布2),负(左)偏态分布,34,频数(率)分布实例(偏态分布3),正(右)偏态分布,35,图某地19901992年男性死亡年龄分布,频数(率)分布实例(偏态分布4),36,偏态,正偏态和负偏态,分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。,37,定量资料的描述,图形描述频数(率)分布图趋势图定量资料的统计指标描述集中位置:算术均数、加权平均数、几何均数、中位数、百分位数离散程度:极差、四分位数间距、标准差、方差、变异系数,38,描述集中位置的指标,平均数(Average),算术均数和加权均数(MeanandWeightedMean),几何均数(GeometricMean),中位数和百分位数(MedianandPercentile),39,集中位置的描述-平均数(1),算术均数(arithmeticmean,mean)简称均数(mean),是用得最多的统计描述指标。,40,总体均数thepopulationmean,样本均数thesamplemean,41,例:11名五岁女童身高值(cm)分别为:112.9,99.5,100.7,101.0,112.1,118.7,107.9,108.1,99.1,104.8,116.5,求平均身高。,42,加权均数(weightedmean)均数是加权均数的一个特例,加权均数,43,均数的应用:,1、均数能全面反映全部观察值的平均数量水平,应用甚广。2、最适于对称分布资料,对于偏态资料,均数不能较好地反映其集中趋势。3、在描述正态分布资料方面有重要意义,44,平均数(2),几何均数(geometricmean,G),45,几何均数例,1:10,1:20,1:40,1:80,1:160,46,几何均数的应用:,1.等比资料,如抗体平均滴度,2.对数正态分布资料,Remember!,47,使用几何均数时的注意点:,1)观察值不能有0。,2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。,Becareful!,48,平均数(3),中位数(median,M)指将一组观察值从小到大按顺序排列,位次居中的观察值,常用M表示。,中位数计算方法:,49,例:某病患者5人,其潜伏期分别为2,3,5,8,20,求中位数?,n=5,Mx3=5(天),例:8名新生儿身长(cm)依次为50,51,52,53,54,55,58,求中位数?,n=8,M(x4x5)/2=(53+54)/2=53.5(cm),中位数例,50,中位数例,9例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.5,9例正常人的发汞值:1.1,1.83.54.24.85.65.97.116,10例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.516,M=4.8,M=4.8,M=(4.8+5.6)/2=5.2,51,中位数例,对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人,6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。本资料属于“开口”资料。本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。,52,平均数(3),百分位数(percentile)是一个位置单位,以Px表示,一个Px将总体或样本的全部观察值分为两部分。理论上有x的观察值比它小,有(100-x)%的观察值比它大.X%PX(100-X)%50%分位数就是中位数25%,75%分位数称四分位数(quartile),53,中位数和百分位数的应用,1、中位数和百分位数的计算对资料分布没有特殊要求。偏态分布;分布不规则或未知分布;一端或两端有不确定数据(开口资料)2、样本含量较少时不宜用靠近两端的百分位数来估计频数分布范围;因为在例数较少时,靠近两端的百分数不够稳定。3、中位数比均数具有较好的稳定性。但是,由于只采纳了数据的相对大小的信息,不够精确。,54,平均数应用的注意事项,同质的资料计算平均数才有意义。算术均数适用于:单峰对称分布的资料几何均数适用于:对数变换后单峰对称的资料中位数和百分位数适用于:偏态分布资料,分布类型未知的资料,有极端值和不确定值的资料,55,例3只用平均数描述资料的弊病,甲组2629303134乙组2427303336丙组2628303234,均数30kg,56,描述离散趋势的指标,57,全距(range),极差R=max-min,优点:简单方便,缺点:不灵敏除了最大、最小值,不能反应组内其他数据的变异。不稳定两样本例数相差旋殊,不适用全距比较变异度。,离散程度的描述指标(1),58,四分位数间距:quartile,P75上四分位数,P25下四分位数,QU,QL,离散程度的描述指标(2),59,MinQLMQUMax,极差,四分位数间距,60,总体方差2=在样本中,未知,常用替代,S2=,方差(variance),离散程度的描述指标(3),61,总体标准差=样本标准差,n-1:自由度(degreeoffreedom),任何统计量的自由度=变量数-限制条件的个数,离散程度的描述指标(4),标准差(standarddeviation),62,甲组2629303134乙组2427303336丙组2628303234极差方差标准差甲组88.502.92乙组1222.504.74丙组810.003.16,离散度比较,63,排除了平均水平的影响,并取消了单位。因此变异系数常用于:比较度量衡单位不同的两组或多组资料的变异度比较均数相差悬殊的两组或多组资料的变异度,离散程度的描述指标(5),变异系数(coefficientofvariation,CV),64,某地100名20岁男子身高:平均166.06cm,标准差4.95cm体重:平均53.72kg,标准差4.96kg,不同指标间变异度的比较,65,不同指标间变异度的比较,66,均数相差悬殊资料的变异度,例:某地不同年龄女童的身高资料如下,比较不同年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论