预防医学-计量资料的统计描述-课件_第1页
预防医学-计量资料的统计描述-课件_第2页
预防医学-计量资料的统计描述-课件_第3页
预防医学-计量资料的统计描述-课件_第4页
预防医学-计量资料的统计描述-课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数值变量资料(计量

资料)的统计描述1PPT课件集中趋势指标算术均数、几何均数、中位数离散趋势指标全距、四分位数间距、方差、标准差和变异系数正态分布特征、曲线下面积分布规律医学参考值范围估计2PPT课件第一节集中趋势指标3PPT课件一、算术均数

(arithmeticmean)

1.适用资料:算术均数简称为均数(mean),适用于正态分布或近似正态分布资料。2.符号:样本均数x,总体均数μ。3.计算:⑴直接法⑵加权法

4PPT课件5PPT课件

频数分布表

(frequencydistributiontable)

将计量资料的变量值进行分组,则某组段所包含的变量值的个数称为频数,以f表示。由频数表的频数分布可以看出两个重要特征:集中趋势和离散趋势。可以根据频数分布的不同类型,选择适当的统计方法,进行计算与分析。

6PPT课件110名20岁健康男大学生身高(cm)的频数分布

身高组段(1)划记(2)频数f(3)

162~1164~4166~9168~13170~19172~27174~16176~8178~8180~3182~1842

合计

1107PPT课件编制频数表的步骤1.求全距(R)。

R=最大值-最小值2.定组段和组距。一般设8-13个组段。各组段的起点和终点分别称为下限和上限。组中值=1/2(下限+上限)。组距为相邻两组段的下限差。组距≈R/10.

注意:第一组段应包含最小值,最末组段应包含最大值并写出其下限和上限值。3.列出频数表。采用划记法或计算机汇总。.8PPT课件110名20岁健康男大学生身高(cm)均数计算表(加权法)

身高组段

组中值x频数ffx

(1)(2)(3)(4)=(2)×(3)

162~1631163164~1654660166~16791503168~169132197170~171193249172~173274671174~17516280017617981432180~1813543182~1841832366

合计

110(Σf)19000(Σfx)

9PPT课件二、几何均数

(geometricmean)

1.适用资料:⑴等比级数资料⑵对数正态分布资料,即变量值的频数分布呈偏态分布,但经过对数转换后呈正态分布2.符号:用G表示3.计算:⑴直接法⑵加权法

10PPT课件11PPT课件

平均抗体滴度计算表

抗体滴度人数f滴度倒数xlgx

flgx

(1)(2)(3)(4)(5)=(2)×(4)1:8280.90311.80621:166161.20417.22461:325321.50517.52551:6410641.806218.06201:12841282.10728.42881:25622562.40824.81641:51215122.70932.7093

合计30(Σf)50.572812PPT课件应用几何均数注意事项

1、几何均数常用于等比级数资料,如抗体平均滴度和药物平均效价、卫生事业平均发展速度、人口的几何增长等,或用于对数正态分布资料;2、观察值不能有0,因为0不能取对数,不能与任何其它数呈倍数关系;3、观察值不能同时有正值和负值。若全是负值,计算时可把负号去掉,得出结果后再加上负号。

13PPT课件三、中位数(median)

1.定义:把n个变量值由小到大顺序排列,位次居中的变量值称为中位数。2.适用资料:⑴偏态分布资料⑵资料分布的末端无确切数据的开口资料⑶分布类型不清3.符号:用M表示。中位数是一个特定的百分位数P50。14PPT课件4.计算:

⑴直接法⑵频数表法频数表法计算公式:

M=L+i/f(n/2-∑fL)15PPT课件164名食物中毒潜伏期的

中位数和百分位数计算表

潜伏期(小时)人数f累积频数(Σf)累积频率(%)

(1)

(2)

(3)

(4)=(3)/n0~252515.212~588350.624~4012375.036~2314389.048~1215896.360~516399.472~841164100.016PPT课件

百分位数percentile)

1.定义:把n个变量值由小到大顺序排列,第x百分位次相对应的变量值称为第x百分位数。2.符号:以Px表示。3.意义:一个百分位数将总体或样本的全部变量值分为两部分,理论上有x%的变量值比它小,有(100%-x%)的变量值比它大。但样本含量过少,计算的百分位数误差较大,不稳定,宜慎用。17PPT课件4.应用:⑴常用以描述一组偏态分布资料在某百分位置上的水平。⑵确定偏态分布资料的医学参考值范围。5.计算:

18PPT课件第二节离散趋势指标19PPT课件一、全距(range)1.符号:R2.计算:R=最大值-最小值3.优点:简单明了4.缺点:不能反映组内所有数据的变异度,并易受个别特大或特小值的影响。样本含量越大,其抽样误差越大。20PPT课件二、四分位数间距

(quartileinterval)

1.适用资料:⑴偏态分布资料,⑵资料分布的末端无确切数据的开口资料2.符号:记作Q,3.计算:Q=P75-P25,Qu上四分位数,QL下四分位数4.意义:即其间包含了50%的变量值。此间距越大,变量值的离散趋势越大。5.优缺点:比极差稳定,但仍未考虑到每个观察值的变异度。21PPT课件三、方差(variance)

标准差

(standarddeviation)

1.适用资料:正态分布或近似正态分布资料。2.符号:样本S/S2,总体σ/σ2。3.意义:当两组或多组资料进行比较时,若各组均数相近,度量衡单位相同的条件下,标准差小,说明变量值围绕在均数的周围,变异度小;反之,标准差大,说明变量值远离均数,变异度大。4.计算:⑴直接法⑵加权法22PPT课件23PPT课件24PPT课件5.标准差的应用⑴描述正态分布资料的离散趋势或变异程度及样本均数的代表性,文献中表示为:X±S或X±SD;结合均数计算变异系数:

CV(%)=S/X×100%;⑵结合均数描述正态分布的基本特征,可以概括地估计变量值的频数分布;⑶标准差与均数相结合,按照正态分布的规律性,制定医学正常值范围:正态分布法(包括对数正态分布法),双侧正常值范围:单侧正常值范围:;⑷标准差结合样本含量n计算均数的标准误,或估计值。25PPT课件四、变异系数

(coefficientofvariation)

1.适用资料:正态分布或近似正态分布资料2.符号:以CV表示。3.应用条件:⑴变量度量衡单位不同⑵均数相差悬殊用来比较两组或多组资料的变异程度大小4.计算:CV=S/X×100%26PPT课件第三节正态分布

(normaldistribution)

27PPT课件

一、正态分布曲线(normaldistributioncurve)

28PPT课件频数分布逐渐接近正态分布示意图

29PPT课件简称正态曲线(normalcurve),是一条高峰位于中央(均数所在处),两侧完全对称,而且逐渐降低,但永远不与横轴相交的钟型曲线。横轴上曲线下的总面积为100%或1,其面积分布有一定的规律性。

30PPT课件二、正态分布的图形又称Gauss分布,是医学上和生物界常见的总体分布。是指变量值以均数为中心,左右两侧完全对称,靠近均数两侧的频数较多,而远离均数两侧的频数逐渐减少。

正态曲线是有固定函数式的一条曲线。为了应用方便,进行变量变换,正态分布就变换为标准正态分布。31PPT课件标准正态变换u=(x-μ)/σ标准正态分布的μ=0,σ=1。32PPT课件正态分布与标准正态分布的面积与纵高

33PPT课件二、正态分布的特征1.正态曲线在横轴上方均数处最高2.正态分布以均数为中心,左右对称3.正态分布有两个参数,即均数μ和标准差σ,正态分布记作N(μσ2),N(0,1)表示标准正态分布。4.正态曲线下的面积分布有一定规律。34PPT课件三、正态曲线下面积分布规律1.正态曲线下面积的意义:表示该区间(X1,X2)包含的观察例数占总例数的百分数或变量值落在该区间的概率。2.查表求面积时注意:⑴表中曲线下面积为-∞到u的面积;⑵当μ、σ已知时,先进行变量变换求得u值,再查表;⑶当μ、σ未知且样本含量足够大时,可用X和S分别代替μ和σ,求得u的估计值,再查表。⑷曲线下对称于0的区间面积相等;⑸曲线下横轴上的总面积为100%或1。35PPT课件正态曲线与标准正态曲线的面积分布规律

36PPT课件3.正态曲线下面积的分布规律正态曲线标准正态曲线面积X±1σ–1,1

68.27%X±1.96σ–1.96,1.96

95.00%X±2.58σ–2.58,2.58

99.00%37PPT课件u分布曲线

(u-distributioncurve)

又称标准正态分布曲线,是与正态分布曲线相似的一条曲线。即高峰位于中央(均数为0处),两侧完全对称,而且逐渐降低的,但永远不与横轴相交的钟型曲线。横轴上曲线下的总面积等于100%或1。其面积的分布规律是:u值在±1之间的面积占总面积的68.27%,u值在±1.96之间的面积占总面积的95%,u值在±2.58之间的面积占总面积的99%。38PPT课件第四节医学参考值的估计(referencerange)39PPT课件一、概念又称正常值(normalvalue)范围是指大多数处于相同生理状态下的“正常人”(或“正常动物”)的某项指标(形态、机能及代谢产物等)数值变化波动的范围。由于正常个体间存在变异、机体内外环境改变,时间、地点、条件的不同,使这些生理指标有一定的波动范围,因此,实际应用中,一般采用正常值范围(normalrange)。

40PPT课件二、用途1.划分正常与异常的界限。如作诊断指标。2.

反映某人群的某项指标的动态变化。如某地不同时期发汞值的正常范围可反映环境污染的变化或环境保护的效果。

41PPT课件三确定医学参考值范围的方法1.确定一批样本含量足够大的“正常人”或动物作为研究对象。

“正常人”不是指机体任何器官、组织的形态及机能都正常的人,而是指排除了影响所研究指标的疾病和有关因素对所研究指标的影响的同质人群。2.统一和准确的测定。测定的方法、仪器、试剂、操作的熟练程度、方法的精确程度等都要统一,以控制检测误差。42PPT课件3.确定分组。原则上组间差别明显且有实际意义者分开,否则可分开。4.根据指标的实际用途确定单、双侧。5.选定适当的百分界限。6.根据资料的分布特点,选用恰当的界值计算方法。

43PPT课件四常用参考值范围估计方法95%正常值范围:同质总体中包含95%的个体值所在的范围。1.正态分布法:适用于正态或近似正态分布资料。双侧:X±1.96S,

单侧:X+1.645S或X–1.645S2.对数正常分布法:适用于对数正态分布资料。双侧:Lg–1(XlgX±1.96SlgX)

单侧:Lg–1(XlgX–1.645SlgX)或Lg–1(XlgX+1.645SlgX)3.百分位数法:适用于偏态分布资料。

双侧:P2.5~P97.5。单侧:P95或P5

44PPT课件

200名血铅值对数变换后的频数表xlgx、slgx计算表

真数组段对数组段频数f组中值lgx

flgxf(lgx)2

2.8~0.45~10.50.50.253.5~0.55~50.63.01.804.5~0.65~100.77.04.905.6~0.75~200.816.012.807.1~0.85~110.99.98.918.9~0.95~211.021.021.0011.2~1.05~291.131.935.0914.1~1.15~251.290.036.0017.8~1.25~301.339.050.7022.4~1.35~201.428.039.2028.2~1.45~161.524.036.0035.5~1.55~8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论