医学统计学:统计资料的整理与描述_第1页
医学统计学:统计资料的整理与描述_第2页
医学统计学:统计资料的整理与描述_第3页
医学统计学:统计资料的整理与描述_第4页
医学统计学:统计资料的整理与描述_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Medicalstatistics医学统计学统计资料的整理与描述数值变量资料2023/9/212主要内容

个体变异频数分布表(图)

定量指标的描述集中位置离散趋势总结2023/9/213个体变异(individualvariation)是同质观察对象间表现出的差异。变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。就个体而言:变异是随机的(random)。就总体而言:个体变异是有规律的。2023/9/214原始数据4.095.335.624.635.184.275.073.603.315.324.884.314.125.334.404.793.925.464.815.094.204.133.944.415.264.665.295.235.583.534.544.684.484.404.764.814.574.973.945.484.275.105.785.123.604.014.755.806.015.505.364.184.334.844.744.604.764.584.344.724.813.844.174.853.294.914.454.434.994.494.355.265.045.384.935.414.523.864.994.244.504.924.135.055.145.055.174.555.425.704.676.184.375.404.154.084.714.124.794.89100名成年男性血红细胞计数(1012/L)资料如下:频数分布表和频数分布图原因:由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。解决:频数分布表的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组的频数,得到频数分布表;在将频数表绘制成频数分布图。

2023/9/216频数表编制步骤

求极差选定适当的组段数后估计组距列出组段划记归组获得频数求频率,完成频数表

2023/9/217频数分布表的编制求极差或全距(Range):R=Xmax-XminR=6.18-3.29=2.89选定适当的组段数后估计组距(i)组段数的选取以能反映资料的分布特征为宜一般取8~15组

i=2.89/10=0.289≈0.32023/9/218频数分布表的编制列出组段组段的含义:包括组段的下限而不含组段的上限。如:3.20~等价于[3.20,3.50)第一个组段应包含最小值

最后一个组段应包含最大值2023/9/219频数分布表的编制划记归组获得频数常用的划记方法:“正”;“||||”求频率,完成频数表相应的频数除以总数即为频率各组段的频率总和为1或者100%100名成年男性血红细胞计数频数表组段(1)频数(2)频率(%)(3)3.20~22.003.50~33.003.80~88.004.10~1616.004.40~1818.004.70~2121.005.00~1414.005.30~1212.005.60~44.005.90~6.2022.00合计100100.0011100名成年男子红细胞计数频数图图2.1100名成年男性的血红细胞计数的频数分布

人数血红细胞(1012个/L)3.2

3.5

3.8

4.1

4.4

4.7

5.0

5.3

5.6

5.9

6.2

0

5

10

15

20

2023/9/2112频数分布表和频数分布图的用途

描述分布类型描述分布的特征便于发现特大、特小的可疑值便于计算有关指标、统计分析与处理2023/9/2113频数分布类型对称分布:以正态分布较为常见非对称分布:偏态分布正偏态:右侧>左侧向右侧拖尾 负偏态:左侧>右侧向左侧拖尾

2023/9/2114频数分布特征

数据分布的范围:3.29~6.18

集中位置:中等大小人数居多,向中间集中数据最集中的区间:4.70~5.00

离散趋势:以中等大小的区间为中心,向两侧逐渐减少分布形态:基本对称2023/9/2115图239人发汞含量的频数分布13579111315171921发汞含量(umol/kg)706050403020100人数2023/9/2116图某城市892名老年人生存质量自评分的频数分布0102030405060708090100自评分4003002001000人数2023/9/2117图102名黑色数瘤患者的生存时间频数分布151015202530354045生存时间(月)403020100人数2023/9/2118图某地1990~1992年男性死亡年龄分布

0510152025

303540455055606570758085死亡年龄(岁)250020001500100050002023/9/2119数值变量资料的统计指标集中位置的描述离散趋势的描述2023/9/2120集中位置的描述----平均数(average)均数(arithmeticmean,mean)总体均数样本均数2023/9/2121平均数(average)加权均数(weightedmean)

均数是加权均数的一个特例2023/9/2122平均数(average)几何均数(geometricmean)

2023/9/2123几何均数例1:10,1:20,1:40,1:80,1:1602023/9/2124平均数(average)中位数(median)

将一组数据按从小到大的顺序排列,位置居中的数即是中位数。2023/9/2125中位数例9例正常人的发汞值(

mol/kg):

1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的发汞值:

1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.2

2023/9/2126平均数(average)LP1P2P3P4HP97P98P991%1%1%1%1%1%1%同样有十分位数、四分位数……百分位数(percentile)2023/9/2127

M=P50排序数据:按从小到大顺序排列X%(100-X)%PXHL2023/9/2128平均数应用的注意事项同质的资料计算平均数才有意义根据资料分布的特征选用适当的平均数均数:单峰对称分布的资料几何均数:各变量值之间成倍数关系,分布呈偏态,经对数变换后呈单峰对称分布资料中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数。(偏态分布、不规则分布资料、有不确定值的资料)2023/9/2129平均数应用的注意事项计算几何均数时:变量值中不能有0

同一组变量值不能同时存在正、负值若变量值全为负值,可先将负号除去,算出结果后再冠以负号样本含量较少时不宜计算靠近两端的百分位数

平均数要与变异指标结合使用2023/9/2130看一个例子:有甲、乙两组同性别同年龄儿童体重(kg):甲组26,28,30,32,34=30kgn甲=5

乙组24,27,30,33,36=30kgn乙=5上述两组数据的特点:集中位置相同:均为30kg

离散程度不同:各观察值离均数的远近不同2023/9/2131离散趋势的描述全距(Range)

亦称极差,记为R,是一组变量值中最大值与最小值之差。优点:简单明了缺点:不灵敏、不稳定

2023/9/2132离散趋势的描述四分位数间距(interquartilerange)

定义为:

QL~QU,即中间一半观察值的极差。 四分位数(quartile)是两个特定的百分位数:第25%分位数P25,和第75%分位数P75,分别记为QL和QU。

四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。2023/9/213325%25%25%25%排序数据:按从小到大顺序排列MQLQUinter-quartilerangeQ2Q1Q32023/9/2134离散趋势的描述方差(Variance)和标准差(StandardDeviation)总体均数

未知,用样本均数估计

2023/9/2135标准差“离均差平方之和平均后的方根”“均方根”n-1称为(标准差的)自由度,即“可以自由变异的程度”分子有n项离均差,但只有n-1项独立,根据任一离均差均可以用另外n-1个离均差表示,所以“只有n-1个独立的离均差”。2023/9/2136标准差大:分布分散、不整齐、波动大;标准差小:分布集中、整齐、波动较小。2023/9/2137离散趋势的描述变异系数(coefficientofvariation)亦称离散系数(coefficientofdispersion),是标准差s与均数之比,即:

2023/9/2138变异系数的两个特点及相应的用途

没有单位反映标准差占均数的百分比或标准差是均数的几倍可用来比较度量衡单位不同的资料的变异度

不受平均水平的影响反映的是以均数为基数的相对变异的大小比较均数相差悬殊的资料的变异度

2023/9/2139某地20岁男子100人,身高均数为171.06cm,标准差为4.95cm;体重均数为61.54kg,标准差为5.02kg,试比较身高和体重的变异。

身高体重

2023/9/2140绝对变异受平均水平的影响相对变异排除了平均水平的影响年龄组人数均数标准差变异系数(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5岁30096.13.13.25~5.5岁400107.83.33.14个不同年龄组儿童身高(cm)的变异

2023/9/2141平均数与变异度的关系

平均数表示的集中性与变异度表示的离散性,是从两个不同的角度阐明计量资料的特征变异度越小,平均数对各变量值的代表性越好

变异度越大,平均数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论