医学统计学 第02章 定量数据的统计描述 学习课件_第1页
医学统计学 第02章 定量数据的统计描述 学习课件_第2页
医学统计学 第02章 定量数据的统计描述 学习课件_第3页
医学统计学 第02章 定量数据的统计描述 学习课件_第4页
医学统计学 第02章 定量数据的统计描述 学习课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章定量数据的统计描述第一节频数分布频数:某个测量值的个(例)数。频数表(frequencytable):是列出原始数据值的可能区间及各个区间的频数。一、频数表的编制例2-1

抽样调查某地120名18岁~35岁健康男性居民血清铁含量(μmol/L),数据如下:7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52手工编制频数表步骤:(1)找出最小值和最大值(2)计算最大值与最小值之差

R=最大值-最小值

=29.64-7.42=22.22(μmol/L)(3)确定组数与组距:

组段数一般可在10~15之间选择。组距=R/预计的组段数。本例如果预计取12个组段,则组距长度约为22.22/10=2.222,取整数2。(4)列表划记列出组段,要求第一组包括最小值,最后一组包括最大值;各组段不能重叠,故每一组段均为半开半闭区间。

6~表示[6,8)。最后一组应写出上限和下限。最终经过整理的频数表MQ二、直方图(histogram)频数分布特征及类型1、频数分布的两个特征:集中水平离散程度2、频数分布的类型:对称分布偏态分布:

正偏态:集中位置偏向小的一侧,长尾向右侧延伸负偏态:集中位置偏向大的一侧,长尾向左侧延伸三、频数表的用途1、陈述资料的重要形式;2、揭示资料的分布类型;3、便于发现可疑的特大值和特小值;4、便于手工计算某些统计指标。第二节集中趋势的指标请问:以下两组同学的成绩是否相同?甲组5060708090乙组6065707580因此应该从集中水平和离散程度两个方面进行描述描述集中位置或平均水平的统计指标描述集中位置或平均水平的常用指标:算术均数(mean)几何均数(geometricmean)中位数(median)统称为平均数(average)1、算术均数,Mean,简称均数适用范围:适合描述对称分布资料的集中位置或平均水平

表示符号:(mu,总体)(x-bar,样本)

计算公式:例2-2测得8只正常大鼠血清总酸性磷酸酶的含量(U/L)为:

4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38试求其算术均数。算术均数=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075(U/L)(2)加权法:说明:fi:表示Xi的权重根据频数表利用加权法计算的均数是一种近似结果表2-2加权法计算均数组段组中值(XO)ffXO(1)(2)(3)(4)=(2)(3)6~7178~932710~1166612~13810414~151218016~172034018~192751320~211837822~231227624~25820026~27410828~3029129合计1202228加权均数=2228/120=18.57直接法均数=18.612、几何均数(GeometricMean)表示符号:G适用范围:适用于观察值变化范围跨越多个数量级的资料,一般为等比资料,经对数转换后呈对称分布的资料。在医学研究中常见的如抗体滴度、效价等。计算公式例2-37名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。3、中位数(Median,M)含义:指将一组观察值从小到大排序后,位置居中的那个值。表示符号:M计算公式:n为奇数:n为偶数:适用范围:可用于各种分布的定量资料,但主要用于偏态分布资料、或有不确定数值资料百分位数(percentile,Px)含义:百分位数PX是一个数值。该数值将一组资料的全部观察值分为两部分,有x%的观察值比PX小,有(100-x)%的观察值比PX大。显然,中位数就是x=50时的百分位数P50从表2-1可判断出位于“18-”这个组段。将相应数据代入式(2-7)请确定P75计算式中的相关数据?例2-4试利用表2-1的频数表求例2-1中血清铁含量的中位数。该组血清铁资料的中位数为18.74(μmol/L)百分位数的应用(了解)描述资料的观察值序列在某百分位置的水平

例如P50就是中位数,描述集中位置多个百分位数相结合可以用来说明一特定的问题

离散程度:Q

参考值范围:P2.5~P97.5

资料划分等级:P5,P25,P75,P95第三节变异程度的统计指标上一节的一个例子请问:以下两组同学的成绩是否相同?甲组5060708090乙组6065707580甲组的平均分为70分,中位成绩70分;乙组的平均分为70分,中位成绩70分。但两组成绩是有差异的。

因此仅仅描述集中水平还不全面,还应该描述两组数据的离散程度常用的描述变异程度(离散趋势)的统计指标有:(1)极差(2)四分位数间距(3)方差(4)标准差(5)变异系数第一节衡量变异程度的指标

1、极差(Range,R)定义:一组数据中最大值与最小值之差。特点:简单、稳定性较差。用途:粗略反映一组数据的变异大小。定义:Q=P75-P25

其中,P75称为上四分位数P25称为下四分位数特点:类似极差,比极差稳定,但仍未考虑每个观察值用途:一般与中位数一起描述偏态分布资料的分布特征。四分位数间距越大说明数据的变异越大。

2、四分位数间距(QuartileRange,Q)定义:

3、方差(Variance)特点:全面反映一组数据的平均变异水平、度量单位与原指标不同。

其值越大,则变异程度越大。用途:常用于描述对称分布资料变异程度样本方差:

分母

n-1称为自由度(degreeoffreedom,简记df),即在所有的n个离均差平方和中,只有n-1个是独立的。由于样本均数的限制,在所有离均差平方项中只要有n-1个已知,剩下的一项便自动确定。

自由度这一概念在统计学中会经常用到。定义:方差的算术平方根。

4、标准差(StandardDeviation,S或SD)特点:同方差、但度量单位与原指标相同、使用更广泛。

其值越大,则变异程度越大。用途:同方差,描述对称分析资料变异程度例2-6a

分别计算例2-6中两患者数据的标准差。

按照公式(2-11)与标准差的定义

甲患者

乙患者

说明甲患者的血压波动比乙患者波动大定义:

5、变异系数(Coefficientof

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论