医学统计学(第3版)课件 第二章 计量资料的统计描述_第1页
医学统计学(第3版)课件 第二章 计量资料的统计描述_第2页
医学统计学(第3版)课件 第二章 计量资料的统计描述_第3页
医学统计学(第3版)课件 第二章 计量资料的统计描述_第4页
医学统计学(第3版)课件 第二章 计量资料的统计描述_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章计量资料的统计描述医学统计学目录频数分布表与频数分布图1集中趋势的描述2离散趋势的描述3正态分布及应用4频数分布表与频数分布图频数分布表(frequencydistributiontable)简称频数表(frequencytable),当变量值个数较多时,对各变量值出现的频数列表表示,即为频数分布表。频数分布表的图形表示称为频数分布图(frequencydistributiongraph)。

例2.1表2.1是某医院产科某月100个顺产婴儿出生身长的资料(单位:cm),试列出频数分布表。48484742534945504852495746484642495150515642594948524249555351454747475048515153464757454651465147515547524748544754494453544548444842474850555053564950564153534944494845525246545044534947484551455053

表2.1某医院产科某月顺产婴儿出生身长(单位:cm)频数分布表与频数分布图48484742534945504852495746484642495150515642594948524249555351454747475048515153464757454651465147515547524748544754494453544548444842474850555053564950564153534944494845525246545044534947484551455053

频率分布表的编制步骤:计算极差(range,R):也称全距,即数据的最大值和最小值之差。最小值最大值R=59-41=18(cm)频数分布表与频数分布图频率分布表的编制步骤:计算极差(range,R):也称全距,即数据的最大值和最小值之差。

确定组段数与组距:一般取5~15个组段,本例取9个,组距≈全距/组段数。组距=18/9=2频数分布表与频数分布图频率分布表的编制步骤:计算极差(range,R):也称全距,即数据的最大之和最小值之差。

确定组段数与组距:一般取5~15个组段,组距≈全距/组段数。确定各组段的上、下限:下限(lowerlimit):每个组段的起点上限(upperlimit):每个组段的终点频数分布表与频数分布图合计

41~43~45~47~49~51~53~55~57~59

组段①第一组段包含最小值,最后一组包含最大值;②各组段不能重叠,每一组段均为左闭右开的区间,但最后一个组段同时写出上限和下限;③尽量取较整齐的数值作为组段的端点,便于表述;④组距以相等为宜。频数分布表与频数分布图频率分布表的编制步骤:计算极差(range,R):也称全距,即数据的最大值和最小值之差。

确定组段数与组距:一般取5~15个组段,组距≈全距/组段数。确定各组段的上、下限:下限:每个组段的起点上限:每个组段的终点列表频数分布表与频数分布图连续型变量的频数分布图

直方图(histogram)图2.1

100名顺产婴儿出生身长的频数分布图频数分布表与频数分布图对称分布数据分布大致以组段“47~”和“49~”为中心,左右对称。揭示资料的分布类型补图1

100名顺产婴儿出生身长的频数分布图频数分布表与频数分布图补图2某地居民238人发汞含量分布(µmol/kg)右侧拖尾频数分布表与频数分布图补图4120例健康成年男子血清铁含量分布(µmol/L)2.描述分布的集中趋势和离散趋势集中趋势离散趋势离散趋势频数分布表与频数分布图3.便于发现某些特大和特小的可疑值补图5100名健康成年男子发贡含量(µmol/kg)频数分布表与频数分布图平均数(average)指标:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。集中趋势的描述

一组参差不齐的数据具有相同的性质(如:年龄相近、性别相同、同为某病患者等)集中趋势(centraltendency):指某计量资料的大多数观察值所在的中心位置。(一)算术均数(Arithmeticmean)符号:总体均数样本均数意义:数据取值的平均数量水平。适用:对称分布,特别是正态分布计量资料集中趋势的描述。集中趋势的描述

例2.2从例2.1数据中随机抽取一行,计算均数。若取第2行数据,数值为:49,57,46,48,46,42,49,51,50,51(cm)。结论:10名婴儿的平均身长为48.9cm。集中趋势的描述

(二)几何均数(geometricmean)符号:G适用:等比数列资料,或原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。正偏态分布正态分布集中趋势的描述

几何均数:变量对数值的算术均数的反对数几何均数:n个数值的乘积开n次方或者集中趋势的描述

符号:M

Md意义:总体中有一半个体的数值低于这个数,一半个体的数值高于这个数。适用:任何分布类型计量资料集中趋势的描述。(三)中位数(median)集中趋势的描述

n为奇数时n为偶数时从小到大排列后,位置排在第(n+1)/2位将数值从小到大排列集中趋势的描述

离散趋势的描述变异(variation)指标:描述一组计量资料观察值之间参差不齐的程度,即变异程度或离散程度。极差(range)1四分位数间距(quartilerange)2方差(variance)标准差(standarddeviation)3变异系数(coefficientofvariation)4(一)极差(range)符号:R适用:适合于各种分布类型的资料,可以用于资料的粗略分析。样本量接近的同类资料比较时,极差越大意味着数据越离散。minmaxR=max-min离散趋势的描述(二)四分位数间距(quartilerange)

四分位数(quartile):下四分位数Q1=P25

中位数Md=P50

上四分位数Q3=P75min(P0)Q3(P75)Q1(P25)Md(P50)max(P100)Q1Q325%75%25%75%minmaxR=max-min离散趋势的描述(三)方差(variance)符号:总体方差样本方差

S2适用:对称分布计量资料离散程度的描述。离散趋势的描述计算公式:

总体样本数据变异程度越大,方差越大。离均差平方和SumofSquare离散趋势的描述(四)标准差(standarddeviation)总体标准差

样本标准差标准差的单位与原观测值相同;数据变异程度越大,标准差越大。离散趋势的描述正态分布曲线的数学函数表达式:自然对数的底(2.718)总体均数随机变量(-∞<X<+∞)如果随机变量的分布服从该密度函数,则称X服从正态分布,记作X~N(

,

2)。圆周率(3.14)总体标准差正态分布及其应用正态曲线下的面积分布有一定的规律,欲求其一定区间的面积,可通过对正态分布密度函数积分来实现,即:正态分布及其应用x=

50%50%在横轴上方呈钟形分布,两端与X轴永不相交,以x=

为对称轴,左右完全对称;在x=

时,曲线达到最高峰,即f()最大,随着x逐渐远离

,f(x)逐渐减小;正态分布及其应用在x=

±

处有拐点;曲线下面积为1;x=

x=+

x=-

正态分布及其应用正态分布的参数:位置参数

与形态参数

位置参数

增大,曲线右移

减小,曲线左移总体均数

越大,曲线越远离原点;

越小,曲线越接近原点。正态分布及其应用正态分布的参数:位置参数

与形态参数

形态参数

越小,曲线越陡峭越大,曲线越平坦总体标准差越大,变异程度越大,个体值越分散;总体标准差越小,变异程度越小,个体值越集中。正态分布及其应用

正态分布及其应用不同变量的正态分布曲线是不相同的(如:身高值和体重值);参数不同,正态分布的形状、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论