卫生统计学:第2章 计量资料的统计描述_第1页
卫生统计学:第2章 计量资料的统计描述_第2页
卫生统计学:第2章 计量资料的统计描述_第3页
卫生统计学:第2章 计量资料的统计描述_第4页
卫生统计学:第2章 计量资料的统计描述_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 2 1 1、了解频数分布表的绘制、了解频数分布表的绘制 2 2、掌握描述计量资料集中趋势、离散趋势、掌握描述计量资料集中趋势、离散趋势 的常用指标的概念的常用指标的概念 3 3、掌握描述计量资料集中趋势、离散趋势、掌握描述计量资料集中趋势、离散趋势 的常用指标的适用范围与计算的常用指标的适用范围与计算 3 统计描述:利用统计图、统计表、统计描述:利用统计图、统计表、 统计指标等来描述样本资料的特征。统计指标等来描述样本资料的特征。 4 表表1 某医院产科某月顺产婴儿出生体长(某医院产科某月顺产婴儿出生体长(cm) 48484848474742425353494945455050484852

2、52 4949575745454848464642424949515150505151 5656444459594949505052524343494955555353 5151454547474747474750504848515151515353 4646474757574545464651514646515147475151 5555474752524747505054544747545449494444 5353545445454848444448484242474748485050 5555505053535656494950505656414153535353 4949444449

3、494848454552525252464654545050 4444535349494747484845455151454550505353 5 第一节第一节 频数分布表及其用途频数分布表及其用途 计量资料进行描述时,如果样本量较大,计量资料进行描述时,如果样本量较大, 需要对原始资料进行整理,列出频数分布表,需要对原始资料进行整理,列出频数分布表, 通过频数表以显示资料的分布类型。通过频数表以显示资料的分布类型。 6 频数:频数:某个测量值的个(例)数。某个测量值的个(例)数。 频数分布表频数分布表(frequency distribution table):): 又称频数表。又称频数表。

4、是将是将原始数据值适当分组后得到原始数据值适当分组后得到 各组的频数。各组的频数。 适用样本量较大的资料进行统计描述的常适用样本量较大的资料进行统计描述的常 用方法。通过频数表可以显示数据分布的范围用方法。通过频数表可以显示数据分布的范围 与形态。与形态。 可用手工和计算机软件(如可用手工和计算机软件(如SAS、SPSS等)等) 方便制作频数表。方便制作频数表。 7 一、离散型定量资料的频数分布一、离散型定量资料的频数分布 例例2-1: 19981998年某山区年某山区9696名孕妇产前检查次名孕妇产前检查次 数资料如下:数资料如下: 0 0,3 3,2 2,0 0,1 1,5 5,6 6,3

5、 3,2 2,4 4,1 1,0 0,6 6, 5 5,1 1,3 3,3 3,4 4,7 7等共等共96个数值个数值。 8 一、离散型定量变量的频数分布一、离散型定量变量的频数分布 例例2-1 1998年某山区年某山区96名孕妇产前检查次数名孕妇产前检查次数 检查次数检查次数频数频数频率(频率(%)累计频数累计频数累计频率(累计频率(%) 0 4 4.2 4 4.2 1 7 7.3 11 11.5 2 11 11.5 22 22.9 3 13 13.5 35 36.5 4 26 27.1 61 63.5 5 23 24.0 84 87.5 5 12 12.5 96 100.0 合计合计 96

6、 100.0 96 9 图 2-1 某 地 96名 妇 女 产 前 检 查 次 率 分 布 0 5 10 15 20 25 30 0123455 产 前 检 查 次 数 频 率 (%) 图2-1 10 二、连续型定量资料的频数分布二、连续型定量资料的频数分布 例例2-2 抽样调查某地抽样调查某地120名名18岁岁35岁健康男性居民血清铁含量(岁健康男性居民血清铁含量(mol/L) 7.427.428.658.6523.0223.0221.6121.6121.3121.3121.4621.469.979.9722.7322.7314.9414.9420.1820.1821.6221.6223.0

7、723.07 20.3820.388.408.4017.3217.3229.6429.6419.6919.6921.6921.6923.9023.9017.4517.4519.0819.0820.5220.5224.1424.1423.7723.77 18.3618.3623.0423.0424.2224.2224.1324.1321.5321.5311.0911.0918.8918.8918.2618.2623.2923.2917.6717.6715.3815.3818.6118.61 14.2714.2717.4017.4022.5522.5517.5517.5516.1016.1017.

8、9817.9820.1320.1321.0021.0014.5614.5619.8919.8919.8219.8217.4817.48 14.8914.8918.3718.3719.5019.5017.0817.0818.1218.1226.0226.0211.3411.3413.8113.8110.2510.2515.9415.9415.8315.8318.5418.54 24.5224.5219.2619.2626.1326.1316.9916.9918.8918.8918.4618.4620.8720.8717.5117.5113.1213.1211.7511.7517.4017.402

9、1.3621.36 17.1417.1413.7713.7712.5012.5020.4020.4020.3020.3019.3819.3823.1123.1112.6712.6723.0223.0224.3624.3625.6125.6119.5319.53 14.7714.7714.3714.3724.7524.7512.7312.7317.2517.2519.0919.0916.7916.7917.1917.1919.3219.3219.5919.5919.1219.1215.3115.31 21.7521.7519.4719.4715.5115.5110.8610.8627.8127.

10、8121.6521.6516.3216.3220.7520.7522.1122.1113.1713.1717.5517.5519.2619.26 12.6512.6518.4818.4819.8319.8323.1223.1219.2219.2219.2219.2216.7216.7227.9027.9011.7411.7424.6624.6614.1814.1816.5216.52 11 连续型定量资料频数表的划记步骤连续型定量资料频数表的划记步骤 : 1、找出最大值和最小值,、找出最大值和最小值, 2、求全距,又称极差、求全距,又称极差R(Range) R=最大值最大值-最小值最小值 R=

11、29.64-7.42=22.22(cm) 3、定组段数与组距:、定组段数与组距: (1)确定组数)确定组数K:根据样本例数:根据样本例数 n大小而定,一般分大小而定,一般分 1015组之间,如样本较小,可少于组之间,如样本较小,可少于10组;如样本较大时,组;如样本较大时, 可大于可大于10组,以能反映出分布规律为原则。组,以能反映出分布规律为原则。 12 (2)定组距)定组距 i:组距即组与组间的距离,一般等距分组。:组距即组与组间的距离,一般等距分组。 i=R/K(极差(极差/组数)组数)=22.22/10=2.222 最终原则是取整、最终原则是取整、 取偶数,取偶数, 所以本例所以本例

12、i=2cm (3)定组段的上下限并划记:)定组段的上下限并划记: 每个组段的起点每个组段的起点(最小值最小值)称为该组的下限(称为该组的下限(low limit),终终 点(最大值)称为该组的上限(点(最大值)称为该组的上限(upper limit)。)。 注意第一组段把最小值包括进去,最后一组把最大值包注意第一组段把最小值包括进去,最后一组把最大值包 括进去。括进去。 4、列表:统计各组段的频数、列表:统计各组段的频数: 13 组段组段频数频数频率频率累计频数累计频数 累计频率累计频率 (1)(2)(3)(3) (4)(4) 610.83 1 0.83 832.50 4 3.33 1065.

13、00 10 8.33 1286.67 18 15.00 141210.00 30 25.00 162016.67 50 41.67 182722.50 77 64.17 201815.00 95 79.17 221210.00 107 89.17 2486.67 115 95.83 2643.33 119 99.17 283010.83 120 100.00 合计合计120100.00 表表2-2 2-2 某地某地120120名名1818岁岁3535岁健康男性居民血清铁含量(岁健康男性居民血清铁含量(mol/Lmol/L) 14 l频数分布图频数分布图 l根据频数分布表,以血清铁含量为横轴,频

14、率根据频数分布表,以血清铁含量为横轴,频率 密度为纵轴,绘制直方图。密度为纵轴,绘制直方图。 l直条的面积表示该组段的频率。直条的面积表示该组段的频率。 15 频率密度 0 2 4 6 8 10 12 68101214161820222426 2830 120例健康成年男子血清铁含量分布 图2-2 16 三、频数分布表的用途三、频数分布表的用途 1、揭示资料的分布类型:揭示资料的分布类型: 频数分布可分为对称分布和偏态分布两种类型。频数分布可分为对称分布和偏态分布两种类型。 对称分布:对称分布:是指各组段的频数以频数最多组段(集中位是指各组段的频数以频数最多组段(集中位 置)为中心,左右两侧大

15、体对称。置)为中心,左右两侧大体对称。 偏态分布:偏态分布:是指频数最多的组段(集中位置)偏向一侧,是指频数最多的组段(集中位置)偏向一侧, 频数分布不对称。频数分布不对称。 正偏态正偏态:集中位置偏向左侧。集中位置偏向左侧。 负偏态负偏态:集中位置偏向右侧。:集中位置偏向右侧。 17 频率密度 0 2 4 6 8 10 12 68101214161820222426 2830 120例健康成年男子血清铁含量分布 18 右偏态分布(正偏态分布):右偏态分布(正偏态分布):频数最多组段右侧的组段数频数最多组段右侧的组段数 多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。多于左侧的组段数,高峰向左

16、偏移,频数向右侧拖尾。 表表4 4- 115名正常成年女子血清转氨酶(名正常成年女子血清转氨酶(mmol/L)含量分布)含量分布 19 左侧的组段数多于右侧的组段数,频数向左侧拖尾。左侧的组段数多于右侧的组段数,频数向左侧拖尾。 表表5 1015 101名正常人的血清肌红蛋白名正常人的血清肌红蛋白( umol/l )( umol/l )含量分布含量分布 20 2 2、揭示频数分布的两个分布特征:、揭示频数分布的两个分布特征: 集中趋势和离散趋势集中趋势和离散趋势 3、便于发现特大或特小的可疑值。便于发现特大或特小的可疑值。 4 4、便于进一步选择方法计算统计指标。、便于进一步选择方法计算统计指

17、标。 21 描述定量资料分布特征的指标有两类,一类是描述描述定量资料分布特征的指标有两类,一类是描述 分布集中趋势的,另一类是描述分布的离散趋势的。分布集中趋势的,另一类是描述分布的离散趋势的。 一、集中趋势的描述一、集中趋势的描述 今介绍描述定量资料分布集中趋势的指标今介绍描述定量资料分布集中趋势的指标 平均数(平均数(average)。)。 平均数包括算术均数、几何均数、中位数、平均数包括算术均数、几何均数、中位数、 众数、调和均数。众数、调和均数。 22 (一)、算术均数:简称均数(一)、算术均数:简称均数(mean) 总体均数用希腊字母总体均数用希腊字母,样本均数,样本均数 样本例数用

18、样本例数用 n 表示。表示。 一、适用资料一、适用资料 1、正态分布、正态分布 2、近似正态分布、近似正态分布 二、计算二、计算 1、直接法、直接法 2、加权法、加权法 式中式中X0为该组段的组中值为该组段的组中值 x n x x n fx x 0 23 例例2-3 测得测得8只正常大鼠血清总酸性磷酸酶(只正常大鼠血清总酸性磷酸酶(TACP) 含量(含量(U/L)为)为4.20,6.43,2.08,3.45,2.26, 4.04,5.42,3.38。试求其算术均数。试求其算术均数。 算术均数算术均数= (4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38) /8=3

19、.9075 (U/L) 1、直接法、直接法 24 表表2-3 加权法计算均数加权法计算均数 组段组段组中值组中值(XO)ffXO (1)(2)(3)(4)=(2)(3)=(2)(3) 671 17 7 893 32727 10116 66666 12138 8104104 14151212180180 16172020340340 18192727513513 20211818378378 22231212276276 24258 8200200 26274 4108108 2830291 12929 合计合计12012022282228 (2)加权频数表法加权频数表法 25 :计算公式为 加

20、权均数=2228/120=18.57(mol/L) 直接法均数=18.61(mol/L)。 n fX f fX x OO 26 (二)、(二)、几何均数几何均数(geometric mean/G) 一、适用资料一、适用资料 1、对数正态分布、对数正态分布 原数据不呈正态分布,但取对数后呈正态分布原数据不呈正态分布,但取对数后呈正态分布 2、等比级数资料、等比级数资料 二、计算二、计算 1、直接法、直接法 2、加权法、加权法 n x xxxG n n lg lg 1 21 f xf G lg lg 1 27 例例2-5 7名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAg滴滴 度资料为度资料

21、为1:16,1:32,1:32,1:64, 1:64, 1:128,1:512。试计算其几何均数。试计算其几何均数。 645121286464323216 7 G ) log (log 1 n X G .648062. 1lg 7 512lg128lg64lg64lg32lg32lg16lg lg 11 28 表表2-4 52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度资料滴度资料 抗体滴度抗体滴度频数频数( (f f) ) 滴度倒数滴度倒数 ( (X X) )lgXf(lgX) 1:162 216161.204121.204122.408242.40824 1:327 732321.505

22、151.5051510.5360510.53605 1:64111164641.806181.8061819.8679819.86798 1:12813131281282.107212.1072127.3937327.39373 1:25612122562562.408242.4082428.8988828.89888 1:5127 75125122.709272.7092718.9648918.96489 合计合计5252108.06977108.06977 29 52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度的几滴度的几 何均数为何均数为1 119.74705。 74705.119 5

23、2 06977.108 lg 1 G 30 (三)、中位数(三)、中位数(median,M) 一、概念一、概念 将观察值从小到大排列,处在中间位置的数值将观察值从小到大排列,处在中间位置的数值 二、适用资料二、适用资料 1、偏态分布、偏态分布 2、开口资料、开口资料 3、分布不清、分布不清 三、计算三、计算 1、直接法、直接法 将观察值从小到大排列将观察值从小到大排列 偶数:为中间两个数的平均偶数:为中间两个数的平均 奇数:为中间数值奇数:为中间数值 2、频数表资料、频数表资料 连续性资料连续性资料 L m m m f n f i LM 2 1 22 2 1 nn XXM 2 1n XM 31

24、 例例2-8 试利用表试利用表2-2的频数表求例的频数表求例2-2中血清铁含量的中血清铁含量的 中位数。中位数。 从表从表2-2可判断出位于可判断出位于“18-”这个组段。将相应数据这个组段。将相应数据 代入式(代入式(2-8) 该组血清铁资料的中位数为该组血清铁资料的中位数为18.74(mol/L)。)。 )/(74.1850 100 12050 27 2 18 50 LmolP 32 二、种类:二、种类: 算术均数算术均数几何均数几何均数中位数中位数 计算计算 直接法直接法 适用适用 资料资料 正态分布正态分布对数正态分布对数正态分布偏态分布偏态分布 开口资料开口资料 近似正态分布近似正态

25、分布等比级数资料等比级数资料分布不清分布不清 n fx x n x x f xf G n x xxxG n n lg lg lg lg 1 1 21 L m m m f n f i LM 2 33 众数众数 出现次数最多的数值出现次数最多的数值 调和平均数调和平均数 调和平均数是总体各单位标志值倒数的算调和平均数是总体各单位标志值倒数的算 术平均数的倒数,又称为倒数平均数,由简术平均数的倒数,又称为倒数平均数,由简 单调和平均数和加权调和平均数。单调和平均数和加权调和平均数。 34 二、离散趋势的描述二、离散趋势的描述 常用的描述定量资料离散趋势的指标有极差、四分常用的描述定量资料离散趋势的指

26、标有极差、四分 位数间距、方差、标准差、变异系数。位数间距、方差、标准差、变异系数。 (一一)、极差(、极差(range) 1、计算、计算 2、优缺点、优缺点 优点:简便优点:简便 缺点:缺点: 信息利用不充分。信息利用不充分。 稳健性较差。稳健性较差。 minmax xxR 35 例例2-11 试观察三组数据的离散状况。试观察三组数据的离散状况。A组:组:26, 28,30,32,34;B组:组:24,27,30,33,36; C组:组:26,29,30,31,34。将三组数据分别点。将三组数据分别点 在直线上,如图在直线上,如图2-4所示。所示。 三组数据的极差三组数据的极差 A组组 R=

27、34-26=8 B组组 R=36-24=12 C组组 R=34-26=8 36 (二二)、四分位数间距、四分位数间距/Q 1、百分位数(、百分位数(percentile ,Px ) 它表示一组观察值按升序排列,并等分为它表示一组观察值按升序排列,并等分为100等份,位等份,位 居第居第x%位置的数。位置的数。 X% Px 1-x% 2、四分位数、四分位数 LP25 UP75 3、四分位数间距、四分位数间距Q=U-L l x x fnx f i LxPx% P25P75 37 (三三)、方差(、方差(variance) 离均差离均差每一个观察值与均数之差,即每一个观察值与均数之差,即X-,可以可以 反映所有观察值的变异程度。反映所有观察值的变异程度。 离均差平方和离均差平方和 方差方差离均差平方的平均值离均差平方的平均值 观察值离均数近,方差就小,表示观察值离散小,观察值离均数近,方差就小,表示观察值离散小, 数据较集中。若各观察值离均数远,方差就大,数据较集中。若各观察值离均数远,方差就大, 表示各观察值离散度大,数据分布分散。表示各观察值离散度大,数据分布分散。 2 )( X N X 2 2 38 数学上可以证明:数学上可以证明: 1 2 2 n xx S 1 / 2 2 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论