第四章 定量资料的统计描述(终板)_第1页
第四章 定量资料的统计描述(终板)_第2页
第四章 定量资料的统计描述(终板)_第3页
第四章 定量资料的统计描述(终板)_第4页
第四章 定量资料的统计描述(终板)_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、欢欢迎学习医学统计学学习医学统计学 第四章第四章 定量资料的统计描述定量资料的统计描述 主讲:谢小花主讲:谢小花 定量资料的统计描述主要内容定量资料的统计描述主要内容 1 1、数值变量资料的频数分布、数值变量资料的频数分布 频数表的编制,频数分布的特征,分布形态频数表的编制,频数分布的特征,分布形态。 2 2、 集中趋势的指标集中趋势的指标平均水平指标平均水平指标 算术均数(均数)、几何均数、中位数算术均数(均数)、几何均数、中位数 3 3、离散程度指标、离散程度指标 极差(极差(R)、四分位数间距(、四分位数间距(Q)、方差和标准、方差和标准差、变异系数(差、变异系数(CV) 一、定一、定义

2、义: 相同观察结果出现的次数称为频数相同观察结果出现的次数称为频数(frequencyfrequency)。)。 将所有观察结果的频数按一定顺序排列在将所有观察结果的频数按一定顺序排列在一起,表达变量取值及其不同取值频数分一起,表达变量取值及其不同取值频数分布情况的统计表称为频数分布表,简称频布情况的统计表称为频数分布表,简称频数表数表(frequency tablefrequency table)。)。 第一节第一节 频数表与频数图频数表与频数图二、频数分布表的编制频数分布表的编制 原始资料分组原始资料分组计量资料频数计量资料频数分布表分布表计数资料频数计数资料频数分布表分布表按数量分组按数

3、量分组按性质或属性分组按性质或属性分组计计量量资资料料离散型离散型资资料料连续连续型型资资料料每一育龄妇女现有的子女数;每分钟的脉搏数身高(cm)、体重(kg)、总胆固醇(mmol/L)结结果果为为整整数数结结果果有度有度量衡量衡单单位位以以变变量取量取值为标值为标志分志分组组,列出各,列出各组别组别的的频数频数 课本课本【例4-1】某市2010年随机抽取120名正常成年男子红细胞计数值(1012/L)资料如下。该组数据为何种类型资料?如何描述其数量特征?试制作该样本红细胞计数值的频数表。5.125.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32

4、 4.844.915.14 5.25 4.89 4.79 4.90 5.09 4.64 5.14 5.46 4.66 4.204.213.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.685.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.924.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.704.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.22 4.44

5、4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.834.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.51 4.644.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.164.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69 【分析分析】 (1 1)该组数据是通过测量)该组数据是通过测量120120名正常成年男子红名正常成年男子红细胞计数值得到的,细胞计数值得到的

6、,表现为具体的数值大小且有表现为具体的数值大小且有度量衡单位,属于定量资料。度量衡单位,属于定量资料。 (2 2)若要了解正常成年男子红细胞计数值的数)若要了解正常成年男子红细胞计数值的数量特征,需要对原始数据进行整理和分析,包括量特征,需要对原始数据进行整理和分析,包括采用适当的采用适当的统计图表、统计指标描述其分布情况统计图表、统计指标描述其分布情况、平均水平以及变异程度等,即进行统计描述、平均水平以及变异程度等,即进行统计描述。 统计描述是用适当的统计描述是用适当的统计图表和统计指标统计图表和统计指标描述资描述资料的分布规律及其数量特征,是从统计资料中获料的分布规律及其数量特征,是从统计

7、资料中获取信息的最基本方法,也是进一步统计分析的基取信息的最基本方法,也是进一步统计分析的基础。础。(一)、频数表的编制方法(一)、频数表的编制方法 1、求极差(全距,、求极差(全距, 用用R表示)表示)最大值最小值最大值最小值6.18-3.292.89( 单位单位 ) 2、确定组数和组距(、确定组数和组距(i) 根据样本含量的大小及研究目的确定组数,一根据样本含量的大小及研究目的确定组数,一般设般设8 81515个组个组;此资料分为10组。 组距:相邻组段下限值之差。组距:相邻组段下限值之差。 i极差极差/2.89/100.289 3(单位单位) 3、确定组段、确定组段(1)第一组段包括最小

8、值,最后组段包括)第一组段包括最小值,最后组段包括最大值;(最大值;(2)每一组段都有上限和下限:)每一组段都有上限和下限: 下限:组段的起点(最小值)下限:组段的起点(最小值) 上限:组段的终点(最大值)上限:组段的终点(最大值) 4、列表划记、得出频数表、列表划记、得出频数表 将所有观察值按其数值大小归入各组。将所有观察值按其数值大小归入各组。 表表4-1 某市某市2010年年120名正常成年男子红细胞计数值(名正常成年男子红细胞计数值(1012/L)的频数表)的频数表组段(组段(1012/L)(1)组中值组中值(2)频数(频数(f)(3)频率(频率(%)(4)累计频数累计频数 (5)累计

9、频率(累计频率(%)(6)3.203.503.804.104.404.705.005.305.605.906.203.353.653.954.254.554.855.155.455.756.052510 19 22 24 21 11 4 2 1.74.2 8.3 15.8 18.3 20.0 17.5 9.2 3.3 1.7 2 7 17 36 58 82 103 114 118 1201.75.914.230.048.268.385.8 95.398.0100.0合计合计12010.0二、频数表的用途二、频数表的用途 1、揭示资料的分布特征和分布类型;、揭示资料的分布特征和分布类型; 2、便

10、于进一步计算指标和统计分析;、便于进一步计算指标和统计分析; 3、便于发现特大或特小的可疑值;、便于发现特大或特小的可疑值; 4、据此绘制频数分布图。、据此绘制频数分布图。频数分布的特征频数分布的特征 1、集中趋势:、集中趋势:观察值向某一数值集中的观察值向某一数值集中的倾向(用平均数指标说明);倾向(用平均数指标说明); 2、离散趋势:、离散趋势:观察值大小不等的倾向观察值大小不等的倾向(用变异指标说明)(用变异指标说明)。频数分布的类型频数分布的类型 1、对称分布:、对称分布:集中位置(高峰)居中,集中位置(高峰)居中,左右两侧频数分布大体对称,其中的正态分左右两侧频数分布大体对称,其中的

11、正态分布是重要的分布形式。布是重要的分布形式。 2、偏态分布、偏态分布 (1)正偏态:)正偏态:集中位置(高峰)偏向数集中位置(高峰)偏向数值较小的一侧。值较小的一侧。 (2)负偏态:)负偏态:集中位置(高峰)偏向数集中位置(高峰)偏向数值较大的一侧。值较大的一侧。频数分布的类型频数分布的类型 对称分布对称分布 偏态分布偏态分布 正偏态负偏态 正正态态分布分布 三、三、 频数图频数图 根据频数分布表制作直方图的要点:分别以横轴上每组别两边界点为端点的线段为底边,做高为相应频数的矩形,就得到所求的频数分布直方图。频数图与频数表的用途相似,但其在表达频数分布的特征及分布类型时更直观、形象,在统计描

12、述中也是经常采用的形式。 表4-1绘制成频数图4-1 如下图:描述描述计计量量资资料分布特征的指料分布特征的指标标集中集中趋势趋势指指标标离散离散趋势趋势指指标标平均平均数数R R、Q Q、S S、S S2 2、CVCV第二节第二节 集中趋势集中趋势的统计描述的统计描述常用的平均数指标:常用的平均数指标: 算术均数、几何均数、中位数算术均数、几何均数、中位数 平均数:平均数:用于描述一组同质计量资料平均水平用于描述一组同质计量资料平均水平( (集集中位置中位置) )的指标,是一组计量资料的代表值。的指标,是一组计量资料的代表值。 使用使用平均数平均数指标描述定量资料的集中趋势的特征。指标描述定

13、量资料的集中趋势的特征。 平均数指标平均数指标x一、算术均数(均数)一、算术均数(均数)总体均数用总体均数用 表示,样本均数用表示,样本均数用表示。表示。适用资料:适用资料:对称分布,尤其是正态分布对称分布,尤其是正态分布的资料。的资料。 算术均数:算术均数:说明一组同质计量资料在数量说明一组同质计量资料在数量上的平均水平。上的平均水平。1. 计算方法计算方法 (1 1) 直接法直接法 【例4-2】 用于样本含量较少时,可直接将各观察值相加,除以观察例数,其公式为:加权法:加权法: nnnfffxfxfxf.212211 ffxf:频数,频数,x 为组中值为组中值=(上限(上限+下限)下限)/

14、 2表表4-14-1资资料料故故120120名正常成年男子红细胞计数值的均数为名正常成年男子红细胞计数值的均数为4.70754.7075(1012/L1012/L)。)。12122 3.355 3.65 10 3.952 6.05564.904.707510120iiikf xxLffff 2.应用应用 均均数数适用于适用于对称对称分布特分布特别别是正是正态态分布分布资资料料集中集中趋势趋势的描述,此的描述,此时时均均数数位于分布的中位于分布的中心,心,既既表表达达了集中的位置,又表了集中的位置,又表达达了一了一组组观观察察值数值数量上的平均水平。量上的平均水平。 二、几何均数二、几何均数(简

15、记为(简记为G) 适用资料:适用资料: 1、呈等比的资料(如抗体滴度或效价);、呈等比的资料(如抗体滴度或效价); 2、对数正态分布资料。、对数正态分布资料。 几何均数:几何均数:说明一组数据平均增减的倍数。说明一组数据平均增减的倍数。计算方法:计算方法:直接法:直接法:nnXXXG.21 )lg(lg)lg.lglg(log1211nXnxxxGn 【例例4-44-4】 某某实验实验室室测测得得5 5人血人血清清中某中某种种抗体的滴度分抗体的滴度分别为别为1/201/20,1/401/40,1/801/80,1/801/80,1/3201/320,试试求平均滴度。分析人求平均滴度。分析人员为

16、员为方便方便计计算,算,将将原始原始数数据取倒据取倒数数,求,求得均得均数为数为108108,再取倒,再取倒数数以恢以恢复复原始的形原始的形式,得平均滴度式,得平均滴度为为1/1081/108。 针对该组数针对该组数据,分析人据,分析人员员采用均采用均数数描述描述资资料的平均水平是否合适?料的平均水平是否合适?【分析】 该组资该组资料料不是不是对称对称分布分布,几,几个观个观察察值值中,中,有有个别个别的的数数据据与与其其它数它数据相差据相差较较大,因此大,因此使得均使得均数数不能很好地代表不能很好地代表该组资该组资料的平均料的平均水平,所以水平,所以选择选择均均数数是不合适的,根据是不合适的

17、,根据该该资资料的特点,宜料的特点,宜选选用几何均用几何均数数。 为了方便计算使用直接法的以下公式:为了方便计算使用直接法的以下公式: 故5个人抗体的平均滴度是1/70。)lg(lg)lg.lglg(log1211nXnxxxGn 加权法:加权法:若若相同观察值较多或资料已编制成频数相同观察值较多或资料已编制成频数表则可利用加权法计算,其公式为:表则可利用加权法计算,其公式为:)lg(lg).lg.lglg(lg12122111 fXffffxfxfxfGnnn 5050名麻疹易感名麻疹易感儿儿接接种种麻疹疫苗后血凝抑麻疹疫苗后血凝抑制抗体的平均滴度制抗体的平均滴度为为1/541/54。应用几

18、何均数注意事项:应用几何均数注意事项: 1、观察值不能有、观察值不能有0; 2、观察值不能同时有正负值;若全为负值,、观察值不能同时有正负值;若全为负值, 则取绝对值计算;则取绝对值计算; 3、同一资料求得的、同一资料求得的G100n100 百分位数法:百分位数法:n300n300 (二)选定适当的百分界值(二)选定适当的百分界值 正常值范围的意思:绝大多数正常值范围的意思:绝大多数正常人的某项观察值均在该范围之正常人的某项观察值均在该范围之内。这个绝大多,习惯上指正常人内。这个绝大多,习惯上指正常人的的8080、9090、9595、9999(最(最常用的是常用的是9595)。)。 (1 1)

19、白细胞数过高和过低均属于异常,)白细胞数过高和过低均属于异常,需制定下限(最小值)和上限(最大需制定下限(最小值)和上限(最大值),称双侧医学参考值范围。值),称双侧医学参考值范围。(三)决定正常参考值范围的单侧或双(三)决定正常参考值范围的单侧或双侧值侧值 (2)(2)肺活量只过低为异常,只需制定医学肺活量只过低为异常,只需制定医学参考值范围的下限;参考值范围的下限; 尿铅只过高为异常,尿铅只过高为异常,只需制定医学参考值范围的上限;均称单只需制定医学参考值范围的上限;均称单侧医学参考值范围。侧医学参考值范围。 (四)选择正常参考值范围的估计方法(四)选择正常参考值范围的估计方法1 1、正、

20、正态态分布分布正正态态分布法分布法2 2、对数对数正正态态分布分布对数对数正正态态分布法分布法3 3、偏、偏态态分布分布百分位百分位数数法法制订医学参订医学参考值值范围围常用方法(1 1)正)正态态分布法分布法(2 2)百分位)百分位数数法法(2 2)百分位数法)百分位数法 (1)(1)适用范围:适用范围: a.a.偏态分布资料偏态分布资料 b.b.分布不清资料分布不清资料 c.c.开口资料开口资料 (2)(2)计算公式:计算公式: 双侧:双侧: 9595 P P2.52.5P P97.597.5 99 99 P P0.50.5P P99.599.5 单侧:单侧: 上限上限 9595 P P9595 99 99 P P9999 下限下限 9595 P P5 5 99 99 P P1 1【分析分析】由表由表4-74-7可以看出,正常人尿汞可以看出,正常人尿汞值值的分布的分布为为偏偏态态分布,不适宜采用正分布,不适宜采用正态态分布法,分布法,应应采用百分位采用百分位数数法;且尿汞的法;且尿汞的参参考考值值范范围应为单侧围应为单侧上界,需上界,需计计算算P P9595。 某市某市238238名健康人名健康人发发汞含量汞含量 发发汞汞值值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论