卫生统计学-卫统4定量资料的统计描述课件_第1页
卫生统计学-卫统4定量资料的统计描述课件_第2页
卫生统计学-卫统4定量资料的统计描述课件_第3页
卫生统计学-卫统4定量资料的统计描述课件_第4页
卫生统计学-卫统4定量资料的统计描述课件_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章定量资料的统计描述统计图表1第四章定量资料的统计描述统计图表1【例4-1】2019年某市120名10岁男孩的身高(cm)资料如下。135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5

【例4-1】2019年某市120名10岁男孩的身高(cm)资【问题4-1】该组数据为何种类型资料?如何描述10岁男孩身高的数量特征?【问题4-1】本章主要内容频数表和频数图

集中趋势的描述

离散趋势的描述正态分布及其应用本章主要内容频数表和频数图第一节频数表和频数图第一节表达变量取值及其不同取值频数分布情况的统计表称为频数分布表,简称频数表(frequencytable)。

频数表和频数图频数表频数表和频数图频数表频数表的编制

求极差(range)

找出一组观察值中的最大值与最小值,其差值即为极差(或全距),用R表示。如例4-1中:R=155.4-130.2=25.2。频数表和频数图频数表的编制求极差(range)频数表和频数图2.确定组数和组距(i)

根据样本含量的大小及研究目的确定组数;一般设8~15个组。例4-1:i=25.2/10=2.52,取整数2做组距。频数表和频数图2.确定组数和组距(i)频数表和频数图3.确定组段

即确定每一组的起点(下限)和终点(上限)。

起点称为下限(lowerlimit)终点称为上限(upperlimit)

上限=下限+组距频数表和频数图3.确定组段上限=下限+组距频数表和频数图4.归组计数,整理成表

确定组段界限后,采用计算机或用划记法将各原始数据归入各组汇总,得出各组段的观察例数,也就是频数。

频数表和频数图4.归组计数,整理成表频数表和频数图表4-12019年某市120名10岁男孩身高(cm)的频数表身高(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合计120100.0——频数表和频数图表4-12019年某市120名10岁男孩身高(cm)的频频数表的用途

揭示资料的频数分布特征和频数分布类型

频数分布的特征:集中趋势(centraltendency)离散趋势(dispersion)频数分布的类型:对称分布偏态分布频数表和频数图频数表的用途揭示资料的频数分布特征和频数分布类型频数表和频数频数频数图1101名正常女子血清总胆固醇的频数分布图269例RA患者血清EBV-VCA-IgG抗体滴度的频数分布图3101名正常人血清肌红蛋白的频数分布血清肌红蛋白(μg/ml)正(右)偏态负(左)偏态对称分布频数频数频数图1101名正常女子血清总胆固醇的2.便于进一步计算指标和统计处理

可利用频数表计算百分位数、中位数、标准差等频数表和频数图3.便于发现某些特大或特小的可疑值。2.便于进一步计算指标和统计处理频数表和频数图3.便频数图(graphoffrequency)是以变量值为横坐标、频数(频率)为纵坐标(不等距分组时以频率/组距=频率密度为纵坐标),以每个等宽的距形面积表示每组的频数(或频率)。频数表和频数图频数图频数表和频数图频数图连续型定量资料:频数图中各距形是相连的,又称直方图(histogram);离散型定量资料:频数图中各距形是间隔的,又称直条图(bargraph)。

频数表和频数图连续型定量资料:频数图中各距形是相连的,又称直方图(hist图4-12019年某市120名10岁男孩身高的频数图频数表和频数图图4-12019年某市120名10岁男孩身高的频数图频第二节集中趋势的描述第二节定量资料集中趋势的描述,常用平均数(average)——表达一组同质定量数据的平均水平或集中位置。集中趋势的描述算术均数

几何均数中位数

众数调和均数定量资料集中趋势的描述,常用平均数(average)集中趋势又称均数(mean),是用一组观察值相加除以观察值的个数所得。样本均数用,总体均数用。

算术均数(arithmeticmean)

集中趋势的描述又称均数(mean),是用一组观察值相加除以观察值的个数所得1.计算方法直接法:样本含量较少

加权法:相同观察值较多或频数表资料集中趋势的描述1.计算方法集中趋势的描述【例4-2】某医生测量了10名脑出血患者的血尿素氮(mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的均数。集中趋势的描述【例4-2】某医生测量了10名脑出血患者的血尿素氮(mmo【例4-3】根据表4-1资料,用加权法求120名10岁男孩身高的均数。身高(1)频数fi(2)组中值xi(3)fixi(4)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106311311331351371391411431451471491511531551313995401096166823973003290020581490906459155合计120()–17202()表4-22019年某市120名10岁男孩身高(cm)的均数计算表集中趋势的描述【例4-3】根据表4-1资料,用加权法求120名10岁男孩身2.应用均数适用于对称分布特别是正态分布资料。集中趋势的描述2.应用集中趋势的描述是n个观察值乘积的n次方根,又称倍数均数,用G表示。

几何均数(geometricmean)

集中趋势的描述是n个观察值乘积的n次方根,又称倍数均数,用G表示。几何1.计算方法直接法:样本含量较少

加权法:相同观察值较多或频数表资料集中趋势的描述1.计算方法集中趋势的描述【例4-4】某实验室测得7人血清中某种抗体的滴度分别为1/4,1/8,1/16,1/32,1/64,1/128,1/256,试求平均滴度。

集中趋势的描述【例4-4】某实验室测得7人血清中某种抗体的滴度分别为集中趋势的描述【例4-6】50名麻疹易感儿接种麻疹疫苗后,测得血凝抑制抗体滴度资料见表4-3,求抗体的平均滴度。86.9977抗体滴度(1)频数(2)滴度倒数(3)(4)(5)1/41/81/161/321/641/1281/2561361013107481632641282560.60210.90311.20411.50511.80622.10722.40820.60212.70937.224615.505123.480621.072016.8574合计50--表4-350名麻疹易感儿血凝抑制抗体滴度集中趋势的描述【例4-6】50名麻疹易感儿接种麻疹疫苗后集中趋势的描述50名麻疹易感儿接种麻疹疫苗后血凝抑制抗体的平均滴度为1/54。

集中趋势的描述50名麻疹易感儿接种麻疹疫苗后血凝抑制抗体2.应用及注意事项几何均数适用

①对数正态分布②等比级数资料观察值中不能有0实验设计的基本要素实验设计的基本要素中位数与百分位数

集中趋势的描述

【例4-7】200名食物中毒患者潜伏期资料如表4-4,研究人员据此采用加权法计算均数得平均潜伏期为27小时。(1)该组数据在分布上有何特点?

(2)用均数描述该资料的平均水平是否合适?中位数与百分位数集中趋势的描述【例4-7】200集中趋势的描述表4-4200名食物中毒患者的潜伏期潜伏期(小时)(1)频数(2)累计频数(3)累计频率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合计200--集中趋势的描述表4-4200名食物中毒患者的潜伏期中位数(median):将一组观察值由小到大排序后,居于中间位置的数值即为中位数,用表示。

中位数是一种位置平均数,它将全部数据排列成的有序数列平均分为两部分,小于和大于中位数的观察值个数相等,各占50%。集中趋势的描述中位数是一种位置平均数,它将全部数据排列成的有序数列1.中位数的计算(1)直接法:观察值个数较少集中趋势的描述集中趋势的描述【例4-8】某实验师对10只小白鼠染毒后观察各小鼠的生存时间(分钟),得数据为:35,60,62,63,63,65,66,68,69,69,试计算小白鼠的平均生存时间。集中趋势的描述集中趋势的描述(2)频数表法:频数表资料LM

中位数所在组段下限

组距

中位数所在组段的频数

中位数所在组段前一组的累计频数(2)频数表法:频数表资料LM中位数所在组段下限集中趋势的描述求:下表200名食物中毒患者的平均潜伏期潜伏期(小时)(1)频数(2)累计频数(3)累计频率(%)(4)=(3)/n0~303015.012~7110150.524~4914974.536~2817889.048~1419296.060~719999.572~841200100.0合计200--集中趋势的描述求:下表200名食物中毒患者的平均潜伏期潜集中趋势的描述(小时)

集中趋势的描述(小时)百分位数(percentile):是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数,用

表示。

集中趋势的描述集中趋势的描述是一种位置指标,一个百分位数将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。集中趋势的描述集中趋势的描述【例4-10】根据表4-4,计算P25、P75。集中趋势的描述【例4-10】根据表4-4,计算P25、P75。集中趋势的描2.中位数与百分位数的应用中位数:偏态分布资料一端或两端无确切值总体分布不明百分位数:非正态分布资料

集中趋势的描述2.中位数与百分位数的应用集中趋势的描述第三节离散趋势的描述

第三节【例4-11】分别观察两组各9只动物的每日进食量(mg/g),结果如下:A组242526272829303132B组202122232425262764两组动物每日进食量的平均数,均为28mg/g。

【例4-11】分别观察两组各9只动物的每日进食量(mg/离散趋势是频数分布的另一特征,反映了观察值之间的变异情况,只有将集中趋势与离散趋势结合起来描述才能全面反映定量资料的数量特征。

离散趋势是频数分布的另一特征,反映了观察值之间的变异情况,只描述离散趋势指标

极差四分位间距标准差变异系数描述离散极差极差(range,R):亦称全距,是一组同质观察值中最大值()与最小值()之差。

极差概念极差概念只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度样本含量越大,极差可能越大极差不足之处极差不足之处四分位数间距(inter-quartilerange,Q):为上四分位数QU(即P75)与下四分位数QL

(即P25)之差。四分位数间距概念四分位数间距概念

【例4-12】根据例4-7资料,计算四分位数间距。小时小时四分位数间距:(小时)

【例4-12】根据例4-7资料,计算四分位数间距。每个观察值x与间的变异称为离均差由于变异程度用离均差平方和反应

方差考虑观察值个数N的影响

方差考虑观察值个数N的影响在实际工作中方差n-1称为自由度(degreeoffreedom)方差适用:描述对称分布特别是正态分布资料的离散程度。

方差n-1称为自由度方差适用:方差的度量单位是原度量单位的平方

方差开方后即与原数据的度量单位相同,这就是标准差(standarddeviation)标准差标准差在实际工作中n-1称为自由度(degreeoffreedom)标准差适用:描述对称分布特别是正态分布资料的离散程度。

标准差n-1称为自由度标准差适用:标准差数学上可以证明标准差数学上可以证明标准差【例4-13】某医生测量了10名脑出血患者的血尿素氮(mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的标准差。标准差【例4-13】某医生测量了10名脑出血患者的血尿素氮(mm身高(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合计120100.0——【例4-14】根据下表资料,计算120名10岁男孩身高的标准差。标准差身高频数频率(%)累计频数累计频率(%)130~10.8标准差标准差【例4-15】某医院预防保健科,对一组5岁男孩进行体检,测量身高、体重等指标。得身高均数与标准差为115.8cm和4.5

cm,体重均数与标准差为20.2kg和0.56kg,得出结论:身高的变异程度比体重大。变异系数上述结论是否正确?

变异系数上述结论是否正确?变异系数(coefficientofvariation,简记为CV):是一组观察值的标准差与其均数的比值,

概念变异系数度量衡单位不同的资料单位相同但均数相差悬殊的两组或多组资料

适用于概念变异系数度量衡单位不同的资料适用于变异系数根据例4-15资料分别计算身高与体重的变异系数。身高:体重:

变异系数根据例4-15资料分别计算身高与体重的变异系数描述数值变量资料集中趋势的指标描述数值变量资料集中趋势的指标描述数值变量资料离散趋势的指标描述数值变量资料离散趋势的指标第四节正态分布及其应用第四节正态分布的概念与特征图4-1120名10岁男孩身高资料的频数图正态分布的概念与特征图4-1120名10岁男孩正态分布的概念与特征正态分布的概念与特征正态分布(normaldistribution)称为高斯分布(Gaussdistribution),如果连续型随机变量X的概率密度函数为:概念正态分布的概念与特征则称随机变量X服从参数为和的正态分布,记作:-∞<x<+∞概念正态分布的概念与特征则称随机变量X服从参数为正态曲线(normalcurve)在横轴上方均数处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。正态分布特征正态分布的概念与特征正态曲线正态分布特征正态分布的概念与特征正态曲线正态分布有两个参数,即位置参数和形状参数

正态分布的概念与特征位置参数正态分布的概念与特征位置参数形态参数σ正态分布的概念与特征形态参数σ正态分布的概念与特征正态分布的概念与特征正态曲线下面积的分布有一定的规律。

①正态曲线与横轴之间的面积恒等于1或100%;②对称分布,对称轴两侧的面积各为50%;③在区间的面积为68.27%在区间的面积为95.00%在区间的面积为99.00%

正态分布的概念与特征正态曲线下面积的分布有一定的规律。正态分布的概念与特征正态分布的概念与特征思考:能否编制正态曲线下面积的分布表,然后通过查表来确定某区间对应的面积呢?

标准正态分布统计学家发现,可以使所有的正态分布转化为统一的的正态分布,该正态分布称为标准正态分布(standardnormaldistribution)。标准正态分布统计学家发现,可以使所有的正态分布转化为统标准正态分布这种变换称为标准化变换或Z变换。若X服从正态分布,则Z就服从。标准正态分布这种变换称为标准化变换或Z变换。若X服从正标准正态分布曲线下面积分布规律标准正态分布曲线下面积分布规律【例4-18】已知某地2019年18岁男大学生身高的均数cm,标准差cm,且18岁男大学生的身高服从正态分布。问该地18岁男大学生中身高在166.8cm及其以下者占多大的比例?标准正态分布先将x转换为z

查附表3表的左侧找-1.9,表的上方找0.06,相交处为0.025

标准正态分布先将x转换为z查附表3表的左侧找-1.【例4-19】某地2019年抽样调查了100名18岁男大学生身高,算得均数为172.70cm,标准差为4.01cm。正态分布的应用

估计正态分布资料的频数分布【问题】该地18岁男大学生中身高在162.35cm~183.05cm范围内者所占的比例是多少?【例4-19】某地2019年抽样调查了100名18岁男大查附表3,左侧的面积为0.005,由正态分布曲线的对称性可知,右侧的面积也为0.005,又由正态分布曲线下的总面积为1,可得-2.58与2.58之间的面积为1-2×0.005=0.99=99%。查附表3,左侧的面积为0.0正态分布的应用制定医学参考值范围

医学参考值范围:亦称正常值范围,指绝大多数“正常人”的解剖、生理、生化等指标的波动范围。所谓“正常人”不是指绝对的“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群。正态分布的应用制定医学参考值范围医学参考值范围:亦称正正态分布的应用制定医学参考值范围的注意事项①要确定一批样本含量足够大的“正常人”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论