第二章数据特征及统计描述_第1页
第二章数据特征及统计描述_第2页
第二章数据特征及统计描述_第3页
第二章数据特征及统计描述_第4页
第二章数据特征及统计描述_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章数据特征及统计描述第一节 描述集中趋势的特征数1、算术平均数(arithmetic mean) 2、几何平均数(geometric mean) 几何平均数用符号G表示。用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。医学上常用于表示类似抗体滴度等呈倍数关系的等比级数资料。 例3-3 测得5个人的血清抗体效价分别为1:8,1:16,1:32,1:64,1:128,求平均滴度。为便于计算,可先将抗体效价取倒数,将效价倒数代入公式 ,得G=lg-1(lg8+lg16+lg32+lg64+lg128)/5=325份血清滴度的平均水平为1:32。 例3-4 某地检查25名学龄儿童的麻

2、疹血凝抑制抗体滴度,结果见下表,求抗体的平均滴度。抗体滴度抗体滴度倒数频数f1:2.52.531:5.05.061:10.010.071:20.020.051:40.040.04表 25份血清麻疹血凝抑制抗体滴度解:即麻疹血凝抑制抗体的平均滴度为。 3、中位数中数是指资料中的观察值由小到大依次排列后居于中间位置的观察值,用Md表示。计算方法当观察例数n不大时,此法常用。先将观察值按大小顺序排列,选用下列公式求M。 当n为奇数时, M=X(n+1)/2 。 当n为偶数时,例 某病患者8人的潜伏期(天)分别为2,3,3,4,7,8,10,18,求它们的中位数。 本例n=8为偶数,将8人潜伏期从小到

3、大排列,用公式算得M= X4 + X5/2=(4+7)/2=5.5(天) 4、 众数众数是指资料中出现次数最多的那个观察值,用M0表示。第二节 描述离散趋势的特征数常用指标: 极差(R) 方差(variance) 标准差(S) 变异系数(CV)1、极差(range) 概念:极差又称全距,描述数据分布范围的离散指标,用R表示。 极差越大,说明变量的变异程度越大。 计算:R=XmaxXmin 2、方差(variance) (1)概念:用于描述呈对称分布的连续型变量资料离散程度的指标,是变量值离均差平方和的平均值。 (2)计算公式分别为: 4、标准差(standard deviation) 概念:方

4、差的算术平方根即为标准差 计算公式: 5、变异系数(coefficient of variation,CV) 概念:标准差与算术均数之比。描述了相对于算术均数而言,标准差的大小。 计算公式 第三节 正态分布及其应用1、质量控制在医药卫生产品生产中,为保证产品或药品的质量,常进行质量控制。如果作为质量控制的指标服从正态分布,则波动仅由个体差异或随机因素产生的测量误差所致。根据正态分布的特点,质量控制常用 作为上下警戒线, 作为上下控制线。若进行某一次测量的指标超过上下警戒线,甚至超过上下控制线,则有理由认为其指标的波动不仅仅是随机误差引起,可能存在某种非随机系统性误差,需对生产过程进行检修,找出

5、可能的原因,从而达到产品质量控制的目的。2、医学正常值范围的制定医学正常值范围又称医学参考值范围,医学正常值范围是指包括绝大多数正常人的各种生理及生化指标的范围。一般常用95%或99%的医学参考值范围。某指标的95%或99%的医学参考值范围只包括95%或99%的正常人该指标的变量值分布范围,还有5%或1%的正常人该指标的变量值不在此范围内。所以,在诊断时参考值范围只能起“参考”作用,不在此范围并不一定异常(患病),在此范围内也不一定正常(不患病)。制定医学参考值范围时,应从正常人群中抽样,且样本含量应较大(n100),根据资料的分布类型采用正态分布法或百分位数法。正态分布法:适用于资料服从正态

6、分布或近似正态分布时。公式;双侧1-参考值范围: 单侧1-参考值范围:第四节 分类资料的统计描述1. 相对数(Relative number)(1)构成比(Proportion)概念:是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,计算公式:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数100%例如:注意:各组成部分的构成比之和为100% 某一部分比重增大,则其它部分相应减少。表 某地1992年护理人员学历构成学历人数构成比/%本科990.14大专12481.74中专5352172.65无学历1876325.47合计73667100.00(2)相对比(R

7、atio)概念:是指两个有联系的指标之比,是对比的最简单形式。计算公式:A、B两个指标,A/B(或100%)若干倍或百分之几。 例如:性别比、CV(3) 率 (Rate)概念:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。计算公式:发生某种现象的观察单位数/可能发生某种现象的观察单位数 100%(1000)例如:发病率、患病率、死亡率、病死率表 某地某年四种常见心血管病死亡率病名平均人口数人数死亡率/(1/10万)高血压1726654023.2冠心病172665116.4脑卒中172665253146.5风心病17255

8、53822.0第五节 常用统计图表 统计表(statistical table)统计图 (statistical graph)一、统计表1、概念 统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。2、统计表的结构 统计表的基本结构包括:标题、标目、线条、数字、以及备注。 表1 甲、乙两地1980年HbsAg阳性率地区调查数阳性数阳性率(%)甲地 5000110022.0乙地 6000105017.5合计11000215019.5 (1)标题(title) 标题一般写在表格的上方中央,概括表的主要内容,一般包括时间、地点、观察单位数和研究内容。3. 编制统计表的

9、基本要求(2)标目(heading) 标目是表格内的项目,标目的文字应简明,有度量单位时应注明。标目分横标目和纵标目。横标目位于表最左侧,说明横行的数字涵义,是被研究对象的分组。纵标目位于表的右上方,说明纵列数字的涵义,是研究被研究对象的各项指标。(3)线条 统计表至少要有三条横线,即顶线和底线及纵标目下的横线。当有合计栏时,在合计栏上面还有一条合计栏线;当表格是组合表时,在总标目和次标目之间还有短横线。表格中没有竖线,也没有斜线。横标目与横标目之间不需要用横线隔开。(4)数字 用阿拉伯数字表示。同一指标小数点位数应一致,小数点位置应对齐。表格内不留空格,无数字时用“”表示;缺失数字时用“”表

10、示。 (5)备注 不是表格的主要研究内容,但又需要在列表时表达的内容称之为备注。备注不列在表格内,列在表格的底线下。 4. 统计表的绘制原则重点突出层次分明简洁明了5.统计表的种类简单表复合表表 某地某年咽舒康治疗急性咽喉炎疗效比较简单表:指被研究对象只按单一特征或标志分组的表格。组别例数有效数有效率(%)试验组1079386.9对照组1088477.8表 某地某年不同年龄、性别的儿童青少年意外损伤情况组合表:指被研究对象按两个或两个以上特征分组的表格。如下表,将被研究对象按年龄和性别两个特征结合起来分组,称为组合表。年龄(岁)男女调查人数损伤人数损伤率(%)调查人数损伤人数损伤率(%)3.5

11、4476614.77424296.846.51215927.571239534.289.5118012210.341070807.4812.5121715012.331136665.8115.818.56226510.45582203.44合计468149510.5744512485.57二、统计图统计图是一种更形象的统计描述工具,它是用直线的升降、直条的长短、面积的大小、颜色的深浅等各种图形来表态统计资料的分析结果。(一)制图的基本要求 1、标题 概括图形所要表达的主要内容(包括时间、地点和研究内容) 标题一般写在图形的下端中央。 2、横轴和纵轴用横轴标目和纵轴标目说明横轴和纵轴的指标和度量

12、单位。一般将两轴的起始点即原点处定为0,但也可以不定为0。 3、统计图要用不同线条和颜色表达不同事物或对象的统计指标时,需要在图的右上角空隙处或图的下方与图标题中间位置附图例加以说明。4、按资料性质和分析目选用适合的图形资料的性质和分析目的宜选用的统计图比较分类资料各类别数值大小条图分析事物内部各组成部分所占比重(构成 比)圆图或百分条图描述事物随时间变化趋势或描述两现象相互变化趋势线图、半对数线图描述双变量资料相互关系的密切程度或相互关系的方向散点图描述连续性变量的频数分布直方图描述某现象的数量在地域上的分布统计地图(二)常用的统计图常见统计图条图百分条图圆图线图半对数线图直方图散点图统计地

13、图1、条图(bar graph)用等宽的直条长短来代表按属性分类的资料各类别统计指标的大小,表示它们之间的对比关系。条图分单式和复式两种适用资料:相互独立的资料绘制方法:单式条图复式条图纵轴的尺度必须从零点开始。复式条图2. 百分条图(percent bar graph)表示事物内部各组成部分所占的比重,即各部分的构成情况,故又称百分条图为构成比图。直条的总长度为100%,直条中各段长度表示事物的各组成部分所占的比重,即构成情况,各部分用不同的图例表示。适用资料:构成比资料。绘制方法:图3 我国部分县1988年死因构成比(%)3. 圆图(circle graph)也是一种构成比图,其用途与百分

14、条图相同。以一个圆面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的构成比例 适用资料:构成比资料绘制方法:图4 我国部分县1988年死因构成比(%)4. 线图(line graph)在直角坐标系中用线段的升降表达一事物的量随另一事物的量变化的趋势,或某事物的量随时间变化的过程。适用资料:连续性资料。绘制方法:年份甲市死亡率(1/10万)乙市死亡率(1/10万)198096.0100.0198182.085.0198275.060.0198363.057.0198432.042.0198518.014.0198616.08.019878.04.0某省甲、乙两市19801987年产妇

15、产褥感染死亡率图6. 1975-1990年某地百日咳与痢疾死亡率(1/10万)5. 半对数线图(semi-logarithmic line graph)是线图的一种,其横轴为算术尺度,纵轴为对数尺度。用于反映事物在一定时间范围内的发展变化速度,或用于比较两种或两种以上事物的发展变化速度。当相互比较的事物间绝对数量上相差较大时,普通线图难以同时表达出变化趋势,这时可采用半对数线图来表示。其绘制方法与普通线图类似,只需其纵轴取对数尺度。年份伤寒死亡率结核病死亡率195031.3174.5195222.4157.1195418.0142.019569.2127.219585.097.719603.8

16、71.319621.659.219640.846.019660.337.5某地居民19501966年伤寒与结核病死亡率(1/10万)图7. 1975-1990年某地百日咳与痢疾死亡率(1/10万)6. 直方图(histogram)直方图是用矩形直条面积表示数值变量资料或连续变量资料的频数分布(或频率)分布。绘制方法:经血量频数201020354036602580141004120314021601801合计130某妇幼保健院测得130例正常妇女月经血量(ml)7.散点图(scatter plot)散点图用点的位置表示两变量间的数量关系和变化趋势。两坐标轴尺度都不要求从0开始。适用于描述双变量资料。某地11名8岁男孩身高(cm)与坐高的关系(cm)对象编号身高坐高1120.065.92127.567.03126.368.04117.863.15117.461.06131.871.37121.166.38120.068.39116.361.510124.367.11113

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论