医学统计学第二讲计量资料的统计描述_第1页
医学统计学第二讲计量资料的统计描述_第2页
医学统计学第二讲计量资料的统计描述_第3页
医学统计学第二讲计量资料的统计描述_第4页
医学统计学第二讲计量资料的统计描述_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计工作基本步骤:设计—收集—整理—分析(按资料类型)﹡整理资料---制作频数表﹡分析资料统计描述:指标、图表统计推断:参数估计、假设检验第二章计量资料的统计描述(指标)第二章主要内容第一节频数分布表和频数分布图(整理)第二节集中趋势第三节离散趋势第四节正态分布第五节医学正常值范围的估计分析应用12345表2.1某年某地区434名15-64岁少数民族已婚妇女现有子女数的频数分布例2.1某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示:频数表(FrequencyTable)同时列出观察指标的可能取值区间及其在各区间内出现的频数。求全距:R=5.95-3.82=2.03确定组数k:通常选择在8~15之间确定组距:参考组距为R/k,R为全距确定组段:包含下限不包含上限对各组段计数:划记,汇总.7某地140名正常男子红细胞数的频数表

140名正常男子红细胞计数的直方图直方图(Histogram)直观、形象地表示频数分布的形态和特征。频数表的用途9便于观察数据的分布类型02便于发现资料中含有的异常值03作为陈述资料的形式01便于进行统计指标的计算和进一步的分析.041.频数表的编制步骤表2.2某市120名5岁女孩身高频数分布1.频数表的编制步骤第二节集中趋势的描述为了进一步揭示数据分布的规律,尚需要用统计指标来较为准确地描述数据的分布特征:集中趋势和离散趋势

平均数(average)是一组反映资料集中趋势(centraltendency

)的指标。常用的有:

1.算术均数(arithmeticmean),简称均数(mean)

2.几何均数(geometricmean)

3.中位数

(median)

4.众数(mode)算术平均数(TheArithmeticmean)简称均数(Mean)或均值,定义为所有变量值之和除以变量值个数(即,样本含量SampleSize)。反映一组呈对称分布的变量值在数量上的平均水平。直接计算法公式:01例1:试计算1,3,7,9的均数?02例2:试计算1,3,3,7,7,9,9,9的均数?03(2)加权法14Σ为求和符号,读成sigma15算术均数小结1.频数表的编制步骤意义:一组性质相同的观察值在数量上的平均水平。表示:

(总体)X(样本)计算:直接法、间接法、计算机特征:∑(X-X)=0。∑(X-X)2

<∑(X-a)2(其中a≠X)易受到极端值的影响。应用:正态分布或近似正态分布;可以作为样本的代表值与其他样本进行比较。注意:合理分组,才能求均数,否则没有意义。在数量上的平均水平。1例一组血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求均数。2此例的算术均数为22222,显然不能代表滴度的平均水平。直观看,其平均水平应为1000,如何求得这一数据呢?3二、几何均数(geometricmean)在数量上的平均水平。01可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。02(1)直接法19几何均数:变量对数值的算术均数的反对数。其他对数(如自然对数)变换也可获得相同的几何均数0102例3.6测定10名伤寒病人血清抗体滴度分别为1:4,1:4,1:4,1:4,1:4,1:16,1:16,1:16,1:64,1:128,求其平均抗体滴度。以其滴度的倒数为原变量值,代入公式有:平均抗体滴度为:1:11(2)加权法21公式:例2.575名儿童的平均抗体滴度计算几何均数小结意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:G计算:直接法、间接法应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。等比资料注意观察值不能同时有正负或有零,若全是负值,则计算时可先去掉负号,得出结果后再加上负号。同一资料,几何均数<均数中位数是将一批数据从小至大排列后位次居中的数据值,符号为M,反映一批观察值在位次上的平均水平。4,10,7,50,3,15,2,9,13,>60,>60秩次123456789101111只大鼠平均存活时间如下,求其平均存活天数?变量排序2,3,4,7,9,10,13,15,50,>60,>60123453.中位数(median)01中位数计算方法直接法:适用于样本量较小的计量资料。当n为奇数时当n为偶数时02频数表的编制步骤1例9名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,19天,

求其中位数。2频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。频数表的编制步骤LM:中位数所在组段下限i:组距fM:中位数所在组段频数∑fL:中位数所在组段前一组的累计频数12频数表资料的中位数28下限值L100cm1i;fm3上限值U120cm2中位数M4中位数=100+20x[(1503x50%-448)/520]=111.67(分)1.频数表的编制步骤中位数小结优点:对极值不敏感缺点:并非考虑到每个观测值计算时只利用了位置居中的测量值大样本偏态分布资料或者一端或两端无确切数值的资料或分布不清的资料﹡对于正态分布资料,中位数等于均数,对于对数正态分布资料,中位数等于几何均数.适用于各种分布类型的资料,特别适合于:1.频数表的编制步骤离散趋势的描述极差(Range)(全距)

百分位数与四分位数间距变异(variation)指标:反映数据的离散度(Dispersion)。即个体观察值的变异程度。常用的指标有:01方差Variance

标准差StandardDeviation

变异系数CoefficientofVariationPercentileandQuartilerange021.频数表的编制步骤

例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙1.极差(Range)(全距)1.频数表的编制步骤优点:简便缺点:只利用了两个极端值;n大,R也会大,不稳定。应用:用于描述单峰对称分布小样本资料;初步了解资料的变异程度。1204020R=Xmax-Xmin百分位数与四分位数间距

Percentileandquartilerange百分位数:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px。3501020304XmaxP005X%(100-X)%PXP100百分位数示意图Xmin变量值从小到大排列0601直接法:略02频数表法:公式百分位数的计算P25=80+20x[(1503x25%-0)/448]=96.77(分)01P75=120+20x[(1503x75%-968)/226]=134.09(分)020P25P50P75100%四分位间距:Q=P75-P25Q越大,表示资料的离散程度越高,反之亦然。与中位数的应用条件相同.可以看作是一对指标。3.方差方差(variance)也称均方差(meansquaredeviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。平均偏差=离均差平方和(SS)=离均差=总体方差01方差性质:方差越大说明数据的变异越大n-1为自由度(degreeoffreedom,简记为DF)01指随机变量能自由取值的个数01与自由度(degreesoffreedom)有关。01自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(n-k)个自由度了。计算标准差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n-1)个“离均差”表示,所以只有(n-1)个独立的“离均差”。因此只有(n-1)个自由度。02样本方差为什么要除以(n-1)方差的计算42S2=[(112.9-107.39)2+(99.5-107.39)+…+(116.5-107.39)]/(11-1)=48.75(cm)2例题:求某市城区11名5岁女孩身高的样本方差,已知X=107.39。1标准差(standarddeviation)即方差的正平方根;其单位与原变量X的单位相同。2计算公式:4.标准差标准差(standarddeviation)01样本标准差为样本方差的平方根;02总体标准差为总体方差的平方根。频数表标准差计算公式451.频数表的编制步骤表2.2某市120名5岁女孩身高频数分布5.变异系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论