




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
定量资料的统计描述分析
统计描述统计推断
统计分析定量资料的统计描述分析统计描述统计推断统
第一节频数分布表与频数分布图一、频数表的制备(一)频数表的编制1、计算极差(range)R=最大值-最小值2、确定组距
I=R/组数,组数=10153、划分组段每个组段应有一个起始值作为组下限;第一组段应包括最小值,最后组段应包括最大值。4、归纳计数
第一节频数分布表与频数分布图一、频数表的制备
某年某市120名12岁健康男孩身高(cm)测量资料142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9R=160.9–125.9=35I=R/10=35/10=3.5,取整I=4.0
某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值 频数ƒ ƒx
(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合计 — 120(ƒ) 17172(ƒx)
某年某市120名12岁健康男孩身高(cm)频数分布表
(二)频数分布的类型1、对称分布2、偏态分布对称分布正偏态分布负偏态分布(二)频数分布的类型对称分布正偏态分布负偏态分布
(三)频数分布表的用途1、揭示资料的分布类型2、频数分布的重要特征——集中趋势(centraltendency)——离散趋势(tendencyofdispersion)3、便于发现某些特大或特小的可疑值(三)频数分布表的用途
二、连续型变量的频数分布图(一)等距分组二、连续型变量的频数分布图
×年×市流行性乙型脑炎患者的年龄分布(二)不等距分组
×年×市流行性乙型脑炎患者的年龄分布
第二节集中趋势的描述
平均数(averageindex):用以描述同质计量资料频数分布的集中趋势,反映一组变量值的平均水平,是一组变量值的代表值。
第二节集中趋势的描述
一、算术均数:简称均数。用于描述对称分布(特别是呈正态分布)的变量值的平均水平。总体均数用希腊字母表示,样本均数用X表示。计算方法:
直接法:x=x/n,用于变量值个数不多时例如:现测得8名健康人血液一小时末红细胞沉降率(血沉)各为:4、7、5、3、10、9、6和7mm/hr。试求其血沉均数。x=x/n=(4+7+5+3+10+9+6+7)/8=6.4(mm/hr)
加权法:x=x/=x/n,当变量值个数较多或变量值为频数表资料时例如,某市某年120名12岁健康男孩身高的均数X=x/=x/n=17172/120=143.10(cm)一、算术均数:简称均数。用于描述对称分布(特别是呈正
某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值 频数ƒ ƒx
(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合计 — 120(ƒ) 17172(ƒx)
X=x/=x/n=17172/120=143.10(cm)
某年某市120名12岁健康男孩身高(cm)频数二、几何均数:用G表示。用于描述变量值呈等比数列,或呈对数正态分布或近似对数正态分布资料。直接法:G=nx1x2x3
xn,G=lg-1(lgx/n)例如,某地在研究人群中流行性感冒抗体水平的调查中,测得12名儿童的血清对某型病毒之血凝抑制效价的倒数各为5、5、5、5、5、5、5、10、10、10、20、40,试计算平均血凝抑制效价。X=(5+5+5+5+5+5+5+10+10+10+20+40)/12=10.42G=12571032040=7.94二、几何均数:用G表示。用于描述变量值呈等比数列,或呈对lgG=lg(12571032040)=lg(571032040)1/12=1/12(7lg5+3lg10+lg20+lg40)=0.89966为简化计算,可两边取对数G=lg-1(lgG)=lg-10.89966=7.94
加权法:G=lg-1(lgx/),当变量值个数较多或变量值为频数表资料时G=12571032040=7.94lgG=lg(12571032040)=lg(5
三、中位数和百分位数:中位数是一组从小到大顺序排列的变量值,位于正中间位置的数值,亦称为位置平均数,代号为M。多用于描述偏态分布资料,或分布不明资料,或一端或两端无确定数值的开口资料的集中趋势。百分位数代号为PX,是一种位置指标。PX:1,2,3,4,5,6,7,8,9,10,…n100等分P50=
M
三、中位数和百分位数:中位数是一组从小到大顺序排列小样本资料中位数计算方法(直接法):
当例数n为奇数时
M=X(n+1)/2
当例数n为偶数时
M=[X(n/2)+X(n/2+1)]/2例如,7名某病潜伏期各为1、2、2、3、3、5、15,求其平均潜伏期。X=(1+2+2+3+3+5+15)/7=4.4(天)M=X(n+1/2)=3(天)小样本资料中位数计算方法(直接法):
1、离散型变量2、连续型变量中位数和百分位数计算方法(频数表法):
PX=L+i(nx%-L)/mL:百分位数所在组组下限i:百分位数所在组组距L:百分位数所在组上一个组段的累计频数m:百分位数所在组频数
M=L+i(n/2-L)/mL:中位数所在组组下限i:中位数所在组组距L:中位数所在组上一个组段的累计频数m:中位数所在组频数1、离散型变量
238名正常人发汞的中位数计算发汞值 频数(ƒ) 累计频数(ƒL)0.3~ 20 200.7~ 66 861.1~ 60 1461.5~ 48 1.9~ 18 2.3~ 16 2.7~ 63.1~ 13.5~ 03.9~ 3 M=1.1+0.4(238/2–86)/60=1.32(g/g)
238名正常人发汞的中位数计算
三种常用平均数平均数 适用资料 计算方法算术均数 变量值呈对称分布 直接法(未分组资料(X) 加权法(分组资料)
几何均数等比级资料, 直接法(未分组资料) (G)对数正态分布 加权法(分组资料)
中位数 呈偏态分布,直接法(未分组资料)(M) 分布不清分布一端无确定值频数表法(分组资料)三种常用平均数第三节离散程度的指标变异指标:又称离散指标,用以描述一组同质变量值之间参差不齐的程度,即离散程度(degreeofdispersion)或变异度(degreeofvariation)。例如,两组新生儿,各有5例,平均出生体重都是3.4公斤甲组2.82.93.43.94.0乙组3.03.23.43.63.8甲的变异程度>乙组第三节离散程度的指标(一)全距:R(range),亦称极差。即一组变量值中最大值与最小值之差。R甲=4.0-2.8=1.2R乙=3.8-3.0=0.8优点:简单明了缺点:仅考虑了资料的最大值与最小值,不能反应组内其它数据的变异程度。一、极差和四分位间距一、极差和四分位间距
(二)四分位间距(inter-quartilerange)1、百分位数2、四分位数:下四分位数(QL):P25上四分位数(QU):P753、四分位间距
QU-QL(二)四分位间距(inter-quartilerang二、方差与标准差:是最常用来衡量变量值间离散程度的变异指标。总体方差2,标准差代号,样本方差S2,标准差代号S。x-离均差
x-
离均差之和如对称则会出现x-=0(x-)2
离均差平方和与变异度及个数有关(x-)2/n即方差(variance),总体方差用2表示2=(x-)2/n数理统计研究结果,(x-x)2/n<(x-)2/n,因此,s2=(x-x)2/(n-1),缺点是将单位也进行了平方=n-1,称为自由度。二、方差与标准差:是最常用来衡量变量值间离散程度的变异指标
x
2–(x)2/nfx2–(fx)2/fxS=(x-x)2/(n-1)= = n–1
fx–1
运用:1、用来描述正态分布资料的变异程度。
2、当资料呈正态或近似正态资料时往往将均数与标准差同时写出:XS,表示均数的代表性。
3、计算变异系数
4、用标准差估计变量值的频数分布
5、用标准差计算标准误标准正态分布示意图课件某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值频数ƒƒxfx2
(1)(2)(3)(4)=(2)(3)(5)=(2)(4)
125127 1127 16129129 131 4524 68644133 135 91215 164025137 139 283829 540988141 143 355005 715715145 147 273969 583443149 151 111661 250811153 155 4620 96100157161159 1159 25181合计 12017172 2461136
(ƒ)(ƒx)(ƒx2)
2461136-(17172)2/120s=120-1
某年某市120名12岁健康男孩身高(cm)频数分布表三、变异系数:又称离散系数。代号为CV。
SCV=100%x
运用:1、比较均数相差悬殊的几组资料的变异程度;
2、比较度量衡单位不同的几组资料的变异程度;例如,某地20岁男子160人,身高均数为166.06cm,标准差4.95cm;体重均数53.72kg,标准差4.96kg,试比较身高与体重的变异程度。身高:CV=(4.95/166.06)×100%=2.98%体重:CV=(4.96/53.72)×100%=9.23%三、变异系数:又称离散系数。代号为CV。正态分布及其应用一、正态分布(normaldistribution):是医学和生物学中最常见的总体频数分布,以均数为中心,两侧逐渐下降并对称,两端永远不与横轴相交。
为了应用方便,常对变量X作u=(X-)/变换,使=0,=1,则正态分布转换为标准正态分布(或称U分布),用N(0,1)表示。
正态分布及其应用
特征:1、均数处最高;2、以均数为中心,左右对称;3、有两个参数:和;正态分布用N(,)表示
特征:
正态分布曲线
正态分布曲线正态曲线下面积的分布规律正态曲线下的面积分布有一定规律:变量值范围正态曲线下面积(变量值出现的概率)
1.068.27%
1.9695.00%(警界线)
2.5899.00%(控制线)面积分布规律的通式
Z
正态曲线下面积的分布规律(68.27%)(95.00%)1.96(99.00%)2.58正态曲线面积分布规律X
(68.27%)X二、标准正态分布Z=(x-)/正态分布N(,),为了应用方便,常对变量X作Z=(X-)/变换,使=0,=1,则正态分布转换为标准正态分布(或称Z分布),Z值的分布就是标准正态分布N(0,1)
二、标准正态分布X-N(,)
x-Z=
Z-N(O,1)0标准正态分布示意图=1X-N(,)x-Z-N(O,1)0标
(68.27%)(95.00%)(99.00%)0-1-1.96-2.5811.962.58标准正态面积分布Z=10-1-1.96-2.5811.962.58标准正态面
标准正态分布表
——附表1
对非标准正态分布分布,求曲线下任意(x1,x2)范围的面积。可作标准化变换,查附表1可求得。标准正态分布表
已知某地7岁110男童身高均数为121.95cm,标准差为4.72cm,试估计身高在116.5-119.0cm范围内有多少人?并确定3男童身高的参考水平。已知某地7岁110男童身高均数为121.95cm,标准三、正态分布的应用:(一)估计频数分布(二)估计医学参考范围正常值:指正常人的各种生理、生化的数值波动范围。当资料呈正态分布时,最常用μz
估计正常值范围,其含义是指绝大多数正常的变量值都在这个范围内,绝大多数是包括正常的80%、90%、95%和99%,最常用95%(X
1.96S)。样本足够大(n>100)
分布呈正态(三)质量控制(四)统计处理方法的基础
三、正态分布的应用:标准正态分布示意图课件思考题:1、均数、中位数和几何均数的适用范围有何异同?2、列出离散程度的指标,说出它们的应用条件。3、正态分布、标准正态分布与对数正态分布在概念和应用上有何异同?4、医学参考值范围的涵义是什么?确定的原则和方法是什么?
思考题:
定量资料的统计描述分析
统计描述统计推断
统计分析定量资料的统计描述分析统计描述统计推断统
第一节频数分布表与频数分布图一、频数表的制备(一)频数表的编制1、计算极差(range)R=最大值-最小值2、确定组距
I=R/组数,组数=10153、划分组段每个组段应有一个起始值作为组下限;第一组段应包括最小值,最后组段应包括最大值。4、归纳计数
第一节频数分布表与频数分布图一、频数表的制备
某年某市120名12岁健康男孩身高(cm)测量资料142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9R=160.9–125.9=35I=R/10=35/10=3.5,取整I=4.0
某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值 频数ƒ ƒx
(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合计 — 120(ƒ) 17172(ƒx)
某年某市120名12岁健康男孩身高(cm)频数分布表
(二)频数分布的类型1、对称分布2、偏态分布对称分布正偏态分布负偏态分布(二)频数分布的类型对称分布正偏态分布负偏态分布
(三)频数分布表的用途1、揭示资料的分布类型2、频数分布的重要特征——集中趋势(centraltendency)——离散趋势(tendencyofdispersion)3、便于发现某些特大或特小的可疑值(三)频数分布表的用途
二、连续型变量的频数分布图(一)等距分组二、连续型变量的频数分布图
×年×市流行性乙型脑炎患者的年龄分布(二)不等距分组
×年×市流行性乙型脑炎患者的年龄分布
第二节集中趋势的描述
平均数(averageindex):用以描述同质计量资料频数分布的集中趋势,反映一组变量值的平均水平,是一组变量值的代表值。
第二节集中趋势的描述
一、算术均数:简称均数。用于描述对称分布(特别是呈正态分布)的变量值的平均水平。总体均数用希腊字母表示,样本均数用X表示。计算方法:
直接法:x=x/n,用于变量值个数不多时例如:现测得8名健康人血液一小时末红细胞沉降率(血沉)各为:4、7、5、3、10、9、6和7mm/hr。试求其血沉均数。x=x/n=(4+7+5+3+10+9+6+7)/8=6.4(mm/hr)
加权法:x=x/=x/n,当变量值个数较多或变量值为频数表资料时例如,某市某年120名12岁健康男孩身高的均数X=x/=x/n=17172/120=143.10(cm)一、算术均数:简称均数。用于描述对称分布(特别是呈正
某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值 频数ƒ ƒx
(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合计 — 120(ƒ) 17172(ƒx)
X=x/=x/n=17172/120=143.10(cm)
某年某市120名12岁健康男孩身高(cm)频数二、几何均数:用G表示。用于描述变量值呈等比数列,或呈对数正态分布或近似对数正态分布资料。直接法:G=nx1x2x3
xn,G=lg-1(lgx/n)例如,某地在研究人群中流行性感冒抗体水平的调查中,测得12名儿童的血清对某型病毒之血凝抑制效价的倒数各为5、5、5、5、5、5、5、10、10、10、20、40,试计算平均血凝抑制效价。X=(5+5+5+5+5+5+5+10+10+10+20+40)/12=10.42G=12571032040=7.94二、几何均数:用G表示。用于描述变量值呈等比数列,或呈对lgG=lg(12571032040)=lg(571032040)1/12=1/12(7lg5+3lg10+lg20+lg40)=0.89966为简化计算,可两边取对数G=lg-1(lgG)=lg-10.89966=7.94
加权法:G=lg-1(lgx/),当变量值个数较多或变量值为频数表资料时G=12571032040=7.94lgG=lg(12571032040)=lg(5
三、中位数和百分位数:中位数是一组从小到大顺序排列的变量值,位于正中间位置的数值,亦称为位置平均数,代号为M。多用于描述偏态分布资料,或分布不明资料,或一端或两端无确定数值的开口资料的集中趋势。百分位数代号为PX,是一种位置指标。PX:1,2,3,4,5,6,7,8,9,10,…n100等分P50=
M
三、中位数和百分位数:中位数是一组从小到大顺序排列小样本资料中位数计算方法(直接法):
当例数n为奇数时
M=X(n+1)/2
当例数n为偶数时
M=[X(n/2)+X(n/2+1)]/2例如,7名某病潜伏期各为1、2、2、3、3、5、15,求其平均潜伏期。X=(1+2+2+3+3+5+15)/7=4.4(天)M=X(n+1/2)=3(天)小样本资料中位数计算方法(直接法):
1、离散型变量2、连续型变量中位数和百分位数计算方法(频数表法):
PX=L+i(nx%-L)/mL:百分位数所在组组下限i:百分位数所在组组距L:百分位数所在组上一个组段的累计频数m:百分位数所在组频数
M=L+i(n/2-L)/mL:中位数所在组组下限i:中位数所在组组距L:中位数所在组上一个组段的累计频数m:中位数所在组频数1、离散型变量
238名正常人发汞的中位数计算发汞值 频数(ƒ) 累计频数(ƒL)0.3~ 20 200.7~ 66 861.1~ 60 1461.5~ 48 1.9~ 18 2.3~ 16 2.7~ 63.1~ 13.5~ 03.9~ 3 M=1.1+0.4(238/2–86)/60=1.32(g/g)
238名正常人发汞的中位数计算
三种常用平均数平均数 适用资料 计算方法算术均数 变量值呈对称分布 直接法(未分组资料(X) 加权法(分组资料)
几何均数等比级资料, 直接法(未分组资料) (G)对数正态分布 加权法(分组资料)
中位数 呈偏态分布,直接法(未分组资料)(M) 分布不清分布一端无确定值频数表法(分组资料)三种常用平均数第三节离散程度的指标变异指标:又称离散指标,用以描述一组同质变量值之间参差不齐的程度,即离散程度(degreeofdispersion)或变异度(degreeofvariation)。例如,两组新生儿,各有5例,平均出生体重都是3.4公斤甲组2.82.93.43.94.0乙组3.03.23.43.63.8甲的变异程度>乙组第三节离散程度的指标(一)全距:R(range),亦称极差。即一组变量值中最大值与最小值之差。R甲=4.0-2.8=1.2R乙=3.8-3.0=0.8优点:简单明了缺点:仅考虑了资料的最大值与最小值,不能反应组内其它数据的变异程度。一、极差和四分位间距一、极差和四分位间距
(二)四分位间距(inter-quartilerange)1、百分位数2、四分位数:下四分位数(QL):P25上四分位数(QU):P753、四分位间距
QU-QL(二)四分位间距(inter-quartilerang二、方差与标准差:是最常用来衡量变量值间离散程度的变异指标。总体方差2,标准差代号,样本方差S2,标准差代号S。x-离均差
x-
离均差之和如对称则会出现x-=0(x-)2
离均差平方和与变异度及个数有关(x-)2/n即方差(variance),总体方差用2表示2=(x-)2/n数理统计研究结果,(x-x)2/n<(x-)2/n,因此,s2=(x-x)2/(n-1),缺点是将单位也进行了平方=n-1,称为自由度。二、方差与标准差:是最常用来衡量变量值间离散程度的变异指标
x
2–(x)2/nfx2–(fx)2/fxS=(x-x)2/(n-1)= = n–1
fx–1
运用:1、用来描述正态分布资料的变异程度。
2、当资料呈正态或近似正态资料时往往将均数与标准差同时写出:XS,表示均数的代表性。
3、计算变异系数
4、用标准差估计变量值的频数分布
5、用标准差计算标准误标准正态分布示意图课件某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值频数ƒƒxfx2
(1)(2)(3)(4)=(2)(3)(5)=(2)(4)
125127 1127 16129129 131 4524 68644133 135 91215 164025137 139 283829 540988141 143 355005 715715145 147 273969 583443149 151 111661 250811153 155 4620 96100157161159 1159 25181合计 12017172 2461136
(ƒ)(ƒx)(ƒx2)
2461136-(17172)2/120s=120-1
某年某市120名12岁健康男孩身高(cm)频数分布表三、变异系数:又称离散系数。代号为CV。
SCV=100%x
运用:1、比较均数相差悬殊的几组资料的变异程度;
2、比较度量衡单位不同的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 夫妻忠诚保障与情感补偿协议
- 商业地产项目全产业链招商运营与品牌孵化合作协议
- 宠物美容院品牌合作、专业技术培训、设备采购与品牌授权协议
- 知识产权改编作品收益分成权益补充协议
- 电动跑车全面升级维护及保养合同
- 宠物领养及长期抚养费用保障协议
- 企业员工股权激励与公司社会责任履行协议
- DB42-T 2025-2023 马铃薯-玉米-大豆复合种植模式技术规程
- 2023年软件测试基础期末试卷及参考答案
- 高一历史备课组期末工作总结模版
- 利用热释光剂量探测器测量射线剂量
- 大病历模板-住院病历
- GB/T 602-2002化学试剂杂质测定用标准溶液的制备
- GB/T 18657.1-2002远动设备及系统第5部分:传输规约第1篇:传输帧格式
- GB/T 15608-2006中国颜色体系
- GB/T 14315-2008电力电缆导体用压接型铜、铝接线端子和连接管
- 中考语文二轮专题复习:散文和小说阅读
- 【人卫九版内分泌科】第十一章-甲状腺功能减退症课件
- 护理人员业务技术档案 模板
- 金融监管学-金融监管学课件
- 语文一年级上册:拼音9《y-w》ppt教学课件
评论
0/150
提交评论