




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章第二章定量数据的统计描述定量数据的统计描述【例例2-1】2006年某市年某市120名名10岁男孩的身高岁男孩的身高(cm)资料如下资料如下135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141
2、.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 14
3、1.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5 【问题问题2-1】该资料为何种类型资料?该资料为何种类型资料?如何对该资料进行描述?如何对该资料进行描述?第一节第一节 频数表和频数图频数表和频数图第二节第二节 集中趋势的描述集中趋势的描述第三节第三节 离散趋势的离散趋势的描述描述第四节
4、第四节 正态分布及其应用正态分布及其应用频数表和频数图频数表和频数图由于个体变异的存在,医学研究中某指标在各个由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布无章的,而是有一定规律的,呈一定的分布(distribution)。将原始数据按照一定的标准划分为若干个组,合将原始数据按照一定的标准划分为若干个组,合计各组的频数,得到频数分布表;也可再将频数计各组的频数,得到频数分布表;也可再将频数表绘制成频数分布图表绘制成频数分布图。频数频数(frequency):一组资料中各观察值或
5、不:一组资料中各观察值或不同组段内观察值出现的频繁程度(次数)同组段内观察值出现的频繁程度(次数)。频数分布表频数分布表(frequency table):由变量值及:由变量值及其频数编制而成的表其频数编制而成的表。一、频数分布表(一)频数表的编制1. 求极差求极差(range): 极差又称全距,是指全部观察值中最极差又称全距,是指全部观察值中最大值与最小值之差,用符号大值与最小值之差,用符号R表示。表示。 R=xmax-xmin155.4 130.225.2Rcm2. 确定组数和组距确定组数和组距 (1) 根据样本含量的大小及研究目的确定组数根据样本含量的大小及研究目的确定组数: 一般设一般
6、设815个组。个组。 (n50,915)。 (2)确定组距(确定组距(class interval):相邻两个组相邻两个组段下限之差为组距,一般采用等距分组。段下限之差为组距,一般采用等距分组。 i=R/组数组数,为了方便资料整理汇总,组距,为了方便资料整理汇总,组距一般取整数一般取整数。25.2 102.522.00icm 3. 确定组段确定组段组段起点称为下限(组段起点称为下限(lower limit)组段终点称为上限(组段终点称为上限(upper limit)注意:注意:第一组段必须包含最小值,最后一个组第一组段必须包含最小值,最后一个组段必须包括最大值,各组段不能重叠。除最末段必须包括
7、最大值,各组段不能重叠。除最末一个组段需同时写出上下限外,其余组段只写一个组段需同时写出上下限外,其余组段只写出其下限出其下限。4. 归组计数,整理成表归组计数,整理成表用计算机或手工划记法汇总,得到各组段观察用计算机或手工划记法汇总,得到各组段观察单位个数,单位个数,绘制成频数分布表。绘制成频数分布表。表表2-1 2006年某市年某市120名名10岁男孩身高(岁男孩身高(cm)的频数表)的频数表身高身高(1)频数频数(2)频率(频率(%)(3)累计频数累计频数(4)累计频率(累计频率(%)(5)130132134136138140142144146148150152 154156 1 3 4
8、 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.7 8.3 5.0 2.5 0.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.7 13.3 23.3 37.5 55.0 71.7 83.3 91.7 96.7 99.2100.0合计合计 120 100.0 (二)频数分布表的用途(二)频数分布表的用途1. 揭示揭示频数分布特征频数分布特征2. 揭示揭示频数分布类型频数分布类型3. 便于发现特大或特小的可疑值便于发现特大或特小的可疑值4. 便于进一步计算统计指标和进行统便于进一步计算统
9、计指标和进行统计分析计分析频数分布的两个特征频数分布的两个特征集中趋势(集中趋势(central tendency):指一组数:指一组数据向某个位置聚集或集中的倾向据向某个位置聚集或集中的倾向。 离散趋势离散趋势(dispersion tendency):指一组:指一组数据的分散性或变异度数据的分散性或变异度。 肌红蛋白47.545.042.540.037.535.032.530.027.525.022.520.017.515.012.510.07.55.02.50.0人数121086420Std. Dev = 10.75 Mean = 27.1N = 91.00血清总胆固醇(mmol/L)5
10、.755.505.255.004.754.504.254.003.753.503.253.002.752.502.2520100抗体滴度1250.01000.0750.0500.0250.00.03020100频 数频频 数数频频 数数血清肌红蛋白血清肌红蛋白(g/ml)负(左)偏态负(左)偏态对称分布对称分布正(右)偏态正(右)偏态二、频数分布图频数分布图(频数分布图(graph of frequency)是以变)是以变量值为横坐标、频数(或频率)为纵坐标量值为横坐标、频数(或频率)为纵坐标(不等距分组时以频率(不等距分组时以频率/组距组距=频率密度为频率密度为纵坐标),以每个等宽的距形面积
11、表示每纵坐标),以每个等宽的距形面积表示每组的频数(或频率)组的频数(或频率)。连续型定量资料:频数图中各距形是相连连续型定量资料:频数图中各距形是相连的,又称的,又称直方图直方图(histogram)。离散型定量资料:频数图中各距形是间隔离散型定量资料:频数图中各距形是间隔的,又称的,又称直条图直条图(bar graph)。图图2-1 2006年某市年某市120名名10岁男孩身高的频数图岁男孩身高的频数图离散型计量资料的频数表 434名少数民族已婚妇女现有子女数频数分布图名少数民族已婚妇女现有子女数频数分布图集中趋势的描述集中趋势的描述平均数平均数(average)是一类描述计量资料是一类描
12、述计量资料集中集中位置或平均水平位置或平均水平的统计指标,在医学领域的统计指标,在医学领域中常用的平均数有中常用的平均数有算术均数、几何均数、算术均数、几何均数、中位数中位数、众数、调和均数、众数、调和均数。一、算术均数一、算术均数(arithmetic mean)简称均数简称均数(mean),总体均数用希腊字母总体均数用希腊字母 (miu)表示,样本均数用表示,样本均数用 (x bar)表表示。均数描述一组数据在数量上的平均示。均数描述一组数据在数量上的平均水平水平。x直接法直接法将所有数据直接相加,再除以总例数将所有数据直接相加,再除以总例数:是希腊字母,读作是希腊字母,读作sigma,为
13、求和符号,为求和符号。12.nxxxxxnn1. 计算方法计算方法【例例2-2】某医生测量了某医生测量了10名脑出血患者的血尿素氮名脑出血患者的血尿素氮(mmol/L)分别是:)分别是:7.4、6.7、6.9、7.3、7.6、6.5、 7.8、8.2、8.0、6.6,试计算该组数据的均数。,试计算该组数据的均数。7.46.76.96.67.310 xxn1 12212iikkkif xf xf xf xxffff加权法加权法 用于频数表资料或样本中相同观察值较多用于频数表资料或样本中相同观察值较多时,将相同观察值的个数时,将相同观察值的个数(频数频数 f )乘以该乘以该观察值观察值 x,以代替
14、相同观察值逐个相加,以代替相同观察值逐个相加。【例例2-3】根据表根据表2-1资料,用加权法求资料,用加权法求120名名10岁男孩身高的均数岁男孩身高的均数f 起了起了“权数权数”的作用,权衡了各组中值由的作用,权衡了各组中值由于频数不同对均数的影响。于频数不同对均数的影响。加权法计算的加权法计算的均数是近似的。均数是近似的。1 1313 1334 135135 cm131120iiif xxf 适用于描述单峰对称分布,特别适用于描述单峰对称分布,特别是是正态分布或近似正态分布资料正态分布或近似正态分布资料的集中趋势。的集中趋势。均数在描述正态分布特征方面有均数在描述
15、正态分布特征方面有重要意义。重要意义。均数的应用均数的应用我也我也知道知道了!了!例例 现有现有5人,其血清抗体效价分别为人,其血清抗体效价分别为1:10、 1:100、 1:1000、 1:10000和和 1:100000,求,求其效价倒数的平均水平其效价倒数的平均水平。若计算效价倒数的算术均数若计算效价倒数的算术均数用算术均数反映这类资料的平均水平是用算术均数反映这类资料的平均水平是不不合适的合适的。22222x 先求效价倒数对数值的均数,然后求反对数先求效价倒数对数值的均数,然后求反对数1000位于位于10、100、1000、10000、100000的中间的中间位置,具有很好的表性,这种
16、平均数就称为位置,具有很好的表性,这种平均数就称为几何几何均数均数。1lg10lg100lg1000lg10000lg100000lg35lg31000GGu是是n个观察值乘积的个观察值乘积的n次方根,又称倍数次方根,又称倍数均数,用均数,用G表示表示 。 几何均数(几何均数(geometric mean) 二、几何均数二、几何均数(Geometric mean,G)直接法:当直接法:当 n 较小时,直接将较小时,直接将 n 个个观察值的乘积开观察值的乘积开n 次方次方。12nnGx xx1lglg ()xGn1. 计算方法计算方法二、几何均数二、几何均数(Geometric mean,G)
17、【例例2-4】 某实验室测得某实验室测得7人血清中某种抗人血清中某种抗体的滴度分别为体的滴度分别为1/4,1/8,1/16,1/32,1/64,1/128,1/256,试求平,试求平均滴度均滴度。 111lg4 lg8lg25610.5361lglglg 1.5052 3277G 加权法:当资料中出现相同观察值较多或资料已加权法:当资料中出现相同观察值较多或资料已编制成频数表时,也可用加权法计算几何均数。编制成频数表时,也可用加权法计算几何均数。11112212lglglglglglgiikkkifxfxfxfxGffff【例例2-6】50名麻疹易感儿接种麻疹疫苗后,测得血凝名麻疹易感儿接种麻
18、疹疫苗后,测得血凝抑制抗体滴度资料见表抑制抗体滴度资料见表4-3,求抗体的平均滴度。,求抗体的平均滴度。表表4-3 50名麻疹易感儿血凝抑制抗体滴度名麻疹易感儿血凝抑制抗体滴度1111 lg43 lg87 lg256lg1 3786.9977lglg 1.73995450G 即即50名麻疹易感儿接种麻疹疫苗后血凝名麻疹易感儿接种麻疹疫苗后血凝抑制抗体的平均滴度为抑制抗体的平均滴度为1/54。 2. 应用及注意事项应用及注意事项几何均数应用于:几何均数应用于: 等比资料,如抗体平均滴度;等比资料,如抗体平均滴度; 对数正态分布资料。对数正态分布资料。Remember!使用几何均数时应注意:使用几
19、何均数时应注意: 观察值不能有观察值不能有0; 观察值不能同时有正值和负值。若全为观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结负值,在计算时先把负号去掉,得出结果再加上负号果再加上负号。Be careful! 【例例2-7】200名食物中毒患者潜伏期资料如表名食物中毒患者潜伏期资料如表2-4,研究人员据此采用加权法计算均数得平,研究人员据此采用加权法计算均数得平均潜伏期为均潜伏期为27小时。小时。(1)该组数据在分布上有何特点?)该组数据在分布上有何特点? (2)用均数描述该资料的平均水平是否合适?)用均数描述该资料的平均水平是否合适?三、中位数与百分位数三、中位数与百
20、分位数表表2-4 200名食物中毒患者的潜伏期名食物中毒患者的潜伏期潜伏期(小时)潜伏期(小时)(1)频数频数(2)累计频数累计频数(3)累计频率(累计频率(%)(4)=(3)/n 030 3015.0127110150.5244915075.0362817889.0481419296.060 719999.5 7284 1200 100.0合计合计 200中位数中位数(median):):一组观察值从小到大一组观察值从小到大排列,位次居中的观察值即中位数,是一排列,位次居中的观察值即中位数,是一个位置指标个位置指标。直接法直接法 n为奇数,为奇数, n为偶数,为偶数,1 222 12nnnM
21、xMxx【例例2-8】某实验师对某实验师对10只小白鼠染毒后观察各小只小白鼠染毒后观察各小鼠的生存时间(分钟),得数据为:鼠的生存时间(分钟),得数据为:35,60,62,63,63,65,66,68,69,69,试计算小白鼠的平,试计算小白鼠的平均生存时间均生存时间将将10个观察值由小到大排列:个观察值由小到大排列:35,60,62,63,63,65,66,68,69,69 22 126365264nnMxx 频数表法频数表法()2MLMinMLffLM 中位数所在组段下限中位数所在组段下限Mf Lfi组距组距中位数所在组段的频数中位数所在组段的频数中位数所在组段前一组的累计频数中位数所在组
22、段前一组的累计频数【例例2-9】根据例根据例4-7的资料计算中位数的资料计算中位数表表2-4 200名食物中毒患者的潜伏期名食物中毒患者的潜伏期潜伏期(小时)潜伏期(小时)(1)频数频数(2)累计频数累计频数(3)累计频率(累计频率(%)(4)=(3)/n 030 3015.0127110150.5244915074.5362817889.0481419296.060 719999.5 7284 1200 100.0合计合计 200()212 200 12(30)71223.8MLMinMLff 百分位数(百分位数(percentile):是指将一组观察值):是指将一组观察值由小到大排序后,将
23、其平均分成由小到大排序后,将其平均分成100等份,等份,对应于每一分割位置上的数值就称为一个百对应于每一分割位置上的数值就称为一个百分位数,用分位数,用 表示表示。xP 是一种位置指标,一个百分位数将一组观是一种位置指标,一个百分位数将一组观察值分为两部分,理论上有察值分为两部分,理论上有x%的观察值比它小,的观察值比它小,有(有(100-x)%的观察值比它大。的观察值比它大。xP(%)xLxiPLn xff(%)xxLxiPLnxffixfxLLf式中:式中:第第x百分位数所在组段下限百分位数所在组段下限组距组距第第x百分位数所在组段的频数百分位数所在组段的频数第第x百分位数所在组段前一组百
24、分位数所在组段前一组的累计频数的累计频数【例例4-10】根据表根据表4-4,计算,计算P25、P7525(%)1212(200 25%30)15.471xLxiPLnxff75(%)1224(200 75% 101)3649xLxiPLnxff适用条件:适用条件: 偏态分布资料偏态分布资料 分布类型不明确的资料分布类型不明确的资料 “开口资料开口资料”(即一端或两端无确切数值的资料即一端或两端无确切数值的资料)Understand?均数、中位数均数、中位数正态分布正态分布时:时: 均数中位数均数中位数正偏态分布正偏态分布时:时:均数均数 中位数中位数负偏态分布负偏态分布时时:均数均数中位数中位
25、数集中趋势指标小结1.即计量资料分布与平均数的选择即计量资料分布与平均数的选择2.2.计量资料的分布与统计分析计量资料的分布与统计分析 分布类型分布类型 算术均数算术均数几何均数几何均数中位数中位数 正态分布正态分布对数正态分布对数正态分布其他分布其他分布正态分布正态分布非正态分布非正态分布可转换为正态分布可转换为正态分布其他分布其他分布应用手段丰富应用手段丰富应用手段有限应用手段有限离散趋势的描述离散趋势的描述描述离散趋势的常用指标描述离散趋势的常用指标极差极差(range)四分位数间距四分位数间距(interquartile range)方差方差(variance)和标准差和标准差(sta
26、ndard deviation) 变异系数变异系数(coefficient of variation)1. 极差极差/全距全距(range) 全部观察值中最大值与最小值之差,用符号全部观察值中最大值与最小值之差,用符号R表示,表示, 即即常用于描述单峰对称分布小样本资料的变异常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度程度,或用于初步了解资料的变异程度maxminRxx极差描述离散趋势的局限极差描述离散趋势的局限只考虑最大值与最小值之差异,不能反只考虑最大值与最小值之差异,不能反映组内其它观察值的变异程度映组内其它观察值的变异程度样本含量越大,极差可能越大,样本含样
27、本含量越大,极差可能越大,样本含量相差悬殊时不宜用极差作比较量相差悬殊时不宜用极差作比较 四分位数四分位数 : P25,P50,P75三个点将全部观三个点将全部观察值等分为四部分,处于分位点上的数值察值等分为四部分,处于分位点上的数值就是四分位数就是四分位数下四分位数即第下四分位数即第25百分位数,用百分位数,用QL表示表示 上四分位数即第上四分位数即第75百分位数,用百分位数,用QU表示表示2. 四分位数间距四分位数间距四分位数间距四分位数间距(interquartile range)即上、即上、下四分位数之差下四分位数之差200名食物中毒患者的潜伏期资料,名食物中毒患者的潜伏期资料,P25
28、=15.4, P75=36ULQQQ36 15.420.6Q 四分位数间距常用于描述偏态分布及分布四分位数间距常用于描述偏态分布及分布的一端或两端无确切数值资料的离散程度的一端或两端无确切数值资料的离散程度四分位数间距较全距稳定,但仍不能全面四分位数间距较全距稳定,但仍不能全面概括所有观察值的变异情况概括所有观察值的变异情况x()x2()x22()xNx22()xN22()1xxsn3. 方差方差(variance)和标准差和标准差(SD)式中式中 n 1 称为自由度称为自由度(Degree of freedom),允许自由取值的变量值个数,用符号允许自由取值的变量值个数,用符号 (niu)表
29、示表示方差的度量单位是原度量单位的平方方差的度量单位是原度量单位的平方方差开方后即与原数据的度量单位相同,方差开方后即与原数据的度量单位相同,这就是这就是标准差标准差(standard deviation)2()xN 标准差应用公式标准差应用公式 直接法直接法 加权法加权法222()()11xxxxnsnn221fxfxnsn 【例例2-13】某医生测量了某医生测量了10名脑出血患者名脑出血患者的血尿素氮(的血尿素氮(mmol/L)分别是:)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的标准差试计算该组数据的标准差22222(7.46.
30、76.96.6 ) (7.4 6.7 6.96.6) /100.61(mmol/L)10 1s【例例2-14】根据表根据表4-1资料,计算资料,计算120名名10岁男岁男孩身高的标准差孩身高的标准差描述对称分布,特别是正态分布或近似正态描述对称分布,特别是正态分布或近似正态分布资料的变异程度分布资料的变异程度222()(17202)24686321204.79(cm)1120 1iiiiiif xf xfsf 【例例2-15】某医院预防保健科,对一组某医院预防保健科,对一组5岁男孩岁男孩进行体检,测量身高、体重等指标。得身高均进行体检,测量身高、体重等指标。得身高均数与标准差为数与标准差为11
31、5.8cm和和4.5cm,体重均数与标,体重均数与标准差为准差为20.2kg和和0.56kg,由此认为身高的变异,由此认为身高的变异程度比体重大。程度比体重大。上述结论是否正确?上述结论是否正确?4. 变异系数变异系数(coefficient of variation) 【例例2-16】某实验室分别测量了某实验室分别测量了10只小白鼠只小白鼠和和10只家兔的体重,得小白鼠体重的均数只家兔的体重,得小白鼠体重的均数与标准差分别为与标准差分别为22g和和3g,家兔体重的均数,家兔体重的均数与标准差分别为与标准差分别为1500g和和100g。经比较得出。经比较得出结论,因家兔体重的标准差大于小白鼠体
32、结论,因家兔体重的标准差大于小白鼠体重的标准差,所以家兔体重的变异程度比重的标准差,所以家兔体重的变异程度比小白鼠体重的变异程度大。小白鼠体重的变异程度大。变异系数(变异系数(coefficient of variation, CV):):是一组观察值的标准差与其均数的比值是一组观察值的标准差与其均数的比值用途:用途:比较度量衡单位不同的资料的变异度比较度量衡单位不同的资料的变异度比较均数相差悬殊的资料的变异度比较均数相差悬殊的资料的变异度100%sCVx4.5 100%3.89%115.80.56 100%2.77%20.2HeightCVWeightCV描述数值变量资料集中趋势的指标描述数
33、值变量资料集中趋势的指标平均数平均数 意义意义 应用场合应用场合 均数均数 平均数量水平平均数量水平 对称分布, 尤其正态分布对称分布, 尤其正态分布 几何均数几何均数 平均增减倍数平均增减倍数 等比、对数正态分布等比、对数正态分布 中位数中位数 位次居中的观察值水平位次居中的观察值水平 偏态、 分布不明确、 分布偏态、 分布不明确、 分布末端无确定值末端无确定值 描述数值变量资料离散趋势的指标描述数值变量资料离散趋势的指标离散趋势指标离散趋势指标 意义意义 应用应用 极差极差 四分位数间距四分位数间距 方差和标准差方差和标准差 变异系数变异系数 反映一组数据的变异范围反映一组数据的变异范围
34、反映全部观察值居中一半的范围反映全部观察值居中一半的范围 反映全部观察值之间的变异程度反映全部观察值之间的变异程度 标准差相对于均数的大小标准差相对于均数的大小 资料不限资料不限 资料不限资料不限 适用于对称分布,尤正态适用于对称分布,尤正态 适用于单位不同或均数适用于单位不同或均数差别较大的变量之间的差别较大的变量之间的比较比较 描述频数分布特征的指标总结描述频数分布特征的指标总结对称分布对称分布偏态分布偏态分布对数正态分布对数正态分布集中趋势集中趋势均数均数中位数中位数几何均数几何均数离散趋势离散趋势标准差标准差四分位数间距四分位数间距 对数标准差的对数标准差的反对数反对数正态分布及其应用
35、正态分布及其应用图图2-2 频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图1. 正态分布的概念及特征正态分布的概念及特征正态分布正态分布(Normal distribution),也称高斯,也称高斯分布分布(Gaussian distribution),是一种非常是一种非常重要的连续型随机变量的概率分布,重要的连续型随机变量的概率分布,是自是自然界中最常见的一种分布然界中最常见的一种分布正态分布(正态分布(normal distribution)称为高斯分)称为高斯分布(布(Gauss distribution),如果连续型随机),如果连续型随机变量变量X的概率密度函数为:的概率
36、密度函数为: 概念概念正态分布的概念与特征正态分布的概念与特征 则称随机变量则称随机变量X服从参数为服从参数为 和和 的正态分布,的正态分布,记作:记作: 22()21( )2xf xex ,XN 正态曲线(正态曲线(normal curve)在横轴上方均数)在横轴上方均数处最高;并以均数为中心,左右对称;两端处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。与横轴永不相交,呈钟形的曲线。 正态分布特征正态分布特征正态分布的概念与特征正态分布的概念与特征 正态曲线正态曲线正态分布有两个参数,即位置参数正态分布有两个参数,即位置参数 和形状和形状参数参数 正态分布的概念与特征正
37、态分布的概念与特征 -6-5-4-3-2-10123456321123位置参数方差相等、均数不等的正态分布图示312-3-2-10123332121形态参数正态分布的概念与特征正态分布的概念与特征 均数相等、方差不等的正态分布图示213正态分布的概念与特征正态分布的概念与特征 正态曲线下面积的分布有一定的规律。正态曲线下面积的分布有一定的规律。 正态分布曲线下一定区间内的面积代表了取值正态分布曲线下一定区间内的面积代表了取值于相应区间内的观察值个数在全部观察值总数中于相应区间内的观察值个数在全部观察值总数中所占的比例(概率),或者是观察值落在该区间所占的比例(概率),或者是观察值落在该区间内的
38、概率。内的概率。正态分布的概念与特征正态分布的概念与特征 正态曲线下面积的分布规律:正态曲线下面积的分布规律: 正态曲线与横轴之间的面积恒等于正态曲线与横轴之间的面积恒等于1或或100%;对称分布,对称轴两侧的面积各为对称分布,对称轴两侧的面积各为50;在在 区间的面积为区间的面积为68.27 在在 区间的面积为区间的面积为95.00 在在 区间的面积为区间的面积为99.00 , 1.96 ,1.96 2.58 ,2.58 正态曲线下的面积规律-+15.87%15.87%68.27%-1.96+1.962.5%2.5%95%-2.58+2.580.5%0.5%99% 若若X服从正态分布服从正态
39、分布 ,则,则Z就服从就服从 。 ,N 0,1NXZ012. 标准正态分布标准正态分布标准正态分布与标准化变换(标准正态分布与标准化变换(Z变换)变换)标准正态分布曲线下面积分布规律标准正态分布曲线下面积 (z) z 0.00 0.02 0.04 0.06 0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0
40、465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.2810 00.50000.49200.48400.47610.46810z 【例例2-18】 已知某地已知某地2003年年18岁男大学生身高的均岁男大学生身高的均数数 cm,标准差,标准差 cm,且,且18岁男大岁男大学生的身高服从正态分布。问该地学生的身高服从正态分布。问该地18岁男大学生岁男大学生中身高在中身高在166.8 cm及其以下者占多大的比例?及其以下者占多大的比例? 173.503.42()/166.8 173.5 /3.421.96zx 查附表
41、查附表3:表的左侧找:表的左侧找-1.9,表的上方找,表的上方找0.06,相,相交处为交处为0.025 3. 正态分布的应用正态分布的应用估计频率分布估计频率分布 【例例2-19】某地某地2003年抽样调查了年抽样调查了100名名18岁男大学生身高,算得均数为岁男大学生身高,算得均数为172.70cm,标准差为标准差为4.01cm。该地。该地18岁男大学生中身岁男大学生中身高在高在162.35cm183.05cm范围内者所占的范围内者所占的比例是多少?比例是多少?查附表查附表3, 左侧的面积为左侧的面积为0.005,由正态分布曲,由正态分布曲线的对称性可知,线的对称性可知, 右侧的面积也为右侧
42、的面积也为0.005,又,又由正态分布曲线下的总面积为由正态分布曲线下的总面积为1,可得,可得-2.58与与2.58之间之间的面积为的面积为1-20.005=0.99=99% 。11()/(162.35 172.0)/4.012.58zxxS 22()/(183.05 172.7)/4.012.58zxxS58. 22Z58. 21Z制定医学参考值范围制定医学参考值范围 医学参考值范围也称正常值范围医学参考值范围也称正常值范围 绝大多数正常人某观察指标的波动范围。绝大多数正常人某观察指标的波动范围。绝大绝大多数:多数:90%、95%、99%等,最常用的是等,最常用的是95% 正常人:不是指完全
43、健康的人,而是指排除了正常人:不是指完全健康的人,而是指排除了影响研究指标的疾病和有关因素的同质人群影响研究指标的疾病和有关因素的同质人群正常人正常人病人病人假阳性率假阳性率假阴性率假阴性率正常人与病人的数据分布重叠示意图正常人与病人的数据分布重叠示意图( (单侧单侧) ) 制定医学参考值范围的注意事项:制定医学参考值范围的注意事项:要确定一批样本含量足够大的要确定一批样本含量足够大的“正常人正常人”根据研究目的和使用要求选定适当的百分界值根据研究目的和使用要求选定适当的百分界值根据专业知识确定单侧或双侧界值根据专业知识确定单侧或双侧界值根据资料的分布选用恰当的计算方法根据资料的分布选用恰当的计算方法 根据医学专业知识确定!根据医学专业知识确定!单侧:下限单侧:下限: 肺活量、肺活量、IQ 上限上限: 转氨酶、尿铅、发汞转氨酶、尿铅、发汞双侧:白细胞计数、血清总胆固醇双侧:白细胞计数、血清总胆固醇 过低异常过低异常-单侧下限单侧下限 过高异常过高异常-单侧上限单侧上限 过低、过高均异常过低、过高均异常-双侧双侧单侧下限单侧下限异常异常正常正常单侧上限单侧上限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常正态分布法:适用于正态或近似正态分布的资料正态分布法:适用于正态或近似正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 和投资人合同协议
- 恋爱赠予父母协议书模板
- 员工奖励协议书范本
- 母婴用品购销合同协议
- 残疾人卖房协议书模板
- 民办机构劳务合同协议
- 微众银行仲裁协议书模板
- 快餐餐具租赁合同协议
- 和单位签订印刷合同协议
- 和国外客户解除合同协议
- 2025届湖北省部分学校高三(9月)起点第一次联考语文试卷及答案
- 选择性育种对犬类行为遗传的影响
- 2024年北京市高考数学真题试卷及答案
- 走近湖湘红色人物智慧树知到答案2024年湖南工商大学
- DB51-T 5071-2011 蒸压加气混凝土砌块墙体自保温工程技术规程
- Elephant'sfriends绘本阅读(课件)人教PEP版英语三年级上册
- AQ6111-2023个体防护装备安全管理规范
- 多发性骨髓瘤肾损伤诊治指南(2024版)
- 2024年中考数学反比例函数-选择题(压轴)(试题)
- 2024-2030年中国吸脂器行业现状动态与需求趋势预测研究报告
- 【渠道视角下伊利股份营运资金管理存在的问题及优化建议探析9000字(论文)】
评论
0/150
提交评论