




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1变量变量类型类型定量变量定量变量定性变量定性变量无序分类无序分类有序分类有序分类:如血清反应如血清反应,治疗效果等治疗效果等二项分类二项分类:如生死如生死,有效无效等有效无效等多项分类多项分类:如血型如血型,职业特征等职业特征等连续型变量连续型变量:如如:身高身高,体重体重离散型变量离散型变量:如子女数如子女数,脉搏数脉搏数2资料辨认病例号病例号年龄年龄身高身高血型血型心电图心电图尿尿WBC产前检产前检查次数查次数职业职业1351.65A正常正常0教师教师2441.74B正常正常3工人工人3261.80O正常正常2职员职员4251.61AB正常正常1农民农民5411.71A异常异常+5工人工
2、人6451.58B正常正常+6工人工人7501.60O异常异常+3干部干部8281.76AB正常正常+2干部干部9311.62O正常正常3军人军人3n统计分析的内容统计分析的内容统计描述统计描述:是用统计表、统计图、统计指标:是用统计表、统计图、统计指标来描述资料的分布规律及其数量特征。来描述资料的分布规律及其数量特征。 把握资料的基本特征把握资料的基本特征; 为统计推断打下基础为统计推断打下基础。 统计推断统计推断:在医学科学研究中通常应用抽样:在医学科学研究中通常应用抽样研究的方法,即对总体中随机抽取的部分观研究的方法,即对总体中随机抽取的部分观察单位察单位(样本样本)进行研究,然后用样本
3、信息推进行研究,然后用样本信息推断总体特征,即统计推断。断总体特征,即统计推断。4 第四章定量资料的统计分析 第一节第一节 频数分布表和频数分布图频数分布表和频数分布图第二节第二节 集中趋势的统计描述集中趋势的统计描述第三节第三节 离散趋势的统计描述离散趋势的统计描述第四节第四节 正态分布及其应用正态分布及其应用本章内容本章内容6第一节第一节 频数分布表和频数分布表和 频数分布图频数分布图一、频数分布表一、频数分布表二、频数分布图二、频数分布图7一、频数分布表一、频数分布表对一个随机现象进行重复观察,其中对一个随机现象进行重复观察,其中某变量值(随机事件)出现的次数被称作某变量值(随机事件)出
4、现的次数被称作频数频数(frequencyfrequency)。)。把变量值及相对应的频数列成表格即频数把变量值及相对应的频数列成表格即频数分布表分布表, ,简称简称频数表频数表(frequency tablefrequency table)。)。 8连续性变量的频数表的编制连续性变量的频数表的编制例例4.2 在某市在某市2005年进行的小学生体质评价研究中,年进行的小学生体质评价研究中,测定了测定了120名名9岁男孩的肺活量岁男孩的肺活量(L),资料如下,根,资料如下,根据该资料制作频数表。据该资料制作频数表。 1.706 1.326 1.632 1.876 2.161 1.684 1.53
5、3 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.64
6、5 1.214 1.184 1.735 你能看出资料有什么规律?你能看出资料有什么规律?9编制步骤:编制步骤: 确定全距(确定全距(range) 全部观察值中最大值与最小值之差,用符号全部观察值中最大值与最小值之差,用符号R表示。表示。又称又称极差极差。本例极差:。本例极差: R = 2.406-0.980 = 1.417(L )。1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1
7、.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735 R = 2.406-0.980 = 1.417(L ) 划分组段划分组段 确定确定组数组数:观察单位及其全距定:观察单位及其全距定:本例本例11确
8、定确定组距组距:等距分组,组距:等距分组,组距R/组数。组数。本例本例i = R=1.417/11=0.1290.130确定确定各组段上下限各组段上下限:每组段的起点称为该组的下限:每组段的起点称为该组的下限(low limit),终点称为,终点称为上限上限(upper limit)。第一组段必须包含最小值。第一组段必须包含最小值。最后一个组段最后一个组段上限必须包上限必须包含最大值含最大值。 统计各组频数统计各组频数采用计算机或手工划记汇总,得到各组段采用计算机或手工划记汇总,得到各组段相应的频数。相应的频数。11根据这些数据编制成的频数表能显示出这组数据分布的特征根据这些数据编制成的频数表
9、能显示出这组数据分布的特征12二、频数分布图二、频数分布图 以观测变量为横轴,频数以观测变量为横轴,频数(或频率或频率)为纵轴所为纵轴所作的直方图,称为频数分布图。横轴依次以等距作的直方图,称为频数分布图。横轴依次以等距标出各组段的起点,在各组段上方分别绘制标出各组段的起点,在各组段上方分别绘制宽度宽度等于组距、高度等于相应频数等于组距、高度等于相应频数的长方形。的长方形。 用途与频数表类似,但用途与频数表类似,但更直观、形象。更直观、形象。13图图4.1 20054.1 2005年某市年某市120120名名9 9岁男孩肺活量频数分布岁男孩肺活量频数分布 141)频数分布特征)频数分布特征n集
10、 中 趋 势集 中 趋 势 ( c e n t r a l tendency)一组数据向某一组数据向某一个位置聚集或集中的一个位置聚集或集中的倾向。例如本例,肺活倾向。例如本例,肺活量有大有小,但中等居量有大有小,但中等居多,此为集中趋势。多,此为集中趋势。n离散程度离散程度(dispersion):一组数据的分散性或变一组数据的分散性或变异度。离异度。离“中心中心”位置位置越远,频数越小;即少越远,频数越小;即少数人具有较大或较小的数人具有较大或较小的肺活量,表现了肺活量肺活量,表现了肺活量分布的离散趋势。分布的离散趋势。15n集中趋势集中趋势:高峰组段的位置:高峰组段的位置n离散趋势离散趋
11、势:观察值的分布范围:观察值的分布范围162)频数分布的类型频数分布的类型对称分布:集中位置在正中,左右两侧大体对称。对称分布:集中位置在正中,左右两侧大体对称。偏态分布:集中位置偏向一侧,频数分布不对称。偏态分布:集中位置偏向一侧,频数分布不对称。 正偏态分布正偏态分布* 分布类型不同,采用的统计方法不同分布类型不同,采用的统计方法不同负偏态分布负偏态分布负偏态分布负偏态分布图12-1 160名正常成年女子的血清甘油三酯的频数分布图05101520250.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90血清甘油三酯(mmol/L)频数频数分布高峰(集频数分布高峰(集
12、中位置)位于中部、中位置)位于中部、两边低、左右对称。两边低、左右对称。1.1.对称分布:对称分布:实例实例1819是否为对称分布?20图图4.2 20044.2 2004年我国麻疹患者的年龄分布年我国麻疹患者的年龄分布 2.2.正偏态分布:正偏态分布:集中位置偏向数值小集中位置偏向数值小的一侧,高峰偏于左的一侧,高峰偏于左侧,长尾向右延伸。侧,长尾向右延伸。21转氨酶含量 人 数 12 2 15 9 18 14 21 23 24 19 27 14 30 11 33 9 36 7 39 4 4245 3 表表4-2 115名正常成年女子血清转氨酶名正常成年女子血清转氨酶(mmol/L)含量分布
13、)含量分布 22图图4.3 4.3 某市某市219219名乳腺癌患者术后康复期生存质量评分的分布名乳腺癌患者术后康复期生存质量评分的分布 频频数数评分评分集中位置偏向数值大集中位置偏向数值大的一侧,高峰偏于右的一侧,高峰偏于右侧,长尾向左延伸。侧,长尾向左延伸。3.3.负偏态分布:负偏态分布:23肌红蛋白含量 人 数 0 2 5 3 10 7 15 9 20 10 25 22 30 23 35 14 40 9 4550 2 表表4-3 101名正常人的血清肌红蛋白含量分布名正常人的血清肌红蛋白含量分布g/mL24(三)频数分布表和频数分布图的用途(三)频数分布表和频数分布图的用途1.反映频数分
14、布的两个重要特征;反映频数分布的两个重要特征;集中趋势集中趋势:变量值的中心数值或中心位置所在。变量值的中心数值或中心位置所在。离散趋势离散趋势:变量值围绕中心数值或中心位置的分布情况。变量值围绕中心数值或中心位置的分布情况。2.揭示资料的分布类型;揭示资料的分布类型; 对称分布:频数分布高峰位于中部;对称分布:频数分布高峰位于中部; 偏态分布:高峰偏于一侧。偏态分布:高峰偏于一侧。3.便于发现某些特大或特小的可疑值;便于发现某些特大或特小的可疑值;4.便于进一步计算指标和统计分析处理。便于进一步计算指标和统计分析处理。25n 4便于进一步做统计分析和处理便于进一步做统计分析和处理26第二节、
15、第二节、集中趋势的描述集中趋势的描述 描述一组同质观察值的平均水平或中描述一组同质观察值的平均水平或中心位置的常用的指标有心位置的常用的指标有算术均数算术均数、几几何均数何均数、中位数中位数等。等。271 1、算术均数、算术均数,mean,meann适用条件:单峰对称分布,特别是正态或近适用条件:单峰对称分布,特别是正态或近似正态分布的定量资料。似正态分布的定量资料。n符号:符号: 表示样本均数,希腊字母表示样本均数,希腊字母 表示表示总体均数。总体均数。X28计算方法:计算方法:n(1)直接法)直接法(小样本(小样本) nXnXXXXn 2129n如:如: 7名正常女子血清总胆固醇(名正常女
16、子血清总胆固醇(mmol/L)分)分别为:别为:4.21,3.32,5.35,4.17,4.14,3.58,4.34。试计算其平均数。试计算其平均数。)/(16. 4734. 4.32. 321. 4.21LmmolnXnXXXXnn例例4.3:例:例4.2 某市某市2005年年120名名9岁男孩的肺活量岁男孩的肺活量(L)的平均数的平均数)(672. 1.21LnXnXXXXn30(2)频数表法)频数表法(加权法(加权法) Xf Xf Xf XffffXfkkk112212 当观察值个数较多时,可先把原始资料分组,当观察值个数较多时,可先把原始资料分组,列出频数表,计算均数时将各组频数乘以相
17、应组列出频数表,计算均数时将各组频数乘以相应组的组中值,逐个相加求和,除以总例数。的组中值,逐个相加求和,除以总例数。X1, X2, , Xk:频数表资料中各组段的频数表资料中各组段的组中值组中值;f1, f2, , fk:相应组段的相应组段的频数频数。31表4.2 120名9岁男孩肺活量均数的计算肺活量组段 (1)频数f (2)组中值x (3) fx(4)=(2)(3)0.98051.0455.2251.11051.1755.8751.24071.3109.1701.370141.43520.091.500191.56529.735.)(673.14.5345.24.045.15LfXfXi
18、ii)(672. 1.21LnXnXXXXn32 均数的应用范围及条件均数的应用范围及条件:1.均数反映一组同质观察值的平均水平,并可作均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。为样本的代表值与其他样本进行比较。2.均数适用于单峰对称分布,尤其是正态分布资均数适用于单峰对称分布,尤其是正态分布资料,这时均数位于分布的中央,能反映观察值料,这时均数位于分布的中央,能反映观察值的集中趋势,即其平均水平。也可用于近似正的集中趋势,即其平均水平。也可用于近似正态分布。态分布。33n适用于数据适用于数据经过对数变换后呈正态分布的资料经过对数变换后呈正态分布的资料,也可用于
19、观察值之间呈倍数或近似倍数变化也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料。(等比关系)的资料。n如医学实验中的抗体滴度;食品中农药含量;如医学实验中的抗体滴度;食品中农药含量;疾病的潜伏期等。疾病的潜伏期等。n计算方法有:计算方法有:直接法直接法和频数表法。和频数表法。2 2、几何均数,、几何均数,geometric meangeometric mean,G G34直接法直接法nlgXlgnlgXlgXlgXlgXXXG1n111nn21n由原始变量值直接计算几何均数。由原始变量值直接计算几何均数。n设变量值为设变量值为X1, X2 Xn,几何均数,几何均数G为:为:35n例例
20、有有5份血清的滴度为份血清的滴度为1:4,1:8,1:16,1:32,1:64,求平均滴度?,求平均滴度? n n该该5份血清的平均滴度为份血清的平均滴度为1:16。 16)2041. 1 (lg)564lg.8lg4lg(lg)lg(lg111nXG362.2.频数表法频数表法( (加权法加权法) )n当资料中出现相同观察值的个数较多时,或资料当资料中出现相同观察值的个数较多时,或资料为频数表资料,则用加权法计算几何均数。为频数表资料,则用加权法计算几何均数。n变量及频数如下变量及频数如下:nX1,X2, Xkn f1 , f2, fkn 则几何平均数则几何平均数G为为: )(121221k
21、kffffkffXXXG 37应用注意事项:应用注意事项:n适用资料:适用资料:经对数变换后呈正态或近经对数变换后呈正态或近似正态分布的资料;似正态分布的资料;用于等比资料;用于等比资料;n注意:注意: 根据对数的性质:零与负数没有对数根据对数的性质:零与负数没有对数1)变量值不能有)变量值不能有0;2)变量值不能同时有正值与负值。)变量值不能同时有正值与负值。38一组观察值从小到大排列,位次居中的观一组观察值从小到大排列,位次居中的观察值即中位数,是一个位置指标。察值即中位数,是一个位置指标。符号:符号:P50 或或M3.3.中位数中位数(median) 39中位数计算方法中位数计算方法(1
22、)直接法:直接法:将观察值由小到大排列,按下式将观察值由小到大排列,按下式计算。计算。 21nXM,n 为为奇奇数数时时2XXM,n12n2n 为为偶偶数数时时40n例某病患者例某病患者9名,其发病的潜伏期(天)为:名,其发病的潜伏期(天)为:3,4,4,5,6,7,7,9,11 ,求中位数。,求中位数。n本例本例n=9,为奇数,按式(,为奇数,按式(4.6)得:)得:n (天)(天)n若在该例基础上再继续观察,在又发现若在该例基础上再继续观察,在又发现1例患者例患者11 天,则天,则n=10,为偶数,按式(,为偶数,按式(4.7)得:)得:n (X5+X6)/2=(6+7)/2=6.5(天)
23、(天) 652)1(XXMn)(21122nnXXM41(2)频数表法)频数表法nL为为P50所在下限;所在下限;i 为该组的组距;为该组的组距;fM 为该组频为该组频数;数; 为比该组段略小的组段的累计频数。为比该组段略小的组段的累计频数。Lf)%50(LMMfnfiLM42%X(100)%XXP 百分位数示意图百分位数示意图附:百分位数(附:百分位数(percentile):P P2525P P7575位置参数位置参数43公式:(%)XXXLXiPLnXff XL:第X 百分位数所在组段下限 Lf:小于XL各组段的累计频数 Xi:第X 百分位数所在组段组距 n:为总例数 44P251.37
24、+0.13x(120 x25%17)/141.49P751.76+0.13x(120 x75%79)/151.86P50 1.63+0.13x(120 x50%50)/291.6745n计算累计频数和累计频率计算累计频数和累计频率(%);n确定确定M所在组段;所在组段;n根据公式计算。根据公式计算。计算步骤计算步骤46评分评分频数频数累计频数累计频数累计频率累计频率(%)频率范围频率范围 0220.9100.9130241.830.921.8340373.201.843.205011188.223.218.2260304821.928.2321.92706311150.6821.9350.68
25、806017178.0850.6978.089010048219100.0078.09100.0表表4.4 219名乳腺癌患者康复期生存质量评分名乳腺癌患者康复期生存质量评分例例4.8 为研究乳癌患者术后康复期生存质量,某医院对为研究乳癌患者术后康复期生存质量,某医院对219名术后名术后康复期乳癌患者进行了生存质量测定,结果如表康复期乳癌患者进行了生存质量测定,结果如表4.4,求平均评分。,求平均评分。nM=70+10/63(21950%-48 )=79.76(分分) 47平均数应用的注意事项平均数应用的注意事项p 同质同质的资料计算平均数才有意义的资料计算平均数才有意义p 根据根据资料的分布
26、类型资料的分布类型选用适当的平均数选用适当的平均数均数:单峰对称分布的资料,特别是正态分布均数:单峰对称分布的资料,特别是正态分布几何均数:等比级数资料、对数正态分布资料几何均数:等比级数资料、对数正态分布资料中位数:理论上可用于任何分布资料,但中位数:理论上可用于任何分布资料,但当资料适当资料适合计算均数或几何均数时,不宜用中位数。合计算均数或几何均数时,不宜用中位数。 (偏态分布、分布不明资料、有不确定值的资料)(偏态分布、分布不明资料、有不确定值的资料)48第三节、离散程度的描述第三节、离散程度的描述集中趋势是数据分布的一个重要特集中趋势是数据分布的一个重要特征,但单有集中趋势指标还不能
27、很好地征,但单有集中趋势指标还不能很好地描述数据描述数据的分布规律。的分布规律。而且还要看数据而且还要看数据的变异散程度的变异散程度 。盘编号盘编号 甲甲乙乙丙丙124604904953 35005005004 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500 例:采甲、乙、丙三人的耳垂血,然后进行红细胞计例:采甲、乙、丙三人的耳垂血,然后进行红细胞计数,每人数数,每人数5个计数盘,得结果如下(万个计数盘,得结果如下(万/mm3)甲乙丙50离散程度:离散程度: 反映一群变量
28、值的变异程度或反映一群变量值的变异程度或参差不齐参差不齐的程度。的程度。离散程度大,均数的代表性差,离散程度大,均数的代表性差,离散程度小,均数的代表性好离散程度小,均数的代表性好。51常用的指标常用的指标(1)极差()极差(range)(2)四分位数间距()四分位数间距(quartile interval) (3)方差和标准差()方差和标准差(variance and standard deviation)(4)变异系数()变异系数(coefficient of variation)521 1、极差、极差/ /全距,全距,rangerangen R = X max - X minn优点:优点
29、:简单明了简单明了n缺点:缺点:n1)只考虑最大值与最小值之差异,不能反映组内其它观)只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度察值的变异度n2)样本含量越大,抽到较大或较小观察值的可能性越大,)样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大,因此样本含量悬殊时不宜用全距。则全距可能越大,因此样本含量悬殊时不宜用全距。 532 2、四分位数间距,、四分位数间距,inter-quartile rangeinter-quartile range 常用于描述偏态分布资料、两端无确切值或分布常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。不明确资料的离散
30、程度。 1)百分位数)百分位数(percentile):是指将观察值从小到:是指将观察值从小到大排列后处于第大排列后处于第x百分位置上的数值,亦是位置百分位置上的数值,亦是位置指标,用指标,用 Px 表示。表示。Px 表示将全部观察值分为两表示将全部观察值分为两部分,有部分,有 x % 的的观察值比观察值比 Px 小,有小,有 (100 x) % 的观察值比的观察值比 Px 大。大。P50 即中位数。即中位数。54n2)四分位数)四分位数(quartile, Q):特定的百分位数,把一:特定的百分位数,把一组观察值分为四等份。组观察值分为四等份。下四分位数:下四分位数: QL = P25上四分
31、位数为:上四分位数为:QU = P75四分位数间距:四分位数间距:QUQL小小大大P0 P25 P50 P75 P100M55表表4.4 219名乳腺癌患者康复期生存质量评分名乳腺癌患者康复期生存质量评分P75=QU=80+10/60(21975%-111)=88.88(分(分)Q= QUQL =88.88-71.07=17.81P25=QL=70+10/63(21925%- 48) =71.07(分(分)例例4.13评分评分频数频数累计频数累计频数累计频率累计频率(%)频率范围频率范围 0220.9100.9130241.830.921.8340373.201.843.205011188.2
32、23.218.2260304821.928.2321.92706311150.6821.9350.68806017178.0850.6978.089010048219100.0078.09100.00nM=70+10/63(21950%-48 )=79.76(分分) 56n四分位数间距四分位数间距越大,变量值的变异程度或离越大,变量值的变异程度或离散程度越大;散程度越大;n四分位四分位数数间距比极差稳定,但仍未考虑每个间距比极差稳定,但仍未考虑每个观察值的变异;观察值的变异;n四分位数间距常用于描述偏态分布资料、两四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。端无
33、确切值或分布不明确资料的离散程度。57例例4.2 在某市在某市2005年进行的小学生体质评价研究中,年进行的小学生体质评价研究中,测定了测定了120名名9岁男孩的肺活量岁男孩的肺活量(L),资料如下,根,资料如下,根据该资料制作频数表。据该资料制作频数表。 1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733 1.796 1.203 1.736 1.450 1.633 1.5
34、55 1.352 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735 P251.37+0.13x(120 x25%17)/141.49P751.76+0.13x(120 x75%79)/151.86R = 2.406-0.980 = 1.417(L )四分位数间距四分位数间距=0.37(L)
35、 =0.37(L) R = 2.406-0.980 = 1.417(L )四分位数间距四分位数间距=0.37(L) =0.37(L) 58为了衡量每个变量值的变异,先选择一个数为了衡量每个变量值的变异,先选择一个数值作为比较标准;谁合适呢?均数最有代表性。值作为比较标准;谁合适呢?均数最有代表性。甲乙丙59.方差和标准差n为了全面考虑每个观察值的变异情况,克服为了全面考虑每个观察值的变异情况,克服全距和四分位数间距的缺点,引入了全距和四分位数间距的缺点,引入了“方差方差”60()方差,()方差,variancevariancen衡量每个观察值相对均数的偏差,构造出综合描述资料衡量每个观察值相对
36、均数的偏差,构造出综合描述资料离散程度的指标。离散程度的指标。n方差说明观察值的变异程度,方差越大,观察值方差说明观察值的变异程度,方差越大,观察值得变异程度较大,反之,观察值得变异程度较小。得变异程度较大,反之,观察值得变异程度较小。2261n在实际工作中,总体均数在实际工作中,总体均数往往是未知的,故只能用样本往往是未知的,故只能用样本均数均数 作为总体均数作为总体均数的估计值,用样本例数的估计值,用样本例数n代替代替N,这,这样计算的结果通常比实际的样计算的结果通常比实际的2低。英国统计学家提出用低。英国统计学家提出用n-1代替代替n来校正,这就是样本方差来校正,这就是样本方差s2 。n
37、式中的式中的n-1称为自由度(称为自由度( degree of freedom)是统计学)是统计学中的一个常用术语,用中的一个常用术语,用表示。表示。 221)(22nXXS221)(22nXXS2262自由度自由度例:有一个例:有一个4个数据的样本,个数据的样本, 在自由取值在自由取值4、2、5三个数据后,第三个数据后,第四个数据只能是四个数据只能是95x 63()标准差,standard deviationn因方差的度量单位是原度量单位的平方,因方差的度量单位是原度量单位的平方,故将方差开方,恢复成原度量单位,得总故将方差开方,恢复成原度量单位,得总体标准差体标准差。n标准差大,表示观察值
38、的变异度大;标准差大,表示观察值的变异度大;n标准差小,表示观察值的变异度小标准差小,表示观察值的变异度小 。NX2)(641)(2nXXs样本标准差(样本标准差(s):):NX2)(65例4-11 三组同龄男孩的身高值(cm) 甲组:90 95 100 105 110 100cmX甲 乙组:96 98 100 102 104 100cmX乙 丙组:96 99 100 101 104 100cmX丙 甲组: 2(500)5025057.91(cm)5 1S同理得:乙组:3.16(cm)S ,丙组:2.92(cm)S 。 66标准差的意义标准差的意义说明资料的离散趋势说明资料的离散趋势(或变异程
39、度或变异程度),标准差的,标准差的值越大,说明变异程度越大,均数的代表性值越大,说明变异程度越大,均数的代表性越差越差; .。 标准差与原始数据的单位一致,在科技标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。描述资料的集中趋势与离散趋势。67例例4.17,某年某市城区,某年某市城区120名名5岁女孩身高均数为岁女孩身高均数为110.15(cm),标准差为,标准差为5.86(cm);体重均数为;体重均数为17.71(kg),标准差为,标准差为1.44(kg),比较其离散程度。,比较其离散程度。 身高身高
40、 体重体重 %100XSCV4.变异系数变异系数(coefficient of variation,CV)(1)意义:)意义:标准差与均数之比,用百分数表标准差与均数之比,用百分数表示。变异系数是相对数,没有单位。示。变异系数是相对数,没有单位。(2 2)适用条件:)适用条件:观察指标单位不同,如身高、体重;观察指标单位不同,如身高、体重; 同单位资料,但均数相差悬殊。同单位资料,但均数相差悬殊。(3 3)公式:)公式:69例例4.17,某年某市城区,某年某市城区120名名5岁女孩身高均数为岁女孩身高均数为110.15(cm),标准差为,标准差为5.86(cm);体重均数为;体重均数为17.71(kg),标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年三醋酸纤维素膜项目建议书
- 2025办公室租赁合同范本4
- 2025年解除商业租赁合同范本标准版
- 2025标准管理咨询服务合同
- 2025办公设备采购合同协议
- 2025标准版权许可合同样式
- 2025中国钢铁产业陕西分公司集体合同
- 2025设备租赁合同版范本
- 2025苏州市购房合同样本
- 2025四川公共租赁住房租赁合同范本
- 商场运营部的培训
- 四年级 人教版 数学《小数的意义》课件
- 《糖尿病与肥胖》课件
- 医疗纠纷防范与医患沟通
- 服装设计与工艺基础知识单选题100道及答案
- 钢结构施工管理培训课件
- 护理MDT多学科联合查房
- 易制毒化学品采购员岗位职责
- 《浅析我国绿色金融体系的构建》5600字(论文)
- 儿科病例分析课件
- 2024年同等学力人员申请硕士学位英语试卷与参考答案
评论
0/150
提交评论