第二章定量数据的统计描述_第1页
第二章定量数据的统计描述_第2页
第二章定量数据的统计描述_第3页
第二章定量数据的统计描述_第4页
第二章定量数据的统计描述_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-4-12医学统计学-(马斌荣主编)供本科生用第二章第二章定量资料的统计描述定量资料的统计描述第一节第一节 频数分布频数分布 一、频数分布表一、频数分布表简称频数表(简称频数表(frequency table)frequency table)8例例2-1 2-1 从某单位从某单位19991999年的职工体检资料中年的职工体检资料中获得获得101101名正常成年女子的血清总胆固醇(名正常成年女子的血清总胆固醇(mmol/Lmmol/L)的测量结果如下,试编制频数分布)的测量结果如下,试编制频数分布表。表。2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.

2、58 4.34 4.84 4.414.78 3.95 3.923.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.91 4.59 4.192.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.803.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.843.60 3.51 4.063.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.

3、87 5.713.30 4.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.06 5.26 5.253.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.953.00 3.26试编制频数分布表。试编制频数分布表。1、频数表的编制、频数表的编制4找全距找全距(range)4定组距定组距(class interval):一般分为一般分为1015组,如组距约为全距组,如组距约为全距/104写组段:写组段:8每个组段的起点称为下限,每个组段的起点称为下限,lower limit;8每个组

4、段的终点称为上限,每个组段的终点称为上限,upper limit;8下限下限X50, 或或 10)4资料的分布不清。资料的分布不清。4注意:在完全对称的单峰曲线分布中,同注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,一组资料的均数与中位数相同, Mean = Median中位数的优缺点中位数的优缺点优点:优点:8不受个别特大或特小的观察值影响;不受个别特大或特小的观察值影响;8其它平均数不宜使用时,中位数就显示其它平均数不宜使用时,中位数就显示出它的优越性。出它的优越性。缺点:缺点:8掉失了大量信息,其敏感性不够。掉失了大量信息,其敏感性不够。百分位数百分位数(Percent

5、ile,Px)百分位数百分位数4位置指标;界值;位置指标;界值;4分布数列的百等份分割值。分布数列的百等份分割值。4有有x%的比的比Px小小, 有有(100-x)%的比的比Px大。大。4中位数是一个特定的百分位数中位数是一个特定的百分位数P50。百分位数的计算百分位数的计算fX 为为PX所在组段的频数,所在组段的频数, i 为该组段的组距,为该组段的组距, L 为该组段的下限,为该组段的下限, fL 为小于为小于L各组段的累计频数。各组段的累计频数。 Lxxfx%nfiLP某传染性疾病的潜伏期(天)如下表,求其某传染性疾病的潜伏期(天)如下表,求其 中位数和百分位数中位数和百分位数P P959

6、5潜伏期 (天)人数f累计频数f累计频率%4 262624.048 487468.5212259991.6716 610597.2220 3108100.00)( 3 .10265 . 01084848%天LfxnfiLM)(4 .189995. 01086416%95天LfxnfiLP百分位数的应用百分位数的应用4描述一组观察值在某百分位置上的水描述一组观察值在某百分位置上的水平。平。4用于确定医学正常值范围。用于确定医学正常值范围。4用一组百分位数描述一组观察值的变用一组百分位数描述一组观察值的变异度,如四分位数。异度,如四分位数。应用平均数时的注意事项应用平均数时的注意事项4同质的变量值

7、才能求平均数;同质的变量值才能求平均数;4根据资料的分布特点,选用适应根据资料的分布特点,选用适应的平均数指标。的平均数指标。平均水平平均水平SPSS统计描述命令统计描述命令4Analyze Descriptive Statistics Frequencies Descriptives使用频数表资料时使用频数表资料时SPSSSPSS操作中应操作中应注意的事项注意的事项Frequencies命令中要选择命令中要选择Values are group midpoints:根据根据分组资料计算百分位数。分组资料计算百分位数。SPSS操作操作求几何均数时有三种方法求几何均数时有三种方法: 1.是先计算对

8、数的均数,然后求其反对数,是先计算对数的均数,然后求其反对数,得出几何均数;得出几何均数;2.直接用直接用Report Case Summaries 命令;命令;3.用用Compare Means 命令,但要个增加分组命令,但要个增加分组变量。变量。第三节第三节 变异程度的统计指标变异程度的统计指标例例 有有3组同龄男孩体重(组同龄男孩体重(kg)如下,其)如下,其体重均数体重均数 都是都是30 (kg),试分析),试分析离散程度。离散程度。甲组甲组 26 28 30 32 34乙组乙组 24 27 30 33 36丙组丙组 26 29 30 31 34X离散程度(或变异程度)离散程度(或变异

9、程度)4指数据参差不齐的程度,反映资料的指数据参差不齐的程度,反映资料的离散趋势。离散趋势。4将反映平均水平与离散程度的指标结将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分合起来使用,可全面地描述数据的分布规律。布规律。一、一、全距全距(或极差(或极差 , Range )4 全距全距 = 最大值最大值 最小值最小值4优点:简单明了优点:简单明了4缺点:不能反映组内其他数据的变缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用异,样本含量相差较大时,不宜用极差比较分布的离散程度。极差比较分布的离散程度。二、二、四分位数间距四分位数间距 (inter-quartile

10、range)4百分位数:指把数据从小到大排列后处于百分位数:指把数据从小到大排列后处于第第X百分位置的数值。它将全部数据分为百分位置的数值。它将全部数据分为两部分,两部分,在不包括在不包括PX的全部数据中有的全部数据中有X%数数据小于据小于PX,有,有1-X%的数据大于的数据大于PX%。中位。中位数是一个特定的百分位数数是一个特定的百分位数P50。4四分位数:四分位数:下四分位数下四分位数P25;上四分位数;上四分位数P75 P0 P25 P50 P75 P100 4四分位数间距:四分位数间距: P75 - P25 或或 QU - QL 比极差稳定,但仍未考虑每个数据的大小比极差稳定,但仍未考

11、虑每个数据的大小。常和中位数结合使用描述数据的分布规。常和中位数结合使用描述数据的分布规律。律。三、三、离均差平方和离均差平方和 (sun of square)、方差方差(variance)和)和标准差标准差(standard deviation)2X-XSS4平均偏差(平均偏差(mean difference): 4离均差平方和离均差平方和(sun of square, SS)nXX平均偏差方差方差和和标准差标准差 NX22 NX2 4离均差平方和离均差平方和: 8考虑每个观察值,但受考虑每个观察值,但受N的影响。的影响。4对离均差平方和求均数,得对离均差平方和求均数,得总体总体方差方差 2

12、 ,开根号开根号得得标准差标准差 。 2X一般一般 未知,常常用未知,常常用 来估计之,来估计之,4数理统计证明,如用样本的变量个数理统计证明,如用样本的变量个数数n来代替来代替N,计算出的样本方差比实计算出的样本方差比实际际 2低,需要用低,需要用n-1校正,得校正,得样本方样本方差差S2。开根号得样本开根号得样本标准差标准差s。 1nXXs22 X 1nXXs2 自由度,自由度,degree of freedom4方差计算公式中的方差计算公式中的n-1被称为自由度,它描被称为自由度,它描述了当述了当 选定时,选定时,n个个X中能自由变动的中能自由变动的X(变量值)的个数。(变量值)的个数。

13、4例:某样本含有例:某样本含有3个数据,要求个数据,要求X=10。则在自。则在自由确定了由确定了2个数据后,第个数据后,第3个数据只能是个数据只能是10-(x1+x2)。 即有即有2个数据可以自由变动个数据可以自由变动,其自由度其自由度=2 。4推而广之,任何统计量的自由度推而广之,任何统计量的自由度 n-k,k为限制条件的个数。为限制条件的个数。 4自由度:是随机变量可以自由度:是随机变量可以“自由自由”取值的取值的个数。个数。X X4总体标准差总体标准差4样本标准差样本标准差 NX2 1nX-Xs2标准差标准差 standard deviation 1/22 nnXXs 1/22 fffX

14、fXs8应用于频数表资料:应用于频数表资料:标准差的计算标准差的计算甲组甲组 26 28 30 32 34 标准差标准差 3.16乙组乙组 24 27 30 33 36 4.74丙组丙组 26 29 30 31 34 2.92甲组:甲组:X=26+28+30+32+34=150X=26+28+30+32+34=150XX2 2=26=262 2+28+282 2+30+302 2+32+322 2+34+342 2=4540=454016. 3155/15045401/222nnXXs用频数表法计算标准差用频数表法计算标准差1/22fffXfXs8见下表计算见下表计算组段频数f 组中值Xf X

15、f X22.3012.452.456.002.6032.758.2522.692.9063.0518.3055.823.2083.3526.8089.783.50 173.6562.05226.483.80 203.9579.00312.054.10 174.2572.25307.064.40 124.5554.60248.434.70 94.8543.65211.705.00 55.1525.75132.615.3025.4510.9059.415.605.901 5.755.7533.06合计101409.751705.09 )/(654.01101101/75.40909.17052Lm

16、mols 标准差的用途:标准差的用途:4反映一组观察值的离散程度;反映一组观察值的离散程度;4计算变异系数;计算变异系数;4计算标准误;计算标准误;4估计参考值范围。估计参考值范围。4标准差与算术均数之比,标准差与算术均数之比,4反映了相对离散程度反映了相对离散程度4常用于比较常用于比较8度量衡单位不同的多组资料的变异度度量衡单位不同的多组资料的变异度8均数相差悬殊的多组资料的变异度均数相差悬殊的多组资料的变异度1 10 00 0% %s sC CV Vx四、四、变异系数变异系数 CV(coefficient of variation)例:度量衡单位不同的变异度例:度量衡单位不同的变异度4某地某地20岁男子岁男子110名名8身高身高 =172.73cm, s4.09cm;8体重体重 55.04kg, s4.10kg,4试比较两组资料的变异试比较两组资料的变异程度,即身高、体重的程度,即身高、体重的变异程度哪个大?变异程度哪个大?%37. 2%10073.17209. 4%100 XsCV%45

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论