




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章第二章计量资料的计量资料的统计描述统计描述数值变量资料的统计描述数值变量资料的统计描述4数值变量资料的频数分布数值变量资料的频数分布4集中趋势的描述集中趋势的描述4离散趋势的描述离散趋势的描述4正态分布正态分布4医学参考值范围的制定医学参考值范围的制定第一节第一节 频数分布频数分布 一、频数分布表一、频数分布表简称频数表简称频数表frequency frequency table)table)8例例2-1 2-1 从某单位从某单位20192019年的职工体检资料中年的职工体检资料中获得获得101101名正常成年女子的血清总胆固醇名正常成年女子的血清总胆固醇mmol/Lmmol/L的测量结
2、果如下,试编制频数分布的测量结果如下,试编制频数分布表。表。2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.923.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.91 4.59 4.192.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.803.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.843.60 3.51 4.063.07 3.55 4.23 3.57 4.8
3、3 3.52 3.84 4.50 3.964.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.713.30 4.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.06 5.26 5.253.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.953.00 3.26试编制频数分布表。试编制频数分布表。1、频数表的编制、频数表的编制4找全距找全距(range)4定组距定组距(class interval):一般分为一般分为101
4、5组,如组距约为全距组,如组距约为全距/104写组段:写组段:4每个组段的起点称为下限,每个组段的起点称为下限,lower limit;4每个组段的终点称为上限,每个组段的终点称为上限,upper limit;4下限下限X50, 或或 10)4资料的分布不清。资料的分布不清。4注意:在完全对称的单峰曲线分布中,同注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,一组资料的均数与中位数相同, Mean = Median中位数的优缺点中位数的优缺点优点:优点:不受个别特大或特小的观察值影响;不受个别特大或特小的观察值影响;其它平均数不宜使用时,中位数就显示其它平均数不宜使用时,中位数
5、就显示出它的优越性。出它的优越性。缺点:缺点:掉失了大量信息,其敏感性不够。掉失了大量信息,其敏感性不够。百分位数百分位数(Percentile,Px)百分位数百分位数位置指标;界值;位置指标;界值;分布数列的百等份分割值。分布数列的百等份分割值。有有x%的比的比Px小小, 有有(100-x)%的比的比Px大。大。中位数是一个特定的百分位数中位数是一个特定的百分位数P50。百分位数的计算百分位数的计算fX 为PX所在组段的频数, i 为该组段的组距, L 为该组段的下限, fL 为小于L各组段的累计频数。 Lxxfx%nfiLP某传染性疾病的潜伏期天如下表,求其某传染性疾病的潜伏期天如下表,求
6、其 中位数和百分位数中位数和百分位数P95P95潜伏期潜伏期 (小时小时)人数人数f累计频数累计频数f累计频率累计频率%4 262624.048 487468.5212259991.6716 610597.2220 3108100.00)( 3 .10265 . 01084848%天LfxnfiLM)(4 .189995. 01086416%95天LfxnfiLP百分位数的应用百分位数的应用4描述一组观察值在某百分位置上的水描述一组观察值在某百分位置上的水平。平。4用于确定医学正常值范围。用于确定医学正常值范围。4用一组百分位数描述一组观察值的变用一组百分位数描述一组观察值的变异度,如四分位数
7、。异度,如四分位数。应用平均数时的注意事项应用平均数时的注意事项4同质的变量值才能求平均数;同质的变量值才能求平均数;4根据资料的分布特点,选用适应根据资料的分布特点,选用适应的平均数指标。的平均数指标。第三节第三节 离散趋势指标离散趋势指标例例 有有3组同龄男孩体重组同龄男孩体重kg如下,其如下,其体重均数体重均数 都是都是30 (kg),试分析),试分析离散程度。离散程度。甲组甲组 26 28 30 32 34乙组乙组 24 27 30 33 36丙组丙组 26 29 30 31 34X离散程度或变异程度)离散程度或变异程度)4指数据参差不齐的程度,反映资料的指数据参差不齐的程度,反映资料
8、的离散趋势。离散趋势。4将反映平均水平与离散程度的指标结将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分合起来使用,可全面地描述数据的分布规律。布规律。(一全距或极差(一全距或极差 , Range )4 全距全距 = 最大值最大值 最小值最小值4优点:简单明了优点:简单明了4缺点:不能反映组内其他数据的变缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用异,样本含量相差较大时,不宜用极差比较分布的离散程度。极差比较分布的离散程度。(二四分位数间距(二四分位数间距 inter-quartile range4百分位数:指把数据从小到大排列后处于百分位数:指把数据从小到大排
9、列后处于第第X百分位置的数值。它将全部数据分为百分位置的数值。它将全部数据分为两部分,在不包括两部分,在不包括PX的全部数据中有的全部数据中有X%数据小于数据小于PX,有,有1-X%的数据大于的数据大于PX%。中。中位数是一个特定的百分位数位数是一个特定的百分位数P50。4四分位数:下四分位数四分位数:下四分位数P25;上四分位数;上四分位数P754 P0 P25 P50 P75 P100 4四分位数间距:四分位数间距: P75 - P25 或或 QU - QL 4 比极差稳定,但仍未考虑每个数据的大比极差稳定,但仍未考虑每个数据的大小。常和中位数结合使用描述数据的分布小。常和中位数结合使用描
10、述数据的分布规律。规律。(三方差(三方差variance和和标准差标准差standard deviation) NX22 NX2 4离均差平方和: 4考虑每个观察值,但受N的影响。4对离均差平方和求均数,得总体方差2 ,开根号得标准差 。 2X一般一般 未知,常常用未知,常常用 来估计之,来估计之,4数理统计证明,如用样本的变量个数理统计证明,如用样本的变量个数数n来代替来代替N,计算出的样本方差比实计算出的样本方差比实际际2低,需要用低,需要用n-1校正,得样本方校正,得样本方差差S2。开根号得样本标准差。开根号得样本标准差s。 1nXXs22 X 1nXXs2 自由度,自由度,degree
11、 of freedom4方差计算公式中的方差计算公式中的n-1被称为自由度,它描被称为自由度,它描述了当述了当 选定时,选定时,n个个X中能自由变动的中能自由变动的X变量值的个数。变量值的个数。4例:某样本含有例:某样本含有5个数据,要求个数据,要求X=15。则。则在自由确定了四个数据后,第在自由确定了四个数据后,第5个数据只能个数据只能是是15-(x1+x2+x3+x4)。 即有即有4个数据可以自由个数据可以自由变动变动,其自由度其自由度=4 。4推而广之,任何统计量的自由度推而广之,任何统计量的自由度n-k,k为限制条件的个数。为限制条件的个数。 4自由度:是随机变量可以自由度:是随机变量
12、可以“自在自在取值的取值的个数。个数。X X4总体标准差总体标准差4样本标准差样本标准差 NX2 1nX-Xs2标准差标准差 standard deviation 1/22 nnXXs 1/22 fffXfXs标准差的计算标准差的计算甲组甲组 26 28 30 32 34 标准差标准差 3.16乙组乙组 24 27 30 33 36 4.74丙组丙组 26 29 30 31 34 2.92甲组:甲组:X=26+28+30+32+34=150X2=262+282+302+322+342=454016. 3155/15045401/222nnXXs用频数表法计算标准差用频数表法计算标准差1/22f
13、ffXfXs组段组段频数频数f 组中值组中值Xf Xf X22.3012.452.456.002.6032.758.2522.692.9063.0518.3055.823.2083.3526.8089.783.50 173.6562.05226.483.80 203.9579.00312.054.10 174.2572.25307.064.40 124.5554.60248.434.70 94.8543.65211.705.00 55.1525.75132.615.3025.4510.9059.415.605.901 5.755.7533.06合计合计101409.751705.09 )/(6
14、54.01101101/75.40909.17052Lmmols 标准差的用途:标准差的用途:4反映一组观察值的离散程度;反映一组观察值的离散程度;4计算变异系数;计算变异系数;4计算标准误;计算标准误;4估计参考值范围。估计参考值范围。4标准差与算术均数之比,标准差与算术均数之比,4反映了相对离散程度反映了相对离散程度4常用于比较常用于比较4度量衡单位不同的多组资料的变异度度量衡单位不同的多组资料的变异度4均数相差悬殊的多组资料的变异度均数相差悬殊的多组资料的变异度1 10 00 0% %s sC CV Vx(四变异系数(四变异系数 CV coefficient of variation例:
15、度量衡单位不同的变异度例:度量衡单位不同的变异度4某地20岁男子110名4身高 =172.73cm, s4.09cm;4体重 55.04kg,4 s4.10kg,4试比较两组资料的变异程度,即身高、体重的变异程度哪个大?%37. 2%10073.17209. 4%100 XsCV%45. 7%10004.5510. 4%100XsCVX XX X例:均数相差悬殊的变异度例:均数相差悬殊的变异度某地成年人舒张压和收缩压的变异程度某地成年人舒张压和收缩压的变异程度均数均数标准差标准差变异系数变异系数(%)舒张压舒张压77.510.713.8收缩压收缩压122.917.113.9SPSS命令及操作命令及操作4Analyze Descriptive
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国际经济法国际海事法律事务考核试卷
- 2025年中国PE发泡鞋材数据监测研究报告
- 2025年中国LED走廊灯数据监测报告
- 2025年中国BD抛光轮数据监测研究报告
- 2025年中国200#溶剂油数据监测报告
- 2025至2030年中国轻触延时开关市场分析及竞争策略研究报告
- 2025至2030年中国花岗岩Ⅴ型架市场分析及竞争策略研究报告
- 2025至2030年中国纸浆模塑宠物用品市场分析及竞争策略研究报告
- 2025至2030年中国瞄点式亮度计市场分析及竞争策略研究报告
- 2025至2030年中国瓷柱式断路器市场分析及竞争策略研究报告
- 2025年毕节市大方富民村镇银行招聘题库带答案分析
- 【220kV-500kV输电线路自动重合闸装置结构与原理分析2500字】
- 航空发动机关键部件项目运营管理手册(范文)
- 2025年中国社区O2O商业模式市场分析报告
- 高中数学试卷江苏真题及答案
- 水泥检测试题及答案
- 泰享懂你 康养友伴-2024年新康养需求洞察白皮书-华泰人寿
- 校长竞聘笔试题目及答案
- 2025-2030“一带一路”背景下甘肃省区域经济发展分析及投资前景报告
- 2025五级应急救援员职业技能精练考试题库及答案(浓缩400题)
- 反恐知识宣传主题班会
评论
0/150
提交评论