计量资料的统计描述.ppt_第1页
计量资料的统计描述.ppt_第2页
计量资料的统计描述.ppt_第3页
计量资料的统计描述.ppt_第4页
计量资料的统计描述.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲 计量资料的统计描述 Descriptions of Measurement Data,主要内容,频数分布 频数分布表的制作 集中趋势的描述 离散趋势的描述 各指标计算及SPSS实现,例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇( )的测量结果,求其平均值。,对于以上数据,应如何处理?,复习相关概念:研究单位,变量,变量值,计量资料,统计描述:用适当的统计图(表)和统计指标来描述资料的分布规律及其数量特征. 计量资料 离散型:变量取值可以列举,如心跳、脉搏 连续型:变量取值不能明确列举,如血糖,概述 :,第一节 频数分布,频数(frequency)及频数分布表(frequency table) 频数:不同组别内的观察单位个数 频数分布表:按一定方法,将分组标志和相应的频数列表,所得的频数分布表格 离散型计量资料的频数表:以变量值为标志分组,列出各组的频数。 较为简单,连续型计量资料的频数表,编制原则 :按变量值范围划分为几个区间,再进行编制。 例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇( )的测量结果如下,试编制频数分布表。,编制步骤如下: 1. 求极差 (全距) 2. 确定组段数(K) 3. 确定组距(i) 4. 确定组段(第一组的上限和下限) 5. 分组段划记并统计频数,2.30,2.60,二、频数分布图,Spss处理,Transformrecode into different variables,Recode into different variables对话框,AnalyzeDescriptive Statistics Frenquences,结果,频数分布表,频数分布图,三、频数表和频数分布图用途,1描述频数分布的类型 (1)对称分布 : (2) 偏态分布,2描述频数分布的特征 有明显的统计分布规律,数据主要集中在3.504.70 之间,尤以组段的人数3.804.10 最多,且上下组段数的频数分布基本对称。 集中趋势:指一组数据向某一位置聚集或集中的倾向。 变异的范围在2.305.90 离散趋势:指一组数据的分散性或变异性,3便于发现一些特大或特小的可疑值 4便于进一步做统计分析和处理,第二节 集中趋势的描述,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。 常用的平均数有: 算术均数 几何均数 中位数,一、算术均数,算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。 统计学中常用希腊字母表示总体均数 用 表示样本均数,1、计算方法,(1)直接计算法 公式 :,例2-2 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。,Spss实现,AnalyzeDescriptive Statistics Frenquences,结果,(2)加权法: 公式 : 计算4,4,4,6,6,8,8,8,10的均数?,例2-3 利用表2-1计算101名正常成年女子的血总胆固醇的均数。,Spss实现,AnalyzeDescriptive Statistics Frenquences,结果,2、特性与应用,特性: 各观察值与均数之差(离均差)的总和等于零。 各观察值的离均差平方和最小。 应用条件 对称分布资料,特别是正态分布资料 用途 描述一组同质观察值的平均水平 在描述正态分布特征方面有重要意义,二、 几何均数,几何均数(geometric mean): 可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。 1、计算方法 (1)、直接计算法 公式: 或,例2-4 某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,10,20,40,40,160,求几何均数。,(2)加权法,公式:,例2-5 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。,故例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为:1:150.6。,SPSS实现,频数加权 DataWeight Cases,SPSS实现,计算 AnalyzeReport Case Summaries,结果:,应用条件: 成等比级数的资料及倍数级增加的资料,特别是对数正态分布资料。 用途 描述上述资料的平均水平或集中趋趋 注意: 观察值若有0或负值,不宜直接使用几何均数 观察值一般不能同时存在正负值。,三、 中位数与百分位数,(一)中位数 中位数(median):是将变量值从小到大排列,位置居于中间的那个变量值。 例: 1,3,7,5,100 中位数为多少?,计算,公式: n为奇数时 n为偶数时,例2-6 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。,本例n=7,为奇数 例2-7 8名患者食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。 本例n=8,为偶数,应用,适用于: 1、各种分布类 型的资料 2、特别是偏态分布资料和开囗资料(一端或两端无确切数值的资料)。,(二)百分位数,百分位数(percentile)是一种位置指标,用 来表示。 一个百分位数 将全部变量值分为两部分,在不包含 的全部变量值中有 的变量值比它小, 变量值比它大。,1直接计算法,设有x个原始数据从小到大排列,第x百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时:,例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。,患 者: 住院天数: n=120,120X5%=6,为整数:,例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。,患 者: 住院天数: ,带有小数,取整后trunc(118.8)= 118,2频数表法,公式:,式中,、,和,分别为第,X,百分位数所在组段,的下限、组距和频数,,为小于,各组段的累计频数,,n,为总例数。,例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表见表2-5第(1)、(2)栏,试分别求中位数及第25、第75百分位数。,SPSS实现,DataWeight Cases AnalyzeDescriptive Statistics Frenquences,结果,注意!此方法对于频数表资料计算不准确,如是原始资料则较为准确,在使用时需注意。,第三节 离散趋势的描述,例2-11 三组同龄男孩的身高值(cm),由资料可看出:虽然三者均数相同,但各组数据参差不齐(变异)的程度却不同。,常用统计指标: 极差、四分位数间距、方差、标准差和变异系数。,一、 极差 极差,用R表示:即一组变量值最大值与最小值之差。,二、四分位数间距,四分位数间距,用QR表示: QR= 下四分位数: 上四分位数:,AnalyzeDescriptive Statistics Frenquences,例2-12 续例2-10。已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。 (天) 请回答: 四分位数间距可以看成大小在中间的一半变量值的全距( R )。,三、方差与标准差,1、 方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 样本方差用 表示,2、 公式: 样本标准差用 表示 公式:,标准差的公式还可以写成 : 利用频数表计算标准差的公式为,例2-12 续例2-11,计算三组资料的标准差。,甲组:,SPSS实现,例:计算101名女子血清总胆固醇的标准差、方差,AnalyzeDescriptive Statistics Frenquences,直接法计算结果,加权法计算结果,四、 变异系数,变异系数(,coefficient of variation,)记为,CV,,,多用于观察指标单位不,同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论