连续性变量的描述.ppt_第1页
连续性变量的描述.ppt_第2页
连续性变量的描述.ppt_第3页
连续性变量的描述.ppt_第4页
连续性变量的描述.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第五讲 连续变量的统计描述,2,连续变量的统计描述概况,1、集中趋势 如均数、中位数、几何均数、众数、调和均数等 2、离散趋势 如全距、方差和标准差、百分位数、四分位数和四分位间距、变异系数等,3,Descriptive过程,Analyze-Descriptive Statistics-Descriptive 此过程主要用于对服从正态分布的连续性变量进行描述。,4,Explore过程,Analyze-Descriptive Statistics-Explore 此过程用于对连续性资料分布状况不清楚时的探索性分析,它可以计算许多描述统计量,给出各种统计图,并进行简单的参数估计。,5,Explore过程特点: 是对连续性变量进行探索性分析最有效的工具 提供了丰富的描述统计量和图形,如直方图、茎叶图、箱线图等,6,茎叶图 是一种文本化的图形,主要用于样本量较小的情况,描述其数据的整体分布趋势,同时还能够精确的反映出具体的数值大小。,7,8,主要内容有三列: 第一列为频数:表示所在行的观察值的频数 第二列为茎:表示实际观察值除以图下方的茎宽(Stem Width)后的整数部分; 第三列为叶:表示实际观察值除以茎宽后的小数部分。 图下方注明了叶子中每个数字代表的观察值个数。,9,例 题,数据背景:调查对象为某大专院校的大学生,文件名student.sav。主要调查内容代码如下:性别(1男、2女),出生年、月、日(具体数字),身高(cm),体重(kg),血型(A、AB、B、O),血型代码(1A、2B、3AB、4O),教育背景(1重点大学本科、2普通大学本科、3大专、4中专/职校),学科(1文史、2理工、3其他),男女身高级别(1低、2中等、3高,两者的划分标准不一样),男女体重级别(1低、2中等、3高,两者的划分标准不一样)和季度(具体数字)。 要求对男性和女性身高数据分别进行描述。,10,练 习 一,用Descriptive过程,对students.sav中的身高和年龄变量进行标准正态变换,对变换后的变量进行统计描述。,11,数据Employee data.sav,对current salary 做探索性分析,并解释结果。,练 习 二,流行病学与卫生统计学教研室,12,第六讲 SPSS图形,13,SPSS12.0 作图特点,自由灵活的图形框架 自由的元素选择方式 方便的模板设计 方便的文本编辑功能,14,如何生成SPSS统计图,判断数据资料的类型,选择正确的统计图 定义图形元素,生成统计图 对图形进行编辑、修饰,15,统计图的种类,单变量图:连续性变量:直方图(茎叶图)、箱图 分类变量:简单条图、饼图 双变量图:连续因变量:线图、散点图 分类因变量:复式条图 多变量图:散点图矩阵等,16,应按照资料的性质与分析目的恰当地选用图形; 标题位于图形正下方; 统计图的高:宽接近5:7为宜; 图中不同的事物用不同的图案或颜色区别,并附图例; 涉及到坐标轴的图形注意标目、尺度和单位等;,统计图的基本要求,17,18,Graphs菜单,19,概念: 用等宽直条的长短来表示各个相互独立的指标大小的图形。 适用资料 : 相互独立的资料比较 离散型定量资料的频数分布 分类:分为单式和复式两种。,直条图(Bar Charts),20,例:数据Anxiety.sav 欲比较该数据中4次不同时间点测量的得分(score)之算数均数的变化情况,选择合适的图形。,21,例:数据Anxiety.sav 欲根据有无紧张症状的病人分别描述不同时间的得分均数情况,请选择合适的统计图,22,分段条图,23,百分条图,24,误差条图,25,练 习,练习一:研究血压状态与冠心病各临床型发生情况的关系,分析资料如下所示,试绘制统计图。,26,普通线图: 纵轴的尺度为算术尺度 用线条的升降表示事物发展变化的趋势。 纵轴的尺度为对数尺度 半对数线图: 用线条的升降表示事物发展变化的速度。,线图 (line diagram),27,例:数据Car.sav 考察随着生产年代的变化Miles per Gallon均数的变化情况,请选择合适的统计图,28,例:数据Car.sav 考察随着年代的变化,Miles per Gallon(mpg)、Horsepower、Time to Accelerate from 0 to 60 mph (accel)三个变量的变化情况。,29,垂线图,30,半对数线图,31,误差线图,32,练习二:某地调查居民心理问题的存在现状,资料如下表所示,试绘制合适的统计图比较不同性别和年龄组的居民心理问题检出情况。,练 习,33,概念: 用于表示各类别某种特征的构成比情况,它以圆行的总面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的百分构成比 。 适用资料:构成比资料。,饼图 (pie graph),34,普通饼图 三维饼图 散点饼图,35,练习三:某年某医院用中草药治疗182 例慢性支气管炎患者,其疗效如下所示,试绘统计图。,练 习,36,概念: 表现两个变量或多个变量之间有无相关关系的统计图,它用点的密集程度和趋势来表示两个变量之间的相关关系及变化趋势。 适用资料:双变量资料,散点图 (scatter diagram),37,简单散点图 散点图矩阵 重叠散点图 三维散点图,38,练习四:随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如下表所示。试绘制统计图。,练 习,39,概念: 表示连续性变量的频数分布,实际应用中常用于考察变量的分布是否服从某种分布类型。 适用资料:连续型定量资料。,直方图 (histogram),40,普通直方图 累积直方图 直方图组,41,练习五:现有某地某年流行性乙型脑炎患者的年龄分布资料如下表,试绘制直方图。,练 习,42,43,用资料的五个数值(最小值、P25、中位数、P75、最大值)绘制。 适用于连续型定量资料的分布,可用于多组资料的比较。 箱式图作用: 观察分布类型、分布特征 比较多组数据的分布 发现极端值,箱图 (box plot),44,简单箱图 复式箱图,45,练习六:研究甲基汞对肝脏脂质过氧化的毒性作用,选用25 只大白鼠,随机分成五组,按不同剂量染毒一段时期后测定肝脏LPO 含量(n mol/L),资料如下表,试绘制箱图。,练 习,46,47,SPSS表格,48,表格元素的构成,层(Layer) 行(Rows) 列(Columns) 单元格(Cells),49,50,SPSS表格类型,叠加表 (Stacking) 交叉表 (Cross tabulation) 嵌套表 (Nesting) 分层表 (Layers) 复合表格,51,52,数据:Car.sav,Tables菜单,53,Basic Tables过程,该过程可对分类资料或者定量资料进行各种复杂格式的描述,功能非常强大,可以满足大多数情况的需要。,54,例:请对数据文件Cars.sav中的汽车数据分不同的产地和气缸数计算其引擎功率、引擎重量的频数和均数,用适当的报表形式给出,并要求给出类别合计。,55,General Tables过程,功能最为强大,可以在同一张表格内同时对分类资料、连续资料、多选题数据进行汇总,但其使用相对复杂。,数据文件Cars.sav,56,Custom Tables模块,从SPSS11.5版本新增的一个用于指标的模块 特点:操作为全拖放式 在正式执行该过程前可以观察到表格的输出格式 两种显示界面即正常视图和紧凑视图,数据文件Cars.sav,57,表格的编辑,设定表格外观 对表格进行编辑 如何根据表格生成图形 表格的导出,58,练 习,例:数据tables.sav 在某次高血压

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论