统计软件SPSS的初步应用(1).ppt_第1页
统计软件SPSS的初步应用(1).ppt_第2页
统计软件SPSS的初步应用(1).ppt_第3页
统计软件SPSS的初步应用(1).ppt_第4页
统计软件SPSS的初步应用(1).ppt_第5页
免费预览已结束,剩余132页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、刘宝花 北大医学部,1,统计软件(SPSS)的初步应用,刘宝花 副教授 Email:baohualiu 电话:82801519 北京大学公共卫生学院 社会医学与健康教育系,刘宝花 北大医学部,2,提纲,熟悉如何使用SPSS for Windows输入统计资料 描述数值变量(计量资料)的统计学指标 描述分类变量(计数资料)的统计学指标 统计分析(t检验、卡方检验),能对结果进行解释 常用统计图的制作,刘宝花 北大医学部,3,SPSS操作入门,SPSS的运行方式 SPSS的窗口 SPSS的结果输出,刘宝花 北大医学部,4,从开始菜单运行,使用桌面快捷方式来运行,运行SPSS,刘宝花 北大医学部,5

2、,菜单栏,工具栏,SPSS界面,刘宝花 北大医学部,6,基本知识介绍,SPSS有三个主要界面: 数据管理窗口 结果浏览窗口 程序编辑窗口,刘宝花 北大医学部,7,数据管理窗口,刘宝花 北大医学部,8,数据编辑窗口的数据视图,菜单栏,工具栏,数据视图标签,变量视图标签,变量名,纵列变量 variable 横行观测单位case,刘宝花 北大医学部,9,数据编辑窗口的变量视图,专门显示有关变量的信息: Name:变量名 Type:变量类型 Width:变量长度 Decimals:小数位数 Label:变量标签 Value:变量值标签 Missing:定义变量缺失值 Columns:显示列宽 Alig

3、n:对齐方式 Measure:测量尺度,菜单栏,工具栏,数据视图标签,变量视图标签,关于变量信息的格式名称,刘宝花 北大医学部,10,结果浏览窗口,又称结果视图,用于存放分析结果。,刘宝花 北大医学部,11,程序编辑窗口的实现:,刘宝花 北大医学部,12,SPSS的2种运行方式,菜单对话框方式 程序方式,刘宝花 北大医学部,13,菜单对话框方式,待选变量列表框,分析变量列表框,粘贴,表格格式,图形,统计,粘贴:将对话框中的选择自动转化为相应的程序语句。 恢复:将对话框恢复为默认状态。,刘宝花 北大医学部,14,File: 对SPSS文件的管理,包括新建、打开、保存文件等 Edit: 与wind

4、ows类似的编辑功能,如复制、剪切、粘贴、 撤消等,以及系统参数设置 View:选择显示状态条、工具栏、网格线、变量标签、变量 视图及字体设置等 Data: 实现文件级别的数据管理,如记录排序、记录拆分、 记录筛选、合并文件等 Transform:实现变量级别的数据管理,如计算新变量、变 量值的分组合并、连续变量变分类变量等,SPSS菜单栏,刘宝花 北大医学部,15,Analyze:SPSS的重点菜单项,涵盖各种主要统计分析功能 Graphs:绘制各种普通统计图及交互式统计图,如直方图、 茎叶图、箱图、残差图等 Utilities:提供各种实用性管理设置,如变量信息管理,输出 结果文件设置、菜

5、单管理等 Windows:窗口拆分、最小化、当前窗口显示等 Help:帮助系统,SPSS菜单栏,刘宝花 北大医学部,16,打开文件,保存文件,打印,召回前次菜单操作,撤消,查找记录,查看变量信息,查找变量值,插入记录,插入变量,拆分文件,设置权重,选择记录,显示变量标签,使用数据集,SPSS工具栏,刘宝花 北大医学部,17,SPSS的4种结果输出,表格格式 文本格式 标准图 交互图,刘宝花 北大医学部,18,表格格式,刘宝花 北大医学部,19,标准图,是在Graphs菜单下直接单击图形生成的,与交互图相比,生成速度快,可以满足大部分统计绘图的需求,但编辑能力要弱于交互图,适用于理解数据。,刘宝

6、花 北大医学部,20,运行SPSS软件的具体工作流程,将数据输入SPSS,并存盘 进行必要的预分析,以确定应采用的检验方法 根据研究需要进行统计分析 保存和导出分析结果,刘宝花 北大医学部,21,一、建立数据文件,刘宝花 北大医学部,22,建库前准备,1变量清单 变量清单应包括全部要用到的问卷或检查项目,对每个项目要确立一个变量名,并定义变量类型、宽度、小数位数、缺省值等。 2选择数据库软件 若问卷或检查项目的结构简单,要分析的变量不多时,可在spss或excel中直接建库。否则建议使用epidata、access、foxpro等专门数据库软件录入数据再用spss读取。,刘宝花 北大医学部,2

7、3,例题:现有14例妇女体检的资料 研究变量为编号、姓名、出生日期、体检日期、身高、体重、疾病名。 请先建立数据库。,刘宝花 北大医学部,24,某地14例妇女体检资料,刘宝花 北大医学部,25,变量的基本属性: 变量名称 变量类型 标签说明 ,SPSS Variable View中的变量属性编辑窗口,10个方面,一、定义变量,刘宝花 北大医学部,26,变量属性,变量名(Name)的定名规则 变量类型(Type) 变量宽度(Width)和小数位数(Decimal) 变量标签(Label) 变量赋值(Value) 变量缺失值的定义(Missing) 列宽(Column)和位置(Align) 度量类

8、型(Measure),刘宝花 北大医学部,27,如果使用的是英文版SPSS For Windows,取变量名最好用英文或汉语拼音,而避免用中文,另外还要遵循以下原则: 变量名的首字符应该是英文字母,其后可以是任意字母、数字或一些诸如“, 1, _, $”的特殊字符,但不可以是空格或“!, ?, , *”等。 变量名的长度不能超过64字符,这意味着如果用中文取名,最多可以有32个字。(SPSS11.0版变量名的长度一般不超过8个字符(4个中文字);) 变量名不允许重名,不能使用SPSS的保留字(Reserved keywords),比如ALL, AND, BY, EQ, GE, GT, LE,

9、LT, NE, NOT, OR, TO, WITH。 变量名是不区分大小写的。,变量名(Name)的定名规则,*输入不合法的变量名时,会自动显示出错信息.,刘宝花 北大医学部,28,对例题的研究定义变量名:,刘宝花 北大医学部,29,变量类型(Type),数值型,逗号型,句点型,科学计数型,日期格式型,字符串型,定制货币型,美元型,刘宝花 北大医学部,30,- 数值型的变量值只能是数字,可以进行数学运算; - 字符型的变量值可以是数字或字母、文字等,不能进行数学运算,可以进行逻辑运算; - 为了进行统计分析,在大部分情况下变量类型为数值型,因此SPSS新建变量默认类型是数值型。,刘宝花 北大医

10、学部,31,变量宽度(Width)和小数位数(Decimal),宽度,小数位数,*宽度数字不得小于小数位数加1。,刘宝花 北大医学部,32,变量标签(Label),一般在变量标签处输入中文,为变量名的中文意思,或相关说明。,变量标签,刘宝花 北大医学部,33,变量标签的显示,刘宝花 北大医学部,34,变量标签(Label),当为变量定义了变量标签以后,在进行分析时,对话框中的待选变量列表框和分析变量列表框中的变量名前标注有变量标签,操作时一目了然。,定义了变量标签,未定义变量标签,刘宝花 北大医学部,35,变量标签(Label),当为变量定义了变量标签以后,在对该变量进行数据处理后得到的图表中

11、就用变量标签来表示变量信息;但如果没有定义变量标签,将直接用变量名来表示变量信息。,未定义变量标签,定义了变量标签,刘宝花 北大医学部,36,变量赋值(Value),填入数字,填入数字所代表的意义,刘宝花 北大医学部,37,点击Value框右半部的省略号,会弹出变量值标签对话框。,刘宝花 北大医学部,38,定义变量标签,输入数值,数值代表的分类含义,刘宝花 北大医学部,39,1=male 2=female,数值标签,显示为数值标签,实际值为1和2,注意: 当点击view菜单后,再点击value lable, 可以方便录入数据。,刘宝花 北大医学部,40,变量赋值(Value),给变量的值赋值(

12、赋予值标签)后,可以使输出结果更清楚、更便于阅读和理解。,未赋予值标签,赋予值标签后,刘宝花 北大医学部,41,变量缺失值的定义(Missing),默认,没有缺失值,离散的缺失值,连续的缺失值加上一个离散缺失值,注意:missing值不计入统计分析。,刘宝花 北大医学部,42,数据文件管理,新建数据文件 选择菜单FileNew Data,刘宝花 北大医学部,43,数据文件管理,新建数据文件 选择菜单FileNew Data 定义新变量,刘宝花 北大医学部,44,数据文件管理,新建数据文件 选择菜单FileNew Data 定义新变量,刘宝花 北大医学部,45,刘宝花 北大医学部,46,刘宝花

13、北大医学部,47,刘宝花 北大医学部,48,列宽(Column)和位置(Align),位置,列宽,刘宝花 北大医学部,49,定类尺度(Nominal Measurement):无序分类变量,如性别可取“男”、“女”。只能计算频数和频率,定序尺度(Ordinal Measurement):有序分类变量,如对游泳的喜欢程度1非常喜欢,2喜欢,3无所谓,4不喜欢,5非常不喜欢,可计算频数、频率、累计频数、累计频率,定比尺度(Scale Measurement):数值变量。,度量类型,刘宝花 北大医学部,50,数据录入的技巧,直接录入 连续录入多个相同变量 从其他表格文件中COPY,1,刘宝花 北大医

14、学部,51,练习数据库建立,某研究生对河北农村婴儿进行体格发育研究,进行问卷调查和体格测量。 调查变量包括编号、儿童母亲职业(外出打工、在家种地、个体经营、工人、教师)、母亲文化程度(小学、初中、高中及以上)、婴儿性别、婴儿出生体重(g)(保留0位小数)、第一次体检月龄(月)(保留0位小数)、第一次体重(kg)(保留2位小数)、第二次体检月龄(月)(保留0位小数)、第二次体重(kg)(保留2位小数)。,刘宝花 北大医学部,52,录入数据并保存文件:,刘宝花 北大医学部,53,二、保存数据文件,点工具栏的磁盘图标或在File菜单下选save或save as可以保存数据文件。在弹出的对话框里,点v

15、ariables可选择只保存一部分变量,点“保存类型”的下拉菜单可选择所存数据文件的类型。SPSS的默认数据格式是“.sav”。,刘宝花 北大医学部,54,SPSS 主要文件类型,SPSS数据文件: *.sav SPSS结果输出文件:*.spo SPSS语句文件: *.sps,刘宝花 北大医学部,55,数据获取 (Getting Data into SPSS),读取SPSS数据文件:*.sav , 常用的其他外部数据文件: *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb 注意:医学领域常用数据库EpiData软件,先将数据文件*.r

16、ec转换为*.sps文件,然后在SPSS的语法窗口运行,生成*.sav 文件。,刘宝花 北大医学部,56,直接打开 使用数据库查询打开 使用导入向导读入文本文件,刘宝花 北大医学部,57,练习:打开数据文件,打开SPSS数据文件(lx1.sav) 打开EXCEL数据文件(lx1.xls) EXCEL已经打开原数据,并且数据量较少时,可以直接用拷贝粘帖的方法将数据引入SPSS。 使用数据库查询打开。 如果数据中含有文本,则不能直接粘帖,否则会丢失数据。解决的方法是先建立一个临时的文本文件,再用SPSS读入该文件。,刘宝花 北大医学部,58,刘宝花 北大医学部,59,刘宝花 北大医学部,60,刘宝

17、花 北大医学部,61,刘宝花 北大医学部,62,刘宝花 北大医学部,63,数据文件管理,打开其他格式的数据文件 选择菜单File Open Data,刘宝花 北大医学部,64,刘宝花 北大医学部,65,刘宝花 北大医学部,66,刘宝花 北大医学部,67,刘宝花 北大医学部,68,刘宝花 北大医学部,69,数据文件管理,保存数据文件,刘宝花 北大医学部,70,刘宝花 北大医学部,71,三、简单数据整理功能,添加、删除变量(variable)和观测值(case) 利用Edit菜单进行查找(Find)、剪切(Cut)、拷贝(Copy)、粘帖(Paste)、清除(Clear)。,刘宝花 北大医学部,7

18、2,练习:应用自己建立的数据库(lx1.sav),查找第一次体重测量为5.55kg 的儿童,并回答其性别? 增加变量“儿童姓名”及“儿童血红蛋白测量值”。,刘宝花 北大医学部,73,数据库文件的编辑(1),数据的排序 数据的重排格式,刘宝花 北大医学部,74,数据的排序 Sort cases,有的过程运行以前要求对数据按照某个或某几个变量进行排序,如数据文件夹拆分和合并等。可执行数据排序操作以实现。,排序,刘宝花 北大医学部,75,数据的排序,升序,第一排序变量,第二排序变量,降序,刘宝花 北大医学部,76,练习,将lx1.sav数据库打开 对变量“母亲文化程度”进行顺排。 对变量“第一次体重

19、”进行逆排。 对 “儿童性别”、“母亲文化程度”和 “出生体重”三个变量进行排序,其中 “儿童性别”、“母亲文化程度”为顺排,“出生体重”为逆排。,刘宝花 北大医学部,77,数据整理及变量编辑,刘宝花 北大医学部,78,数据的合并 数据文件的拆分 数据的选择 数据的加权 日期的计算 计算产生新变量 赋值产生新变量,数据整理及变量编辑,刘宝花 北大医学部,79,数据的合并 Merge Files,对于存在某种联系的两个数据文件,可以用SPSS的合并功能将它们按照一定的方式进行合并。 SPSS提供了两种方式来合并数据文件: 个案合并(Add Cases) 变量合并(Add Variables)。,

20、刘宝花 北大医学部,80,数据文件的合并纵向合并:增加记录Merge Files.Add Cases,打开数据文件lx1.sav作为“工作数据文件”,刘宝花 北大医学部,81,打开lx2.sav作为“外部数据文件”,刘宝花 北大医学部,82,*代表工作数据文件 +代表外部数据文件,刘宝花 北大医学部,83,将连接后的文件另存一个文件名:data_4.sav,刘宝花 北大医学部,84,数据文件的合并横向合并:增加变量Merge Files.Add Variables,打开lx4.sav作为“工作数据文件”,刘宝花 北大医学部,85,打开lx5.sav作为“外部数据文件”,刘宝花 北大医学部,86

21、,对于排序的文件,按照关键变量进行匹配,关键变量,(1)两个文件均提供记录(Both files provide cases),刘宝花 北大医学部,87,刘宝花 北大医学部,88,连接后的数据文件,另存为lx6.sav,刘宝花 北大医学部,89,(2)按照关键变量,将外部数据文件匹配到工作数据文件中(External file is keyed table)。,刘宝花 北大医学部,90,(3)按照关键变量,将工作数据文件匹配到外部数据文件中(Working file is keyed table)。,刘宝花 北大医学部,91,练习,用lx4.sav和lx5.sav数据库练习数据的变量合并。 用

22、lx1.sav和lx2.sav数据库练习数据的记录合并。,刘宝花 北大医学部,92,数据文件的拆分 Split File,如果要对数据基于一个或几个变量分类以后形成的各组数据的个体进行统计分析,可以用拆分(Split)功能。 需要明确的是,所谓拆分,并不是要把文件真的分成几个,而是根据需要,依据某一个或几个变量按照一定顺序把原数据重新排列,把与所选定的一个或几个变量共同相关的数据在数据编辑器中集合到一起,以便集中操作和对比。 拆分以后,原数据进行了重新排列,这一点与排序有相近之处。但实际上,其主要作用是,对拆分后的数据进行处理,结果显示不同,它是按照某一个或几个变量分类后,各自的结果而显示。,

23、刘宝花 北大医学部,93,文件拆分命令,刘宝花 北大医学部,94,比较组,分组变量,根据分组变量排序,刘宝花 北大医学部,95,刘宝花 北大医学部,96,数据文件的拆分,刘宝花 北大医学部,97,数据拆分状态显示,刘宝花 北大医学部,98,注意:拆分是按某个分类变量进行的,如果需要对全部数据进行分析,则需要将拆分取消。,刘宝花 北大医学部,99,练习,根据母亲文化程度对数据进行拆分,分析各分类中儿童性别的比例。 再分析总人群中儿童性别的比例。 根据母亲职业对数据进行拆分,分析各分类中母亲文化程度的比例。 再分析总人群中母亲文化程度的比例。,刘宝花 北大医学部,100,数据的选择 Select

24、Cases,如需要在大量的原始数据中选择所需要的部分数据进行统计分析,就可用到“数据的选择”功能。,刘宝花 北大医学部,101,数据的选择,根据逻辑关系表达式选择数据,随机选取数据,在给定范围(日期、时间或个案号等)内选择数据,用过滤器变量选取数据,选择所有数据,剔除个案(斜杠),删除个案,刘宝花 北大医学部,102,数据的选择(逻辑关系表达式举例),选择男性并且年龄大于等于35岁且小于等于74岁的个案,刘宝花 北大医学部,103,练习,lx6.sav数据库 问调查对象为女孩且出生体重小于2500克的共多少人? 第一次体重低于6公斤或第二次体重低于8公斤的调查对象共多少人?,刘宝花 北大医学部

25、,104,数据的加权,加权是一种通过人为方法来调节样本或数据大小的方法,在样本分析和科学评价中经常用到。所谓加权,就是给被加权对象乘上一个系数。,加权数据库的建立: 分类变量进行样本率的比较时,如果没有原始数据库,只有每种分类变量的样本数和某现象的阳性数,可在SPSS软件中建立数据库。,刘宝花 北大医学部,106,数据的加权(个案加权举例),107,刘宝花 北大医学部,108,用加权变量的方法建立数据库,SPSS程序:Data Weight Cases Weight cases by 选入 Frequency variable OK,刘宝花 北大医学部,109,日期计算 Date/Time,刘

26、宝花 北大医学部,110,刘宝花 北大医学部,111,刘宝花 北大医学部,112,Date1与Date2之差,以“年”为单位,刘宝花 北大医学部,113,刘宝花 北大医学部,114,生成的新变量:,刘宝花 北大医学部,115,练习,用“例1.sav”数据库练习日期变量计算 计算体检者年龄(天) 计算体检者年龄(月),刘宝花 北大医学部,116,通过计算产生新变量 compute,刘宝花 北大医学部,117,Compute菜单特点,目标变量可以是新变量,也可以是已有的变量(此时系统会弹出提示对话框加以确认)。 赋给变量的值可以是一个常数(数值、日期等),也可以是从已有变量值或系统函数计算而来的值

27、。SPSS提供了多达70余种的系统函数(数值变换、时间变换、统计概率计算等)。 操作记录可以是所有case,也可以设定逻辑条件,即只对满足条件的记录加以赋值。其余记录的相应变量或保持原状或被赋为缺失值。,刘宝花 北大医学部,118,要求:根据出生体重小于2500克划分低出生体重组(=1)和正常出生体重组(=0),Transform菜单 Compute命令,(系统默认),刘宝花 北大医学部,119,新变量数据库,刘宝花 北大医学部,120,如果出生体重小于2500克划分低出生体重组(=1)和正常出生体重组(=2),则需要使用“IF”对话框. 第一步同上面操作 第二步再次选择Transform菜单 第三步定义已生成变量LBW=2,同时点击 “IF”子对话框。 第四步定义条件,即birthw2500克,Compute命令,刘宝花 北大医学部,121,SPSS对话框如下:,刘宝花 北大医学部,122,计算BMI指数 公式BMI=体重(kg)/身高(m)2 SPSS程序:transform菜单下打开compute子菜单,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论