spss概述及基本知识_第1页
spss概述及基本知识_第2页
spss概述及基本知识_第3页
spss概述及基本知识_第4页
spss概述及基本知识_第5页
已阅读5页,还剩205页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Spss概述统计软件概述 从20世纪60年代开始,统计软件(statistical software)在数量和质量上均有了很大的发展。纵观统计软件的发展历程,开发较早、应用范围较广并一直在不断改进完善并日臻成熟的大型商业统计软件,当属美国SAS研究公司研制的SAS(statistical analysis system),美国加利福尼亚大学研制的BMDP(biomedical computer programs),和美国SPSS研究公司研制的SPSS。统计软件概述 这三种软件,由于开发时间长,经历了众多这三种软件,由于开发时间长,经历了众多用户在不同机型上的考验,用户与开发商以及用用户在不同机

2、型上的考验,用户与开发商以及用户与用户之间均建立了广泛的交流,开发上投入户与用户之间均建立了广泛的交流,开发上投入了大量的人力、物力专门进行维护和更新,因此了大量的人力、物力专门进行维护和更新,因此功能越来越强,使用越来越方便,性能更趋于完功能越来越强,使用越来越方便,性能更趋于完善。善。 美国还有美国还有SYSTAT、STATA等软件,中国和等软件,中国和其他国家也有许多统计软件面世,原上海医科大、其他国家也有许多统计软件面世,原上海医科大、华西医科大、第四军医大都编制过一些面向基层华西医科大、第四军医大都编制过一些面向基层人员、操作灵活、简便、实用的统计软件。人员、操作灵活、简便、实用的统

3、计软件。SPSS介绍 SPSS公司总部位于美国芝加哥,创立于公司总部位于美国芝加哥,创立于1975年,一直以经营统计软件产品开发为主业。年,一直以经营统计软件产品开发为主业。1994年年-1998年,年,SPSS公司得到了很大的发展,公司得到了很大的发展,陆续购并了陆续购并了systat公司、公司、BMDP软件公司、软件公司、Quantum公司、公司、ISL公司等,并将各公司的主打公司等,并将各公司的主打产品收纳产品收纳SPSS旗下,从而使旗下,从而使SPSS公司由原来的公司由原来的单一统计产品开发销售转向为企业、教育科研及单一统计产品开发销售转向为企业、教育科研及政府机构提供全面信息统计决策

4、支持服务,成为政府机构提供全面信息统计决策支持服务,成为最新的最新的“数据仓库数据仓库”和和“数据挖掘数据挖掘”领域前沿的领域前沿的一家综合统计软件公司。一家综合统计软件公司。 SPSS软件是软件是SPSS公司赖以起家的产品,公司赖以起家的产品,目前也仍然是该公司的主打产品之一,是目前也仍然是该公司的主打产品之一,是国际上最流行并具有权威性的统计分析软国际上最流行并具有权威性的统计分析软件之一,软件由件之一,软件由fortran语言写成,升级速语言写成,升级速度很快。目前的最新版本为度很快。目前的最新版本为18.0 。 SPSS的英文名称原为的英文名称原为Statistical Package

5、 for Social Sciences ,意为社会科学统计意为社会科学统计软件包。软件包。 后来,随着后来,随着SPSS产品服务领域的扩大和服产品服务领域的扩大和服务深度的增加,务深度的增加,2002年英文全称更改为年英文全称更改为 Statistical Product and Service Solutions,意为统计产品与服务解决方案。,意为统计产品与服务解决方案。 在近在近30年的发展中,虽然竞争对手不断出年的发展中,虽然竞争对手不断出现,但现,但SPSS却始终以其鲜明的特色鼎立于却始终以其鲜明的特色鼎立于统计学软件之中,现在和统计学软件之中,现在和SAS被并称为当被并称为当今最权

6、威的两大统计软件。今最权威的两大统计软件。 学习重点:根据统计结果作出解释和统计学习重点:根据统计结果作出解释和统计结论结论 一、 SPSS软件的基本特点 1、功能强大、功能强大2、兼容性好、兼容性好3、易用性强、易用性强功能强大囊括了各种成熟的统计方法与模型,为统计囊括了各种成熟的统计方法与模型,为统计分析用户提供了全方位的统计学算法,为各分析用户提供了全方位的统计学算法,为各种研究提供了相应的统计学方法。种研究提供了相应的统计学方法。自由灵活的表格功能,使得制表变得更加简自由灵活的表格功能,使得制表变得更加简单和直接单和直接提供了各种常用的统计学图形,如线图、条提供了各种常用的统计学图形,

7、如线图、条图、饼图、直方图、散点图等多种图形,并图、饼图、直方图、散点图等多种图形,并且可以将表格图形直接拷贝到且可以将表格图形直接拷贝到word文档、幻文档、幻灯片中,直接进行结果的展现。灯片中,直接进行结果的展现。兼容性好兼容性好 在数据方面,不仅可以在在数据方面,不仅可以在spss中作数据录入中作数据录入工作,还可将日常工作中常用的工作,还可将日常工作中常用的excel表格数表格数据、文本格式数据导入据、文本格式数据导入spss中进行分析,不中进行分析,不仅节省了相当大的工作量,并且避免了因拷仅节省了相当大的工作量,并且避免了因拷贝粘贴可能引起的错误。贝粘贴可能引起的错误。在结果方面,在

8、结果方面,spss的表格、图形结果可直接的表格、图形结果可直接导出为导出为word、文本、网页、文本、网页、excel格式等,格式等,也可以将表格、交互式图形作为对象选择型也可以将表格、交互式图形作为对象选择型粘贴到粘贴到word、powerpoint等中,并在其中等中,并在其中再利用再利用spss对他们进行编辑。对他们进行编辑。易用性强易用性强 Spss之所以有广大的用户群,不仅因之所以有广大的用户群,不仅因为它是权威的统计学工具,提供了强大的为它是权威的统计学工具,提供了强大的统计功能,也因为它是一种非常简单易用统计功能,也因为它是一种非常简单易用的软件。界面友好,操作简单。另外,的软件。

9、界面友好,操作简单。另外,spss也向一些高级用户提供了编程功能,也向一些高级用户提供了编程功能,使分析工作变得更加节省时间和精力。使分析工作变得更加节省时间和精力。第二节第二节 视窗界面视窗界面一、软件的启动与退出一、软件的启动与退出启动:启动:(1)在)在Windows开始菜单中选择开始开始菜单中选择开始程序程序SPSS for WindowsSPSS for Windows,如图,如图1.1(2)在快捷工具栏单击)在快捷工具栏单击SPSS 19.0图标,图标, 退出:选择菜单退出:选择菜单FileExit,或者直接关闭,或者直接关闭窗口,即可!窗口,即可! Spss运行后,可见一个运行对

10、话框,运行后,可见一个运行对话框, 初次进入初次进入spss系统时会出现一个导航对话系统时会出现一个导航对话框,单击右下方的框,单击右下方的cancel按钮,即可进入按钮,即可进入spss的主界面,的主界面, SPSS运行对话框 二、SPSS的5个窗口 1、数据编辑窗口(、数据编辑窗口(SPSS Data Editor):以):以“sav”为扩展名,是为扩展名,是spss数据文件数据文件 2、结果管理窗口(、结果管理窗口(SPSS Output Viewer):以):以“spo”为扩展名,是为扩展名,是spss的结果文件的结果文件 3、草稿结果窗口(、草稿结果窗口(SPSS Draft vie

11、wer)以)以“rtf”为扩展名,是为扩展名,是spss草稿文件草稿文件 4、语法编辑窗口(、语法编辑窗口(SPSS Syntax Editor):以):以“sps”为扩展名,是为扩展名,是spss语法文件语法文件 5、脚本窗口(、脚本窗口(spss script editor):以):以“sbs”为扩展名,是为扩展名,是spss脚本文件脚本文件 常用的是常用的是数据编辑窗口数据编辑窗口和和结果管理窗口结果管理窗口。数据编辑窗口 1、数据编辑窗口(、数据编辑窗口(SPSS Data Editor):此窗):此窗口类似于口类似于Excel窗口,窗口,SPSS处理数据的主要工作处理数据的主要工作都

12、在此窗口进行。它分为两个视图:都在此窗口进行。它分为两个视图: (1) 数据视图:如图数据视图:如图1.3(a),显示具体的数据,),显示具体的数据,一行代表一个观测个体(一行代表一个观测个体(SPSS中称为中称为Record),),一列代表一个属性(一列代表一个属性(SPSS中称为中称为Variable) (2)变量视图:如图变量视图:如图1.3(b)。专门显示有关变量)。专门显示有关变量的信息:包括变量名称,每个变量的各种属性、的信息:包括变量名称,每个变量的各种属性、格式等等。格式等等。图1.3(a)数据视图图1.3(b) 变量视图菜单栏 打开新的数据编辑窗口,当没有输入任何数打开新的数

13、据编辑窗口,当没有输入任何数据时,所有行、列的标号都是灰色的。见图。据时,所有行、列的标号都是灰色的。见图。注意,第一行第一列的单元格边框为深色,注意,第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。表明该数据单元格为当前单元格。 2、结果管理窗口(、结果管理窗口(SPSS Output Viewer):又称结果视图,用于存放分析):又称结果视图,用于存放分析结果,如图。结果,如图。 类似于类似于windows的资源管理器,整个窗口的资源管理器,整个窗口分为两个区。分为两个区。 左边:目录区左边:目录区 是是spss分析结果的一个目录分析结果的一个目录 右边:内容区。是与目录一一

14、对应的内容右边:内容区。是与目录一一对应的内容 3、草稿管理窗口(、草稿管理窗口(SPSS Draft viewer) :草稿结果是结果的一种简化文:草稿结果是结果的一种简化文本格式。实际上就是本格式。实际上就是word所兼容的所兼容的rtf超文超文本格式,因此可以在没有安装本格式,因此可以在没有安装spss的电脑的电脑上使用文字编辑软件打开。上使用文字编辑软件打开。 草稿管理窗口(SPSS Draft viewer) 4、语法编辑窗口(、语法编辑窗口(SPSS Syntax Editor) :spss最大的优势在于简单易用,最大的优势在于简单易用,即菜单即菜单对话框式的操作,除此之外,对话框

15、式的操作,除此之外,spss还提供了语法方式或程序方式进行分还提供了语法方式或程序方式进行分析。这个方法既是对菜单功能的一个补充,析。这个方法既是对菜单功能的一个补充,也可以使繁琐的工作得到简化,尤其适用也可以使繁琐的工作得到简化,尤其适用于高级分析人员。于高级分析人员。 语法编辑窗口(SPSS Syntax Editor) 5、脚本窗口:、脚本窗口:spss脚本是用脚本是用sax basic 语语言写的程序,可以像言写的程序,可以像spss宏一样构建和运宏一样构建和运行行spss命令,而且脚本可以在命令中利用命令,而且脚本可以在命令中利用当前数据文件的变量信息,还可以对结果当前数据文件的变量

16、信息,还可以对结果进行编辑或者构建一些新的自定义的对话进行编辑或者构建一些新的自定义的对话框。脚本可用于使框。脚本可用于使spss内部操作自动化,内部操作自动化,使结果格式自定义化,实现使结果格式自定义化,实现spss新功能以新功能以及将及将spss与与VB和和VBA兼容应用程序连接。兼容应用程序连接。第二章第二章 数据录入与数据获取数据录入与数据获取 第一节第一节 数据格式概述数据格式概述一、用于分析的数据资料有两种:一、用于分析的数据资料有两种: 1、原始资料。如调查问卷中的数据,录入、原始资料。如调查问卷中的数据,录入SPSS软件,建立数据文件。软件,建立数据文件。 2、已经被录入为其他

17、数据格式的资料,需、已经被录入为其他数据格式的资料,需要将其内容直接读入要将其内容直接读入SPSS中。中。 二、统计软件中数据的录入格式二、统计软件中数据的录入格式 1、同一观察对象的数据应当独占一行 2、同一个指标的测量数值都应当录入到同一个变量中去,即每一个测量指标或影响因素只能占据一列的位置, 数据库是一个数据库是一个二维表结构二维表结构(行列表结构),(行列表结构), 列是变量(列是变量(variable);); 行为个体(行为个体(case,record);); 数据表中的一个格子(叫做数据表中的一个格子(叫做cell,要记住),要记住),一个格子放一个数据(可以是数值或字一个格子放

18、一个数据(可以是数值或字符)。符)。三、建立数据库的步骤 1、定义变量(变量名、变量属性):就、定义变量(变量名、变量属性):就是给每个指标起个名字,再对每个指标是给每个指标起个名字,再对每个指标的一些统计特性作出制定。的一些统计特性作出制定。 2、输入数据:即把每个被访者的各指标、输入数据:即把每个被访者的各指标取值录入为电子格式。取值录入为电子格式。 因此这里首先介绍一下变量的各种属因此这里首先介绍一下变量的各种属性问题。性问题。 进入进入SPSS数据编辑窗口以后,单击数据编辑窗口以后,单击左下方的左下方的Variable View(变量表变量表),进入变,进入变量视图,我们可以看到量视图

19、,我们可以看到spss会为每一个变会为每一个变量指定量指定10种变量属性种变量属性 四、定义变量(四、定义变量(defined variable) 1、Name:变量名。:变量名。 在该选项下方的方格中,单击定位后,在该选项下方的方格中,单击定位后,双击激活方格,进入编辑状态,输入变量双击激活方格,进入编辑状态,输入变量名,名,10.0版本最大可输入版本最大可输入8个英文字符,个英文字符,4个中文字符。系统默认值为个中文字符。系统默认值为VAR000011、Name:变量名 如果不对变量进行定义直接输入的话,就会出现这样的情况: 从从Spss12.0开始,变量名在开始,变量名在8个字符之内个字

20、符之内的这个限制已经被取消了,最多可以有的这个限制已经被取消了,最多可以有64个字符。但出于兼容性的考虑,变量名的个字符。但出于兼容性的考虑,变量名的定义还有一些限制,即定义还有一些限制,即 1、不能以数字开头;、不能以数字开头; 2、中间不能有空格;、中间不能有空格; 3、一个数据文件中不能有相同的变量名等。、一个数据文件中不能有相同的变量名等。当然,我们只要在使用中尝试即可,不必当然,我们只要在使用中尝试即可,不必记那么多规则。记那么多规则。2、Type:变量类型 SPSS中,变量有三种基本的类型中,变量有三种基本的类型,分别分别是:数值型、字符型和日期型。是:数值型、字符型和日期型。 根

21、据不同的显示方式,数值型又被细分了根据不同的显示方式,数值型又被细分了5种,所以种,所以SPSS中的变量类型共有中的变量类型共有8种。种。 系统默认值为数值型(系统默认值为数值型(Numeric)。)。单击单击Type单元格,方格的右侧会出现按钮,单元格,方格的右侧会出现按钮,单击该按钮,会弹出变量类型对话框。单击该按钮,会弹出变量类型对话框。 在以上三大类变量类型中,数值型是在以上三大类变量类型中,数值型是spss中最常中最常用的变量类型,因而默认为数值型。用的变量类型,因而默认为数值型。 数值型的数据是由数值型的数据是由0-9的阿拉伯数字和其他特殊的阿拉伯数字和其他特殊符号,比如美元符号,

22、逗号或圆点(小数点)组成。符号,比如美元符号,逗号或圆点(小数点)组成。如工资、年龄、成绩等变量都可以定义为数值型数据。如工资、年龄、成绩等变量都可以定义为数值型数据。 在选定了变量类型以后,通常在对话框右侧还有选项在选定了变量类型以后,通常在对话框右侧还有选项供选择,比如,如果选择数值型,如上图,则会出现供选择,比如,如果选择数值型,如上图,则会出现width和和decimal. Width:用于定义数值位数。系统默认为:用于定义数值位数。系统默认为8位,根据需位,根据需要可以进行修改。注意:小数点要占要可以进行修改。注意:小数点要占1位。位。 Decimal:用于定义小数位数。系统默认为:

23、用于定义小数位数。系统默认为2位,根据位,根据需要可以进行修改。需要可以进行修改。 (试试宽度(试试宽度8位改位改2位,小数位数位,小数位数2位改位改0位)位) 日期型如下:日期型数据主要在时间序列分日期型如下:日期型数据主要在时间序列分析中比较有用。在较为简单的分析问题中完全可析中比较有用。在较为简单的分析问题中完全可以用普通数值型数据来代替。以用普通数值型数据来代替。美元数值型如下:美元数值型如下:String:字符型数据,也比较常用。默认宽度为:字符型数据,也比较常用。默认宽度为8个字个字符位,它区分大小写字母,并且不能进行数学运算。符位,它区分大小写字母,并且不能进行数学运算。字符型数

24、据在字符型数据在SPSS的数据处理过程(比如在计算生成的数据处理过程(比如在计算生成新变量时)中是用一对引号引起来的。新变量时)中是用一对引号引起来的。 需要注意的是,在输入数据时不应输入引号,否则,需要注意的是,在输入数据时不应输入引号,否则,双引号将会作为字符型数据的一部分。双引号将会作为字符型数据的一部分。Characters:定义字符串长度。系统默认为:定义字符串长度。系统默认为8位。一个位。一个中文字符占中文字符占2位。位。3、width:数值位数:数值位数相当于相当于type对话框中的对话框中的width选项。单击选项下的方格定位选项。单击选项下的方格定位后,方格右方会出现上下按钮

25、后,方格右方会出现上下按钮,单击可增加或减少位数,或,单击可增加或减少位数,或双击后直接在方格中填入位数。双击后直接在方格中填入位数。 4、decimals:小数位数:小数位数 4、decimals:小数位数。相当于:小数位数。相当于type对对话框中的话框中的decimal选项,单击选项下的方选项,单击选项下的方格定位后,方格右方会出现按钮,单击可格定位后,方格右方会出现按钮,单击可增加或减少位数,或双击后直接在方格中增加或减少位数,或双击后直接在方格中填入位数。填入位数。5、labels:变量名标签 5、labels:变量名标签。:变量名标签。 即变量说明,对变量名(即变量说明,对变量名(

26、name)的)的含义进行进一步解释说明,该标签会在含义进行进一步解释说明,该标签会在结果中代替变量名,输出,以方便阅读,结果中代替变量名,输出,以方便阅读,增强变量名的可视性和统计分析结果的增强变量名的可视性和统计分析结果的可读性。可读性。 具体操作是:具体操作是:单击定位后,双击激活方单击定位后,双击激活方格,进入编辑状态,输入变量标签。格,进入编辑状态,输入变量标签。 从从Spss12.0开始,变量名在开始,变量名在8个字符之内个字符之内的这个限制已经被取消了,最多可以有的这个限制已经被取消了,最多可以有64个字符。但出于兼容性的考虑,变量名的个字符。但出于兼容性的考虑,变量名的定义还有一

27、些限制,即定义还有一些限制,即 1、不能以数字开头;、不能以数字开头; 2、中间不能有空格;、中间不能有空格; 3、一个数据文件中不能有相同的变量名、一个数据文件中不能有相同的变量名等。等。 当然,我们只要在使用中尝试即可,不必当然,我们只要在使用中尝试即可,不必记那么多规则。记那么多规则。6、values:数值标签:数值标签 6、values:数值标签,用于定义变量值,:数值标签,用于定义变量值,是对变量取值含义的解释说明信息。是对变量取值含义的解释说明信息。 数值标签对于分类变量来说,是必不可少数值标签对于分类变量来说,是必不可少的,它不但使分类变量的数据录入变得更的,它不但使分类变量的数

28、据录入变得更加方便,而且明确了数据的含义,也同样加方便,而且明确了数据的含义,也同样增强了分析结果的可读性。增强了分析结果的可读性。 注意:第一行表示你赋予的变量值(数注意:第一行表示你赋予的变量值(数值),也就是编码,第二行,是标签,表值),也就是编码,第二行,是标签,表达的是它代表的真实含义。达的是它代表的真实含义。 点击点击add按钮,最后单击按钮,最后单击ok按钮,按钮,数值标签就设置完成了。此时做任何分数值标签就设置完成了。此时做任何分析,在结果中都有相应的标签出现。析,在结果中都有相应的标签出现。 做任何分析,在结果中都有相应的标签出做任何分析,在结果中都有相应的标签出现。如果现在

29、就想看效果,切换回现。如果现在就想看效果,切换回data view界面,然后选择菜单界面,然后选择菜单view-value labels,就会看到下述结果。,就会看到下述结果。操作后界面将变成下面这样 每个变量值被变量标签所替代,每个变量值被变量标签所替代,在单元格中,多了一个下拉按钮,可在单元格中,多了一个下拉按钮,可以通过选择进行修改。以通过选择进行修改。 7、missing:定义缺失值:定义缺失值 Missing项是一个重要的,而且容易被忽项是一个重要的,而且容易被忽视的选项,它用于定义变量缺失值。视的选项,它用于定义变量缺失值。 Spss中缺失值有两大类,中缺失值有两大类, 一类是用户

30、自定义缺失值,一类是用户自定义缺失值, 一类是系统缺失值一类是系统缺失值 对于数值型的数据,系统缺失值用对于数值型的数据,系统缺失值用一个圆点一个圆点“.”表示,而字符型变量默认表示,而字符型变量默认就是空字符串。如果在问卷调查中,有就是空字符串。如果在问卷调查中,有些数据项漏填了,则数据录入时只能跳些数据项漏填了,则数据录入时只能跳过,那么相应的单元格就会被系统自动过,那么相应的单元格就会被系统自动当作缺失值来处理。例如当作缺失值来处理。例如 :用户自定义缺失值 自定义缺失值:往往出现在一些设计比较严格的自定义缺失值:往往出现在一些设计比较严格的大型调查中,在一些题目选项处有的会给出这样大型

31、调查中,在一些题目选项处有的会给出这样的选项:不知道或拒答。相应的代码可能用的选项:不知道或拒答。相应的代码可能用9或或者者99来表示。那么显然,这里的来表示。那么显然,这里的99不是一个真实不是一个真实的答案,仅仅是缺失值代码,需要告知的答案,仅仅是缺失值代码,需要告知spss这个这个特定的标记数据,让他在统计分析的时候区别对特定的标记数据,让他在统计分析的时候区别对待缺失值和正常的分析数据。待缺失值和正常的分析数据。 discrete missing values:指定离散:指定离散的缺失值,最多可以定义的缺失值,最多可以定义3个值个值 最后一行:指定缺失值所在的区间范围,最后一行:指定缺

32、失值所在的区间范围,并可以同时指定一个离散值。并可以同时指定一个离散值。 8、columns:列宽。用于调整数据表:列宽。用于调整数据表中各列的显示宽度。系统默认为中各列的显示宽度。系统默认为8位。位。 9、align:定义字符排列方向。分别为:定义字符排列方向。分别为左对齐、右对齐、居中。系统默认为右左对齐、右对齐、居中。系统默认为右对齐。对齐。 10、measure:数据量度选项:数据量度选项 Scale:定量变量:定量变量 Ordinal:有序分类变量:有序分类变量 Nominal:名义变量(分类变量):名义变量(分类变量) 就数据录入这部分内容而言,变量属性就数据录入这部分内容而言,变

33、量属性的设置是最重要的一部分工作,属性的设的设置是最重要的一部分工作,属性的设置不仅涉及对错,还有一个设置好坏的问置不仅涉及对错,还有一个设置好坏的问题,属性设置的好,会简化后边的数据分题,属性设置的好,会简化后边的数据分析工作,所以不可小看这部分工作。析工作,所以不可小看这部分工作。 第二节第二节 数据的直接录入数据的直接录入 在在spss中,新建一个数据文件非常容中,新建一个数据文件非常容易,只要打开易,只要打开spss,系统就已经生成了一,系统就已经生成了一个空数据文件,用户只要按自己的需要:个空数据文件,用户只要按自己的需要:定义变量定义变量输入数据输入数据保存,即可。保存,即可。 练

34、习:练习: 某医生观察了一组住院病人,完成了其中某医生观察了一组住院病人,完成了其中24名患者的名患者的资料收集,指标包括:观察编号,住院号(资料收集,指标包括:观察编号,住院号(inno),),入院日期(入院日期(indate),年龄(),年龄(age),性别(),性别(sex),),身高(身高(xl,单位:,单位:cm),体重(),体重(x2,单位:,单位:kg),),血压(收缩压血压(收缩压x3,舒张压,舒张压x4,单位:,单位:mmHg),空腹),空腹血糖(血糖(x5,单位:,单位:mmol/L)和胰岛素样生长因子)和胰岛素样生长因子-1水平(水平(igf-1,x6,单位:,单位:ng

35、/mL),并根据临床情况),并根据临床情况将患者的病情分为五级(将患者的病情分为五级(x0,1为正常,为正常,2为一级,为一级,3为为2级,级,4为为3级,级,5为为4级)。原始数据见表(简单)级)。原始数据见表(简单) 请建立数据库!请建立数据库!编号编号innoinnoindateindateageagesesex xx x0 0 x1x1x2x2x3x3x4x4x5x5x6x6155155174417442 21996-10-1996-10-21 21 2323男男3 316616652.552.510810878788.98.9185.6185.63 3172172455445549

36、91999-3-3 1999-3-3 71.171.1女女4 415115161.561.5150150909015.815.8145.9145.97 7195195312531257 71998-1-81998-1-857.357.3女女2 2143.143.5 541.541.5152152888813.513.53 30 011811836361997-6-24 1997-6-24 65.665.6男男3 31621625252166166707017.717.79 9180.4180.41、定义变量名:定义所有的变量名 单击单击name选项下第一单元格,输入选项下第一单元格,输入“编号

37、编号”,再单击下面第二个定位,输入再单击下面第二个定位,输入“inno”,依次输,依次输入其它变量名。最后回车或者单击任意方格,所入其它变量名。最后回车或者单击任意方格,所有变量的其它选项激活,为默认设定。在绝大多有变量的其它选项激活,为默认设定。在绝大多数情况下,数情况下,spss给出的默认数据类型和数据精度给出的默认数据类型和数据精度可以满足需要,如果默认值满足分析的需要,变可以满足需要,如果默认值满足分析的需要,变量定义就到此结束了,否则就需要对不满足条件量定义就到此结束了,否则就需要对不满足条件的选项进行进一步的设置的选项进行进一步的设置 2、定义Type选项 前边两个都是数值型数据,

38、默认状态即可,前边两个都是数值型数据,默认状态即可,第三个变量第三个变量“入院日期入院日期”是日期型数据,是日期型数据,默认状态为默认状态为numeric,需要更改下,更改,需要更改下,更改步骤为:步骤为:设定为日期型变量后,我们发现变量表中设定为日期型变量后,我们发现变量表中width和和decimals选选项变成了灰色项变成了灰色.变量变量“性别(性别(sex)”为字符变量,有一个中文字为字符变量,有一个中文字符。进入符。进入type,选择,选择string,单击,单击characters右右侧编辑栏,将数字改为侧编辑栏,将数字改为2,ok返回,可见变量返回,可见变量视图中视图中width

39、 和和decimals选项会自动显示为选项会自动显示为2和和0,3、定义中width 和decimals选项 根据具体情况进行更改,有两种方法:根据具体情况进行更改,有两种方法: 以身高(以身高(x1)为例)为例166.0, 单击变量单击变量x1的的decimals选项,单击上下按钮,由于小选项,单击上下按钮,由于小数位数是一位,因而将数位数是一位,因而将2改为改为1,或者双击进入编辑状,或者双击进入编辑状态,输入态,输入1。然后单击。然后单击width选项,我们看身高的字符选项,我们看身高的字符宽度是宽度是5位(小数点算一位),那么就将位(小数点算一位),那么就将8改成改成5。单。单击其它任

40、意方格或者回车,完成击其它任意方格或者回车,完成! 单击变量单击变量x1的的type选项,进入选项,进入type对话框,将右侧对话框,将右侧width数值栏数值栏8改成改成5,decimals数值栏,数值栏,2改成改成1,ok,返回返回 注意:先改小数位数,再改宽度,避免矛盾,如将宽注意:先改小数位数,再改宽度,避免矛盾,如将宽度改为度改为2,此时小数位数默认为,此时小数位数默认为2,就会提示出现错误。,就会提示出现错误。可以试验一下,请大家完成可以试验一下,请大家完成4、定义、定义label选项和选项和values选项选项 这两个选项分别为变量标签和数值标签。这两个选项分别为变量标签和数值标

41、签。理论上,所有变量均可以定义变量标签。理论上,所有变量均可以定义变量标签。数值标签只用于分类变量的说明数值标签只用于分类变量的说明 (1)单击变量)单击变量x0的的label选项,输入选项,输入“病病情分级情分级” ,回车确认,回车确认变量标签完成变量标签完成 (2)单击变量)单击变量x0的的values选项方格,单选项方格,单击省略号按钮击省略号按钮5、定义missing选项 第三条的最后一个单元格,数值为第三条的最后一个单元格,数值为0 方法方法:单击单击x6的的missing那个选项,单击省那个选项,单击省略号按钮,进入缺失值定义对话框,选定略号按钮,进入缺失值定义对话框,选定disc

42、rete missing values选项,单击下方选项,单击下方的数值栏,输入的数值栏,输入0,ok即可。设定后,数即可。设定后,数值值0缺失。缺失。 6、定义、定义columns,align选项:为数据选项:为数据窗口的显示格式,可取默认设定。窗口的显示格式,可取默认设定。 7、定义、定义measure选项:数据量度选项选项:数据量度选项 Type为为numeric时,默认为时,默认为scale Type为为string时,默认为时,默认为nominal. 本例,原始数据中,病情分级为有序分本例,原始数据中,病情分级为有序分类变量,应选择类变量,应选择ordinal。二、输入数据 完成变量

43、定义后,单击左下方完成变量定义后,单击左下方data view 标签,激活数据窗口。输入数据,标签,激活数据窗口。输入数据,回车,如果想查看变量标签,将鼠标箭回车,如果想查看变量标签,将鼠标箭头指向某变量名,就会出现所定义的变头指向某变量名,就会出现所定义的变量标签。量标签。 注意:输入数据时,回车之前,数据单注意:输入数据时,回车之前,数据单元格内左对齐显示,表示该单元格为第元格内左对齐显示,表示该单元格为第一次录入数据,同时数据栏内同步显示一次录入数据,同时数据栏内同步显示出输入的数值。出输入的数值。 如果想在一个界面中显示更多数据列,可调整如果想在一个界面中显示更多数据列,可调整列宽,方

44、法:列宽,方法: 1、直接缩小列宽,与、直接缩小列宽,与excel操作相同。操作相同。 2、返回变量表,调整、返回变量表,调整columns位数,位数, 一般一般columns的位数应大于的位数应大于width的位数。的位数。否则显示不完整。否则显示不完整。 注意:不得不提醒大家,数据录入过程中,要注意:不得不提醒大家,数据录入过程中,要随时注意保存,如果突然断电或者死机,辛苦随时注意保存,如果突然断电或者死机,辛苦工作的成果将付之东流。工作的成果将付之东流。三、变量标签和数值标签的意义 定义变量标签后,在其它调用该数据库的操作中,定义变量标签后,在其它调用该数据库的操作中,变量标签会与变量名

45、同时显示。在输出结果中,变量标签会与变量名同时显示。在输出结果中,会以标签代替变量名,非常直观。会以标签代替变量名,非常直观。 数值标签与变量标签的作用相似。数值标签与变量标签的作用相似。 注意一点:在对数值进行编码时,尽量用数值代注意一点:在对数值进行编码时,尽量用数值代码码+值标签这种录入方式,尽量不采用字符代码值标签这种录入方式,尽量不采用字符代码+值标签这种录入方式。值标签这种录入方式。 例如:比较不同病情分级的收缩压水平。例如:比较不同病情分级的收缩压水平。Analyzecompare meansmeans变量名和数值都是用标签来显示的。收缩压(而不是x3),病情分级(而不是x0)正

46、常、一级、二级、三级(而不是1,2,3,4)第三节第三节 数据编辑数据编辑 1、数据修改:在单元格内,或在编辑栏修改即可 2、数据的复制和粘贴:选定,右键copy-paste,或者在编辑器菜单栏中选择editcopypaste 3、数据删除:单元格内数据删除 (1)选定单元格,delete键 (2)单击右键,clear (3)在编辑器菜单栏中选择editclear 整条记录删除:在序号栏上,选定要删除的序号,delete,clear 4、变量删除: (1)在数据窗口,选定某一个变量所在的列,delete,或clear (2)在变量窗口,单击变量所在的序里号(行),delete,或clear第四

47、节第四节 数据保存、转换和读取数据保存、转换和读取 1、数据保存、转换、数据保存、转换 在Spss建立的数据库,默认以spss文件格式报春,后缀名为(*.sav)。保存已建立的数据库,有两种方式 (1)以spss文件格式(*.sav)保存:filesave,确认,或单击快捷栏上保存按钮 (2)以其它文件格式保存或换名保存:filesave as,确认,可转换成(excel,,dbf等多种格式,) 如果要保存一个新的未命名或未保存过的数据库,都会进入save data as 对话框。 练习: 1、把刚才建立的数据库保存,命名为sample.sav 2、将文件名改为data1.sav,保存;并另存

48、为同名的excel格式文件2、数据库读取 (1)打开打开spss文件(文件(.sav格式)格式) 1)在spss运行对话框中,选中open an existing data source,选中要打开的数据库文件,如果没有,选中more files,ok。 2)菜单栏,fileopendata,确定。进入open file对话框,单击搜索栏的下拉按钮,选择要开打的文件。2、数据库读取 (2)打开打开excel文件文件(2)打开excel文件 Spss可以读入许多非spss默认类型的数据文件,方式主要有三种: A 直接打开 B 利用文本向导读入文本数据 C 利用数据库ODBC接口读取数据。 下面将

49、以常见的Excel格式的数据、文本数据为例,介绍spss获取数据的功能。 步骤: Fileopendata(或单击快捷工具栏上的“打开文件”按钮) 弹出open file 对话框,单击文件类型,选择所需的文件类型,然后选中打开的数据文件。 练习: 选中文件后出现下面的对话框: 首先要了解excel文件的结构: 1、包括几个数据表(工作表),具体应当打开哪个表 2、如果不需要所有数据,只需读入一部分,这时需要了解读入的数据的精确位置,如单元格A2:F5。 3、第一行是否是变量名数据全部导入导入部分数据A1:C10 数据读入的优点:数据读入的优点: 1、这种直接读取的方法优于“拷贝+粘贴”,可以顺

50、利地进行变量名的转化; 2、可以直接读取字符型变量,如果用“拷贝+粘贴”地方法,字符型变量就全部变成缺失值了; 3、操作简单,不容易出错,就和读取spss自己的文件一样方便。3、读入文本文件、读入文本文件练习:读入文本格式的病人基本资料定义在数据预览窗口中所选择的变量:顾名思义,在这个对话框中,用户可以在数据预览窗口中选择某一列变量,更改其变量名和类型。变量类型等属性需要重新设置。 第三章 结果输出 一、结果窗口概述 作为功能强大的统计分析工具,为了能够使得分析结果更为美观易读,更好地满足用户的需求,spss一共提供了4种格式的统计分析结果:表格、文本、标准图和交互图1、表格格式1、绘制表格用

51、于表述数据,2、大部分分析结果也都以专用表格的形式展示,这些表可以是二维表,也可能是多维表。3、二维表、多维表都可以作为“spss pivot table”对象而粘贴到其他应用程序(如word,excel,powerpoint)中,并且依然利用spss对这些表格进行编辑。 Spss的指标功能非常强大,能很好地满足用户各种情况下的要求。2、文本格式、文本格式随着版本的增加,文本输出已经越来越少了。这些文字可以随意进行拷贝粘贴、格式设定等操作。3、标准图与交互图、标准图与交互图 注意:注意:结果是单独的一个文件,不会保存在数据库里边,因而要赋予名称进行保存。 练习: 继续前面的例题:比较不同病情分

52、级的收缩压水平并作条图。 步骤: 1、比较收缩压水平、比较收缩压水平: AnalyzeCmopare MeansMeans, 进入Means过程对话框, 将变量“收缩压(x3)”和“病情分级(x0)”分别放入dependent list栏和independent list栏ok 2、作图、作图。 步骤:Graphsbar, 进入Bar charats对话框:单击simple 单击summaries for groups of cases define(定义,对即将作图的变量进行选择) 进入define simple bar 对话框,单击 other summary function 选项,变量

53、“收缩压(x3)”和“病情分级(x0)”分别放入variabe栏和category Axis栏ok, 作图结果就加入到了当前已打开的接过文件中,请大家注意,看左边的目录区增加了新的结果目录。 结果目录一般包括四个子目录四个子目录 1、tite:分析或作图方法名称 2、notes:分析过程的各种参数,语法等,默认为关闭状态 3、case processing:显示分析所调用个体数据的情况 4、report:分析结果 点击相应目录即可查看相应结果,也可直接用鼠标上下移动。 二、结果文件编辑二、结果文件编辑 1、title的编辑:在内容区,双击means,进入编辑状态,输入:收缩压均数 2、repo

54、rt表格编辑:双击表格表格编辑:双击表格 更改表格名:双击表格名report,更改,输入“不同病情分级收缩压水平” 3、report表格格式编辑:要修改表格格式,须在分析前进行定义。 步骤:editoptions,进入options(参数)对话框,单击pivot tables标签,进入该页,选择样本格式,再次运行分析过程。得到不同形式的表格结果 4、graph图表编辑: (1)调整大小 (2)图表结构编辑: 方法:1、双击图表,出现编辑菜单; 2、单击右键,选择spss chart objectopen,激活图表编辑器spss chart editor。 可以对图表的线条、标记、颜色、坐标刻度

55、、做标题等进行修改,具体方法“统计图”一章详述。 三、结果文件输出三、结果文件输出 1、将选定的表格或图表粘贴到、将选定的表格或图表粘贴到word或或powerpoint 文件中文件中 (1)步:复制; 第一种:在结果文件中,光标指向表格或图表,单击右键,出现编辑菜单,选择copy object 第二种:选定,菜单栏editcopy object (2)步:粘贴; 打开word或powerpoint文档,菜单栏editpaste, 或单击右键,在编辑菜单上选择paste,可将表格或图表粘贴到相应文档。 2、将选定的表格转换成其他格式输出、将选定的表格转换成其他格式输出 表格表格可以转换成文本文

56、件(可以转换成文本文件(.txt)或超)或超文本本件(文本本件(.html) 图表图表可以转换成可以转换成JPEG,PNG格式等多格式等多种图像文件加以保存。种图像文件加以保存。 表格的转换输出步骤表格的转换输出步骤: 在结果文件中,光标指向表格或图表,单击右键,出现编辑菜单,选择export,或菜单栏上操作。出现export对话框: 图表的转换输出步骤图表的转换输出步骤: (1)编辑:指向图表,右键,编辑菜单,选择spss chart objectopen,激活图表编辑器spss chart editor。 (2)在spss chart editor菜单栏上,选择fileexport cha

57、rt,进入对话框 (3)在对话框中指定输出文件所在文件夹和文件名,在文件名处输入文件名。选择图像格式,保存。四、结果文件的保存四、结果文件的保存 1、Spss的分析结果可以保存为spss自身的格式:“.spo”格式格式(操作:file直接save即可),或换名保存,save as 2、但除此之外,还可以使用导出功能以外另外几种常用的格式,具体有几下几种格式可供选择:HTML, TEXT,多种格式) 操作:fileExport output,五、结果文件的读取五、结果文件的读取 Fileopenoutput, 在一个数据编辑器中,允许打开一个或多个结果文件, 若打开多个结果文件,最后打开的为默认

58、最后打开的为默认结果文件。 在spss数据编辑器或任何一个已打开的spss viewer 中进行新操作,结果都将记录在最后打开的结果文件上。如果关闭最后打开的结果文件,默认结果文件将改为第一个打开的结果文件。 Spss系统参数设定 选择Editoptions,可以对数据、表格、图表、草稿、标题等格式,以及数据编辑器、结果阅读器、草稿阅读器的视图界面进行定义和修改。第二章第二章 第四节第四节 数据整理数据整理 一切统计分析都是以数据为基础的,在一切统计分析都是以数据为基础的,在数据文件建立好以后,还需要对数据进行必数据文件建立好以后,还需要对数据进行必要的加工处理。要的加工处理。 对同一个数据往

59、往要从各种不同的侧面对同一个数据往往要从各种不同的侧面进行研究,采取多种统计方法进行分析,而进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽不同的统计方法对数据文件结构的要求不尽相同,就需要对结构进行重新调整或转换。相同,就需要对结构进行重新调整或转换。这项工作称这项工作称数据整理数据整理。v 在在spss中,数据文件的管理功能基本上中,数据文件的管理功能基本上都集中在都集中在Data和和Transform菜单上菜单上vData:实现实现变量或个体级别变量或个体级别的管理的管理v 如插入新变量、新个体、记录排序;如插入新变量、新个体、记录排序;vTransform:

60、实现:实现文件级别文件级别的管理的管理v 如变量排序、文件合并、拆分等。如变量排序、文件合并、拆分等。一、插入或删除变量或个体一、插入或删除变量或个体v(一)插入个体v 例题:以病人基本资料为例,请在个体5与个体6之间插入一个个体。v 步骤:v 单击个体6编号(行首)选择DataInsert case,输入数据49,17204,.v(二)插入变量v例题:以病人基本资料为例,请在变量sex与变量x0之间插入一个变量pulse(脉搏)。v 步骤:v 单击变量x0(列首)选择 DataInsert variable,出现空白变量var00001,切换到变量窗口,定义变量属性,输入数据一、插入或删除变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论