版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计软件概述 从20世纪60年代开始,统计软件(statistical software)在数量和质量上均有了很大的发展。纵观统计软件的发展历程,开发较早、应用范围较广并一直在不断改进完善并日臻成熟的大型商业统计软件,当属美国SAS研究公司研制的SAS(statistical analysis system),美国加利福尼亚大学研制的BMDP(biomedical computer programs),和美国SPSS研究公司研制的SPSS。第1页/共210页第一页,编辑于星期六:二十二点 四分。统计软件概述 这三种软件,由于开发时间长,经历了众多用户在不同机型上的考验,用户与开发商以及用户与用
2、户之间均建立了广泛的交流,开发上投入了大量的人力、物力专门进行维护和更新,因此功能越来越强,使用越来越方便,性能更趋于完善。 美国还有SYSTAT、STATA等软件,中国和其他国家也有许多统计软件面世,原上海医科大、华西医科大、第四军医大都编制过一些面向基层人员、操作灵活、简便、实用的统计软件。第2页/共210页第二页,编辑于星期六:二十二点 四分。SPSS介绍 SPSS公司总部位于美国芝加哥,创立于1975年,一直以经营统计软件产品开发为主业。1994年-1998年,SPSS公司得到了很大的发展,陆续购并了systat公司、BMDP软件公司、Quantum公司、ISL公司等,并将各公司的主打
3、产品收纳SPSS旗下,从而使SPSS公司由原来的单一统计产品开发销售转向为企业、教育科研及政府机构提供全面信息统计决策支持服务,成为最新的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。第3页/共210页第三页,编辑于星期六:二十二点 四分。 SPSS软件是SPSS公司赖以起家的产品,目前也仍然是该公司的主打产品之一,是国际上最流行并具有权威性的统计分析软件之一,软件由fortran语言写成,升级速度很快。目前的最新版本为18.0 。第4页/共210页第四页,编辑于星期六:二十二点 四分。 SPSS的英文名称原为Statistical Package for Social Scien
4、ces ,意为社会科学统计软件包。 后来,随着SPSS产品服务领域的扩大和服务深度的增加,2002年英文全称更改为 Statistical Product and Service Solutions,意为统计产品与服务解决方案。第5页/共210页第五页,编辑于星期六:二十二点 四分。 在近30年的发展中,虽然竞争对手不断出现,但SPSS却始终以其鲜明的特色鼎立于统计学软件之中,现在和SAS被并称为当今最权威的两大统计软件。 学习重点:根据统计结果作出解释和统计结论第6页/共210页第六页,编辑于星期六:二十二点 四分。 一、 SPSS软件的基本特点 1、功能强大2、兼容性好3、易用性强第7页/
5、共210页第七页,编辑于星期六:二十二点 四分。功能强大囊括了各种成熟的统计方法与模型,为统计分析用户提供了全方位的统计学算法,为各种研究提供了相应的统计学方法。自由灵活的表格功能,使得制表变得更加简单和直接提供了各种常用的统计学图形,如线图、条图、饼图、直方图、散点图等多种图形,并且可以将表格图形直接拷贝到word文档、幻灯片中,直接进行结果的展现。第8页/共210页第八页,编辑于星期六:二十二点 四分。兼容性好 在数据方面,不仅可以在spss中作数据录入工作,还可将日常工作中常用的excel表格数据、文本格式数据导入spss中进行分析,不仅节省了相当大的工作量,并且避免了因拷贝粘贴可能引起
6、的错误。在结果方面,spss的表格、图形结果可直接导出为word、文本、网页、excel格式等,也可以将表格、交互式图形作为对象选择型粘贴到word、powerpoint等中,并在其中再利用spss对他们进行编辑。第9页/共210页第九页,编辑于星期六:二十二点 四分。易用性强 Spss之所以有广大的用户群,不仅因为它是权威的统计学工具,提供了强大的统计功能,也因为它是一种非常简单易用的软件。界面友好,操作简单。另外,spss也向一些高级用户提供了编程功能,使分析工作变得更加节省时间和精力。第10页/共210页第十页,编辑于星期六:二十二点 四分。第二节 视窗界面一、软件的启动与退出启动:(1
7、)在Windows开始菜单中选择开始程序SPSS for WindowsSPSS for Windows,如图1.1(2)在快捷工具栏单击SPSS 19.0图标,第11页/共210页第十一页,编辑于星期六:二十二点 四分。第12页/共210页第十二页,编辑于星期六:二十二点 四分。 退出:选择菜单FileExit,或者直接关闭窗口,即可! Spss运行后,可见一个运行对话框, 初次进入spss系统时会出现一个导航对话框,单击右下方的cancel按钮,即可进入spss的主界面, 第13页/共210页第十三页,编辑于星期六:二十二点 四分。 SPSS运行对话框 第14页/共210页第十四页,编辑于
8、星期六:二十二点 四分。二、SPSS的5个窗口 1、数据编辑窗口(SPSS Data Editor):以“sav”为扩展名,是spss数据文件 2、结果管理窗口(SPSS Output Viewer):以“spo”为扩展名,是spss的结果文件 3、草稿结果窗口(SPSS Draft viewer)以“rtf”为扩展名,是spss草稿文件 4、语法编辑窗口(SPSS Syntax Editor):以“sps”为扩展名,是spss语法文件 5、脚本窗口(spss script editor):以“sbs”为扩展名,是spss脚本文件 常用的是数据编辑窗口和结果管理窗口。第15页/共210页第十五
9、页,编辑于星期六:二十二点 四分。数据编辑窗口 1、数据编辑窗口(SPSS Data Editor):此窗口类似于Excel窗口,SPSS处理数据的主要工作都在此窗口进行。它分为两个视图: (1) 数据视图:如图1.3(a),显示具体的数据,一行代表一个观测个体(SPSS中称为Record),一列代表一个属性(SPSS中称为Variable) (2)变量视图:如图1.3(b)。专门显示有关变量的信息:包括变量名称,每个变量的各种属性、格式等等。第16页/共210页第十六页,编辑于星期六:二十二点 四分。图1.3(a)数据视图第17页/共210页第十七页,编辑于星期六:二十二点 四分。图1.3(
10、b) 变量视图第18页/共210页第十八页,编辑于星期六:二十二点 四分。第19页/共210页第十九页,编辑于星期六:二十二点 四分。菜单栏第20页/共210页第二十页,编辑于星期六:二十二点 四分。 打开新的数据编辑窗口,当没有输入任何数据时,所有行、列的标号都是灰色的。见图。注意,第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。第21页/共210页第二十一页,编辑于星期六:二十二点 四分。 2、结果管理窗口(SPSS Output Viewer):又称结果视图,用于存放分析结果,如图。 类似于windows的资源管理器,整个窗口分为两个区。 左边:目录区 是spss分析结果的
11、一个目录 右边:内容区。是与目录一一对应的内容第22页/共210页第二十二页,编辑于星期六:二十二点 四分。第23页/共210页第二十三页,编辑于星期六:二十二点 四分。 3、草稿管理窗口(SPSS Draft viewer) :草稿结果是结果的一种简化文本格式。实际上就是word所兼容的rtf超文本格式,因此可以在没有安装spss的电脑上使用文字编辑软件打开。 第24页/共210页第二十四页,编辑于星期六:二十二点 四分。草稿管理窗口(SPSS Draft viewer) 第25页/共210页第二十五页,编辑于星期六:二十二点 四分。 4、语法编辑窗口(SPSS Syntax Editor)
12、 :spss最大的优势在于简单易用,即菜单对话框式的操作,除此之外,spss还提供了语法方式或程序方式进行分析。这个方法既是对菜单功能的一个补充,也可以使繁琐的工作得到简化,尤其适用于高级分析人员。 第26页/共210页第二十六页,编辑于星期六:二十二点 四分。语法编辑窗口(SPSS Syntax Editor)第27页/共210页第二十七页,编辑于星期六:二十二点 四分。 5、脚本窗口:spss脚本是用sax basic 语言写的程序,可以像spss宏一样构建和运行spss命令,而且脚本可以在命令中利用当前数据文件的变量信息,还可以对结果进行编辑或者构建一些新的自定义的对话框。脚本可用于使s
13、pss内部操作自动化,使结果格式自定义化,实现spss新功能以及将spss与VB和VBA兼容应用程序连接。第28页/共210页第二十八页,编辑于星期六:二十二点 四分。第29页/共210页第二十九页,编辑于星期六:二十二点 四分。第二章 数据录入与数据获取 第一节 数据格式概述一、用于分析的数据资料有两种: 1、原始资料。如调查问卷中的数据,录入SPSS软件,建立数据文件。 2、已经被录入为其他数据格式的资料,需要将其内容直接读入SPSS中。第30页/共210页第三十页,编辑于星期六:二十二点 四分。 二、统计软件中数据的录入格式 1、同一观察对象的数据应当独占一行 2、同一个指标的测量数值都
14、应当录入到同一个变量中去,即每一个测量指标或影响因素只能占据一列的位置,第31页/共210页第三十一页,编辑于星期六:二十二点 四分。 数据库是一个二维表结构(行列表结构), 列是变量(variable); 行为个体(case,record); 数据表中的一个格子(叫做cell,要记住),一个格子放一个数据(可以是数值或字符)。第32页/共210页第三十二页,编辑于星期六:二十二点 四分。三、建立数据库的步骤 1、定义变量(变量名、变量属性):就是给每个指标起个名字,再对每个指标的一些统计特性作出制定。 2、输入数据:即把每个被访者的各指标取值录入为电子格式。 因此这里首先介绍一下变量的各种属
15、性问题。第33页/共210页第三十三页,编辑于星期六:二十二点 四分。 进入SPSS数据编辑窗口以后,单击左下方的Variable View(变量表),进入变量视图,我们可以看到spss会为每一个变量指定10种变量属性 四、定义变量(defined variable)第34页/共210页第三十四页,编辑于星期六:二十二点 四分。 1、Name:变量名。 在该选项下方的方格中,单击定位后,双击激活方格,进入编辑状态,输入变量名,10.0版本最大可输入8个英文字符,4个中文字符。系统默认值为VAR000011、Name:变量名第35页/共210页第三十五页,编辑于星期六:二十二点 四分。 如果不对
16、变量进行定义直接输入的话,就会出现这样的情况:第36页/共210页第三十六页,编辑于星期六:二十二点 四分。 从Spss12.0开始,变量名在8个字符之内的这个限制已经被取消了,最多可以有64个字符。但出于兼容性的考虑,变量名的定义还有一些限制,即 1、不能以数字开头; 2、中间不能有空格; 3、一个数据文件中不能有相同的变量名等。当然,我们只要在使用中尝试即可,不必记那么多规则。第37页/共210页第三十七页,编辑于星期六:二十二点 四分。2、Type:变量类型 SPSS中,变量有三种基本的类型,分别是:数值型、字符型和日期型。 根据不同的显示方式,数值型又被细分了5种,所以SPSS中的变量
17、类型共有8种。 系统默认值为数值型(Numeric)。第38页/共210页第三十八页,编辑于星期六:二十二点 四分。单击Type单元格,方格的右侧会出现按钮,单击该按钮,会弹出变量类型对话框。第39页/共210页第三十九页,编辑于星期六:二十二点 四分。 在以上三大类变量类型中,数值型是spss中最常用的变量类型,因而默认为数值型。 数值型的数据是由0-9的阿拉伯数字和其他特殊符号,比如美元符号,逗号或圆点(小数点)组成。如工资、年龄、成绩等变量都可以定义为数值型数据。 第40页/共210页第四十页,编辑于星期六:二十二点 四分。 在选定了变量类型以后,通常在对话框右侧还有选项供选择,比如,如
18、果选择数值型,如上图,则会出现width和decimal. Width:用于定义数值位数。系统默认为8位,根据需要可以进行修改。注意:小数点要占1位。 Decimal:用于定义小数位数。系统默认为2位,根据需要可以进行修改。 (试试宽度8位改2位,小数位数2位改0位)第41页/共210页第四十一页,编辑于星期六:二十二点 四分。 日期型如下:日期型数据主要在时间序列分析中比较有用。在较为简单的分析问题中完全可以用普通数值型数据来代替。第42页/共210页第四十二页,编辑于星期六:二十二点 四分。美元数值型如下:第43页/共210页第四十三页,编辑于星期六:二十二点 四分。String:字符型数
19、据,也比较常用。默认宽度为8个字符位,它区分大小写字母,并且不能进行数学运算。字符型数据在SPSS的数据处理过程(比如在计算生成新变量时)中是用一对引号引起来的。 需要注意的是,在输入数据时不应输入引号,否则,双引号将会作为字符型数据的一部分。Characters:定义字符串长度。系统默认为8位。一个中文字符占2位。第44页/共210页第四十四页,编辑于星期六:二十二点 四分。3、width:数值位数相当于type对话框中的width选项。单击选项下的方格定位后,方格右方会出现上下按钮,单击可增加或减少位数,或双击后直接在方格中填入位数。 第45页/共210页第四十五页,编辑于星期六:二十二点
20、 四分。4、decimals:小数位数 4、decimals:小数位数。相当于type对话框中的decimal选项,单击选项下的方格定位后,方格右方会出现按钮,单击可增加或减少位数,或双击后直接在方格中填入位数。第46页/共210页第四十六页,编辑于星期六:二十二点 四分。5、labels:变量名标签 5、labels:变量名标签。 即变量说明,对变量名(name)的含义进行进一步解释说明,该标签会在结果中代替变量名,输出,以方便阅读,增强变量名的可视性和统计分析结果的可读性。 具体操作是:单击定位后,双击激活方格,进入编辑状态,输入变量标签。 第47页/共210页第四十七页,编辑于星期六:二
21、十二点 四分。第48页/共210页第四十八页,编辑于星期六:二十二点 四分。 从Spss12.0开始,变量名在8个字符之内的这个限制已经被取消了,最多可以有64个字符。但出于兼容性的考虑,变量名的定义还有一些限制,即 1、不能以数字开头; 2、中间不能有空格; 3、一个数据文件中不能有相同的变量名等。 当然,我们只要在使用中尝试即可,不必记那么多规则。第49页/共210页第四十九页,编辑于星期六:二十二点 四分。6、values:数值标签 6、values:数值标签,用于定义变量值,是对变量取值含义的解释说明信息。 数值标签对于分类变量来说,是必不可少的,它不但使分类变量的数据录入变得更加方便
22、,而且明确了数据的含义,也同样增强了分析结果的可读性。 第50页/共210页第五十页,编辑于星期六:二十二点 四分。第51页/共210页第五十一页,编辑于星期六:二十二点 四分。 注意:第一行表示你赋予的变量值(数值),也就是编码,第二行,是标签,表达的是它代表的真实含义。第52页/共210页第五十二页,编辑于星期六:二十二点 四分。第53页/共210页第五十三页,编辑于星期六:二十二点 四分。 点击add按钮,最后单击ok按钮,数值标签就设置完成了。此时做任何分析,在结果中都有相应的标签出现。第54页/共210页第五十四页,编辑于星期六:二十二点 四分。第55页/共210页第五十五页,编辑于
23、星期六:二十二点 四分。 做任何分析,在结果中都有相应的标签出现。如果现在就想看效果,切换回data view界面,然后选择菜单view-value labels,就会看到下述结果。第56页/共210页第五十六页,编辑于星期六:二十二点 四分。操作后界面将变成下面这样第57页/共210页第五十七页,编辑于星期六:二十二点 四分。 每个变量值被变量标签所替代,在单元格中,多了一个下拉按钮,可以通过选择进行修改。 第58页/共210页第五十八页,编辑于星期六:二十二点 四分。7、missing:定义缺失值 Missing项是一个重要的,而且容易被忽视的选项,它用于定义变量缺失值。 Spss中缺失值
24、有两大类, 一类是用户自定义缺失值, 一类是系统缺失值第59页/共210页第五十九页,编辑于星期六:二十二点 四分。 对于数值型的数据,系统缺失值用一个圆点“.”表示,而字符型变量默认就是空字符串。如果在问卷调查中,有些数据项漏填了,则数据录入时只能跳过,那么相应的单元格就会被系统自动当作缺失值来处理。例如 :第60页/共210页第六十页,编辑于星期六:二十二点 四分。用户自定义缺失值 第61页/共210页第六十一页,编辑于星期六:二十二点 四分。 自定义缺失值:往往出现在一些设计比较严格的大型调查中,在一些题目选项处有的会给出这样的选项:不知道或拒答。相应的代码可能用9或者99来表示。那么显
25、然,这里的99不是一个真实的答案,仅仅是缺失值代码,需要告知spss这个特定的标记数据,让他在统计分析的时候区别对待缺失值和正常的分析数据。 第62页/共210页第六十二页,编辑于星期六:二十二点 四分。 discrete missing values:指定离散的缺失值,最多可以定义3个值 最后一行:指定缺失值所在的区间范围,并可以同时指定一个离散值。第63页/共210页第六十三页,编辑于星期六:二十二点 四分。 8、columns:列宽。用于调整数据表中各列的显示宽度。系统默认为8位。 9、align:定义字符排列方向。分别为左对齐、右对齐、居中。系统默认为右对齐。第64页/共210页第六十
26、四页,编辑于星期六:二十二点 四分。 10、measure:数据量度选项 Scale:定量变量 Ordinal:有序分类变量 Nominal:名义变量(分类变量) 第65页/共210页第六十五页,编辑于星期六:二十二点 四分。 就数据录入这部分内容而言,变量属性的设置是最重要的一部分工作,属性的设置不仅涉及对错,还有一个设置好坏的问题,属性设置的好,会简化后边的数据分析工作,所以不可小看这部分工作。第66页/共210页第六十六页,编辑于星期六:二十二点 四分。 第二节 数据的直接录入 在spss中,新建一个数据文件非常容易,只要打开spss,系统就已经生成了一个空数据文件,用户只要按自己的需要
27、:定义变量输入数据保存,即可。第67页/共210页第六十七页,编辑于星期六:二十二点 四分。 练习: 某医生观察了一组住院病人,完成了其中24名患者的资料收集,指标包括:观察编号,住院号(inno),入院日期(indate),年龄(age),性别(sex),身高(xl,单位:cm),体重(x2,单位:kg),血压(收缩压x3,舒张压x4,单位:mmHg),空腹血糖(x5,单位:mmol/L)和胰岛素样生长因子-1水平(igf-1,x6,单位:ng/mL),并根据临床情况将患者的病情分为五级(x0,1为正常,2为一级,3为2级,4为3级,5为4级)。原始数据见表(简单) 请建立数据库!第68页/
28、共210页第六十八页,编辑于星期六:二十二点 四分。编号编号innoinnoindateindateageagesesex xx x0 0 x1x1x2x2x3x3x4x4x5x5x6x6155155174417442 21996-10-1996-10-21 21 2323男男3 316616652.552.510810878788.98.9185.6185.63 3172172455445549 91999-3-3 1999-3-3 71.171.1女女4 415115161.561.5150150909015.815.8145.9145.97 7195195312531257 71998-
29、1-81998-1-857.357.3女女2 2143.143.5 541.541.5152152888813.513.53 30 011811836361997-6-24 1997-6-24 65.665.6男男3 31621625252166166707017.717.79 9180.4180.4第69页/共210页第六十九页,编辑于星期六:二十二点 四分。1、定义变量名:定义所有的变量名 单击name选项下第一单元格,输入“编号”,再单击下面第二个定位,输入“inno”,依次输入其它变量名。最后回车或者单击任意方格,所有变量的其它选项激活,为默认设定。在绝大多数情况下,spss给出的默认
30、数据类型和数据精度可以满足需要,如果默认值满足分析的需要,变量定义就到此结束了,否则就需要对不满足条件的选项进行进一步的设置 第70页/共210页第七十页,编辑于星期六:二十二点 四分。第71页/共210页第七十一页,编辑于星期六:二十二点 四分。2、定义Type选项 前边两个都是数值型数据,默认状态即可,第三个变量“入院日期”是日期型数据,默认状态为numeric,需要更改下,更改步骤为:第72页/共210页第七十二页,编辑于星期六:二十二点 四分。设定为日期型变量后,我们发现变量表中width和decimals选项变成了灰色.第73页/共210页第七十三页,编辑于星期六:二十二点 四分。变
31、量“性别(sex)”为字符变量,有一个中文字符。进入type,选择string,单击characters右侧编辑栏,将数字改为2,ok返回,可见变量视图中width 和decimals选项会自动显示为2和0,第74页/共210页第七十四页,编辑于星期六:二十二点 四分。3、定义中width 和decimals选项 根据具体情况进行更改,有两种方法: 以身高(x1)为例166.0, 单击变量x1的decimals选项,单击上下按钮,由于小数位数是一位,因而将2改为1,或者双击进入编辑状态,输入1。然后单击width选项,我们看身高的字符宽度是5位(小数点算一位),那么就将8改成5。单击其它任意方
32、格或者回车,完成! 单击变量x1的type选项,进入type对话框,将右侧width数值栏8改成5,decimals数值栏,2改成1,ok,返回 注意:先改小数位数,再改宽度,避免矛盾,如将宽度改为2,此时小数位数默认为2,就会提示出现错误。可以试验一下,请大家完成第75页/共210页第七十五页,编辑于星期六:二十二点 四分。4、定义label选项和values选项 这两个选项分别为变量标签和数值标签。理论上,所有变量均可以定义变量标签。数值标签只用于分类变量的说明 (1)单击变量x0的label选项,输入“病情分级” ,回车确认变量标签完成 (2)单击变量x0的values选项方格,单击省略
33、号按钮第76页/共210页第七十六页,编辑于星期六:二十二点 四分。第77页/共210页第七十七页,编辑于星期六:二十二点 四分。5、定义missing选项 第三条的最后一个单元格,数值为0 方法:单击x6的missing那个选项,单击省略号按钮,进入缺失值定义对话框,选定discrete missing values选项,单击下方的数值栏,输入0,ok即可。设定后,数值0缺失。 第78页/共210页第七十八页,编辑于星期六:二十二点 四分。第79页/共210页第七十九页,编辑于星期六:二十二点 四分。 6、定义columns,align选项:为数据窗口的显示格式,可取默认设定。 7、定义me
34、asure选项:数据量度选项 Type为numeric时,默认为scale Type为string时,默认为nominal. 本例,原始数据中,病情分级为有序分类变量,应选择ordinal。第80页/共210页第八十页,编辑于星期六:二十二点 四分。第81页/共210页第八十一页,编辑于星期六:二十二点 四分。二、输入数据 完成变量定义后,单击左下方data view 标签,激活数据窗口。输入数据,回车,如果想查看变量标签,将鼠标箭头指向某变量名,就会出现所定义的变量标签。第82页/共210页第八十二页,编辑于星期六:二十二点 四分。 注意:输入数据时,回车之前,数据单元格内左对齐显示,表示该
35、单元格为第一次录入数据,同时数据栏内同步显示出输入的数值。第83页/共210页第八十三页,编辑于星期六:二十二点 四分。 如果想在一个界面中显示更多数据列,可调整列宽,方法: 1、直接缩小列宽,与excel操作相同。 2、返回变量表,调整columns位数, 一般columns的位数应大于width的位数。否则显示不完整。 注意:不得不提醒大家,数据录入过程中,要随时注意保存,如果突然断电或者死机,辛苦工作的成果将付之东流。第84页/共210页第八十四页,编辑于星期六:二十二点 四分。三、变量标签和数值标签的意义 定义变量标签后,在其它调用该数据库的操作中,变量标签会与变量名同时显示。在输出结
36、果中,会以标签代替变量名,非常直观。 数值标签与变量标签的作用相似。 注意一点:在对数值进行编码时,尽量用数值代码+值标签这种录入方式,尽量不采用字符代码+值标签这种录入方式。 第85页/共210页第八十五页,编辑于星期六:二十二点 四分。例如:比较不同病情分级的收缩压水平。Analyzecompare meansmeans第86页/共210页第八十六页,编辑于星期六:二十二点 四分。变量名和数值都是用标签来显示的。收缩压(而不是x3),病情分级(而不是x0)正常、一级、二级、三级(而不是1,2,3,4)第87页/共210页第八十七页,编辑于星期六:二十二点 四分。第三节 数据编辑 1、数据修
37、改:在单元格内,或在编辑栏修改即可 2、数据的复制和粘贴:选定,右键copy-paste,或者在编辑器菜单栏中选择editcopypaste第88页/共210页第八十八页,编辑于星期六:二十二点 四分。 3、数据删除:单元格内数据删除 (1)选定单元格,delete键 (2)单击右键,clear (3)在编辑器菜单栏中选择editclear 整条记录删除:在序号栏上,选定要删除的序号,delete,clear第89页/共210页第八十九页,编辑于星期六:二十二点 四分。 4、变量删除: (1)在数据窗口,选定某一个变量所在的列,delete,或clear (2)在变量窗口,单击变量所在的序里号
38、(行),delete,或clear第90页/共210页第九十页,编辑于星期六:二十二点 四分。第四节 数据保存、转换和读取 1、数据保存、转换 在Spss建立的数据库,默认以spss文件格式报春,后缀名为(*.sav)。保存已建立的数据库,有两种方式 (1)以spss文件格式(*.sav)保存:filesave,确认,或单击快捷栏上保存按钮 (2)以其它文件格式保存或换名保存:filesave as,确认,可转换成(excel,,dbf等多种格式,)第91页/共210页第九十一页,编辑于星期六:二十二点 四分。 如果要保存一个新的未命名或未保存过的数据库,都会进入save data as 对话
39、框。 练习: 1、把刚才建立的数据库保存,命名为sample.sav 2、将文件名改为data1.sav,保存;并另存为同名的excel格式文件第92页/共210页第九十二页,编辑于星期六:二十二点 四分。第93页/共210页第九十三页,编辑于星期六:二十二点 四分。2、数据库读取 (1)打开spss文件(.sav格式) 1)在spss运行对话框中,选中open an existing data source,选中要打开的数据库文件,如果没有,选中more files,ok。 2)菜单栏,fileopendata,确定。进入open file对话框,单击搜索栏的下拉按钮,选择要开打的文件。第9
40、4页/共210页第九十四页,编辑于星期六:二十二点 四分。2、数据库读取 (2)打开excel文件第95页/共210页第九十五页,编辑于星期六:二十二点 四分。(2)打开excel文件 Spss可以读入许多非spss默认类型的数据文件,方式主要有三种: A 直接打开 B 利用文本向导读入文本数据 C 利用数据库ODBC接口读取数据。 下面将以常见的Excel格式的数据、文本数据为例,介绍spss获取数据的功能。第96页/共210页第九十六页,编辑于星期六:二十二点 四分。 步骤: Fileopendata(或单击快捷工具栏上的“打开文件”按钮) 弹出open file 对话框,单击文件类型,选
41、择所需的文件类型,然后选中打开的数据文件。 练习: 第97页/共210页第九十七页,编辑于星期六:二十二点 四分。选中文件后出现下面的对话框:第98页/共210页第九十八页,编辑于星期六:二十二点 四分。第99页/共210页第九十九页,编辑于星期六:二十二点 四分。 首先要了解excel文件的结构: 1、包括几个数据表(工作表),具体应当打开哪个表 2、如果不需要所有数据,只需读入一部分,这时需要了解读入的数据的精确位置,如单元格A2:F5。 3、第一行是否是变量名第100页/共210页第一百页,编辑于星期六:二十二点 四分。数据全部导入第101页/共210页第一百零一页,编辑于星期六:二十二
42、点 四分。导入部分数据A1:C10第102页/共210页第一百零二页,编辑于星期六:二十二点 四分。第103页/共210页第一百零三页,编辑于星期六:二十二点 四分。第104页/共210页第一百零四页,编辑于星期六:二十二点 四分。第105页/共210页第一百零五页,编辑于星期六:二十二点 四分。 数据读入的优点: 1、这种直接读取的方法优于“拷贝+粘贴”,可以顺利地进行变量名的转化; 2、可以直接读取字符型变量,如果用“拷贝+粘贴”地方法,字符型变量就全部变成缺失值了; 3、操作简单,不容易出错,就和读取spss自己的文件一样方便。第106页/共210页第一百零六页,编辑于星期六:二十二点
43、四分。3、读入文本文件第107页/共210页第一百零七页,编辑于星期六:二十二点 四分。第108页/共210页第一百零八页,编辑于星期六:二十二点 四分。第109页/共210页第一百零九页,编辑于星期六:二十二点 四分。第110页/共210页第一百一十页,编辑于星期六:二十二点 四分。练习:读入文本格式的病人基本资料第111页/共210页第一百一十一页,编辑于星期六:二十二点 四分。第112页/共210页第一百一十二页,编辑于星期六:二十二点 四分。第113页/共210页第一百一十三页,编辑于星期六:二十二点 四分。第114页/共210页第一百一十四页,编辑于星期六:二十二点 四分。定义在数据
44、预览窗口中所选择的变量:顾名思义,在这个对话框中,用户可以在数据预览窗口中选择某一列变量,更改其变量名和类型。第115页/共210页第一百一十五页,编辑于星期六:二十二点 四分。第116页/共210页第一百一十六页,编辑于星期六:二十二点 四分。变量类型等属性需要重新设置。 第117页/共210页第一百一十七页,编辑于星期六:二十二点 四分。第三章 结果输出 一、结果窗口概述 作为功能强大的统计分析工具,为了能够使得分析结果更为美观易读,更好地满足用户的需求,spss一共提供了4种格式的统计分析结果:表格、文本、标准图和交互图第118页/共210页第一百一十八页,编辑于星期六:二十二点 四分。
45、1、表格格式1、绘制表格用于表述数据,2、大部分分析结果也都以专用表格的形式展示,这些表可以是二维表,也可能是多维表。3、二维表、多维表都可以作为“spss pivot table”对象而粘贴到其他应用程序(如word,excel,powerpoint)中,并且依然利用spss对这些表格进行编辑。 Spss的指标功能非常强大,能很好地满足用户各种情况下的要求。第119页/共210页第一百一十九页,编辑于星期六:二十二点 四分。第120页/共210页第一百二十页,编辑于星期六:二十二点 四分。2、文本格式随着版本的增加,文本输出已经越来越少了。这些文字可以随意进行拷贝粘贴、格式设定等操作。3、标
46、准图与交互图 第121页/共210页第一百二十一页,编辑于星期六:二十二点 四分。 注意:结果是单独的一个文件,不会保存在数据库里边,因而要赋予名称进行保存。 练习: 继续前面的例题:比较不同病情分级的收缩压水平并作条图。第122页/共210页第一百二十二页,编辑于星期六:二十二点 四分。 步骤: 1、比较收缩压水平: AnalyzeCmopare MeansMeans, 进入Means过程对话框, 将变量“收缩压(x3)”和“病情分级(x0)”分别放入dependent list栏和independent list栏ok第123页/共210页第一百二十三页,编辑于星期六:二十二点 四分。第1
47、24页/共210页第一百二十四页,编辑于星期六:二十二点 四分。第125页/共210页第一百二十五页,编辑于星期六:二十二点 四分。 2、作图。 步骤:Graphsbar, 进入Bar charats对话框:单击simple 单击summaries for groups of cases define(定义,对即将作图的变量进行选择) 进入define simple bar 对话框,单击 other summary function 选项,变量“收缩压(x3)”和“病情分级(x0)”分别放入variabe栏和category Axis栏ok, 第126页/共210页第一百二十六页,编辑于星期六
48、:二十二点 四分。第127页/共210页第一百二十七页,编辑于星期六:二十二点 四分。第128页/共210页第一百二十八页,编辑于星期六:二十二点 四分。 作图结果就加入到了当前已打开的接过文件中,请大家注意,看左边的目录区增加了新的结果目录。第129页/共210页第一百二十九页,编辑于星期六:二十二点 四分。第130页/共210页第一百三十页,编辑于星期六:二十二点 四分。 结果目录一般包括四个子目录 1、tite:分析或作图方法名称 2、notes:分析过程的各种参数,语法等,默认为关闭状态 3、case processing:显示分析所调用个体数据的情况 4、report:分析结果 点击
49、相应目录即可查看相应结果,也可直接用鼠标上下移动。第131页/共210页第一百三十一页,编辑于星期六:二十二点 四分。 二、结果文件编辑 1、title的编辑:在内容区,双击means,进入编辑状态,输入:收缩压均数第132页/共210页第一百三十二页,编辑于星期六:二十二点 四分。 2、report表格编辑:双击表格 更改表格名:双击表格名report,更改,输入“不同病情分级收缩压水平”第133页/共210页第一百三十三页,编辑于星期六:二十二点 四分。第134页/共210页第一百三十四页,编辑于星期六:二十二点 四分。 3、report表格格式编辑:要修改表格格式,须在分析前进行定义。
50、步骤:editoptions,进入options(参数)对话框,单击pivot tables标签,进入该页,选择样本格式,再次运行分析过程。得到不同形式的表格结果第135页/共210页第一百三十五页,编辑于星期六:二十二点 四分。第136页/共210页第一百三十六页,编辑于星期六:二十二点 四分。第137页/共210页第一百三十七页,编辑于星期六:二十二点 四分。 4、graph图表编辑: (1)调整大小 (2)图表结构编辑: 方法:1、双击图表,出现编辑菜单; 2、单击右键,选择spss chart objectopen,激活图表编辑器spss chart editor。 可以对图表的线条、
51、标记、颜色、坐标刻度、做标题等进行修改,具体方法“统计图”一章详述。 第138页/共210页第一百三十八页,编辑于星期六:二十二点 四分。第139页/共210页第一百三十九页,编辑于星期六:二十二点 四分。第140页/共210页第一百四十页,编辑于星期六:二十二点 四分。三、结果文件输出 1、将选定的表格或图表粘贴到word或powerpoint 文件中 (1)步:复制; 第一种:在结果文件中,光标指向表格或图表,单击右键,出现编辑菜单,选择copy object 第二种:选定,菜单栏editcopy object (2)步:粘贴; 打开word或powerpoint文档,菜单栏editpas
52、te, 或单击右键,在编辑菜单上选择paste,可将表格或图表粘贴到相应文档。第141页/共210页第一百四十一页,编辑于星期六:二十二点 四分。 2、将选定的表格转换成其他格式输出 表格可以转换成文本文件(.txt)或超文本本件(.html) 图表可以转换成JPEG,PNG格式等多种图像文件加以保存。第142页/共210页第一百四十二页,编辑于星期六:二十二点 四分。 表格的转换输出步骤: 在结果文件中,光标指向表格或图表,单击右键,出现编辑菜单,选择export,或菜单栏上操作。出现export对话框:第143页/共210页第一百四十三页,编辑于星期六:二十二点 四分。第144页/共210
53、页第一百四十四页,编辑于星期六:二十二点 四分。 图表的转换输出步骤: (1)编辑:指向图表,右键,编辑菜单,选择spss chart objectopen,激活图表编辑器spss chart editor。 (2)在spss chart editor菜单栏上,选择fileexport chart,进入对话框 (3)在对话框中指定输出文件所在文件夹和文件名,在文件名处输入文件名。选择图像格式,保存。第145页/共210页第一百四十五页,编辑于星期六:二十二点 四分。第146页/共210页第一百四十六页,编辑于星期六:二十二点 四分。第147页/共210页第一百四十七页,编辑于星期六:二十二点
54、四分。四、结果文件的保存 1、Spss的分析结果可以保存为spss自身的格式:“.spo”格式(操作:file直接save即可),或换名保存,save as 2、但除此之外,还可以使用导出功能以外另外几种常用的格式,具体有几下几种格式可供选择:HTML, TEXT,多种格式) 操作:fileExport output,第148页/共210页第一百四十八页,编辑于星期六:二十二点 四分。五、结果文件的读取 Fileopenoutput, 在一个数据编辑器中,允许打开一个或多个结果文件, 若打开多个结果文件,最后打开的为默认结果文件。 在spss数据编辑器或任何一个已打开的spss viewer
55、中进行新操作,结果都将记录在最后打开的结果文件上。如果关闭最后打开的结果文件,默认结果文件将改为第一个打开的结果文件。第149页/共210页第一百四十九页,编辑于星期六:二十二点 四分。 Spss系统参数设定 选择Editoptions,可以对数据、表格、图表、草稿、标题等格式,以及数据编辑器、结果阅读器、草稿阅读器的视图界面进行定义和修改。第150页/共210页第一百五十页,编辑于星期六:二十二点 四分。第二章 第四节 数据整理 一切统计分析都是以数据为基础的,在数据文件建立好以后,还需要对数据进行必要的加工处理。 对同一个数据往往要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同
56、的统计方法对数据文件结构的要求不尽相同,就需要对结构进行重新调整或转换。这项工作称数据整理。第151页/共210页第一百五十一页,编辑于星期六:二十二点 四分。 在spss中,数据文件的管理功能基本上都集中在Data和Transform菜单上 Data:实现变量或个体级别的管理 如插入新变量、新个体、记录排序; Transform:实现文件级别的管理 如变量排序、文件合并、拆分等。第152页/共210页第一百五十二页,编辑于星期六:二十二点 四分。一、插入或删除变量或个体 (一)插入个体 例题:以病人基本资料为例,请在个体5与个体6之间插入一个个体。 步骤: 单击个体6编号(行首)选择Data
57、Insert case,输入数据49,17204,.第153页/共210页第一百五十三页,编辑于星期六:二十二点 四分。 (二)插入变量 例题:以病人基本资料为例,请在变量sex与变量x0之间插入一个变量pulse(脉搏)。 步骤: 单击变量x0(列首)选择 DataInsert variable,出现空白变量var00001,切换到变量窗口,定义变量属性,输入数据一、插入或删除变量或个体第154页/共210页第一百五十四页,编辑于星期六:二十二点 四分。一、插入或删除变量或个体 (三)删除个体或变量 例题:删除个体8,删除变量indate 步骤: 1、单击选中个体8EditCut或Clear
58、 单击变量名indate EditCut或Clear 2、或单击右键,进行操作第155页/共210页第一百五十五页,编辑于星期六:二十二点 四分。第156页/共210页第一百五十六页,编辑于星期六:二十二点 四分。 (四)恢复已删除的个体或变量 EditUndo 不仅能恢复前一删除操作的个体或变量,在前的删除操作步骤也能恢复!一、插入或删除变量或个体第157页/共210页第一百五十七页,编辑于星期六:二十二点 四分。二、个体排序第158页/共210页第一百五十八页,编辑于星期六:二十二点 四分。Sort by:排序变量栏。如果放入两个变量,则先按第 一个变量排序,在对第二个变量进行次排序。As
59、cending:升序排列,默认第159页/共210页第一百五十九页,编辑于星期六:二十二点 四分。 练习:对变量inno(住院号)进行升序排列。 对age降序排列 对不同性别进行身高的升序排列第160页/共210页第一百六十页,编辑于星期六:二十二点 四分。三、合并文件 统计分析的第一步工作是数据录入,在数据量较大时,经常需要把一份大的数据分成几个小部分,然后再分别由不同的录入员进行录入,以缩短录入时间。 就会出现一份大数据分别储存在几个不同的数据文件中的现象。 除此之外,如果数据有多个来源,则可能会是变量分散在几个文件中。第161页/共210页第一百六十一页,编辑于星期六:二十二点 四分。数
60、据文件的合并方式 (一)纵向连接:几个数据集中的数据纵向相加,组成新的数据集,其中的记录数是原来几个数据集当中记录数的总和。 (二)横向合并:按照记录的次序,或者某个关键变量的数值(如住院号),将多个数据集的不同变量合并为一个数据集,新的数据集包含的变量数是所有原数据集当中不重名变量的总和。第162页/共210页第一百六十二页,编辑于星期六:二十二点 四分。合并中的注意事项 注意:进行合并的文件必须都存储为spss格式。 如果用程序方式,可以一次实现多个数据文件的合并; 如果使用对话框方式,一次只能进行两个spss数据文件的合并,且其中一个必须是已被打开的当前数据文件。第163页/共210页第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 娄星区人民医院2025年-2026年度医疗卫生专业技术人才招聘备考题库完整参考答案详解
- 2025年会昌昌兴酒店管理有限责任公司招聘劳务派遣工作人员备考题库完整参考答案详解
- 2025年四川大学华西乐城医院招聘18人备考题库有完整答案详解
- 2025年山西立恒技工学校教师招聘备考题库及完整答案详解1套
- 2025年深圳市南山区科技第二幼儿园招聘机动教师1名备考题库完整答案详解
- 首都医科大学附属北京儿童医院面向2026年应届毕业生(含社会人员)公开招聘备考题库及答案详解(考点梳理)
- 2025年广东省农业科学院作物研究所招聘科研助理人员备考题库及1套参考答案详解
- 杭州地铁科技有限公司2026届校园招聘9人备考题库(第一批)完整参考答案详解
- 2025年石家庄市藁城人民医院医共体公开招聘医师7名备考题库及答案详解(易错题)
- 未来五年新形势下综合类录像制品制作服务行业顺势崛起战略制定与实施分析研究报告
- 麻腮风的知识讲座
- 非遗文化创意产品设计 课件全套 第1-5章 概述- 非遗文创产品设计案例解析
- 秋季安全大检查典型检查卡
- 转基因的科学-基因工程知到章节答案智慧树2023年湖南师范大学
- JJF 1245.1-2010安装式电能表型式评价大纲通用要求
- 陈静《村镇规划课程》村镇规划课程第一章-学科背景和发展历程
- 雨季道路、管道工程施工专项措施
- 《中国人民站起来了》课件-统编版高中语文选择性必修上册
- 大学生创业教育说课课件
- 反垄断法及反不正当竞争法课件
- (中职)机械基础2、认识材料力学的基础知识教学课件
评论
0/150
提交评论