第二章-SPSS数据文件的建立和管理_第1页
第二章-SPSS数据文件的建立和管理_第2页
第二章-SPSS数据文件的建立和管理_第3页
第二章-SPSS数据文件的建立和管理_第4页
第二章-SPSS数据文件的建立和管理_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章SPSS数据文件--建立与管理2-1SPSS数据文件一、SPSS数据文件的特点1、SPSS数据文件的扩展名是.sav;2、SPSS数据文件是一种有结构的数据文件。(结构+内容)二、SPSS数据的基本组织方式1、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标,那么这些数据就可按原始数据的方式组织。打开住房状况调查:桌面->培训->住房状况调查一行为一个个案一列为一个变量二、计数数据的组织方式有时所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的计数数据。在研究职称和年龄的关系时汇总得到如表所示的数据。其中职称的分组值分别为1~4,年龄段的分组值为1~3。职称年龄段35岁以下(1)36~49岁(2)50岁以上(3)教授(1)0158副教授(2)10201讲师(3)20101助教(4)3520频数数据举例2-2数据文件的结构和定义方法

一、变量名二、数据类型三、变量名标签四、变量值标签五、缺失数据六、计量尺度SPSS数据的结构是对SPSS每列变量及其相关属性的描述,它的定义是通过数据编辑窗口中的变量视图实现的。一、变量名(Name)

变量名是变量存取的惟一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。为了方便记忆,变量名最好与代表的数据含义相对应。变量名一般的起名规则:1、变量名的字符个数不多于8个;变量名不区分大小写字母。允许汉字作为变量名,汉字总数不能超过4个;2、首字符应以英文字母开头,后面可以跟除了!,?,*之外的字母或数字。下划线、圆点不能为变量名的最后一个字母;3、变量名不能与SPSS内部特有的具有特定含义的保留字相同,如ALL,BY,NOT,OR等;SPSS有默认的变量名,它以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。二、数据的类型、宽度、小数位数

Type、Width、Decimals数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型,分别为数值型、字符型和日期型。相应的类型会有默认的列宽或小数位数等。1、数值型数值型是SPSS最常用的数据类型,通常由阿拉伯数字(0~9)和其他特殊符号(如美元符号、逗号、圆点)等组成。SPSS中数值型有以下五种不同的标识方法:(1)标准型(Numeric)(2)科学记数法型(ScientificNotation)(3)逗号型(Comma)(4)圆点型(Dot)(5)美元符号型(Dollar)SPSS变量类型默认长度小数位数显示方式标准型Numeric82标准格式数值变量,圆点表示小数点数值科学记数法型ScientificNotation82科学记数法逗号型Comma82圆点做小数点,逗点做三位分隔符的数值圆点型Dot82逗点做小数点,圆点做三位分隔符的数值美元符号型Dollar82有效数值前带$,以逗点为分隔符字符型String8无一串字符日期型Datedd-mmm-yyyy、mm/dd/yyyy

等2、字符型(String)3、日期型(Date)字符型也是SPSS较常用的数据类型,由一串字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。日期型用来表示日期或者时间数据,如生日、成立日期等变量可以定义为日期型。三、变量名标签(Label)

1、变量名标签是对变量名含义的进一步解释说明,它可增强变量名的可视性和统计分析结果的可读性。2、变量名标签可用中文,总长度可达120字符,但在统计分析结果的显示中,一般不可能显示如此长的变量名标签信息。3、变量名标签这个属性是可以省略的,但建议最好给出变量名的标签。四、变量值标签(Values)变量值标签是对变量取值含义的解释说明信息,对于定类型和定序型数据尤为总要。例,用数值1表示男,用数值2表示女。可见,变量值标签对于定序数据(如收入的高、中、低)和定类数据(如民族、性别)来说是必不可少的,它不但明确了数据的含义,也增强了最后统计分析结果的可读性。变量值标签可以用中文。五、缺失数据(Missing)数据中明显错误或明显不合理的数据以及漏填的数据都可看做缺失数据。例,在某项客户满意度的问卷调查数据中,某个被调查者的年龄是213岁。这个数据显然是一个不符合实际情况的失真数据。例,在某项客户满意度的问卷调查数据中,某个被调查者的年收入没有填,是空缺的。SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方式是:首先,在遗漏的数据处填入某个特定的标记数据,例,将遗漏的年收入数据用特定的标记数据(如9999999)来替代;然后,再指明这个特定的标记数据(如9999999)或那些明显的失真的数据(如213)等为用户缺失值。这样,在进行统计分析时,SPSS就能将这些用户缺失值与正常的数据区分开来,并依据用户选择的处理策略对其进行处理或分析等。SPSS用户缺失值是:★对字符型或数值型变量,用户缺失值可以是1~3个特定的离散值。★对一个数值型变量,用户缺失值可以在一个连续的闭区间内并同时附加一个区间以外的离散值。SPSS系统缺失值:是用一个圆点表示,它不等于0或.00,通常出现在数值型变量数据中。六、计量尺度(Measure)定距型数据(Scale):通常是指诸如年龄、身高、体重、血压等连续数值型数据,也包括“人数”、“商品件数”等离散数值型数据;定序型数据(Ordinal):具有内在固有大小或高低顺序,一般可以用数值或字符表示,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),但是相邻级别之间的差距是不相等。例如,职称变量可以有低级、中级、高级三个取值,可分别用1,2,3表示。年龄段变量可以有老、中、青三个取值,分别用A、B、C表示等。

定类型数据(Nominal):是指没有内在固有大小或高低顺序,而只是一种名义上的指代,一般以数值或字符表示的分类数据。如性别变量中的男、女取值,可以分别用1,2表示。民族变量中的各个民族,可以分别用汉、回、满等字符表示。单击VariableView进入;定义变量名定义变量类型定义变量名标签变量值标签定义度量尺度定义显示宽度定义对齐方式

定义变量类型对话框

定义变量值标签对话框定义变量缺省值对话框变量结构定义的基本操作2-3SPSS数据的录入与编辑

一、SPSS数据的录入SPSS数据的录入操作在数据编辑窗口中的数据视图中实现。其操作方法与Excel基本类似,也是以电子表格的方式进行录入。二、SPSS数据的编辑1、SPSS数据定位(1)人工定位:指通过人工浏览数据,确定当前数据单元,适用于数据量较少的情况。用户只需要用鼠标拖动数据编辑窗口右边的滚动钮,或按键盘上的PageUp,PageDown键就可以完成数据的浏览和定位。(2)自动定位:指SPSS按照用户给出的定位条件自动寻找满足条件的第一个数据单元,并设置它为当前数据单元,适用于数据量较大的情况。定位条件可以是一个个案的号码,也可以是某个变量的变量值。A、按个案号码自动定位★将当前单元定位在任何单元中。★选择菜单:编辑->转至个案->输入个案号码B、按变量值自动定位★将当前单元定位在要查找的变量的任何一条个案上。★选择菜单:编辑->查找->输入定位变量值2、插入和删除一条个案(1)插入一条个案:在数据编辑窗口的某条个案前插入一条新个案。★将当前数据单元确定在一条个案上。★选择菜单:编辑->插入个案(2)删除一条个案:即删除数据编辑窗口中的某条个案。★在要删除的个案号码上单击左键,于是待删除的个案数据全部反色显示。★单击右键,从弹出菜单中选择cut选项。3、插入和删除一个变量(1)插入一个新变量:即在数据编辑窗口的某个变量前插入一个新变量。★将当前数据单元确定在某变量上★选择菜单:编辑->插入变量(2)删除一个变量:即删除数据编辑窗口中的某列变量。★在要删除列的变量名上单击左键,于是待删除列的数据全部反色显示。★单击右键,从弹出菜单中选择cut选项。4、数据的移动、复制和删除

数据的移动、复制和删除:与一般的应用程序相同(1)选择操作对象(变量、个案、若干连续单元等)(2)剪切:Edit+Cut(Ctrl+X)复制:Edit+Copy(Ctrl+C)粘贴:Edit+Paste(Ctrl+V)

恢复删除或修改前数据

Edit+Undo插入与删除变量插入与删除个案数据的剪切、粘贴与复制1.插入变量在添加处单击Var,单击右鼠标键出现右侧对话框,单击InsertVariables2.删除变量1.插入个案在添加处单击观测量,单击右鼠标键出现右侧对话框,单击InsertCase2.删除个案剪切复制粘贴若想恢复,打开EditUndo2-4读取其他格式的数据文件

一、直接读入其他格式的数据文件基本操作步骤如下:(1)选择菜单:文件->打开->数据(2)选择数据文件的类型,并输入数据文件名。注意:如果读入的是Excel格式文件,SPSS默认将它的所有数据读到SPSS数据编辑窗口中,也可以指定读取工作表中某个区域内的数据(A5:B10,表示仅读取以A5单元为左上角,B10单元为右下角的矩形区域内的数据)。工作表上的一行数据为SPSS的个案。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息,则应选择读取变量名选项。二、使用文本导向读入文本文件(1)选择菜单:文件->检索数据间如何分割数据文件的第一行上是否有变量名数据部分从文本文件的第几行开始个案数据在文本文件中是如何安排的指定文本文件的分割符号字符型数据表示方法2-5SPSS数据文件合并

一、纵向合并数据文件纵向合并数据文件就是将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行首尾对接,即将一个SPSS数据文件的内容追加到数据编辑窗口中当前数据的后面,依据两个数据文件中的变量名进行数据对接。纵向合并SPSS数据时,通常要注意以下两个问题:★两个待合并的SPSS数据文件的内容合并起来应是有实际意义的。换句话说,如果两份完全不相干的数据,虽然操作上能够实现他们的纵向合并,但却是毫无意义的。★为方便SPSS数据文件的纵向合并,在不同数据文件中数据含义相同的数据项最好用相同的变量名,且数据类型也最好相同,利于SPSS对变量的自动匹配。例有两份关于职工基本情况的SPSS数据文件,文件名分别为“职工数据.sav”和“追加职工.sav”。两份数据文件中的数据项不尽相同,且同一数据项的变量名也不完全一致。现需要将这两份数据合并到一起。纵向合并数据文件的基本操作步骤1、在数据编辑窗口中打开一个需要合并的SPSS数据文件。2、选择菜单:数据->合并文件->添加个案3、新的活动数据集中的变量:框中显示的变量名是两个数据文件中的同名变量,SPSS默认它们有相同的数据含义,并将它们作为合并后新数据文件中的变量。如果不接受这种默认,可以按按钮将它们剔除到非成对变量框中。〔*〕表示该变量是当前数据编辑窗口中的变量,〔+〕表示该变量是指定的要追加的磁盘的数据文件中的变量。4、非成对变量:框中显示的变量名是两个文件中的不同变量。SPSS默认这些变量的含义不同,且不放入合并后的新文件中。如果不接受这种默认,可选择其中的两个变量名并按指定配对,表示虽然它们的名称不同,但数据含义是相同的。可进入合并后的数据文件中。或者,对某变量按改名后再指定配对。纵向合并数据文件的基本操作步骤5、如果希望在合并后的数据文件中看出哪些个案来自合并前的哪个SPSS数据文件,可以选项。于是合并后的数据文件中将自动生产一个名为源01取值为0或1的变量。可以省略。0表示个案来自第一份数据文件,1表示来自第二份数据文件。纵向合并数据文件的基本操作步骤二、横向合并数据文件横向合并数据文件就是将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行左右对接,即将一个数据文件的内容拼到数据编辑窗口中当前数据的右边,依据两个数据文件中的个案进行数据对接。横向合并数据文件时,通常要注意以下三个问题:★两个数据文件必须至少有一个名称相同的变量,该变量是两个数据文件横向拼接的依据,称为关键变量。★两个数据文件都必须事先按照关键变量进行升序排列。★为方便SPSS数据文件的横向合并,不同数据文件中数据含义不相同的数据项,变量名不应相同。例有两份关于职工基本情况的SPSS数据文件,文件名分别为“职工数据.sav”和“职工奖金.sav”。这里,两份数据文件中职工号的变量名是相同的,第二份数据中只有部分职工的奖金数据。现需要将这两份数据文件合并。横向合并数据文件的基本操作步骤(1)在数据编辑窗口中打开一个需要合并的SPSS数据文件。(2)选择菜单:数据->合并文件->添加变量个案由两个文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论