版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第2章章 数据文件建立和管数据文件建立和管理理 本章本章将进将进一步具体一步具体讲讲解解数数据的据的录录入、入、读读取和存取和存储储,数数据的据的编辑编辑,数数据文件的据文件的预处预处理,以及理,以及数数据文件的拆分据文件的拆分与与合合并并。2.1 2.1 定义变量定义变量 在介绍对数据的具体操作前,首先需认识数据编辑视图。数据编辑视图由“数据视图”和“变量视图”两个视图组成,在视图左下角的视图标签处对以上两个视图进行切换;“数据视图”用于显示、编辑数据;“变量视图”用于显示、编辑变量。2.1.1 2.1.1 打开定义变量视图 按前一章所述打开SPSSSPSS主界面,视图切换标签处单击“变量
2、视图”,即打开“变量视图”窗口,如图所示。在该视图可对变量的以下属性进行定义:名称、类型、宽度、小数、标签、值、缺失、列、对齐、度量标准和角色。2.1.2 2.1.2 定义变量名称 在“变量视图”变量栏的“名称”栏中定义变量名称,用户可根据数据需要或个人习惯进行定义,如果不对变量进行定义,系统将自动默认变量名为var00001var00001、var00002var00002、var00003var00003等。一般根据变量的实质意义来命名,例如:年龄、性别、年级等变量,可用Age,Gender,GradeAge,Gender,Grade命名,也可用中文意义命名,但当出现变量数量较大时,一般使
3、用流水编号,即防混淆又方便。虽然变量可根据用户的需求自行编辑,但仍有其需共同遵循的原则: 若用英文命名,变量名首字必须为英文字母,其后方可接数字、英文字母、 等。若用中文命名,则可直接使用。 不可使用空格和特殊字符(如键盘上的!、# #、$ $、% %、& &、 、* *、(、)、?等字符)。 不能使用相同的字符,英文字符不论大小写,都代表相同的名称。 一般字符宽不超过8 8个字符(4 4个中文),在SPSS 18.0SPSS 18.0中可达到4040个字符。 变量名不可使用系统保留字,如:AllAll、AndAnd、ByBy、EqEq、GeGe、GtGt、LeLe、LtLt、
4、NeNe、NotNot、OrOr、ToTo、WithWith等变量名称。 变量名结尾不可使用“.”.”、“”和“_”_”结尾。2.1.3 2.1.3 定义变量类型 如图1 1所示,单击图中圆圈处按钮,打开“变量类型”对话框,如图2 2所示。 图1 1 图2 2 SPSS 18.0SPSS 18.0软件提供了8 8种变量类型,如表所示。2.1.4 2.1.4 定义变量宽度和数据小数位数 在“变量视图”的“宽度”栏中(如图所示)定义数据宽度(默认值为8 8个字符,最大值为4040个字符),在“小数”栏中定义小数位数(默认值为2 2个字符,最大值为1616个字符)。2.1.5 2.1.5 定义变量标
5、签和数值标签1 1变量标签 在处理大量数据的过程中,为方便使用,变量名称越简单越好。而同时在简化过程中很容易混淆这些变量名称,因此给变量名称贴上“标签”,对它进行标识和区分就显得尤为重要了。2 2值 由于变量有时可能有几个水平,每个水平代表不同的意义,而对水平所赋予的“值”本身并不能代表这些意义,这样就需对“值”进行标识。 例如:性别有两个水平(男和女),为便于区分,用0 0代表男,1 1代表女(数值仅是一种符号,无实际意义,可自行选择数值),如此既能表示变量的不同水平,又便于后续统计分析。具体操作如下: 将光标移至“值”栏的单元格中,单击里面的按钮,即弹出“值标签”对话框,如下图所示: 在“
6、值”文本框中输入数值,在“标签”文本框输入标识(字符串)。单击“确定”按钮,即生成标识语言。如下图所示。待定义完所有数值标识后,单击“确定”按钮。2.1.6 2.1.6 定义变量缺失值 在实际的调查研究工作中,经常出现被试不答、漏答和错答的情况,而这些不答、漏答和错答的题目在总体数据中,就构成了缺失值。SPSS 18.0SPSS 18.0软件提供定义变量缺失值的功能,如图所示,对不合理的缺失值进行定义,使缺失的变量值不参与统计分析。其中有3个单选按钮:没有缺失值:系统默认值,在“数据视图”窗口中用“.”表示。离散缺失值:最多可在3个文本框中分别输入3个不同的数值为缺失值。范围加上一个可选离散缺
7、失值:可在“低”、“高”文本框中输入缺失值的范围,并在“离散值”文本框中输入一个单独的缺失值。2.1.7 2.1.7 定义数据列宽和对齐方式 在“变量数据”窗口的“列”栏中,定义数据显示的列宽(默认值为8 8个字符,最大值为256256个字符),如图1 1所示。在“对齐”列中,定义数据对齐的方式:“左”、“右”、“居中”(默认“字符串型”数据为“左”,“数值型数据”和“日期型数据”为“右”),如图2 2所示。 图1 1 图2 2 2.1.8 2.1.8 定义变量度量类型 在“变量视图”窗口中的“度量标准”栏中定义变量度量类型,SPSS 18.0SPSS 18.0软件将量表分为:度量、序号和名义
8、,如图所示,分别对应等距/ /等比变量、序列变量和称名变量使用,系统默认值为“度量”。用户可根据分析变量或量表的性质进行选择。2.1.9 2.1.9 定义变量角色 一些文本框支持预定义的角色,从而对预先选择的变量进行分析,角色的分配不仅影响文本框,还可影响语法命令。SPSS 18.0SPSS 18.0软件在“变量视图”窗口中增添了对“角色”的定义,系统提供了6 6种选择,如图所示。2.2 数据录入、读取和存储 以上介绍了如何在“变量视图”窗口中定义变量的各种属性,这一部分将把目光转向“数据视图”窗口。定义好数据的规则后,接下来将具体介绍数据的录入、读取和存储。2.2.1 2.2.1 数据文件的
9、录入 在实际工作中往往需要录入成百上千的数据,此时运用直接输入法就比较费时费力。这里就可以用“语法编辑器”,如图所示,编辑语法命令,选择“文件”|“|“新建”|“|“语法”命令,即打开“语法编辑器”对话框。 其有两种格式:自由格式和固定格式,如表所示。 编辑结束后单击“运行”按钮,即在“数据视图”窗口录入数据,如图所示。2.2.2 2.2.2 数据文件的读取1 1读取“* *. .savsav”数据文件 方法一: 启动SPSS 18.0SPSS 18.0软件时,会自动跳出PASW Statistic 18PASW Statistic 18对话框,如图所示。 若要选择已存在的数据,单击“打开现有
10、的数据源”单选按钮,在列表框中进行选择。若在列表框中没有想要找的文件,则双击“更多文件”选项,弹出“打开数据”对话框,如图所示。方法二: 进入“数据编辑器”窗口后,若想读取“* *. .savsav”数据文件,可执行下操作: 选择“文件”| |“打开”| |“数据”命令,即打开“打开数据”对话框,如图所示。根据数据的文件格式在列表框中进行选择,单击“打开”按钮,即打开所需数据。2 2读取非“* *. .savsav”数据文件 若要打开非* *. .savsav的文件,则在PASW Statistic 18PASW Statistic 18对话框中,选择“打开其他文件类型单选按钮,其他操作同上。
11、 或者打开“打开数据”对话框,单击“文件类型”下拉列表框中的下三角按钮,选择欲找寻的文件格式即可。在SPSS SPSS 18.018.0中,可共享的数据文件软件包如下:* *. .savsav: SPSS for Windows: SPSS for Windows数据文件* *.sys: SPSS/PC+.sys: SPSS/PC+数据文件* *. .sydsyd: : SystatSystat软件包的系统文件* *. .porpor: SPSS for Windows: SPSS for Windows版本的ASCIIASCII码数据文件* *. .xlsxls,* *. .xlsxxlsx
12、, ,* *. .xlsmxlsm: Excel: Excel数据文件 * *.w: Lotus.w: Lotus公司的1-2-31-2-3格式数据文件* *. .slkslk: Multiplan: Multiplan公司的symbolicsymbolic格式的数据文件* *.dbf: .dbf: 数据库dBase,FoxbasedBase,Foxbase格式数据文件* *.sas7dbat,.sas7dbat,* *.sd7,.sd7,* *.sd2,.sd2,* *.ssd01,.ssd01,* *.ssd07,.ssd07,* *. .xptxpt: SAS: SAS软件包的长文件名的
13、数据文件* *.txt,.txt,* *. .datdat: : 纯文本数据文件* *. .dtadta: : 数据管理统计绘图软件(StataStata)数据文件* *. .* *: : 所有文件3 3读取“* *. .xlsxls”数据文件 (1) (1) 打开“打开数据”对话框,单击“文件类型”下拉列表框中的下三角按钮,选择“ExcelExcel( * *. .xlsxls,* *. .xlsxxlsx, ,* *.xlsm .xlsm )”命令。 (2) (2) 选择需要打开的数据文件,单击“打开”按钮,打开“打开ExcelExcel数据源”对话框。如图所示: (3) (3) 选择需打
14、开的数据文件,单击“确定”按钮,即读取ExcelExcel数据文件。4 4读取“* *.txt”.txt”数据文件 现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向导”对话框,如图所示:(2) 在“您的文本文件与预定义的格式匹配吗?”选项组中选择“是”单选按钮,可单击“浏览” 按钮,选择已预定义好的格式;单击“否”则需要建立一个新格式。(3) 单击“下一步”按钮,进入下一步,如图所示。在“变量是如何排列的?”选项组中,根据原有文本文件的格
15、式,选择“分隔”表示使用分隔格式的数据结构;选择“固定宽度”表示使用固定格式的数据结构。(4) 在“变量名称是否包含在文件的顶部?”选项组中,选择“是”表示文本数据的第一行,将被作为变量名读入“数据视图”窗口的变量栏中;选择“否”表示文本数据的第一行,将作为个案被读入“数据视图”窗口的个案1中。(5)单击“下一步”按钮,进入下一步,如图所示。单击“第一个数据个案从那个行号开始?”选项的微调按钮,可选择数据文本的第几行作为“数据视图”窗口中的第一个个案。若在上一步的“变量名称是否包含在文件的顶部?”中选择“是”,则系统在该处默认为2;若选择“否”,则在该处默认为1。(6) 在“如何表示个案?”中
16、,选择系统默认选项“每一行表示一个个案”,表示文本数据的每一行即为SPSS“数据视图”窗口的一个个案;选择“变量的特定编号表示一个个案”,表示文本数据的前几列被作为变量读入SPSS“数据视图”窗口,可在微调框中定义读入的列数。(7) 在“您要导入多少个个案?”中,可根据需要自行选择系统默认选项“全部个案”,或选择“前几个个案”、“个案的随机百分比(近似值)”单选按钮。 (8) 选择完毕后,参照“数据预览”选项组,单击“下一步”按钮。(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据文本数据中变量间的分隔符,可选择“制表符”、“空格”、“逗号”、“分号”和“其他”复选框。在
17、“文本限定符是什么?”中,可选择“无”、“单引号”、“双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。(10) 之后进入下一步,如图所示。在“数据预览”中选择变量。在“变量名称”文本框中输入欲使用的名称,也可使用系统默认的名称。在“数据格式”下拉列表框中选择数据格式,选完后单击“下一步”。(11) 之后进入下一步,如图所示。可根据选项组的内容,对该操作的文件格式和语法进行保存。若勾选“在本地缓存数据”,可在磁盘中临时保存数据文件的完整副本。缓存数据文件可以提高SPSS的性能。单击“完成”按钮,即成功读取文本型数据文件。2.2.3 2.2.3 数据文件的存储 选择“文件
18、”|“|“保存”|“|“另存为”|“|“保存所有数据”命令,即打开“将数据保存为”对话框,如图所示。 若要对部分变量进行保存,单击“变量”按钮,打开“数据存储为:变量”对话框,如图所示,在复选框中勾选需要选择的变量。或单击“全部保存”按钮,选择全部变量;单击“仅可视”按钮,选择正在使用中的变量集;单击“全部丢弃”按钮,撤销对所有变量的选择。单击“继续”按钮,即再次打开“将数据保存为”对话框。单击“保存”按钮,即可完成数据的存储。2.3 编辑数据 将数据录入或读入“数据视图”窗口后,需对数据进行初步加工,为后续统计分析做准备。这一部分将重点讨论,在加工过程中会使用到的:数据的剪切、复制和粘贴,数
19、据的查找、替换,个案的增加和删除,数据的排序,数据的行列互换,选择个案,数据的分类汇总,缺失值的替代,数据的加权处理。 2.3.1 2.3.1 数据的剪切、复制和粘贴 在单元格中选择需要剪切、复制或粘贴的位置,选择“编辑”|“|“剪切”、“复制”或“粘贴” 命令。 选择需要进行操作的部分,单击右键,在弹出的快捷菜单中选择相应的命令,即可进行相应的操作单击鼠标右键,即可进行操作,如图所示。2.3.2 2.3.2 数据的查找、替换 查找和/ /或替换“变量视图”和“数据视图”窗口中的数据值或属性值:选择“编辑”|“|“查找”或“替换”命令,即打开“查找和替换- -数据视图”对话框,如图所示。2.3
20、.3 2.3.3 个案的增加和删除1 1个案的增加: 选择“编辑”|“|“插入个案”命令。若在选择“插入个案”之前没有选中某个案,则在数据底部增加一个新个案;若在选择“插入个案”之前已选中某个案,则在已选个案的上方增加一个新个案。还有一种较简单的方法:在观测序号栏中选中某个案,单击鼠标右键,选择选项,则在所选个案的上方增加一个新个案,如图所示。2 2个案的删除: 在观测序号栏中选中需删除的个案,选择“编辑”|“|“清除”命令。另一种方法是在观测序号栏中单击鼠标右键,选择“清除”命令,则删除该个案。3 3变量的增加和删除: 在变量栏中选中某变量,其他操作和个案的增加和删除相同。 2.3.4 2.
21、3.4 数据的排序 一种方法:选择“数据”|“|“排序个案”命令,即打开“排序个案”对话框,如图所示。 另一种方法:选中需排序的数据,鼠标置于其上单击右键,选择“升序排列”命令或“降序排列”命令,排序完毕,如图所示。2.3.5 2.3.5 数据的行列互换 SPSSSPSS软件可以对“数据编辑器”窗口中打开的数据进行行、列互换,该功能会在某些统计分析中使用。 操作如下:选择“数据”| |“转置”命令,即打开“转置”对话框,如图所示。在左边列表框中选择需要转置的变量,将其移入到右边的“变量”或“名称变量”中,单击“重置”按钮,即完成转置。2.3.6 2.3.6 数据的个案、变量定位 选择选择“ “
22、编辑编辑” ”菜菜单单 | | 选择选择“ “转转至至个个案案” ”或或“ “转转向向变变量量” ”命令,命令,即打即打开开“ “转转到到” ”对话对话框,如框,如图图所示。所示。 转到个案:选择“个案”命令,在“转向个案数”微调文本框中输入要转到的个案序号,单击“转向”按钮,则转到个案。 转到变量:选择“变量”命令,单击“下三角”按钮,在“转向变量”下拉列表框中选择要转到的变量,单击“转向”按钮,则转到变量。 2.3.7 2.3.7 选择个案 在在实际实际工作中,用工作中,用户户往往需要某些特定往往需要某些特定条条件下的件下的数数据,据,进进行行观观察察研研究,此究,此时时就需要就需要对个对
23、个案案进进行行选择选择。具体操作如下:。具体操作如下:单击单击“ “数数据据” ”菜菜单单,选择选择“ “选择个选择个案案” ”命令,即打命令,即打开开“ “选择个选择个案案” ”对话对话框,如框,如图图所示。所示。1.1.“选择”选项组 全部个案:关闭所有过滤情况,使用所有个案,该选项为系统默认值。 如果条件满足:使用条件表达式来选择个案,只有满足指定条件的个案,才可以参与后面的统计分析。选择该单选按钮,单击下面的“如果”按钮,即打开“选择个案:IfIf”对话框,如图所示: 运用变量列表框、元件按钮和函数组列表框,在表达是文本框中定义条件表达式。例如要选年份是20002000年的可以这样定义
24、:year=2000.year=2000.单击“继续”按钮,完成对条件的定义。 随机个案样本:选中该单选按钮,单击“样本”按钮,打开“选择个案:随机样本”对话框,如图所示: 在“样本尺寸”选项组中,选择“大约* *所有个案的% %”按钮,表示对一定比例的个案进行处理;选择“精确* *从第一个开始的个案* *个案”,表示对具体个案群集进行处理。单击“继续”按钮,完成对样本的选择。 基于基于时间时间或或个个案全距:案全距:选选中中该单选该单选按按钮钮,单击单击“ “范范围围” ”按按钮钮,打打开开“ “选择个选择个案:范案:范围围” ”对话对话框。在框。在对话对话框中框中输输入所要入所要选择选择的
25、第一的第一个个和最后一和最后一个个个个案。案。 使用使用筛选筛选器器变变量:指定某一量:指定某一变变量量为过滤为过滤器器变变量,量,该过滤该过滤器器变变量所量所对应对应的的个个案案值值若若为为0 0或缺失或缺失值值,则则不不选择该个选择该个案。案。2.2.“输出”选项组 过滤掉未选定的个案:未选择的个案,不参加统计分析,但仍显示在“数据视图”窗口中。若已选择“如果条件”选项,系统在“数据视图”窗口中新建一个变量“fiterfiter_$_$”, ,用以表明哪些是被选定的个案,哪些不是,该选项是默认选项。 将选定个案复制到新数据集:被选择的个案,将显示在“数据编辑器”中。在“数据集名称”文本框中
26、,输入新数据集的名称。 删除未选定个案:在原数据文件中,删除没有选择的个案,这种删除是永久性的。2.3.8 2.3.8 数据的分类汇总 数据的分类汇总是将数据文件按指定的分组变量对个案进行分类,然后对每组个案的个变量进行汇总分析。具体操作如下: (1) 选择“数据”|“分类汇总”命令,打开“汇总数据”对话框。如图所示: (2) 从从左左边边列表框中列表框中选择变选择变量,量,单击单击 按按钮钮,选选入入“ “分分组变组变量量” ”列表框中。列表框中。 (3) 从从左左边边列表框中列表框中选择变选择变量,量,单击单击 按按钮钮,选选入入“ “汇总变汇总变量量” ”选项组选项组中的中的“ “变变量
27、摘要量摘要” ”列表框中。列表框中。 (4) 单击单击“ “变变量摘要量摘要” ”列表框下面的列表框下面的“ “函函数数” ”按按钮钮,打,打开开“ “汇总数汇总数据:据:汇总汇总函函数数” ”对话对话框,如框,如图图所示。所示。可在其中选择各种描述统计量,单击“继续”按钮,完成汇总函数定义。百分比:上方(高于指定值的百分比)、下方(低于指定值的百分比)、内部(指定值范围之内的百分比)、外部(指定值范围之外的百分比)。 分数:上方(高于指定值的比率)、下方(低于指定值的比率)、内部(指定值范围之内的比率)、外部(指定值范围之外的比率)。(5) 单击单击“ “变变量名量名称与标签称与标签” ”按
28、按钮钮,打,打开开“ “汇总数汇总数据:据:变变量名量名称称和和标签标签” ”对话对话框,如框,如图图所示,新生成的所示,新生成的汇总汇总文件中的文件中的变变量就是量就是对汇对汇总变总变量量计计算的算的结结果。果。(6) 勾勾选复选选复选框框“ “个个案案数数” ”,将将各分各分类类的的个个案案数数保存保存为为一一个变个变量,量,可在可在“ “名名称称” ”文本框定文本框定义义一一个变个变量名,默量名,默认为认为N_BREAK.(7) 在“保存”选项组中进行选择,对数据进行保存,各选项的具体功能如下: 将汇总变量添加到活动数据集:数据文件本身并不汇总,而是对相同类别的个案,赋予相同的新汇总变量
29、值。 创建只包含汇总变量的新数据集:将汇总数据存储到当前所用的数据集中,该数据集包括定义汇总个案的分组变量和所有被汇总函数定义过的汇总变量,活动数据集不会受到影响。 写入只包含汇总变量的新数据集:将汇总数据存储到一个外部文件中,该文件包括定义汇总个案的分组变量和所有被分组函数定义过的汇总变量,活动数据集不会受到影响。(8) 在“适用于大型数据集的选项”选项组中进行选择,对大型数据集进行排序,各选项的具体功能如下: 文件已经按分组变量排序:若选择此项,将使程序运行更快,占内存更少,但要谨慎使用。 在汇总之前排序文件:在处理极少数的大数据文件时,对数据文件进行排序是很必要的,但该选项不建议使用。2
30、.3.9 2.3.9 缺失值的替代 用户在处理数据的过程中,会面临缺失数据的情况,为了不影响后续操作,需对缺失值进行处理,具体操作如下:(1) (1) 选择“转换”| |“替换缺失值”命令,即打开“替换缺失值”对话框,如图所示:(2) (2) 从变从变量列表框中量列表框中选择选择缺失缺失值值所在的所在的变变量,量,单击单击 按按钮钮,移入移入“ “新新变变量量” ”列表框。列表框。(3) (3) 在在“ “名名称称和方法和方法” ”选项组选项组中,定中,定义义新新变变量。量。(4) (4) 单击单击“ “确定确定” ”按按钮钮,完成,完成“ “替替换换缺失缺失值值” ”操作。操作。2.3.10
31、 2.3.10 数据的加权处理 在在处处理理数数据的据的过过程中,程中,对对于不同于不同权权重的重的数数据,用据,用户户需需对对其做其做加加权处权处理。如在理。如在评评定一定一个个同同学学的成的成绩时绩时,不,不仅仅要考要考虑该虑该同同学学不同不同课课程的考程的考试试成成绩绩,而且,而且还还要考要考虑虑不同不同学学科的科的学学分情分情况况。例如:利用某例如:利用某变变量作量作为权为权重重变变量量对对下下图图中的中的个个案案进进行加行加权处权处理。理。 具体操作如下:具体操作如下:(1) (1) 新建新建“ “权权重重变变量量” ”,如下,如下图图所示,所示,对个对个案案赋赋予予权权重,可用手重
32、,可用手工方式工方式输输入,也可用入,也可用“ “转换转换” ”菜菜单单中中“ “计计算算变变量量” ”命令命令进进行建立。行建立。(2) (2) 选择选择“ “数数据据” ”| |“ “加加权个权个案案” ”命令,打命令,打开开“ “加加权个权个案案” ”对话对话框,如框,如图图所示:所示:选择选择“ “加加权个权个案案” ”单选单选按按钮钮,从变从变量列表框中量列表框中选择选择新建的新建的“ “权权重重变变量量” ”,单击单击按按钮钮,移入,移入“ “频频率率变变量量” ”文本框,文本框,单击单击“ “确定确定” ”按按钮钮,完,完成加成加权处权处理。理。(3) (3) 选择选择“ “分析
33、分析” ”| |“ “描述描述统计统计” ”| |“ “描述描述” ”命令,即打命令,即打开开“ “描述性描述性” ”对对话话框,框,对对加加权权前的前的数数据文件和加据文件和加权权后的后的数数据文件据文件进进行描述性行描述性统统计计分析,分析,输输出描述出描述统计统计量表格,如下面的量表格,如下面的两个两个表格所示,表格所示,对它对它们进们进行比行比较较,则发现则发现加加权权前的前的N=9N=9,加,加权权后的后的N=135N=135(1010* *3+153+15* *3+203+20* *3 3)。)。2.4 数据文件的预处理 在前一部分,探在前一部分,探讨讨了了数数据的据的编辑编辑,在
34、,在进进行行实际实际的的统计统计分析分析之前,用之前,用户还户还需需对数对数据文件据文件进进行行预处预处理,以便于下一章的理,以便于下一章的操作。操作。这这一部分一部分将将就就计计算算变变量、量、对个对个案案内内的的值计数值计数、转换转换值值、对数对数据据进进行重新行重新编码编码、变变量离散化、准量离散化、准备备建模建模数数据、据、个个案排秩、日期和案排秩、日期和时间时间的的处处理等方面理等方面进进行行讨论讨论。2.4.1 2.4.1 计算变量 SPSS 18.0SPSS 18.0软软件系件系统统提供了强大的提供了强大的计计算算变变量的功能。在量的功能。在进进行行统计统计分析分析时时,为为了找
35、出了找出变变量量间间的的关关系,需系,需对录对录入的原始入的原始数数据据进进行某些行某些计计算,以生成新算,以生成新变变量,量,这这即是即是“ “计计算算变变量量” ”的的功能。仍以上面的功能。仍以上面的为为例,如下例,如下图图:具体操作步具体操作步骤骤如下:如下:(1)(1)选择选择“ “转换转换” ”| |“ “计计算算变变量量” ”命令,即打命令,即打开开“ “计计算算变变量量” ”对话对话框,框,如如图图所示:所示:(2)(2)在在“ “目目标变标变量量” ”文本框中文本框中输输入入计计算后的新算后的新变变量名量名称称。(3)(3)单击单击“ “类类型型与标签与标签” ”按按钮钮,打,
36、打开开“ “计计算算变变量:量:类类型型与标签与标签” ”对话对话框,如框,如图图所示,在其中可以定所示,在其中可以定义变义变量量属属性。性。在“标签”选项组中可选择“标签”单选按钮,定义变量标签;也可选择“将表达式用作标签”单选按钮。在“类型”选项组中可选择“数值”单选按钮;也可选择“字符串”单选按钮,并定义字符串宽度。(4)(4)单击“继续”按钮,完成对变量类型和标签的定义。(5)(5)从变从变量列表框中量列表框中选择选择需要需要计计算的算的变变量,量,单击单击 按按钮钮,将将其移入其移入“ “数数字表字表达达式式” ”列表框中。另外,通列表框中。另外,通过过下方的下方的计计算器面算器面板
37、,可板,可对对各各变变量量进进行行计计算。算。还还可根据需要可根据需要从从右右边边的的“ “函函数组数组” ”和和“ “函函数数和特殊和特殊变变量量” ”列表框中列表框中调调用相用相应应的函的函数数,从从而而组组成各成各种种表表达达式。式。SPSS18.0SPSS18.0软软件系件系统统在在“ “函函数组数组” ”列表框中,提供了列表框中,提供了7070余余种种已建立的函已建立的函数数式,包括算式,包括算术术函函数数、统计统计函函数数、分布函、分布函数数、日期函、日期函数数、缺失、缺失值值函函数数和文字函和文字函数数等。等。(6)(6)单击单击“ “如果如果” ”按按钮钮,打,打开开“ “计计
38、算算变变量:量:IfIf个个案案” ”对话对话框,如框,如图图所示。所示。系系统统默默认选项认选项是是“ “包括包括所有所有个个案案” ”;若只;若只对对某某些符合特定些符合特定条条件的件的变变量量进进行行计计算算时时,则选择则选择“ “如果如果个个案案满满足足条条件件则则包括包括” ”单选单选按按钮钮,具体,具体操作操作参参照上述照上述“ “选择个选择个案案” ”命令中命令中对对“ “选择个选择个案:案:IfIf” ”操作操作规则规则。(7)(7)单击单击“ “继续继续” ”按按钮钮,完成,完成条条件件设设置,返回置,返回“ “计计算算变变量量” ”对话对话框。框。(8)(8)单击单击“ “
39、确定确定” ”按按钮钮,完成,完成对变对变量的量的计计算,在算,在“ “数数据据视图视图” ”窗窗口口会显会显示示计计算的新算的新变变量。量。2.4.2 2.4.2 对个案内的值计数 在实际的统计分析工作中,用户常常需要计数某些满足特定要求的数据出现的次数,针对这一问题,SPSS 18.0SPSS 18.0软件系统提供了“对个案内的值计数”的功能。具体操作步骤如下:(1)(1)选择“转换”| |“对个案内的值计数”命令,即打开“计算个案内值的出现次数”对话框,如图所示:(2)(2)在“目标变量”文本框中输入计数变量的名称,在“目标标签”文本框中输入新计数变量的标签。(3)(3)从从左左侧侧的的
40、变变量列表框中,量列表框中,选择选择需需计数计数的的变变量,量,单击单击 按按钮钮,移入,移入“ “数数字字变变量量” ”列表框中。列表框中。(4)(4)单击单击“ “定定义值义值” ”按按钮钮,打,打开开“ “统计个统计个案案内内的的值值:要:要统计统计的的值值” ”对话对话框,如框,如图图所示:所示:(5)(5)选择选择系系统统默默认认“ “值值” ”单选单选按按钮钮,在,在“ “值值” ”文本框中文本框中输输入需入需计计数数的的数值数值,单击单击“ “添加添加” ”按按钮钮,写写入入“ “要要统计统计的的值值” ”列表框中。列表框中。(6)(6)若需若需对对“ “要要统计统计的的值值”
41、”列表框中的列表框中的数数据据进进行修改或行修改或删删除,除,则选则选中中该数该数据,据,单击单击“ “更改更改” ”或或“ “删删除除” ”按按钮钮。单击单击“ “继续继续” ”按按钮钮,完成完成对值对值的定的定义义,返回,返回“ “计计算算个个案案内值内值的出的出现现次次数数” ”对话对话框。框。(7)(7)单击单击“ “如果如果” ”按按钮钮,打,打开开“ “统计统计出出现现次次数数:IfIf个个案案” ”对话对话框,框,如如图图所示:所示:(8)(8)单击单击“ “确定确定” ”按按钮钮,完成,完成对个对个案案内内的的值值的的计数计数。2.4.3 2.4.3 转换值 转换值,是指创建一
42、个新变量,该变量从较早或较晚个案中获取数值。具体操作如下:(1)选择“转换”|“转换值”命令,打开“转换值”对话框,如图所示:(2)从变从变量列表框中量列表框中选择选择欲操作的欲操作的变变量,量,单击单击 按按钮钮,移入,移入“ “变变量量-新名新名称称” ”列表框中。列表框中。(3)选择选择“ “变变量量-新名新名称称” ”列表框中的列表框中的变变量,在量,在“ “名名称称和方法和方法” ”选项组选项组中的中的“ “名名称称” ”文本框中,文本框中,输输入新入新变变量名量名称称,单击单击“ “更改更改” ”按按钮钮,即完成,即完成对对新新变变量的命名。量的命名。(4)在在“ “方法方法” ”
43、选项选项中,可根据中,可根据处处理理数数据的需要据的需要进进行行选择选择。(5)完成完成选择选择后,后,单击单击“ “确定确定” ”按按钮钮,完成,完成转换值转换值的操作。的操作。2.4.4 2.4.4 对数据进行重新编码 SPSS 18.0SPSS 18.0软软件的重新件的重新编码编码功能可以功能可以对数对数据文件中原有据文件中原有变变量的量的值进值进行修改,修改后的行修改,修改后的数数据可生成据可生成两种两种模式:重新模式:重新编编码为码为相同相同变变量(在原有量(在原有变变量上量上进进行修改)和重新行修改)和重新编码为编码为不不同同变变量(修改的量(修改的数数据形成新据形成新变变量)。量
44、)。 1 1重新重新编码为编码为相同相同变变量量 2 2重新重新编码为编码为不同不同变变量量1 1重新重新编码为编码为相同相同变变量量(1)(1)选择选择“ “转换转换” ”| |“ “重新重新编码为编码为相同相同变变量量” ”命令,打命令,打开开“ “重新重新编编码码到相同的到相同的变变量中量中” ”对话对话框,如框,如图图所示:所示:(2)(2)在左在左侧侧列表框中列表框中选择选择需要修改的需要修改的变变量,量,单击单击 按按钮钮,移,移入入“ “数数字字变变量量” ”对话对话框。框。(3)(3)单击单击“ “旧值旧值和新和新值值” ”按按钮钮,打,打开开“ “重新重新编码编码成相同成相同
45、变变量量” ”对对话话框,如框,如图图所示:所示:(4)(4)在“旧值”选项组中,选择不同命令定义需修改的旧值。(5(5) )在“新值”选项组中的“值”文本框中输入新值,或选择系统缺失命令。(6(6) )单击“添加”按钮,定义成功,单击“继续”按钮,返回上一级对话框。(7(7) )单击“如果”按钮,打开“重新编码成相同变量:IfIf个案”对话框,在其中可定义需修该数据的条件。(8(8) )单击“确定”按钮,完成编码操作。2 2重新重新编码为编码为不同不同变变量量(1)(1)选择选择“ “转换转换” ”| |“ “重新重新编码为编码为不同不同变变量量” ”命令,打命令,打开开“ “重新重新编码为
46、编码为其他其他变变量量” ”对话对话框,如框,如图图所示:所示:(2)(2)在在“ “输输出出变变量量” ”选项组选项组中,中,输输入新入新变变量的名量的名称称和和标签标签,单击单击“ “更改更改” ”按按钮钮,在,在“ “数数字字变变量量-输输出出变变量量” ”对话对话框中框中显显示示变变量的修量的修改改过过程。其他操作同程。其他操作同“ “重新重新编码为编码为相同相同变变量量” ”的操作。的操作。2.4.5 2.4.5 对数据进行自动编码 自动重新编码是将原有变量转换为秩分变量,并存为新变量。此处的秩分类型为连续赋值型,结点处的秩分取最小值。具体操作如下:(1)选择“转换”|“自动重新编码
47、”命令,打开“自动重新编码”对话框,如图所示:(2)在左在左侧侧列表框中列表框中选择选择需要修改的需要修改的变变量,量,单击单击 按按钮钮,移入,移入“ “变变量量-新名新名称称” ”列表框中。列表框中。(3)在在“ “新名新名称称” ”文本框中文本框中输输入新入新变变量名量名称称,单击单击“ “添加新名添加新名称称” ”按按钮钮,完成更改。,完成更改。(4)在在“ “重新重新编码编码的起点的起点” ”选项组选项组中,中,选择选择“ “最低最低值值” ”则从则从最小最小值值开开始始编码编码;选择选择“ “最高最高值值” ”则从则从最大最大值开值开始始编码编码。(5)可根据需要勾可根据需要勾选复
48、选选复选框框“ “对对所有所有变变量使用相同的重新量使用相同的重新编码设编码设计计” ”和和“ “将将空字符串空字符串值视为值视为用用户户缺失缺失值值” ”,默,默认为认为不不选选。(6)在在“ “模板模板” ”选项组选项组中,可中,可单击单击“ “文件文件” ”按按钮钮,选择选择已存在的秩已存在的秩分模板,或分模板,或将将新生成的新生成的变变量存量存为为模板。模板。(7)单击单击“ “确定确定” ”按按钮钮,完成,完成“ “重新自重新自动编码动编码” ”操作。操作。2.4.6 2.4.6 个案排秩 在数据文件中,某些变量的数值需按其大小进行排序,其序列号即生成一个序列号变量,序列号变量也称为
49、“秩分变量”,序列编号即为“秩分”,而在数据文件中重复出现的数值就叫做“结点”。对个案排秩的具体操作如下:(1)(1)选择“转换”| |“个案排秩”,命令,打开“个案排秩”对话框,如图所示:(2)(2)从变量列表框中选择排秩变量,可选择多个,单击 按钮,移入“变量”列表框中。(3)(3)从变量列表框中选择分组变量,单击 按钮,移入“排序标准”列表框中,系统将根据该变量,对不同的分组分别求秩分。(4)(4)在“将秩1 1指定给”选项组中,选择“最小值”单选按钮(系统默认),即对秩分变量进行升序排序;选择“最大值”单选按钮,即对秩分变量进行降序排序。(5)(5)勾选复选框“显示摘要表”,即在“PA
50、SW PASW StasticsStastics查看器”中输出摘要表。(6)(6)单击“秩的类型”按钮,打开“个案排秩:类型”对话框,如图所示,系统提供了8 8种秩分类型。(7)(7)单击“继续”按钮,完成对秩分类型的定义,返回“个案排秩”对话框。(8)(8)单击“结”按钮,打开“个案排秩:结”对话框,如图所示。系统对节点有4 4种指定的秩,分别如下:均值:结点取重复数据在总秩分中的平均数,后续秩分按总排序赋值,该选项为系统默认。低:结点取重复数据在总秩分中的最小值,后续秩分按总排序赋值。高:结点取重复数据在总秩分中的最大值,后续秩分按总排序赋值。顺序秩到唯一值:结点取秩分最小值,后续秩分按前
51、一秩分赋值。单击“继续”按钮,完成对结点的赋值,返回“个案排秩”对话框。(9)(9)单击“确定”按钮,完成排秩操作。2.5 数据文件的拆分与合并 在在实际实际工作中,用工作中,用户户常常常常会碰会碰到到这样这样的的问题问题:需要:需要将将多多个个文件合文件合并并或拆或拆开开。如。如学学校校经经常需要常需要将将几几个个班班级级的成的成绩汇总绩汇总进进行行处处理,或者理,或者将将年年级总级总成成绩绩拆分成几拆分成几个单个单科成科成绩绩再再进进行行统计统计分析。面分析。面对这种问题对这种问题,SPSS 18.0SPSS 18.0软软件系件系统统提供了提供了“ “数数据文件的拆分据文件的拆分与与合合并
52、并” ”功能,功能,帮帮助用助用户户更更灵灵活的活的处处理理数数据。据。2.5.1 2.5.1 数据文件的拆分 数数据文件的拆分是指按照某据文件的拆分是指按照某变变量,量,对数对数据文件据文件进进行分行分组组,以便以便进进行分行分组组分析。拆分后的分析。拆分后的数数据文件据文件并并非是形成几非是形成几个独个独立的立的数数据文件,而是呈据文件,而是呈现现在同一在同一个数个数据文件中,只是在据文件中,只是在统统计计分析分析过过程中分程中分别对别对不同的拆分不同的拆分组进组进行行统计统计分析。具体操分析。具体操作如下:作如下: (1 1)选择选择“ “数数据据” ”|“|“拆分文件拆分文件” ”命令
53、,即打命令,即打开开“ “分割文件分割文件” ”对话对话框,如框,如图图所示。所示。 (2 2)从从源列表框中源列表框中选择选择用于分用于分组变组变量,量,单击单击按按钮钮,写写入入“ “分分组组方式方式” ”列表框中。列表框中。 (3 3)用)用户户按按个个人需要人需要对选项进对选项进行行选择选择。 (4 4)选择选择完完毕毕,单击单击“ “确定确定” ”按按钮钮,完成拆分文件。,完成拆分文件。2.5.2 2.5.2 数据文件的合并数据文件的合并有两种方式: 变量合并(横向合并):将外部变量与当前变量合并,生成新数据文件。 个案合并(纵向合并):将外部个案与当前个案合并,生成新数据文件。选择
54、“数据”|“合并文件”命令,可从子菜单中选择“添加个案”或“添加变量”命令。1.变变量合量合并并【例例】合合并并“ “人均收入人均收入数数据据2” ”和和“ “人均收入人均收入数数据据3” ”两个数两个数据文据文件,如下件,如下图图所示:所示:具体操作如下:具体操作如下:(1)打打开开“ “人均收入人均收入数数据据2” ”数数据文件。据文件。选择选择“ “数数据据” ”|“ “添加添加变变量量” ”命令,即打命令,即打开开“ “将变将变量添加到量添加到” ”对话对话框,在框,在“ “打打开开的的数数据集据集” ”文本框中文本框中将显将显示打示打开开的的数数据文件名。据文件名。(2)选选中中“
55、“外部外部PASW StasticsPASW Stastics数数据文件据文件” ”单选单选按按钮钮,单击单击“ “浏览浏览” ”按按钮钮,选择选择需要需要与与之合之合并并的的数数据文件,此据文件,此处选择处选择“ “人均收入人均收入数数据据3” ”。(3)单击单击“ “继续继续” ”按按钮钮,打,打开开“ “添加添加变变量量从从” ”对话对话框。框。当两个当两个文文件中件中个个案案数数量不相等或量不相等或顺顺序不一序不一样时样时,应应勾勾选选“ “按照排序文按照排序文件中的件中的关键变关键变量匹配量匹配个个案案” ”复选复选框。框。(4)可根据可根据处处理理数数据的需要据的需要进进行行选择选择,单击单击“ “确定确定” ”按按钮钮,完成,完成变变量合量合并并,生成新,生成新数数据文件。如据文件。如图图所示:所示:2.个个案合案合并并【例例】合合并并“ “人均收入人均收入数数据据4” ”和和“ “人均收入人均收入数数据据5” ”两个数两个数据文据文件,如下件,如下图图所示:所示:具体操作如下:具体操作如下:(1)打打开开“ “人均收入人均收入数数据据4” ”数数据文件。据文件。选择选择“ “数数据据” ”|“ “添加添加变变量量”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年四川长江职业学院单招《数学》检测卷附参考答案详解【培优A卷】
- 2024-2025学年度医院三基考试检测卷附参考答案详解【夺分金卷】
- 2026年3月广东广州市天河区广氮实验幼儿园招聘编外聘用制专任教师1人笔试参考题库及答案解析
- 2024-2025学年度文化教育职业技能鉴定每日一练试卷含完整答案详解(网校专用)
- 2026年黄石市妇幼保健院招聘医疗医技岗位工作人员(第一批)笔试备考试题及答案解析
- 2024-2025学年度一级建造师考前冲刺练习试题含完整答案详解(必刷)
- 2024-2025学年度医学检验(士)试题预测试卷及完整答案详解一套
- 2024-2025学年度一级建造师通关考试题库(突破训练)附答案详解
- 2024-2025学年度机械设备制造修理人员题库【新题速递】附答案详解
- 2024-2025学年园林绿化作业人员能力提升B卷题库附参考答案详解(培优)
- 控制工程基础第四章 频率特性
- 混凝课件完整版
- 风景画的构图
- GB/T 35962-2018群青
- GB/T 10051.4-2010起重吊钩第4部分:直柄单钩毛坯件
- 电子舌工作原理及应用课件
- 农产品质量安全知识培训
- 南极洲地理介绍课件
- 土地盐碱化课件
- 江苏省幼儿园教育技术装备标准
- 外科学课件-运动系统慢性损伤
评论
0/150
提交评论