spss概述及基本知识_第1页
spss概述及基本知识_第2页
spss概述及基本知识_第3页
spss概述及基本知识_第4页
spss概述及基本知识_第5页
已阅读5页,还剩205页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Spss概述 统计软件概述 从20世纪60年代开始 统计软件 statisticalsoftware 在数量和质量上均有了很大的发展 纵观统计软件的发展历程 开发较早 应用范围较广并一直在不断改进完善并日臻成熟的大型商业统计软件 当属美国SAS研究公司研制的SAS statisticalanalysissystem 美国加利福尼亚大学研制的BMDP biomedicalcomputerprograms 和美国SPSS研究公司研制的SPSS 统计软件概述 这三种软件 由于开发时间长 经历了众多用户在不同机型上的考验 用户与开发商以及用户与用户之间均建立了广泛的交流 开发上投入了大量的人力 物力专门进行维护和更新 因此功能越来越强 使用越来越方便 性能更趋于完善 美国还有SYSTAT STATA等软件 中国和其他国家也有许多统计软件面世 原上海医科大 华西医科大 第四军医大都编制过一些面向基层人员 操作灵活 简便 实用的统计软件 SPSS介绍 SPSS公司总部位于美国芝加哥 创立于1975年 一直以经营统计软件产品开发为主业 1994年 1998年 SPSS公司得到了很大的发展 陆续购并了systat公司 BMDP软件公司 Quantum公司 ISL公司等 并将各公司的主打产品收纳SPSS旗下 从而使SPSS公司由原来的单一统计产品开发销售转向为企业 教育科研及政府机构提供全面信息统计决策支持服务 成为最新的 数据仓库 和 数据挖掘 领域前沿的一家综合统计软件公司 SPSS软件是SPSS公司赖以起家的产品 目前也仍然是该公司的主打产品之一 是国际上最流行并具有权威性的统计分析软件之一 软件由fortran语言写成 升级速度很快 目前的最新版本为18 0 SPSS的英文名称原为StatisticalPackageforSocialSciences 意为社会科学统计软件包 后来 随着SPSS产品服务领域的扩大和服务深度的增加 2002年英文全称更改为StatisticalProductandServiceSolutions 意为统计产品与服务解决方案 在近30年的发展中 虽然竞争对手不断出现 但SPSS却始终以其鲜明的特色鼎立于统计学软件之中 现在和SAS被并称为当今最权威的两大统计软件 学习重点 根据统计结果作出解释和统计结论 一 SPSS软件的基本特点 1 功能强大2 兼容性好3 易用性强 功能强大 囊括了各种成熟的统计方法与模型 为统计分析用户提供了全方位的统计学算法 为各种研究提供了相应的统计学方法 自由灵活的表格功能 使得制表变得更加简单和直接提供了各种常用的统计学图形 如线图 条图 饼图 直方图 散点图等多种图形 并且可以将表格图形直接拷贝到word文档 幻灯片中 直接进行结果的展现 兼容性好 在数据方面 不仅可以在spss中作数据录入工作 还可将日常工作中常用的excel表格数据 文本格式数据导入spss中进行分析 不仅节省了相当大的工作量 并且避免了因拷贝粘贴可能引起的错误 在结果方面 spss的表格 图形结果可直接导出为word 文本 网页 excel格式等 也可以将表格 交互式图形作为对象选择型粘贴到word powerpoint等中 并在其中再利用spss对他们进行编辑 易用性强 Spss之所以有广大的用户群 不仅因为它是权威的统计学工具 提供了强大的统计功能 也因为它是一种非常简单易用的软件 界面友好 操作简单 另外 spss也向一些高级用户提供了编程功能 使分析工作变得更加节省时间和精力 第二节视窗界面 一 软件的启动与退出启动 1 在Windows开始菜单中选择开始 程序 SPSSforWindows SPSSforWindows 如图1 1 2 在快捷工具栏单击SPSS19 0图标 退出 选择菜单File Exit 或者直接关闭窗口 即可 Spss运行后 可见一个运行对话框 初次进入spss系统时会出现一个导航对话框 单击右下方的cancel按钮 即可进入spss的主界面 SPSS运行对话框 二 SPSS的5个窗口 1 数据编辑窗口 SPSSDataEditor 以 sav 为扩展名 是spss数据文件2 结果管理窗口 SPSSOutputViewer 以 spo 为扩展名 是spss的结果文件3 草稿结果窗口 SPSSDraftviewer 以 rtf 为扩展名 是spss草稿文件4 语法编辑窗口 SPSSSyntaxEditor 以 sps 为扩展名 是spss语法文件5 脚本窗口 spssscripteditor 以 sbs 为扩展名 是spss脚本文件常用的是数据编辑窗口和结果管理窗口 数据编辑窗口 1 数据编辑窗口 SPSSDataEditor 此窗口类似于Excel窗口 SPSS处理数据的主要工作都在此窗口进行 它分为两个视图 1 数据视图 如图1 3 a 显示具体的数据 一行代表一个观测个体 SPSS中称为Record 一列代表一个属性 SPSS中称为Variable 2 变量视图 如图1 3 b 专门显示有关变量的信息 包括变量名称 每个变量的各种属性 格式等等 图1 3 a 数据视图 图1 3 b 变量视图 菜单栏 打开新的数据编辑窗口 当没有输入任何数据时 所有行 列的标号都是灰色的 见图 注意 第一行第一列的单元格边框为深色 表明该数据单元格为当前单元格 2 结果管理窗口 SPSSOutputViewer 又称结果视图 用于存放分析结果 如图 类似于windows的资源管理器 整个窗口分为两个区 左边 目录区是spss分析结果的一个目录右边 内容区 是与目录一一对应的内容 3 草稿管理窗口 SPSSDraftviewer 草稿结果是结果的一种简化文本格式 实际上就是word所兼容的rtf超文本格式 因此可以在没有安装spss的电脑上使用文字编辑软件打开 草稿管理窗口 SPSSDraftviewer 4 语法编辑窗口 SPSSSyntaxEditor spss最大的优势在于简单易用 即菜单 对话框式的操作 除此之外 spss还提供了语法方式或程序方式进行分析 这个方法既是对菜单功能的一个补充 也可以使繁琐的工作得到简化 尤其适用于高级分析人员 语法编辑窗口 SPSSSyntaxEditor 5 脚本窗口 spss脚本是用saxbasic语言写的程序 可以像spss宏一样构建和运行spss命令 而且脚本可以在命令中利用当前数据文件的变量信息 还可以对结果进行编辑或者构建一些新的自定义的对话框 脚本可用于使spss内部操作自动化 使结果格式自定义化 实现spss新功能以及将spss与VB和VBA兼容应用程序连接 第二章数据录入与数据获取 第一节数据格式概述一 用于分析的数据资料有两种 1 原始资料 如调查问卷中的数据 录入SPSS软件 建立数据文件 2 已经被录入为其他数据格式的资料 需要将其内容直接读入SPSS中 二 统计软件中数据的录入格式1 同一观察对象的数据应当独占一行2 同一个指标的测量数值都应当录入到同一个变量中去 即每一个测量指标或影响因素只能占据一列的位置 数据库是一个二维表结构 行列表结构 列是变量 variable 行为个体 case record 数据表中的一个格子 叫做cell 要记住 一个格子放一个数据 可以是数值或字符 三 建立数据库的步骤 1 定义变量 变量名 变量属性 就是给每个指标起个名字 再对每个指标的一些统计特性作出制定 2 输入数据 即把每个被访者的各指标取值录入为电子格式 因此这里首先介绍一下变量的各种属性问题 进入SPSS数据编辑窗口以后 单击左下方的VariableView 变量表 进入变量视图 我们可以看到spss会为每一个变量指定10种变量属性 四 定义变量 definedvariable 1 Name 变量名 在该选项下方的方格中 单击定位后 双击激活方格 进入编辑状态 输入变量名 10 0版本最大可输入8个英文字符 4个中文字符 系统默认值为VAR00001 1 Name 变量名 如果不对变量进行定义直接输入的话 就会出现这样的情况 从Spss12 0开始 变量名在8个字符之内的这个限制已经被取消了 最多可以有64个字符 但出于兼容性的考虑 变量名的定义还有一些限制 即1 不能以数字开头 2 中间不能有空格 3 一个数据文件中不能有相同的变量名等 当然 我们只要在使用中尝试即可 不必记那么多规则 2 Type 变量类型 SPSS中 变量有三种基本的类型 分别是 数值型 字符型和日期型 根据不同的显示方式 数值型又被细分了5种 所以SPSS中的变量类型共有8种 系统默认值为数值型 Numeric 单击Type单元格 方格的右侧会出现按钮 单击该按钮 会弹出变量类型对话框 在以上三大类变量类型中 数值型是spss中最常用的变量类型 因而默认为数值型 数值型的数据是由0 9的阿拉伯数字和其他特殊符号 比如美元符号 逗号或圆点 小数点 组成 如工资 年龄 成绩等变量都可以定义为数值型数据 在选定了变量类型以后 通常在对话框右侧还有选项供选择 比如 如果选择数值型 如上图 则会出现width和decimal Width 用于定义数值位数 系统默认为8位 根据需要可以进行修改 注意 小数点要占1位 Decimal 用于定义小数位数 系统默认为2位 根据需要可以进行修改 试试宽度8位改2位 小数位数2位改0位 日期型如下 日期型数据主要在时间序列分析中比较有用 在较为简单的分析问题中完全可以用普通数值型数据来代替 美元数值型如下 String 字符型数据 也比较常用 默认宽度为8个字符位 它区分大小写字母 并且不能进行数学运算 字符型数据在SPSS的数据处理过程 比如在计算生成新变量时 中是用一对引号引起来的 需要注意的是 在输入数据时不应输入引号 否则 双引号将会作为字符型数据的一部分 Characters 定义字符串长度 系统默认为8位 一个中文字符占2位 3 width 数值位数 相当于type对话框中的width选项 单击选项下的方格定位后 方格右方会出现上下按钮 单击可增加或减少位数 或双击后直接在方格中填入位数 4 decimals 小数位数 4 decimals 小数位数 相当于type对话框中的decimal选项 单击选项下的方格定位后 方格右方会出现按钮 单击可增加或减少位数 或双击后直接在方格中填入位数 5 labels 变量名标签 5 labels 变量名标签 即变量说明 对变量名 name 的含义进行进一步解释说明 该标签会在结果中代替变量名 输出 以方便阅读 增强变量名的可视性和统计分析结果的可读性 具体操作是 单击定位后 双击激活方格 进入编辑状态 输入变量标签 从Spss12 0开始 变量名在8个字符之内的这个限制已经被取消了 最多可以有64个字符 但出于兼容性的考虑 变量名的定义还有一些限制 即1 不能以数字开头 2 中间不能有空格 3 一个数据文件中不能有相同的变量名等 当然 我们只要在使用中尝试即可 不必记那么多规则 6 values 数值标签 6 values 数值标签 用于定义变量值 是对变量取值含义的解释说明信息 数值标签对于分类变量来说 是必不可少的 它不但使分类变量的数据录入变得更加方便 而且明确了数据的含义 也同样增强了分析结果的可读性 注意 第一行表示你赋予的变量值 数值 也就是编码 第二行 是标签 表达的是它代表的真实含义 点击add按钮 最后单击ok按钮 数值标签就设置完成了 此时做任何分析 在结果中都有相应的标签出现 做任何分析 在结果中都有相应的标签出现 如果现在就想看效果 切换回dataview界面 然后选择菜单view valuelabels 就会看到下述结果 操作后界面将变成下面这样 每个变量值被变量标签所替代 在单元格中 多了一个下拉按钮 可以通过选择进行修改 7 missing 定义缺失值 Missing项是一个重要的 而且容易被忽视的选项 它用于定义变量缺失值 Spss中缺失值有两大类 一类是用户自定义缺失值 一类是系统缺失值 对于数值型的数据 系统缺失值用一个圆点 表示 而字符型变量默认就是空字符串 如果在问卷调查中 有些数据项漏填了 则数据录入时只能跳过 那么相应的单元格就会被系统自动当作缺失值来处理 例如 用户自定义缺失值 自定义缺失值 往往出现在一些设计比较严格的大型调查中 在一些题目选项处有的会给出这样的选项 不知道或拒答 相应的代码可能用9或者99来表示 那么显然 这里的99不是一个真实的答案 仅仅是缺失值代码 需要告知spss这个特定的标记数据 让他在统计分析的时候区别对待缺失值和正常的分析数据 discretemissingvalues 指定离散的缺失值 最多可以定义3个值最后一行 指定缺失值所在的区间范围 并可以同时指定一个离散值 8 columns 列宽 用于调整数据表中各列的显示宽度 系统默认为8位 9 align 定义字符排列方向 分别为左对齐 右对齐 居中 系统默认为右对齐 10 measure 数据量度选项Scale 定量变量Ordinal 有序分类变量Nominal 名义变量 分类变量 就数据录入这部分内容而言 变量属性的设置是最重要的一部分工作 属性的设置不仅涉及对错 还有一个设置好坏的问题 属性设置的好 会简化后边的数据分析工作 所以不可小看这部分工作 第二节数据的直接录入 在spss中 新建一个数据文件非常容易 只要打开spss 系统就已经生成了一个空数据文件 用户只要按自己的需要 定义变量 输入数据 保存 即可 练习 某医生观察了一组住院病人 完成了其中24名患者的资料收集 指标包括 观察编号 住院号 inno 入院日期 indate 年龄 age 性别 sex 身高 xl 单位 cm 体重 x2 单位 kg 血压 收缩压x3 舒张压x4 单位 mmHg 空腹血糖 x5 单位 mmol L 和胰岛素样生长因子 1水平 igf 1 x6 单位 ng mL 并根据临床情况将患者的病情分为五级 x0 1为正常 2为一级 3为2级 4为3级 5为4级 原始数据见表 简单 请建立数据库 1 定义变量名 定义所有的变量名 单击name选项下第一单元格 输入 编号 再单击下面第二个定位 输入 inno 依次输入其它变量名 最后回车或者单击任意方格 所有变量的其它选项激活 为默认设定 在绝大多数情况下 spss给出的默认数据类型和数据精度可以满足需要 如果默认值满足分析的需要 变量定义就到此结束了 否则就需要对不满足条件的选项进行进一步的设置 2 定义Type选项 前边两个都是数值型数据 默认状态即可 第三个变量 入院日期 是日期型数据 默认状态为numeric 需要更改下 更改步骤为 设定为日期型变量后 我们发现变量表中width和decimals选项变成了灰色 变量 性别 sex 为字符变量 有一个中文字符 进入type 选择string 单击characters右侧编辑栏 将数字改为2 ok返回 可见变量视图中width和decimals选项会自动显示为2和0 3 定义中width和decimals选项 根据具体情况进行更改 有两种方法 以身高 x1 为例166 0 单击变量x1的decimals选项 单击上下按钮 由于小数位数是一位 因而将2改为1 或者双击进入编辑状态 输入1 然后单击width选项 我们看身高的字符宽度是5位 小数点算一位 那么就将8改成5 单击其它任意方格或者回车 完成 单击变量x1的type选项 进入type对话框 将右侧width数值栏8改成5 decimals数值栏 2改成1 ok 返回注意 先改小数位数 再改宽度 避免矛盾 如将宽度改为2 此时小数位数默认为2 就会提示出现错误 可以试验一下 请大家完成 4 定义label选项和values选项 这两个选项分别为变量标签和数值标签 理论上 所有变量均可以定义变量标签 数值标签只用于分类变量的说明 1 单击变量x0的label选项 输入 病情分级 回车确认 变量标签完成 2 单击变量x0的values选项方格 单击省略号按钮 5 定义missing选项 第三条的最后一个单元格 数值为0方法 单击x6的missing那个选项 单击省略号按钮 进入缺失值定义对话框 选定discretemissingvalues选项 单击下方的数值栏 输入0 ok即可 设定后 数值0缺失 6 定义columns align选项 为数据窗口的显示格式 可取默认设定 7 定义measure选项 数据量度选项Type为numeric时 默认为scaleType为string时 默认为nominal 本例 原始数据中 病情分级为有序分类变量 应选择ordinal 二 输入数据 完成变量定义后 单击左下方dataview标签 激活数据窗口 输入数据 回车 如果想查看变量标签 将鼠标箭头指向某变量名 就会出现所定义的变量标签 注意 输入数据时 回车之前 数据单元格内左对齐显示 表示该单元格为第一次录入数据 同时数据栏内同步显示出输入的数值 如果想在一个界面中显示更多数据列 可调整列宽 方法 1 直接缩小列宽 与excel操作相同 2 返回变量表 调整columns位数 一般columns的位数应大于width的位数 否则显示不完整 注意 不得不提醒大家 数据录入过程中 要随时注意保存 如果突然断电或者死机 辛苦工作的成果将付之东流 三 变量标签和数值标签的意义 定义变量标签后 在其它调用该数据库的操作中 变量标签会与变量名同时显示 在输出结果中 会以标签代替变量名 非常直观 数值标签与变量标签的作用相似 注意一点 在对数值进行编码时 尽量用数值代码 值标签这种录入方式 尽量不采用字符代码 值标签这种录入方式 例如 比较不同病情分级的收缩压水平 Analyze comparemeans means 变量名和数值都是用标签来显示的 收缩压 而不是x3 病情分级 而不是x0 正常 一级 二级 三级 而不是1 2 3 4 第三节数据编辑 1 数据修改 在单元格内 或在编辑栏修改即可2 数据的复制和粘贴 选定 右键copy paste 或者在编辑器菜单栏中选择edit copy paste 3 数据删除 单元格内数据删除 1 选定单元格 delete键 2 单击右键 clear 3 在编辑器菜单栏中选择edit clear整条记录删除 在序号栏上 选定要删除的序号 delete clear 4 变量删除 1 在数据窗口 选定某一个变量所在的列 delete 或clear 2 在变量窗口 单击变量所在的序里号 行 delete 或clear 第四节数据保存 转换和读取 1 数据保存 转换在Spss建立的数据库 默认以spss文件格式报春 后缀名为 sav 保存已建立的数据库 有两种方式 1 以spss文件格式 sav 保存 file save 确认 或单击快捷栏上保存按钮 2 以其它文件格式保存或换名保存 file saveas 确认 可转换成 excel dbf等多种格式 如果要保存一个新的未命名或未保存过的数据库 都会进入savedataas 对话框 练习 1 把刚才建立的数据库保存 命名为sample sav2 将文件名改为data1 sav 保存 并另存为同名的excel格式文件 2 数据库读取 1 打开spss文件 sav格式 1 在spss运行对话框中 选中openanexistingdatasource 选中要打开的数据库文件 如果没有 选中morefiles ok 2 菜单栏 file open data 确定 进入openfile对话框 单击搜索栏的下拉按钮 选择要开打的文件 2 数据库读取 2 打开excel文件 2 打开excel文件 Spss可以读入许多非spss默认类型的数据文件 方式主要有三种 A直接打开B利用文本向导读入文本数据C利用数据库ODBC接口读取数据 下面将以常见的Excel格式的数据 文本数据为例 介绍spss获取数据的功能 步骤 File open data 或单击快捷工具栏上的 打开文件 按钮 弹出openfile对话框 单击文件类型 选择所需的文件类型 然后选中打开的数据文件 练习 选中文件后出现下面的对话框 首先要了解excel文件的结构 1 包括几个数据表 工作表 具体应当打开哪个表2 如果不需要所有数据 只需读入一部分 这时需要了解读入的数据的精确位置 如单元格A2 F5 3 第一行是否是变量名 数据全部导入 导入部分数据 A1 C10 数据读入的优点 1 这种直接读取的方法优于 拷贝 粘贴 可以顺利地进行变量名的转化 2 可以直接读取字符型变量 如果用 拷贝 粘贴 地方法 字符型变量就全部变成缺失值了 3 操作简单 不容易出错 就和读取spss自己的文件一样方便 3 读入文本文件 练习 读入文本格式的病人基本资料 定义在数据预览窗口中所选择的变量 顾名思义 在这个对话框中 用户可以在数据预览窗口中选择某一列变量 更改其变量名和类型 变量类型等属性需要重新设置 第三章结果输出 一 结果窗口概述作为功能强大的统计分析工具 为了能够使得分析结果更为美观易读 更好地满足用户的需求 spss一共提供了4种格式的统计分析结果 表格 文本 标准图和交互图 1 表格格式 1 绘制表格用于表述数据 2 大部分分析结果也都以专用表格的形式展示 这些表可以是二维表 也可能是多维表 3 二维表 多维表都可以作为 spsspivottable 对象而粘贴到其他应用程序 如word excel powerpoint 中 并且依然利用spss对这些表格进行编辑 Spss的指标功能非常强大 能很好地满足用户各种情况下的要求 2 文本格式随着版本的增加 文本输出已经越来越少了 这些文字可以随意进行拷贝粘贴 格式设定等操作 3 标准图与交互图 注意 结果是单独的一个文件 不会保存在数据库里边 因而要赋予名称进行保存 练习 继续前面的例题 比较不同病情分级的收缩压水平并作条图 步骤 1 比较收缩压水平 Analyze CmopareMeans Means 进入Means过程对话框 将变量 收缩压 x3 和 病情分级 x0 分别放入dependentlist栏和independentlist栏 ok 2 作图 步骤 Graphs bar 进入Barcharats对话框 单击simple单击summariesforgroupsofcases define 定义 对即将作图的变量进行选择 进入definesimplebar对话框 单击othersummaryfunction选项 变量 收缩压 x3 和 病情分级 x0 分别放入variabe栏和categoryAxis栏 ok 作图结果就加入到了当前已打开的接过文件中 请大家注意 看左边的目录区增加了新的结果目录 结果目录一般包括四个子目录1 tite 分析或作图方法名称2 notes 分析过程的各种参数 语法等 默认为关闭状态3 caseprocessing 显示分析所调用个体数据的情况4 report 分析结果点击相应目录即可查看相应结果 也可直接用鼠标上下移动 二 结果文件编辑1 title的编辑 在内容区 双击means 进入编辑状态 输入 收缩压均数 2 report表格编辑 双击表格更改表格名 双击表格名report 更改 输入 不同病情分级收缩压水平 3 report表格格式编辑 要修改表格格式 须在分析前进行定义 步骤 edit options 进入options 参数 对话框 单击pivottables标签 进入该页 选择样本格式 再次运行分析过程 得到不同形式的表格结果 4 graph图表编辑 1 调整大小 2 图表结构编辑 方法 1 双击图表 出现编辑菜单 2 单击右键 选择spsschartobject open 激活图表编辑器spsscharteditor 可以对图表的线条 标记 颜色 坐标刻度 做标题等进行修改 具体方法 统计图 一章详述 三 结果文件输出 1 将选定的表格或图表粘贴到word或powerpoint文件中 1 步 复制 第一种 在结果文件中 光标指向表格或图表 单击右键 出现编辑菜单 选择copyobject第二种 选定 菜单栏edit copyobject 2 步 粘贴 打开word或powerpoint文档 菜单栏edit paste 或单击右键 在编辑菜单上选择paste 可将表格或图表粘贴到相应文档 2 将选定的表格转换成其他格式输出表格可以转换成文本文件 txt 或超文本本件 html 图表可以转换成JPEG PNG格式等多种图像文件加以保存 表格的转换输出步骤 在结果文件中 光标指向表格或图表 单击右键 出现编辑菜单 选择export 或菜单栏上操作 出现export对话框 图表的转换输出步骤 1 编辑 指向图表 右键 编辑菜单 选择spsschartobject open 激活图表编辑器spsscharteditor 2 在spsscharteditor菜单栏上 选择file exportchart 进入对话框 3 在对话框中指定输出文件所在文件夹和文件名 在文件名处输入文件名 选择图像格式 保存 四 结果文件的保存 1 Spss的分析结果可以保存为spss自身的格式 spo 格式 操作 file 直接save即可 或换名保存 saveas 2 但除此之外 还可以使用导出功能以外另外几种常用的格式 具体有几下几种格式可供选择 HTML TEXT 多种格式 操作 file Exportoutput 五 结果文件的读取 File open output 在一个数据编辑器中 允许打开一个或多个结果文件 若打开多个结果文件 最后打开的为默认结果文件 在spss数据编辑器或任何一个已打开的spssviewer中进行新操作 结果都将记录在最后打开的结果文件上 如果关闭最后打开的结果文件 默认结果文件将改为第一个打开的结果文件 Spss系统参数设定选择Edit options 可以对数据 表格 图表 草稿 标题等格式 以及数据编辑器 结果阅读器 草稿阅读器的视图界面进行定义和修改 第二章第四节数据整理 一切统计分析都是以数据为基础的 在数据文件建立好以后 还需要对数据进行必要的加工处理 对同一个数据往往要从各种不同的侧面进行研究 采取多种统计方法进行分析 而不同的统计方法对数据文件结构的要求不尽相同 就需要对结构进行重新调整或转换 这项工作称数据整理 在spss中 数据文件的管理功能基本上都集中在Data和Transform菜单上Data 实现变量或个体级别的管理如插入新变量 新个体 记录排序 Transform 实现文件级别的管理如变量排序 文件合并 拆分等 一 插入或删除变量或个体 一 插入个体例题 以病人基本资料为例 请在个体5与个体6之间插入一个个体 步骤 单击个体6编号 行首 选择Data Insertcase 输入数据49 17204 二 插入变量例题 以病人基本资料为例 请在变量sex与变量x0之间插入一个变量pulse 脉搏 步骤 单击变量x0 列首 选择Data Insertvariable 出现空白变量var00001 切换到变量窗口 定义变量属性 输入数据 一 插入或删除变量或个体 一 插入或删除变量或个体 三 删除个体或变量例题 删除个体8 删除变量indate步骤 1 单击选中个体8 Edit Cut或Clear单击变量名indate Edit Cut或Clear2 或单击右键 进行操作 四 恢复已删除的个体或变量Edit Undo不仅能恢复前一删除操作的个体或变量 在前的删除操作步骤也能恢复 一 插入或删除变量或个体 二 个体排序 Sortby 排序变量栏 如果放入两个变量 则先按第一个变量排序 在对第二个变量进行次排序 Ascending 升序排列 默认 练习 对变量inno 住院号 进行升序排列 对age降序排列对不同性别进行身高的升序排列 三 合并文件 统计分析的第一步工作是数据录入 在数据量较大时 经常需要把一份大的数据分成几个小部分 然后再分别由不同的录入员进行录入 以缩短录入时间 就会出现一份大数据分别储存在几个不同的数据文件中的现象 除此之外 如果数据有多个来源 则可能会是变量分散在几个文件中 数据文件的合并方式 一 纵向连接 几个数据集中的数据纵向相加 组成新的数据集 其中的记录数是原来几个数据集当中记录数的总和 二 横向合并 按照记录的次序 或者某个关键变量的数值 如住院号 将多个数据集的不同变量合并为一个数据集 新的数据集包含的变量数是所有原数据集当中不重名变量的总和 合并中的注意事项 注意 进行合并的文件必须都存储为spss格式 如果用程序方式 可以一次实现多个数据文件的合并 如果使用对话框方式 一次只能进行两个spss数据文件的合并 且其中一个必须是已被打开的当前数据文件 纵向连接 纵向连接 即将一个spss数据文件的内容追加到数据编辑窗口中当前数据的后面 条件 一 待合并的数据文件 其内容合并是有实际意义的 二 为方便合并 在不同数据文件中 数据含义相同的变量 最好定义相同 变量名 类型 长度等 方便自动匹配 例 将病人基本资料2 sav中的记录添加到病人基本资料1 sav中 注意 两个文件中对性别的命名不同 基本资料2 sav中的sex对应了基本资料1 sav中的gender 步骤 1 打开基本资料1 sav 2 Data Mergefile AddCases 并选择待合并的文件基本资料2 sav 横向合并 将一个已有的spss数据文件中的若干个变量加到当前数据编辑窗口的数据中 即新加的内容接到当前数据的右边 实质就是按照记录一一对应 左右对接 遵循条件 1 如果没有记录号 必需至少有一个变量名相同的公共变量 这个变量名是两个数据文件合并的依据 称关键变量 如学号 贵宾卡号等 关键变量可以是多个 2 合并前按关键变量进行升序排列 3 为方便合并 不同文件中数据含义不同的 变量名应取不同名称 练习 将病

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论