




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 SPSS 基础基础 目录目录 第一章第一章SPSS 简介简介 1 1 SPSS 概述概述 1 2 SPSS 窗口窗口 1 数据编辑窗口 data editor 2 输出窗口 Viewer 3 程序编辑窗口 1 3 SPSS 系统参数的设置系统参数的设置 1 3 1 Options 选择对话框选择对话框 1 3 2 通用参数设置通用参数设置 1 3 3 结果输出窗口参数设置结果输出窗口参数设置 1 3 4 Currency 窗口参数设置窗口参数设置 第二章第二章 数据文件的编辑与管理数据文件的编辑与管理 2 12 1 建立与保存数据文件建立与保存数据文件 2 1 12 1 1定义新变量定义新变量 1 变量名 Name 2 变量类型 Type 3 变量长度 Width 4 变量小数点占位 Decimal 5 变量标签 Lable 6 变量值标签 Values 7 缺失值的定义方式 Missing 8 变量的显示宽度 Columns 9 变量显示的对齐方式 Align 10 变量的度量方式 Measure 2 1 2 数据的输入数据的输入 2 2 1 3 数据的保存数据的保存 2 2 读如其他格式的数据文件读如其他格式的数据文件 例例 2 2 12 2 1 读入 EXCEL 数据文件 student xls 并保存为同名的 SPSS 数据集 student sav 2 32 3 FileFile 菜单中的其他条目菜单中的其他条目 2 42 4 数据文件数据文件的编辑的编辑 2 4 1 单元值的查找单元值的查找 2 4 2 增加或删除一个观测增加或删除一个观测 2 4 3 分析数据的排序分析数据的排序 2 4 4 分析数据集的转置分析数据集的转置 2 4 5 选取数据的观测子集选取数据的观测子集 2 4 6 分析数据归类分组汇总分析数据归类分组汇总 2 4 7 缺失值的替代缺失值的替代 2 5 数据变量的操作数据变量的操作 2 5 1 增加或删除一个变量增加或删除一个变量 2 5 2 从原有变量构造新变量从原有变量构造新变量 2 5 3 数据排秩数据排秩 2 5 4 产生计数变量产生计数变量 2 5 5 数据重新编码数据重新编码 2 5 6 产生自动分组变量产生自动分组变量 2 5 7 变量集的定义和使用变量集的定义和使用 2 6 数据文件的合并与拆分数据文件的合并与拆分 2 6 1 数据文件的纵向合并数据文件的纵向合并 2 6 2 数据文件的横向合并数据文件的横向合并 2 6 3 数据文件的拆分数据文件的拆分 3 第一章第一章 SPSS 简介简介 1 1 SPSS 概述概述 Statistical package for Social Science 社会科学统计软件包是一个组合式软件包 它集 数据整理 分析过程 结果输出等功能于一身 是世界上著名的统计分析软件之一 但是 随着 SPSS 产品服务领域的扩大和服务深度的增加 SPSS 公司已于 2000 年正式将英文 全称更改为 Statistical Product and Service Solutions 意为 统计产品与服务解决 方案 标志着 SPSS 软件的应用领域有了重大拓展 SPSS 解决方案广泛应用于市场研究 电讯 卫生保健 银行 财务金融 保险 制造业 零售等领域 SPSS 的的 5 大特色大特色 智能操作 易学易用 一般情况下无须编写程序 数据转换接口有很好的兼容性 具有丰富的统计分析功能和完善的分析报告功能 Complex Samples 模块增加了统计建模的功能 SPSS 公司的历史公司的历史 19681968 年 美国斯坦福大学的三位专业背景截然不同的研究生 Norman H Nie C Hadlai Tex Hull 和 Dale H Bent 开发了最早的统计软件系统 他们称呼这个软件系 统为 社会科学统计软件包 简称 SPSS 他们的出发点是使用统计方法来将原始数据转 变为决策所必需的信息 Nie 是一位社会科学家 斯坦福大学的博士生 承担了用户的角 色 提出应用需求 Bent 是斯坦福大学的运筹学博士生 拥有着数据分析方面的专业知 识 设计出了 SPSS 系统文件结构 Hull 刚从斯坦福大学获得 MBA 学位 由他来负责编 程 19751975 年年 在芝加哥成立 SPSS 总部 19841984 年年 推出用于个人电脑的 SPSS PC 19921992 年年 推出 Windows 版本 同时在纳斯达克上市 股票代码为 SPSS 目前在全球 100 多个国家和地区有分支机构或合作伙伴 直系员工超过 2000 人 SPSS 软件家族广泛应用于自然科学 技术科学 社会科学的各个领域 世界上许多有影 响的报刊杂志纷纷就 SPSS 的自动统计绘图 数据的深入分析 使用方便 功能齐全等方 面给予了高度的评价与称赞 SPSS 是世界上应用最广泛的专业统计软件 全球约有 25 万家 SPSS 公司产品的用户 它们分布于通讯 医疗 银行 证券 保险 制造 商业 市场研究 科研教育等多个领域和行业 全球 500 强中有 80 的公司使用 SPSS 而在 市场研究和市场调查领域有超过 80 的市场占有率 在国际学术界有条不成文的规定 即在国际学术交流中 凡是用 SPSS 软件完成的计算和统计分析 可以不必说明算法 由 此可见其影响之大和信誉之高 4 1 2 SPSS 窗口窗口 1 数据编辑窗口 数据编辑窗口 data editor 基本功能基本功能 建立建立 SPSS 数据文件数据文件 主要构件主要构件 标题栏和系统状态栏 菜单栏 工具栏 文件以文件以 sav 为扩展名为扩展名 2 输出窗口 输出窗口 Viewer 以 spo 为扩展名 3 程序编辑窗口 程序编辑窗口 编辑 SPSS 程序 通过运行主菜单的 RUN 命令将编辑好的程序一次性地提交给计算机 执行 也可以将编好的程序保存为一个后缀为 sps 的文件供以后需要的时候调用 1 3 SPSS 系统参数的设置系统参数的设置 1 3 1 Options 选择对话框选择对话框 Edit Options 1 3 2 通用参数设置通用参数设置 1 3 3 结果输出窗口参数设置结果输出窗口参数设置 1 3 4 Currency 窗口参数设置窗口参数设置 5 第二章第二章 数据文件的编辑与管理数据文件的编辑与管理 2 12 1 建立与保存数据文件建立与保存数据文件 2 1 12 1 1 定义新变量 大多数情况下我们需要从头定义变量 在 SPSS 10 0 中 定义变量的操作界面和 FoxPro 等数据库非常相似 只需单击左下方的 Variable View 标签就可以切换到变量定义 界面开始定义新变量 1 变量名 Name 变量名必须以字母 汉字或 开头 剩下的字符可以是字母 数字 句点 等 变量名不能以句点结尾 名字长度不能超过 8 个字符 空格和特殊字符不能被用 如 每一个变量名必须是唯一的 重复的变量名是不被允许的 变量名无大小写之分 下列关键词不能用作变量名 all NE EQ TO le lt by or gt and not ge with 举例 location loc 5 x 1 over 500 2 变量类型 Type 变量类型可由变量类型对话框确定 6 在 SPSS 数据集中 变量分为 8 种类型 主要有字符型变量字符型变量 String 和数值型变量数值型变量 numeric Numeric 数值型 Comma 加有逗号的数值型 Dot 加有圆点的数值型 Scientific notation 科学计数型 Date 日期型 Dollar 货币型 Custom currency 用户自定义型 String 字符型 3 变量长度 Width 4 变量小数点占位 Decimal 5 变量标签 Lable 6 变量值标签 Values 变量值标签则在它右侧的 Value 框定义 以性别 为例 单击 Value 框右半部的省略号 会弹出变量值标签对话框如下 7 8 上部的两个文本框分别为变量值输入框和变量值标签输入框 分别在其中输 入 f 和 女生 此时下方的 Add 钮变黑 单击它 该变量值标签就会被加 入下方的标签框内 与此类似定义变量值 m 为 男生 最后按 OK 变量 值标签就设置完成 切换回 Data View 界面 然后选择菜单 View Value Labels 7 缺失值的定义方式 Missing 定义缺失值的作用 凡是在定义的缺失值范围内的数据不参与统计分析 SPSS 有两类缺失值 系统缺失值和用户缺失值 数据长方形中任何空的数字单元都被认为是系统缺失值 用点 表示 由特殊原因造成的信息缺失值被认为是用户缺失值 例如调查问卷中 被调查 者不愿意回答的项目可定义为用户缺失值 单击 missing 框下相应变量右侧的省略号 会弹出缺失值对话框如下 9 no missing values 无缺失值 系统默认选项 discrete missing values 定义离散缺失值 选择该选项后 激活下面 3 个输入框 可 以在其中指定 3 个数值作为缺失值 也可以少于 3 个 例如对于性别变量 值 2 3 4 都 被认为是非法的 在输入数据过程中有可能输入了这几个数 则可以把这 3 个值分别输入 到 3 个矩形框中 range puls one optional discrete miss 定义一个缺失值的范围 选择该选项后 激 活下面 3 个输入框 在 low 和 hight 输入框中分别输入缺失值的下限和上限 可以在最下 方的 discrete 框中输入范围之外的一个离散值 8 变量的显示宽度 Columns 9 变量显示的对齐方式 Align 选择变量值显示时的对齐方式 系统默认是右对齐 备选方式 Left 左对齐 Right 右对齐 Center 居中对齐 10 变量的度量方式 Measure 为了区分变量在分析中的不同作用 又按变量的度量方式分为三类 选择变量的度量方式 系统默认是定距变量 备选方式 Scale 定距变量 必须是数值型变量 可以对其观测值进行四则运算 Ordinal 顺序变量 可以是数值型的 也可以是字符型的 可以对其观测值进 行排序 10 Nominal 名义变量 可以是数值型的 也可以是字符型的 常起分类作用 使用该窗口 我们可以一次定义许多新变量 不会象老版本那样一个一个的定 义了 2 1 2数据的输入 2 1 3数据的保存 在对数据做了修改后 保存数据文件是必不可少的工作之一 选择菜单 File Save 如果数据文件曾经存储过 则系统会自动按原文件名保存数据 否则 就会弹出和选择 Save as 菜单时相同的 Save as 对话框 里面可以保存 的数据类型和可以打开的几乎一样多 选择合适的类型 确定就是了 2 2 读如其他格式的数据文件读如其他格式的数据文件 SPSS 可以直接读入许多格式的数据文件 选择菜单 File Open Data 或直接单击快捷工具栏上的 按钮 系统就会弹出 Open File 对话框 单击 文件类型 列表框 在里面能看到直接打开的数据文件格 式 分别是 SPSS sav SPSS 数据文件 6 0 10 0 版 SPSS PC sys SPSS 4 0 版数据文件 Systat syd syd 格式的 Systat 数据文件 Systat sys sys 格式的 Systat 数据文件 SPSS portable por SPSS 便携格式的数据文件 EXCEL xls EXCEL 数据文件 从 5 0 版 2000 版 Lotus w Lotus 数据文件 SYLK slk SYLK 数据文件 dBase dbf dBase 系列数据文件 从 dBase II IV Text txt 纯文本格式的数据文件 data dat 纯文本格式的数据文件 选择所需的文件类型 然后选中需要打开的文件 SPSS 就会按你的要求打开你要使用 的数据文件 并自动转换为数据 SPSS 格式 例例 2 2 12 2 1 读入 EXCEL 数据文件 student xls 并保存为同名的 SPSS 数据集 student sav 2 32 3 FileFile 菜单中的其他条目菜单中的其他条目 Disp Data Info 该菜单项用于显示数据的基本信息 选择它后会弹出非常类似于打开文件 的一个对话框用于选择数据文件 选择好后按 OK 系统就会在结果窗口中列出 所选数据的基本情况 如建立时间 标签设置 记录数 变量设置等 11 Apply Data Dictionary 即使用数据字典 该功能使你可以直接在新数据集中套用以前定义好的变 量设置 格式 标签等 但不包括数据类型 例 打开 Li1 1 sav 文件 将 变量 x 的长度从 8 改为 4 标签删掉 然后选择菜单 File Apply Data Dictionary 在文件对话框中选择 Li1 1 sav 并按 OK 即将 Li1 1 sav 的变量 设置按相同变量名一一套用在现在的数据集上 Cache Data 建立数据缓冲区 以前 SPSS 每执行一条命令都会重新读取所需的数据 如 果是从远程用 SQL 调用数据库 这会非常的费时 现在使用 Cache Data 可以 将数据全部读入暂存盘 建立活动数据的缓冲区 大大加快处理速度 如果是 处理本机数据的话 该命令对速度的提升不是非常明显 Print 和 Print Preview 这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来 其中 Print Preview 是新增加的 使用上和 WPS2000 的打印预览非常相似 其实用 的是同样的程序 不过和 SPSS 结果的打印程序一样 用 SPSS 直接打印数据 非常的浪费纸张 Stop Processor 用于停止执行当前的 SPSS 命令 由于 SPSS 处理速度非常的慢 如果你正在 对一个大型的数据执行统计命令 等了半天都没有结束 可是你的结果还没有 存 执行命令时又存不了 怎么办呢 试试这个命令吧 但并非所有的命令都并非所有的命令都 可以喊停的 许多数据库操作命令 计算变量 合并等 好象就停不了 可以喊停的 许多数据库操作命令 计算变量 合并等 好象就停不了 2 42 4 数据文件数据文件的编辑的编辑 在 SPSS 中 数据文件的编辑 整理等功能被集中在了 Edit Data 和 Transform 三个菜单项中 Data Insert Variable 在选中的单元格之前的一列插入一个新变量 Insert Cases 在选中的单元格之前的一行插入一个新观测 Goto Case 定位到指定的观测值 Sort Case 按某变量的取值对观测值进行排序 Transpose 对数据文件进行转置 12 Merge Files 合并数据文件 Aggregate 对数据进行分类和不分类的汇总 Orthogonal Design 正交设计 Split File 按照某个分组变量对数据文件进行拆分 Select Cases 选择观测值 Weight Cases 对观测值加权 下面我们将根据其功能来分别讲述 2 4 1 观测与变量的查找 编辑 Edit 转至个案 Go to Case 打开 转至 G Go to Case 对话框 2 4 2 增加或删除一个观测 增加一个新的行 激活需要添加行的下一行的任意单元 选择EditInsert Case 删除一个行 单击要删除行的行头 将该行全部选中 按 Delete 键 2 4 3 分析数据的排序 观测数据的排序 特别是逐级排序 可以从统计角度了解整体数据的取值情况 例 将数据集补钙产品 sav 按 性别 降序 再按 问卷编号 升序排序 操作 选择菜单 数据 Data 排序个案 Sort Cases 系统弹出排序个案 Sort Cases 对话框 下方的排列顺序 Sort Order 单选钮 有升序和降序两种选择 请注意 该单 选钮是和上方的 Sort By 框一起使用的 具体方法如下 确认降序单选钮被选择 将 性别 选入 Sort By 框 13 选择升序单选钮 将 问卷编号 选入 Sort By 框 2 4 4 分析数据集的转置 将观测 行 和变量 列 位置互换 特别适用于实现存 取 Excel 文件进行数据共享功能前 后的预操作 例 将数据集 补钙产品 sav 中的变量 性别 年龄 和 居住时间 进行转置 操作 选择菜单 数据 Data Transpose 打开 Transpose 对话框 将需要转置的变量移入 Variable 列表框 如果在数据文件中有一个变量是代表转置后各变量的变量名 则将该变量移入 Name Variable 列表框中 否则转置后数据集的变量将被分别命名为 Var001 Var002 Var003 单击 OK 2 4 5 选取观测的子集 在统计分析时 有时并不需要对所有的观测进行分析 只需要对某些观测进行分析 例如在补钙产品的市场调查中 我们只对女性被调查者的情况感兴趣 或者只有在本市居 住时间超过 3 年的被调查者才具有统计分析价值 另一种情况是在全部样品中抽取一小部 分样品进行分析 SPSS 的 Select Cases 可以实现这种样本筛选的功能 仍以补钙产品数据 为例来说明 操作 选择菜单数据 Data 选择个案 Select Cases 打开 选择个案 Select Cases 对话 框 14 制定样本筛选方式 Select Cases 对话框右上 Select 下共有 5 种筛选方式 All cases 不进行筛选 选中它则分析所有的记录 If condition is satisfied 按指定条件筛选 单击下面的 If 按钮 在弹出的 Select Cases If 对话框可以设置筛选条件 在右上方的输入框中输入条件表 达式 条件表达式可以用键盘直接输入 也可以左侧的变量列表中选择变量 从下面的计 算器中选择数字和运算符号 在右下方的 Functions 列表中有 SPSS 的常用函数供用户选择 在本例中如果只相对居住时间超过 3 年的被调查者进行分析 则在输入框中输入表达式 time 3 15 Random sample of cases 随机抽取观测 单击下面的 sample 按钮 在弹出的 Select Cases Random sample 对话框中设定随机抽取的观测数 有两种选择 按百分 比抽取记录 在本例中如果想从所有的观测中抽取 30 进行分析 则在 Approximately 后的框中输入 30 或者精确设定从前 n 个观测中随机精确抽取一定量的观测 在本例 中如果想从前 10 个观测中随机抽取 5 个 则按下表填写 Based on time or case range 按顺序抽样 单击 Range 按钮 在弹出的 Select Cases range 子对话框中设定被筛选的观测的起止序号 Use filter variable 使用指定的过滤变量进行观测筛选 选择这一项的前提是数 据文件中已经存在一个过滤变量 所谓过滤变量即只取 0 1 两个值的变量 该 变量取值为 1 的观测将被选中 取值为 0 的观测将被删除 确定未被选中的观测的处理办法 在 Select Cases 对话框的左下 output 下有 3 种选择 Filter out unselect Cases 则在数据文件中根据用户定义的选择条件自动生成一 个变量名为 filter 选择相同值的秩的取值方法 单击 Ties 按钮 弹出 Ties 子对话框 各选项的意义 如下 Mean 相同值的秩取平均值 系统默认值 Low 相同值的秩取最小值的秩 High 相同值的秩取最大值的秩 Sequential ranks to unique values 相同值的秩取第一个出现的秩值 23 2 5 4 产生计数变量 在数据统计中 常常需要进行一些计数工作 主要是针对所有观测或满足一定条件的 观测实现计数 计算出若干个变量中有几个变量的值落在指定区间内 并将计算结果存入 一个新变量即计数变量 例如在补钙产品的市场调查数据中要统计居住时间在 3 到 8 年之 间 年龄在 50 岁以上被调查者人数 操作 选择菜单 转换 Transform 对个案内的值计数 CountCount ValuesValues withinwithin CasesCases 打开 计算个案内值的出现次数 CountCount OccurrencesOccurrences ofof ValuesValues withinwithin CasesCases 对话框 首先在 Target Variable 框中指定一个变量 可以是变量列表中已有的变量 也可以 是将要生成的新变量 然后将需要计数的变量添加到 Numeric Variables 框中 这里选择居 住时间 time 和年龄 age 24 确定需要计数的数值范围 单击 Define Values 打开Values to Count 对话 框其选项有 Value 输入某个指定值作为计数值 System missing 表示以系统指定的缺失值作为计数值 System or user missing 表示以系统或用户指定的缺失值作为计数值 Range 指定数值范围为计数区间 第 2 个 Range 指定为只需要输入最大值 不需 要输入最小值的半闭区间 Lowest through n 即小于等于 n 的区间 第 3 个 Range 指定为只需要输入最小值 不需要输入最大值的半闭区间 n through highest 即大于等于 n 的区间 这里选择第 3 个 Range 输入 50 再选择第一个 Range 输入 3 through 8 单击 ContinueContinue 25 指定条件来选择参与计数的观测 单击 if 按钮 打开 Count Occurrences if Cases 对 话框 一般用系统默认的全部观测参与统计 2 5 5 数据重新编码 产生分组变量 26 有时候搜集到的数据不太适合直接做统计分析 例如对补钙产品数据按居住时间 time 分 析 但变量 time 取值过于分散 不利于分析 希望对居住不同时间段的被调查者进行分析 可以利用 SPSS 提供的重新编码对变量 time 分组 根据原始数据 我们希望将 time 分为 3 组 3 年 4 6 年 7 年 操作 重新编码变量覆盖原变量 Transeform Into Same Variables 打开 Recode Into Same Variables 重新编码变量为新变量 Transeform Into Different Variables 打开 Recode Into Different Variables 单击 old and new values 27 在原数据文件中增加变量 nem time 2 5 6 产生自动分组变量 在 2 5 5 中的重新编码可以按用户要求对数据分组 本节提供一种按分位数对变量分组 的工具 例如对补钙产品数据希望对居住时间 time 按分位数分组 操作 选择 Transeform Categorize Variables 打开 Categorize Variables 对话框 将分组变量 time 移入 Create Variables 列表框 在 Number of categories 输入框中输入分组数目 3 单及 ok 在原数据文件中增加新变量 n time 2 5 8 变量集的定义和使用 2 6 数据文件的合并与拆分数据文件的合并与拆分 纵向合并 Add Cases 横向合并 Add Variables 28 2 6 1 数据文件的纵向合并 纵向合并要求合并的两个或多个数据文件有相同变量和不同的观测 例 合并 studendf sav 和 studendm sav 打开其中一个数据文件 studendf sav 选择菜单 DataMerge FilesAdd Cases 打开 Read File 对话框 选择另一被合并 的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度杭州汽车租赁合同与杭州长租公寓租赁管理协议
- 2025版国际贸易欺诈防范与信用评估合同
- 二零二五年度瓷砖行业品牌授权合同
- 二零二五大连情感修复与离婚协议执行合同
- 2025版数字媒体广告投放合作协议
- 二零二五年度农业产业化合作经营合同范本
- 二零二五年度城市绿化带搭棚改造与美化合同
- 2025版自驾游汽车租赁服务合作协议
- 二零二五年度公共停车场冬季清雪与安全管理服务合同
- 二零二五年度顶级中介房屋买卖担保协议
- 预见性护理在骨科的应用
- 2025年甘肃社会化工会工作者招聘考试(公共基础知识)综合试题及答案
- 高二班主任班级管理课件
- 侵蚀性葡萄胎护理查房
- 2025年行政执法证考试题库及参考答案
- 2025年校招:招商银行试题及答案(可下载)
- 2025年安防生产行业技能考试-安防工程企业技术人员能力验证考试历年参考题库含答案解析(5卷100道集合-单选题)
- 2025年康复治疗师资格考试试题及答案
- 国际营销中心管理办法
- 无痛人流知识课件
- 全国律师会费管理办法
评论
0/150
提交评论