SPSS教程PPT课件.ppt_第1页
SPSS教程PPT课件.ppt_第2页
SPSS教程PPT课件.ppt_第3页
SPSS教程PPT课件.ppt_第4页
SPSS教程PPT课件.ppt_第5页
已阅读5页,还剩220页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 SPSS系统教程 2 第一节SPSS简介 SPSS的含义SPSSforWINDOWS的特点SPSSforWINDOWS的启动与退出SPSSforWINDOWS系统运行方式SPSSforWINDOWS窗口类型SPSSforWINDOWS系统参数设置 3 一 SPSS的含义 SPSS是软件英文名称的首字母缩写 原意为StatisticalPackagefortheSocialSciences 即 社会科学统计软件包 SPSS公司于2000年正式将英文全称更改为StatisticalProductandServiceSolutions 意为 统计产品与服务解决方案 我们现在讲授的主要是SPSSforWindows11 0版 4 二 SPSSforWindows11 0的特点 操作界面极为友好 易于学习 易于使用 是非专业统计人员的首选统计软件 无需花费大量时间记忆大量命令 过程 选择项等 只要粗通统计分析原理 就能得到统计分析的结果 可以根据计算机的设备来选择安装 灵活方便 能非常方便地与其他软件的数据进行转换 分析方法丰富 图表功能强大 输出结果美观漂亮 5 三 SPSS的启动与退出 SPSS的启动使用开始菜单启动SPSS双击SPSS图标启动SPSSSPSS的退出使用FILE菜单中的 EXITSPSS 菜单项退出SPSS单击数据编辑窗右上角 x 的退出SPSS 6 进入SPSS后显示的文件对话框 在数据窗口输入数据选项 运行一个已存在的文件选项 打开一个已存在的数据源程序 使用数据库向导来创造一个新的文件选项 打开一个其它类型的文件 以浏览运行操作指导 7 Spss11 0的界面 数据窗口 变量定义窗口 8 主界面的10个下拉菜单 文件 File 编辑 Edit 视图 View 数据 Data 转换 Transform 统计分析 Analyze 作图 Graphs 工具 Utilities 窗口转换 Windows 帮助 Help 9 四 SPSS系统的运行方式 SPSS系统运行的三种方式 完全窗口菜单运行管理方式程序运行管理方式混合运行管理方式 10 完全窗口菜单运行管理方式 完全窗口菜单运行管理方式主要在数据编辑窗口和输出观察窗口中进行操作 运行方式操作简便 直观 特别适合于初学者 也是本门课程讲授的主要方式 缺点 对话框中包括的是基本参数和基本统计量的选择项 对于某些专业人员来说 可能不能充分满足需要 11 程序运行管理方式 程序运行管理方式是在语句窗口 Syntax 中直接运行编写好的程序的一种方式 分析结果仍然是显示在输出观察窗中 主要用于习惯使用程序的用户 SPSS最初是使用程序来进行统计分析的 12 混合运行管理方式 混合运行方式是以上两种方法的结合方式 操作程序 首先在数据窗中输入数据或利用主菜单中的 File 菜单项打开已经存在的数据文件 然后利用对话框选择分析过程和分析参数 选择后不马上执行 而是用Paste将选择的过程与参数变换成相应的命令语句 在语句窗口中可以进行修改 然后再将程序提交系统执行 13 五 SPSS窗口类型 数据编辑窗口 Newdata 输出窗口 Output1 语句窗口 Syntax 统计图表编辑窗口 Chart 帮助窗口 Help 14 数据编辑窗口 Newdata 数据编辑窗口是一个可扩展的二维表格 用户可在该窗口中建立或编辑数据文件 其主要功能有 定义变量属性 录入数据 修改变量属性 移动记录指针 插入记录 插入新的变量等 在一个SPSS运行期间不能同时打开两个以上的数据编辑窗口 15 输出窗口 Output1 输出窗口是一个文本窗口 其功能是用来显示系统处理的输出结果或系统运行过程中所发生的错误信息 在一个SPSS运行期间可以同时打开两个或两个以上的输出窗口 其中只有一个为主输出窗口 16 语句窗口 Syntax 语句窗口可以用来粘贴SPSS过程的命令语句以及各选项对应的子命令语句 也可以用来手工编辑命令语句 然后将这些命令提交给系统进行运行 在一个SPSS运行期间可以同时打开两个或两个以上的语句窗口 其中只有一个为主语句窗口 17 统计图表编辑窗口 18 帮助窗口 Help 19 六 SPSS系统参数设置 系统初始状态和系统默认值的设置是通过options选择对话框完成的 具体操作是通过打开Edit菜单中的options打开系统参数设置对话框 参数与状态的设置生效的时间不同 有的在确认后立即生效 有的要在下一次启动spss系统时才生效 20 系统参数设置基本操作 21 Spss11 0中系统参数的设置 22 系统参数的设置的主要项目 通用参数的设置 General 观察窗口参数设置 Viewer 草稿窗口参数设置 DraftViewer 标签输出设置 OutputLabels 统计图形参数设置 Charts 交互图形窗口参数设置 Interactive 要点表参数设置 PivotTables 数据功能卡设置 Data 数值型变量自定义格式设置 Currency 稿本窗口参数设置 Scripts 23 通用参数的设置项目 设置日志文件设置内存工作区的大小启动spss时语句窗口状态的设置测度系统参数设置设置显示变量表顺序的方式文件表中文件数的设置启动时输出窗口类型的设置输出通告设置临时文件路径设置 24 通用参数的设置 日志文件 在日志文件中记录系统执行语句将每次运行的语句记录在前次运行语句之后 并存入日志文件将每次存入日志文件时覆盖前次所存 设定内存测度单位选择语句窗口状态设定 声音设置 无声 默认声 自选声音文件 启动时输出窗类型 产生交互式要点图和统计图输出文本格式要点图和统计图 变量显示方式顺序变量标签显示在前变量表中只显变量名变量名按字母顺序按数据文件中变量类型顺序 文件表中文件数设定系统使用过的文件数设定文件暂存处输出声明设置产生新结果时屏幕显示导航器产生新结果时屏幕显示新输出信息 25 观察窗口参数设置 主要项目 初始输出状态设置输出文本的字体 字号设置文本输出页面设置文本输出字型 字号设置与颜色 26 观察窗口参数设置 初始输入状态设置 文本标题字体和大小选择 文本输出字型 字号 颜色设置 文本输出页面设置 27 草稿观察窗口参数设置 主要项目 DisplayOutputItems显示输出项的设置 PageBreaksBetween分页位置设置 在Front栏中设置使用在新的输出中的字体 TabularOutput平面表格输出栏 控制将要点表转换成平面表 即文本输出 TextOutput文本输出栏 控制文本输出页的尺寸 28 草稿观察窗口参数设置 日志中是否显示命令显示警告显示说明信息显示标题显示统计图形显示文本输出显示运行日志显示表格输出 分页设置在每个程序之间分页在每个输出之间插入一个分割符 字体设置 列表输出指定列宽和列分割符形式使用空格为分割符 重复占多个页面表的标题单元格周围显示格线输出表时每栏均为最大列宽和标签长度在character栏内设定列宽和标签最大宽度 在cell栏指定行分割符和列分割符 标准页宽 每行80字符 132字符 自定义字符数标准页长 每页59行 尽可能的页长 自定义页长 29 标签输出设置 主要项目 在OutlineLabeling结果标签栏中 设置输出图形时是否使用标签 在PivotTableLabeling要点表格标签栏中 设置输出表格时是否使用标签 30 标签输出设置 用于设定在输出图形时是否使用标签控制新的要点表中的变量名和描述性变量标签的输出 Labels 使用变量标签来标识每个变量 Names使用变量名来标识每个变量 Namesandlabels 使用变量名和变量标签来标识每个变量 控制新的要点表中的变量名和描述性变量标签的输出 Labels使用变量标签值来标识每个变量 Values使用变量值来标识每个变量 LabelsandValues使用变量值和变量标签值来标识每个变量 要点表标签栏 用于设定在输出图形时是否使用标签控制在新的要点表中的变量名和描述性的变量标签值的输出 Labels 使用变量标签来标识每个变量 Names使用变量名来标识每个变量 Namesandlabels 使用变量名和变量标签来标识每个变量 控制新的要点表中的数据值和描述性的变量标签值的输出 Labels使用变量标签值来标识每个变量 Values使用变量值来标识每个变量 LabelsandValues使用变量值和变量标签值来标识每个变量 31 统计图形参数设置 主要项目 图形模板栏ChartTemplate图形的宽与高比设置参数框ChartAspect图形中文字字体设置栏Font图形填充和线条样式栏FillPatternsandLineStyles图形变框栏Frame 32 统计图形参数设置 图形模板栏新的图形属性采用本对话框之中设置使用一个图形模板来确定图形属性 图形宽高设置栏 可输入宽高比值 框架栏为整个图形画一个框 包括标题和图例为输出的图形部分画出边框 单元格栏在线上标志刻度在线上标志分类 当前设置字体选择图形填充和线条样式使用14种颜色调色板 后根据需要给颜色增加样式使用样式来代替颜色 33 交互图形窗口参数设置 主要项目 ChartLook交互图形外观样式栏DataSavedwithChart栏 控制与交互图形同时保存的信息 PrintResolution栏 控制交互图形打印的精度 MeasurementSystem栏 设置交互图形的度量系统 ReadingPre 8 0DataFiles栏 读取8 0以前版本的数据文件选择项 34 交互图形窗口参数设置 图形外观样式栏可单击Browse选择样式目录 图形数据存储栏当生成图表的数据文件与图表分开时 控制信息与交互图形一起保存只保存综合数据 打印精度栏 测度单元栏 读取8 0前版本的数据文件栏可对数值型变量描述最小值以便将数据分类或指明刻度 35 要点表参数设置 主要项目 TableLook表格外观样式栏 可选择新表格的表格样式 SetTableLookDirectory按钮允许改变系统默认的TableLook目录 AdjustColumnWidthfor控制要点表列宽的自动调整栏 DefaultEditMode设置默认的编辑表格模式 36 要点表参数设置 表格外观栏选择系统提供的表格输出时的外观样式 调整要点表列宽栏列宽调整为标签列宽列宽调整为标签列宽和数据值列宽中较大的一个 默认编辑模式栏Editalltablesinviewer 控制在观察窗口中的要点表或一个单独窗口的激活Editonlysmalltablesinviewer 在观察窗口仅能编辑小的要点表Editsmallandmediumtablesinviewer 在观察窗口仅能编辑小的或中等的要点表Editallbutverylargeinviewer 在观察窗口不能编辑非常大的要点表Openalltablesinaseparatewindows 在一个单独窗口打开表 样本栏预览TableLook中选定的样式 37 数据功能卡设置 主要项目 TransformationandMergeOptions选择数据转换和合并栏 DisplayFormatforNewNumericVariables新数值变量指定系统默认的显示宽度和小数位数 SetCenturyRangefor2 DigitYears栏 对日期型数据中的年份指定用两位数字输入和显示 38 数据功能卡设置 设置两位年表示法变动范围自动选择自定义 为新数值型变量指定格式栏宽度小数点 数据转换与合并栏立刻执行要求的转换同时读取数据文件在遇到命令时才执行转换和合并 39 数值型变量自定义格式的设置 主要项目 CustomOutputFormats用户定义输出格式栏AllValues设置数值的首尾字符栏NegativeValue设置负数的首尾字符栏DecimalSeparator设置小数点符号栏 40 数值型变量自定义格式的设置 自定义输出格式 设置首尾字符栏在此框输入一个字符 此字符将成为在所有值前都显示的前缀 在此框输入的值成为在所有值后都显示的后缀 设置负数的首尾字符栏在此框内输入在所有负值前都显示的前缀在此框内输入的值成为在所有负值后都显示的后缀 输出样本栏显示变量格式的预览 小数点分割符设置栏采用圆点作小数点采用逗号作小数点 41 稿本窗口参数设置 主要项目 GlobalProcedures全局过程栏Autoscripts自动稿本栏 自动稿本文件是稿本子程序的组合 在每次运行建立某一输出对象类型的过程时都要自动运行这些稿本子程序 Autoscriptsubroutinestatus矩形框中包含当前所有自动稿本文件的所有子程序 42 全局过程栏 自动脚本栏 稿本窗口参数设置 43 第二节SPSS数据文件的建立 44 本讲主要内容 1 进入spss前的准备工作 资料的审查 数据编码 资料的登录 制定分析计划等等 2 Spss运行的基本程序与使用方法 录入 定义 保存 分析 45 数据资料的形式 封闭性问卷资料与开放性问卷资料 不同的资料形式均要求对资料进行审查 但在编码时有不同的要求 一 进入SPSS之前的准备工作 46 资料的审查 主要考察三个方面 资料的完整性审查资料的统一性审查资料的合格性审查 资料 47 资料的完整性审查 包括资料总体上的完整性和每份资料的完整性 资料总体的完整性主要考虑问卷发放的数量 回收率等 每份资料的完整性主要看问卷的填答情况 是否是有效问卷 48 资料的统一性审查 1 检查所有问卷 报表填答的方法是否统一 2 检查统一指标的数值所使用的单位是否一致 3 审查指标的定义和分析的标准是否与自己的研究分类相一致 4 审查指标统计的总体是否一致 49 资料的合格性审查 审查提供资料的人的身份是否符合规定的调查对象的身份 审查所提供的资料是否符合填答的要求 审查所提供的资料是否正确 50 审查资料正确性的三种方法 1 判断检验 依据已知情况来判断是否真实正确 2 逻辑检验 从资料的逻辑关系来检验是否正确 3 计算检验 通过各种数字的运算来检验是否正确 51 资料的编码 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程 问题025 您认为打工的外地人对武汉市的社会秩序是否有影响 单选 1 有很大影响2 有较大影响3 没有影响4 不好说 4 编码 答案 52 编码的步骤 1 确定变量 变量 用来反映概念的量化形式 在统计中往往指最小的分析单位 编码就是对变量进行编码 变量由两个部分构成 变量名和变量值 要注意区分何为变量 何为变量值 在调查问卷中还要注意区分问题和变量 53 问题009 您有几个儿子 几个女儿 1 儿子 人2 女儿 人 2 3 问题 变量1 变量2 变量1的值 变量2的值 54 2 几种常见的编码方式 封闭性问卷的处理方法单项选择题多项选择题多项排序选择题固定选择项不固定选择项开放性问卷的处理方法 55 2 2 56 有6个选项 故应设6个变量 运用0 1编码方法编码 即 1 0 1 0 1 1 此外 多选还有另外一种编码方法 即直接编码输入法 编码为1 3 5 6 0 0 1356 57 316 问题012 您择业中考虑的主要因素有 依据重要性大小排列 限选三项 1 经济收入2 专业对口3 发展前途4 地理区位5 个人爱好6 风险大小7 劳动强度8 社会福利9 社会地位10 其他 因为是依据重要性大小排列 限选三项 故应设三个变量 编码依次为3 1 6 58 择业中考虑的主要因素 依据重要性先后排列 1 经济收入2 专业对口3 发展前途4 地理区位5 个人爱好6 风险大小7 劳动强度8 社会福利9 其他 3164785 因为是依据重要性排列 不限制选项 故应设九个变量 编码依次为 3 1 6 4 7 8 5 0 0 59 择业中考虑的主要因素 多选 1 经济收入2 专业对口3 发展前途4 地理区位5 个人爱好6 风险大小7 劳动强度8 社会福利9 其他 编码应为 1 0 1 1 1 0 1 1 0 或1 3 4 5 7 8 0 0 0 60 开放性问卷的处理方法 1 对回答进行分类 一般首先随机抽取一部分问卷 了解回答的情况 依据回答对问卷进行分类 主要考虑语气强弱 观点确定等方面 2 建立回答类别与对应的数量关系 进行编码 61 数据登录 在大型社会调查中通常要进行数据登录 现在一般采用问卷页边编码方式 以避免转录中增加误差 数据登录的主要作用 输入更快捷 准确 有利于多人分工合作 共同输入 便于核查数据 62 采用DOS WPS CCED等软件 按ASCII码方式录入成文本文件 dat txt 这种录入方式的特点是 数据之间没有间隔 录完一个数码后自动后移 录入速度较快 缺点是容易错位 采用SPSS数据编辑器 SPSSDataEditor 录入 其优点是不容易错位 缺点是不能自动后移 录入速度慢 数据错误不容易修改 数据录入 63 二 SPSS运行的基本步骤 64 数据编辑器 录入数据 65 保存数据 单击保存类型列表框 可以看到SPSS所支持的各种数据类型 有DBF FoxPro EXCEL ACCESS等 这里我们仍然将其存为SPSS自己的数据格式 sav文件 在文件名框内键入变量名并回车 可以看到数据管理窗口左上角由Untitled变为了现在的新变量名 66 SPSS变量定义 Spss7 5 Spss8 0 Spss9 0的定义变量均通过Data菜单中DefineVariable子菜单的对话框中完成 Spss10 0中变量定义只需在Data和Variable中进行转换即可进行变量定义 Spss10 0中的变量定义 67 Spss11 5变量定义项目 Spss11 5中变量定义的一共有10个项目 变量名 name 变量类型 type 变量长度 width 小数位数 decimals 变量标签 label 变量值标签 values 缺省值 missing 变量显示宽度 columns 变量对齐方式 align 变量测量尺度 measure 注意区分变量的标签 VariableLabels 与变量值的标签 ValueLabels 68 变量的类型表 69 变量标签与变量值标签 变量标签 VariableLabels 为进一步描述变量所表示的意义 特别是当变量名不能充分描述变量所表述的意义时 变量值标签 ValueLabels 为进一步说明变量的可能取值 它可以定义 也可不定义 如 变量取值为 grade1 grade2 grade3 grade4 其表示年级 则变量标签为年级 而变量值标签对应变量取值为 本科一年级 本科二年级 本科三年级 本科四年级 70 Spss11 5中变量定义的操作 单击VariableView进入 单击 定义变量名 单击 定义变量类型 定义变量标签 变量标签值 定义测度层次 定义变量宽度 定义对齐方式 定义变量类型对话框 定义变量标签值对话框 定义变量定义缺省值对话框 71 插入变量与删除变量 插入量与删除观测量 数据的剪切 粘贴与复制 1 插入变量在添加处单击Var 单击右鼠标键出现右侧对话框 单击InsertVariables2 删除变量 1 插入观测量在添加处单击观测量 单击右鼠标键出现右侧对话框 单击InsertCase2 删除观测量 剪切 复制 粘贴 若想恢复 打开Edit Undo 数据的简单编辑 72 1 寻找某个观察量 单击Data GotoCase打开对话框 输入要寻找观测量序号 2 在某个变量中寻找指定数据 1 单击某变量如stock所在列的任意一单元格2 单击Edit Find 打开对话框3 在Find中输入要找数据某变量 FindDatainVariableSALARY对话框 GoToCase对话框 数据的简单编辑 73 第三节为分析作好准备 74 本节主要内容 数据编辑器的功能数据文件的整理数据文件的加权重编码数据的变换和计算缺失值的处理 75 数据编辑器 图标 菜单栏 标题栏 输入数据栏 数据显示区 变量名观察序号 数据编辑器的构成 一 数据编辑器的功能 76 数据编辑器的功能主要是通过主菜单的 Edit 和 Data 两个菜单项来实现的 其主要功能有 1 变量和观测量的编辑功能2 数据编辑功能 数据编辑器的功能 77 数据编辑功能表 Edit菜单 78 Data菜单的各项命令 79 Data菜单的各项命令 80 二 数据文件的整理 主要内容 观测量数据的排序变量值排秩拆分数据文件合并数据文件 81 观测量数据的排序 首先在数据窗中建立或读入一个数据文件 按Data SortCases顺序逐一单击鼠标键 打开SortCases观测量排序对话框 依据需要进行选择 然后单击OK按纽即可 82 观测量数据的排序 在左边的源变量框中选择排序变量进入Sortby框 如果选择2个以上的变量 观测量的排序结果与排序变量在Sortby框中的顺序有关 列于首位的为第一排序变量 在SortOrder栏内选择排序方式 升序与降序 83 变量值排秩 运用Transform命令实现 求得的秩在数据窗中建立一个新变量来保存 具体操作方法 按Transform RankCases顺序逐一单击鼠标键 打开RankCases对话框 依据需要进行选择 然后单击OK按纽即可 新生成的秩变量的名称以原变量名称前加字母 R 的形式出现在数据文件中 84 变量值排秩 85 变量值排秩的选项说明 在Assignrank1to栏中可选择秩的排列方式 如选择一个或多个分组变量进入By栏 系统将按By变量分组排秩 当所选择的变量具有相同值时称为Tie 结 其秩次的决定原则可以在RankCases Ties对话框中指定 在RankType中可以选择获得秩次的其他方法 DisplaysummaryTables复选项为默认选择 表示要在输出结果窗中显示新变量的名称 标签 秩类型等总结性信息 86 拆分数据文件 在进行数据处理时经常要对数据文件中的观测量进行分组分析 如分性别的平均分数 进行分析之前必须对数据文件进行拆分 拆分分件并不是将一个数据文件分为两个或几个独立的数据文件 而是在同一个数据文件中按某个条件分组 这种拆分在以后的运算中一直有效直到取消或更改拆分变量 87 拆分数据文件的具体操作 读取一个数据文件 按Data SplitFiles顺序逐一单击鼠标 打开SplitFiles对话框 根据对数据的具体需要选择相应的选项 按Ok完成 88 拆分数据文件 89 合并数据文件 合并数据文件是指将外部数据中的观测量或变量合并到当前的数据文件中去 合并数据文件包括两种方式 从外部数据文件增加观测量到当前数据文件中 纵向合并或称追加观测量 从外部数据文件增加变量到当前数据文件中 横向合并 90 纵向合并 首先打开一个数据文件 按Data MergeFiles AddCases顺序逐一单击鼠标 打开 ReadFile对话框 依据需要选择文件 然后进入AddCasesFrom对话框 选择相应的选项或做适当的修改即可 91 纵向合并 92 纵向合并 93 横向合并 横向合并有两种方式 从一个指定的外部数据文件中取得一个或几个变量的数据 包括变量名称 增加到当前工作数据文件中 实际上相当于两个数据文件的横向合并 按关键变量合并 即要求两个数据文件必须有一个共同的关键变量 而且这两个文件中的关键变量还存在一定数量的相同值的观测量 94 横向合并的具体操作 首先打开一个数据文件 按Data MergeFiles AddVariables顺序逐一单击鼠标 打开AddVariables ReadFile对话框 依据需要选择相应的选项或做适当的修改即可 95 横向合并 96 三 对观测量加权处理 在计算的过程中需要利用变量对数据进行加权处理时采用 加权处理的具体方法 按Data WeightCases 打开WeightCases对话框 依据需要进行适当的选择即可 97 对观测量加权处理 98 对观测量加权处理 在选择加权变量时应注意 加权变量中含有零 负数或缺省值的观测量将被排除在分析之外 分数值有效 一旦对数据进行了加权处理 那么在以后的分析中加权处理一直有效 直到关闭加权处理过程或选择其他的加权变量进行加权处理 99 四 重编码 重编码的步骤及两种方式 1 IntoSameVariables 2 IntoDifferentVariables 100 重编码的应用 高一层次的变量 转化为低一层次的变量时 常常需要重编码 当采用量表来进行测量 而量表中变量取值有正反两种方向的设置 需要转化为同一方向时 常常需要重编码 101 第一种方式重编码 102 IfCase对话框 用于设置变量重编码的条件 103 OldandNewValues对话框 设置旧变量转变为新变量的对应方式 104 第二种方式重编码 第二种重编码方式需要在OutputValues中定义新变量的变量名与变量标签 第二种重编码方式中If和OldandNewValues按钮展开的对话框形式与结构 内容是一样的 105 五 对数据进行变换和计算 利用菜单 Transform 下的 Compute 命令实现数据的变换和计算利用菜单 Transform 下的 Compute 命令 可以完成以下工作 1 计算数值或字符型变量的值2 创建新的变量或取代已存在的变量 对于新的变量 依然可以定义3 可以利用已建立的函数进行变量的计算和转换 106 创建新的变量对话框 107 创建新的变量 108 六 缺失值的处理 SPSS中缺失值默认为圆点 DATA中设置了3种设置缺失值的方式TRANSFORM下设置了5中不同的替代缺失值的方法 缺失值的处理方法 109 缺失值定义方法 110 缺失值替代方法 111 缺失值处理方法 Excludecasespariwise成对删除含缺失值的个案Excludecaseslistwise删除所有含有缺失值的个案Replacewithmean用均值代替缺失值Excludecasesanalysisbyanalysis统计检验时 删除含有缺失值的个案Reportvalues报值 112 第四节基本统计分析 2020 3 19 113 114 一 SPSS统计分析功能概述 1 SPSS数值分析过程2 SPSS图形分析过程 115 1 SPSS数值分析过程 DescriptiveStatisticsComparemeansGenerallinearmodelCorrelateRegression LoglinearClassifyDatareductionScaleNonparametrictestsSurvivalMultipleresponse 116 2 SPSS图形分析过程 117 基本统计分析功能包括 描述性统计分析 DescriptiveStatistics 二 基本统计分析功能 118 描述性统计分析 DescriptiveStatistics 1 Frequencies频数分析表2 Descriptive描述性统计分析过程3 Crosstabs列联表分析过程 119 1 频数分析表 一 主要功能可对数据按组进行归类整理 形成变量不同水平的频数分布表和图形 对数据的分布趋势进行初步分析 二 频数分析按Analyze DescriptiveStatistic Frequencies顺序 打开Frequencies对话框如图 120 选择一个或多个变量右移入Variable s 框 按Statistics按钮 打开Statistics对话框 显示频数分布表 按Chart按钮 打开Chart对话框 按Format按钮 打开Format对话框 Frequences主对话框 121 输出百分位数 输出四分位数 显示25 50 75 的百分位数 将数据平均分为所设定的相等等份 可输入2 100的整数 如键入4则输出第25 50 75百分位数自定义百分位数 可输入0 100的整数 输入值后 按Add 输入值后按此键 可反复操作键入多个百分位数 按Remove 删除已键入的数值按Change 重新输入新数 离差栏 分布参数栏 在计算百分位数值和中位数时 假设数据已分组 且用各组的组中值代替各组数据 中心趋势栏 输出统计量对话框 122 Chart对话框 不输出任何图形 为默认输出条形图 各条高度代表变量各分类的频数输出圆图 圆图中各块的数值表示各分类变量的频数输出直方图 此图仅适用于区间型数值变量 选择此项后 还可选择Withnormalcurve 画出的直方图带有正态曲线 只有选择了条形图和圆图项才有效 决定纵轴表示的统计量纵轴表示频数图纵轴表示百分比 123 Format对话框 控制频数表输出的分类数量 默认为10 多变量框中可设定多变量表格输出的格式 设置频数表输出的格式 选择频数表中排列顺序按变量升序排列 此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列 124 表4 9100名大学生血清蛋白含量 三 例题分析 对某高校100名大学生血清蛋白含量 g 做频数分析 数据如表4 9 125 1 具体步骤按Analyze DescriptiveStatistic Frequencies顺序 打开Frequencies对话框 打开数据文件 大学生血清 sav 挑xdh变量进入Variable框 grade变量进入Break框 选中Displayfrequencytables复选框 要求输出频数分布表 单击Statistics按钮 选择要输出的统计量 单击Chart按钮 选择Histogram项 输出直方图 并选择Withnormalcurve复选框 输出正态曲线 单击Format按钮 选Ascending项 单击 OK 完成 126 血清蛋白含量的直方图 血清蛋白含量的统计表 2 输出结果及分析结果如下 127 血清蛋白含量的频数分布表 128 一 主要功能 调用此过程对变量进行描述性统计分析 计算均值 标准差 全距和均值标准误差等 并可将原始数据转换成Z分数 二 描述统计量分析按AnalyzeDescriptiveStatisticsDescriptives顺序单击 打开Descriptives主对话框 如图 选一个或多个变量移入 如选中此框 将对Variables框中选择的变量进行标准化产生相应的Z分值 并作为新变量保存到数据窗口 其变量名在原变量名前加z Descriptive对话框 2 描述性统计分析过程 129 Options对话框 基本统计量 当Variables框中有多个变量时 此框确定其输出顺序 按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列 分布 130 三 例题分析已知20个初生婴儿的体重数据如下表 对其进行描述统计 20个初生婴儿的体重 g 1 操作步骤 打开数据文件 婴儿体重 sav 打开Descriptives主对话框 选定变量t进入Variable栏中 选中Savestandardizedvaluesasvariables复选框 要求计算变量的z值 并保存结果到当前数据集中 单击Options按钮 选中Mean Std Deviation Minimum Maximum Variance项 131 婴儿体重的描述统计量 这时打开原数据集 可看到多了一列zt 这是t的z分数 如下图所示 保存了z分数的数据集 2 输出结果及分析 132 3 列联表分析过程 主要功能 调用列联表分析过程可进行计数资料和某些等级资料的列联表分析 一个行变量和一个列变量可组成一个二维列联表 如再加一个控制变量则可组成一个三维列联表 而多个行 列 控制变量就可组成一个复杂的多维列联表 在分析中可对二维和多维列联表资料进行统计描述和x2检验 并计算相应的百分数指标 此外 还可计算四格表确切概率 Fisher sExactTest 且有单双侧 One Tail Two Tail 对数拟然比检验 LikelihoodRatio 以及线性关系的Mantel Haenszelx2检验 133 4 列联表分析过程 列联表分析程序按Analyze DescriptiveStatistics Crosstabs顺序打开Crosstabs主对话框 如图 134 列联表概述 列联表分析的基本步骤按Analyze DescriptiveStatistics Crosstabs的顺序打开列联表的对话框 在左侧的原变量框中选择一个或多个分类变量送入Row作为分布表中的行变量 选择一个分类变量送入Column框 作为分布表中的列变量 根据需要选择一个控制变量进入layer框中 该变量决定频数分布表的层 Displayclusteredbarcharts复选项 显示每一组中各分类变量的分类条形图 Suppresstables复选项 要求只输出统计量 不输出多为列联表 135 该框中的变量作为分布表中的行变量 必须是数值型或字符型等分类变量 该框中的变量作为控制变量 决定频数分布表中的层 可有多个控制变量 如要增加新的控制变量 按Next键 要修改以前的变量按Previous键 显示每一组中各变量的分类条形图 只输出统计量 不输出多维列联表 Crosstabs对话框 136 进行行和列变量相互独立的假设检验 有多种检验法 注 进行相关系数的检验 有两项结果显示 Pearson相关系数和Spearman相关系数 适用于定类变量的统计量 基于卡方检验基础上对相关性的检验用来描述相关性当用自变量预测因变量时 此系数反映这种预测降低错误的比率 显示不确定系数 表示用一个变量来预测其他变量时降低错误的比率 适用于定序变量 Gamma系数反映两个有序变量间的对称相关性 是Gamma检验的非对称推广 对有序变量和秩变量相关性的非参数检验 与Kendall stau c相似 适用于定序变量 用于检验相关性用于检验两个评估人对同一对象的评估是否具有一致系 检验某事件发生和某因子之间的关系进行两个相关的二值变量的非参数检验进行一个二值因素变量和一个二值响应变量的独立性检验 Crosstabs的Statistics对话框 137 Crosstabs的CellDisplay对话框 选择在列联表中输出的统计量 包括观测量数 百分比 残差 输出观测量的实际数量如果行和列变量在统计上是独立的或不相关的 那么会在单元格中输出期望的观测值的数量 输出单元格中观测量的数目占整行全部观测量数目的百分比输出单元格中观测值的数目占整列全部观测量数目的百分比输出单元格中观测量的数目占全部观测量数目的百分比 计算非标准化残差计算标准化残差计算调整后残差 138 TableFormat对话框 决定各行的排列顺序 各行的排列按升序各行的排列按降序 三 例为了探讨吸烟与慢性支气管炎有无关系 调查了339人 情况如下 吸烟和慢性支气管炎调查表 139 输入数据 变量h为采得的数据 变量x为是否吸烟 1为吸烟 2为不吸烟 变量n为是否患病 1为患病 2为不患病 数据文件名为 Crosstab sav 在Data菜单中选WeightCases 项 打开WeightCases对话框 WeightCasesby 再将变量h选入FrequenceVariable框 单击OK完成加权 按Analyze DescriptiveStatistics Crootabs顺序打开Crootabs主对话框 将x变量选入Row框作为行变量 将n变量选入Column框作为列变量 打开Statistics对话框 选中Chi square Contingencycoefficient和PhiandCramer sV复选框 单击Continue返回 单击Cell按钮 打开Celldisplay对话框 选中observed和Expected复选框 单击Continue返回 单击OK 1 操作步骤 140 统计摘要表 列出观测量有效值个数 缺失值个数和总的个数 从列联表中可看出 吸烟人中患病者有43人 比期望值33 9大 不吸烟人中患病者只有13人 比期望值22 1小 2 输出结果及分析输出结果如表 吸烟与患病统计摘要表 141 吸烟与患病列联表 卡方检验 142 卡方检验表 从表中可看出 Chi Square值为7 469 显著值为0 006 0 05 应否定零假设 即认为吸烟与患慢性支气管炎是不独立的 由于使用卡方检验要求每个单元格频数不少于5 当条件不满足时 还可用Fisher精确检验 其双侧检验显著值为0 007 对称性检验表 通过度量对称性来得到有效的观测个数 本例为339 对称性检验表 143 第五节双变量关系描述统计 相关分析与检验 144 双变量的关系 有关与无关 寻找变量间的关系是科学研究的首要目的 变量间的关系最简单的划分即 有关与无关 在统计学上 我们通常这样判断变量之间是否有关 如果一个变量的取值发生变化 另外一个变量的取值也相应发生变化 则这两个变量有关 如果一个变量的变化不引起另一个变量的变化则二者无关 145 性别与四级英语考试通过率的相关统计 表述 统计结果显示 当性别取值不同时 通过率变量的取值并未发生变化 因此性别与考试通过率无关 自变量的不同取值在因变量上无差异 两变量无关 自变量的不同取值在因变量上有差异 两变量有关 146 表述 统计结果显示 当性别取值不同时 收入变量的取值发生了变化 因此性别与月收入有关 147 双变量关系的统计类型 148 双变量的关系 关系强度测量 变量关系强度的含义 指两个变量相关程度的高低 统计学中是以准实验的思想来分析变量相关的 通常从以下的角度分析 A 两变量是否相互独立 B 两变量是否有共变趋势 C 一变量的变化多大程度上能由另一变量的变化来解释 149 双变量关系强度测量的主要指标 150 双变量的关系 关系的性质 直线相关与曲线相关正相关与负相关完全相关与完全不相关 151 相关分析 可采用相关分析和非参数相关分析过程 可选择计算积距相关系数 Spearman秩相关系数和Kendall秩相关系数 检验的假设为相关系数为0 可选择是单尾检验还是双尾检验 152 一 相关分析 Correlate菜单 相关分析用于描述两个变量间联系的密切程度 其特点是变量不分主次 被置于同等的地位 在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令Bivariate过程 Partial过程 Distances过程 分别对应着相关分析 偏相关分析和相似性测度的三个spss过程 153 简单相关分析 Bivariate过程用于进行两个或多个变量间的相关分析 如为多个变量 给出两两相关的分析结果 Partial过程 当进行相关分析的两个变量的取值都受到其他变量的影响时 就可以利用偏相关分析对其他变量进行控制 输出控制其他变量影响后的相关系数 Distances过程用于对同一变量各观察单位间的数值或各个不同变量间进行相似性或不相似性分析一般不单独使用 而作为因子分析等的预分析 154 二 Bivariate相关分析 在进行相关分析时 散点图是重要的工具 分析前应先做散点图 以初步确定两个变量间是否存在相关趋势 该趋势是否为直线趋势 以及数据中是否存在异常点 否则可能的出错误结论 Bivariate相关分析的步骤 输入数据后 依次单击Analyze Correlate Bivariate 打开BivariateCorrelations对话框如图5 1 155 图5 1BivariateCorrelations对话框 不清楚变量之间是正相关还是负相关时选择此项 清楚变量之间是正相关还是负相关时可选择此项 计算积距相关系数 连续性变量才可采用 计算Kendall秩相关系数 适合于定序变量或不满足正态分布假设的等间隔数据 计算Spearman秩相关系数 适合于定序变量或不满足正态分布假设的等间隔数据 在输出结果中 相关系数的右上角上有 则表示显著性水平为0 05 右上角上有 则表示显著性水平为0 01 见图5 2 156 图5 2Optins对话框 对每一个变量输出均值 标准差和无缺省值的观测数 对每一个变量输出交叉距阵和协方差距阵 计算某个统计量时 在这一对变量中排除有缺省值的观测值 对于任何分析 有缺省值的观测值都会被排除 157 连续变量相关分析实例数据表 相关分析实例1 连续变量的相关分析实例十只小鸡的体重与鸡冠的数据如表所示 数据文件 小鸡 相关 sav 158 分析步骤 1 输入数据 依次单击Analyze Correlate Bivariate 打开BivariateCorrelations对话框2 选择weight和coronary变量进入Variables框中 3 在CorrelationCoefficients栏内选择Pearson 4 在TestofSignificance栏选择Two tailed 5 选择Flagsignificantcorrelation 6 单击Options按钮 选择Meanandstandarddeviations Cross productdeviationsandcovariances Excludecasespairise选项 7 单击OK完成 159 描述性统计量表 如下 从表中可看出 变量weight的均值为82 50 标准差为10 01 观测数为10 变量coronaryt的均值为60 00 标准差为27 60 观测数为10 结果分析 160 从表中可看出 Pearson相关系数为0 865 即小鸡的体重与鸡冠的相关系数为0 865 这两者之间不相关的双尾检验值为0 001 体重观测值的协方差为100 278 而鸡冠重观测值的协方差为761 556 体重和鸡冠重的协方差为239 111 从统计结果可得到 小鸡的体重与鸡冠重之间存在正相关关系 当小鸡的体重越大时 则小鸡的鸡冠越重 并且 否定了小鸡的体重与鸡冠重之间不相关的假设 Pearson相关系数距阵 161 2 定序变量的Spearman分析实例为研究集团迫使个人顺从的效应 一些研究者用F量表和为测量地位欲而设计的一种量表对12名大学生进行调查 欲知道对权威主义的评分之间相关的信息 权威主义和地位欲评秩 162 1 输入数据 依次单击Analyze Correlate Bivariate 打开BivariateCorrelations对话框2 选择power和position变量进入Variables框中 3 在CorrelationCoefficients栏内选择Spearman选项 4 在TestofSignificance栏选择Two tailed 5 选择Flagsignificantcorrelation 6 单击Options按钮 选择Meanandstandarddeviations Cross productdeviationsandcovariances Excludecasespairise选项 7 单击OK 分析步骤 163 从表中可看出 权威主义和地位欲的相关系数为0 818 这表明权威主义越高的人地位欲也越高 权威主义与地位欲不相关的假设检验值为0 001 否定假设 即权威主义与地

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论