SPSS介绍PPT课件.ppt_第1页
SPSS介绍PPT课件.ppt_第2页
SPSS介绍PPT课件.ppt_第3页
SPSS介绍PPT课件.ppt_第4页
SPSS介绍PPT课件.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS统计分析介绍 张文彤 邝春伟 SPSS统计分析基础教程 第二版 高等教育出版社罗纳德 D 约克奇 SPSS其实很简单 中国人民大学出版社 1 SPSS含义 StatisticalPackageforSocialScience社会科学统计软件包StatisticalProductandServiceSolutions统计产品与服务解决方案PASW PredictiveAnalyticsSoftware SPSS应用 通讯 医疗 银行 证券 保险 制造 商业 市场研究 科研教育等 SPSS的历史开始于1968年 斯坦福大学的3位不同专业的研究生开发的统计软件系统 1975年成立相应的公司 2009年 公司被IBW收购 2 一 SPSS的基本特点 1 功能强大 SPSS囊括了各种成熟的统计方法与模型 如方差分析 回归分析 多元统计分析 生存分析等 另外 SPSS提供了灵活的表格功能和绘制统计图形 2 兼容性好 在数据方面 不仅可在SPSS中直接进行数据录入工作 还可将日常工作中用到的Excel表格数据 文本格式数据导入SPSS 在结果方面 SPSS输出的表格 图形结果可直接导出为Word文本 网页 Excel格式等 3 易用性强 人机界面操作简单 4 扩展性强 可直接与R语言对接 3 完全窗口菜单方式所有分析操作都通过菜单 按钮 输入对话框等方式完成程序运行方式将分析操作命令编辑为SPSS程序 运行程序 完成分析 混合运行方式 二 SPSS的基本运行方式 4 三 SPSS的四种窗口 SPSS是多窗口软件 运行时使用的窗口有四种类型 数据窗口 输出窗口 语法窗口和脚本窗口 最常用的是前两种 SPSS的数据窗口 也称为数据编辑器 处理数据的主要工作在此窗口进行 又分为两个视图 数据视图用于显示具体的数据 一行代表一个观测个体 Case 一列代表一个属性 variable 变量视图则专门显示有关变量的信息 变量名称 类型 格式等 输出窗口 也称结果查看器 此窗口用于输出分析结果 整个窗口分为两个区 左边为目录区 右边为内容区 5 四 SPSS的菜单 SPSS的每个窗口都有10多个菜单 下面以数据窗口为例 简单介绍各菜单项的功能 1 文件 几个特殊菜单项 1 显示数据文件信息 在输出窗口中以表格的形式列出当前文件或指定的外部数据文件的信息 包括变量列表信息 变量值标签信息等 2 停止处理程序 用于停止执行当前的SPSS命令 3 缓存数据 开关服务器与存储库 处理服务器方的数据 不常用 6 2 编辑 3 视图 用于对当前窗口进行显示切换 4 数据与转换 提供数据管理相关的功能 5 分析 6 直销 提供用于改善直销活动效果的工具 7 图形 8 实用程序 提供一些比较方便的数据文件管理功能和界面编辑功能 9 窗口 用于对各个窗口进行切换和管理 10 帮助 提供完整和系统的帮助功能 7 五 数据集的建立 SPSS数据文件的特点数据文件包括 数据结构和数据内容分别在变量视图和数据视图中编辑扩展名为 savSPSS数据文件的组织方式原始数据的组织方式列 变量 行 个案 8 变量名 Name 数据类型 Type 列宽 Width 小数位 Decimals 变量名标签 Label 变量值标签 Values 显示列数 Columns 对齐方式 Align 缺失值 Missing 计量尺度 Measure 变量视图包括 9 数值型标准型 Numeric 注 数据的显示不影响真正的数据存储计算科学记数型 ScientificNotation 例如 120 1 2E 02逗号型 Comma 其整数部分从个位开始每三位以一个逗号隔开 输入数据时系统自动添加逗号 圆点型 Dot 其整数部分从个位开始每三位以一个圆点隔开 以逗号作为整数和小数部分的分隔符 输入数据时系统自动添加逗号 美元符号型 Dollar 表示货币数据 在数据前自动添加美元符号 数据类型 10 字符型 String 由一串字符组成 如 职工号码 姓名 字符型数据区分大小写字母 在SPSS命令处理过程中应用一对双引号引起来 但在输入数据时不应输入双引号 日期型 Date 表示日期或时间的数据 11 变量标签用于帮助对变量含义的理解变量标签使输出分析结果更具可读性 变量标签 对于使用代码的离散型变量值 应定义变量值标签 如 性别变量 用数值1表示男 数值2表示女 变量值标签对于定序数据 如收入的高 低 和定类数据 如性别 民族 十分必要 变量值标签 对变量取值含义的解释说明信息 对于定类型和定序型数据十分总要 12 三类计量尺度定类尺度 类别 如 性别定序尺度 大小比较有意义 如 学历 某种事物的喜好程度定距尺度 大小比较有意义 差有意义 差之比有意义 如 温度 收入等常见的变量 统计数据的计量尺度 13 数据视图中的数据录入 1 数据的直接录入 2 外部数据的获取 可读取Excel表格 文本数据 数据库中的数据 选择 文件 打开 数据 菜单项 然后选择文件路径和文件名打开即可 下面以SPSS自带的文件demo xls为例说明 该文件位于SPSS安装目录下的Samples子目录中 首先 在Excel中打开demo xls 了解如下内容 该文件包含几个数据表 具体应打开哪一个表 如果不需要该表的所有数据 而只需要读入一部分 需要了解要读入数据的精确位置 如单元格A2 F5 该部分数据的第一行是否是变量名 14 2020 3 18 15 接下来 第一步 在打开文件对话框中 选择路径 选择文件类型 xls 文件列表中出现所有的Excel文件 单击文件demo xls 第二步 打开相应的对话框 在 工作表 下拉列表框中选择一个表 在 范围 文本框中指定读取数据的具体位置 用单元格的起止位置表示 中间用冒号隔开 上方的复选框用于确定单元格范围的第一行是否为变量名 指定完毕 单击 确定 按钮 数据顺利被读入SPSS中 16 六 画散点图 1 选择 图形 图表构建程序 菜单项 打开 图表构建程序 对话框 2 在图库中选择 散点 图组 将右侧出现的简单散点图图标拖入画布中 3 将自变量拖入横轴框中 将因变量拖入纵轴框中 4 单击 确定 按钮绘制出图形 随后可双击图形进入编辑状态 对坐标轴尺度 图的位置等进行调整 也可插入相应的拟合线 17 七 一元线性回归模型界面说明 选择 分析 回归 线性 菜单项 即可打开 线性回归 对话框 其中 1 因变量 列表框 用于选入回归分析模型中的因变量 只能选入一个 2 块按钮组 用于将选入下面 自变量 列表框中自变量分组 在非线性回归分析有应用 3 自变量 列表框 用于选入回归模型中的自变量 4 方法 下拉列表框 用于选择对自变量的选入方法 包括 进入 后退 逐步 等方法 18 5 选择变量 列表框 实际含义是进行案例筛选 选入一个筛选变量 并利用右侧的 规则 按钮建立一个选择条件 这样 只有满足该条件的记录 样本 才能进行回归分析 6 个案标签 列表框 选择一个变量 它的取值作为每条记录的标签 例如 记录 工号 学号 等的变量 7 WLS权重 列表框 可选择权重向量以进行加权最小二乘法的回归分析 19 Statistics对话框 20 RegressionCoefficients 回归系数选项 Estimates 输出回归系数和相关统计量 Confidenceinterval 回归系数的95 置信区间 Covariancematrix 回归系数的方差 协方差矩阵 Residuals 选项 Durbin Watson Durbin Watson检验 Casewisediagnostic 输出满足选择条件的观测量的相关信息 选择该项 下面两项处于可选状态 Outliersoutsidestandarddeviations 选择标准化残差的绝对值大于输入值的观测量 Allcases 选择所有观测量 21 Modelfit 输出样本相关系数 相关系数平方 调整系数 估计标准误 ANOVA表 Rsquaredchange 输出由于加入和剔除变量而引起的复相关系数平方的变化 Descriptives 输出变量矩阵 标准差和各变量间相关系数单侧显著性水平矩阵 Partandpartialcorrelation 相关系数和偏相关系数 Collinearitydiagnostics 显示单个变量和共线性分析的公差 22 输出带有正态曲线的标准化残差的直方图 输出标准化残差的正态概率图 对每一个自变量 会产生一个自变量与因变量残差的散点图 主要用于回归诊断 X轴或Y轴中有一个是因变量标准化的预测值标准化的残差删除的残差修正后的预测值 学生化残差学生化删除的残差 Plots对话框 23 Save对话框 24 在线性回归中 保存 子对话框中 可将如下几类信息存储在数据集中 1 预测值 复选框组 包含了各种可供存储的因变量预测值 包括未标准化预测值 标准化预测值 调节预测值 去掉当前记录时模型对该记录因变量的预测值 预测值的标准差 2 残差 复选框组 包含了可供存储的各种残差 包括未标准化残差 标准化残差 学生化残差 删除残差 学生化已删除残差 3 距离 复选框组 给出一系列用于测量数据点离拟合模型距离的指标 包括马哈拉诺夫距离 库克距离 杠杆值等 主要用于强影响点的诊断 25 4 影响统计量 复选框组 提供一些专门用于判断强影响点的统计量 5 预测区间 复选框组 给出均值的可信区间或个体置信区间的上下界 默认为95 区间 用户也可自己设定 6 系数统计 框组 将回归系数等模型结果输出到一个新的数据文件中供后续分析使用 7 将模型信息输出到XML文件 框组 与数据挖掘相关 26 八 一元线性回归模型的结果输出及解释 回归分析的结果输出共有四张表格 第一张表格 模型中各个自变量纳入模型的情况汇总 一元线性回归中 只有一个自变量 结果就比较简单 选择变量的方法为强行进入法 也就是将所有的自变量都放入模型中 第二张表格 模型的简单汇总 即对回归方程的拟合情况的描述 通过这张表可以知道相关系数的取值 相关系数的平方即决定系数 调整后的决定系数和回归系数的标准差 即随机误差项方差的无偏估计的平方根 27 第三张表格 模型的方差分析结果 即F 检验的结果汇总 方差分析表 第四张表格 给出回归方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论