




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 SPSS基础与Access数据库 姓名 郑戟明电话 67703855E mail shift zjm 答疑时间 答疑地点 学院楼B421 商务信息学院计算机教学部 2 SPSS的名称 1968年美国斯坦福大学两名研究生研制 原名SPSS 英文名称社会科学统计软件包 StatisticalPackagefortheSocialSciences 首字母的缩写 1994 1998年间陆续并购SYSTAT等公司 统计软件的3S指的就是SPSS SAS SYSTAT2000年改名为 StatisticalProductandServiceSolutions 即 统计产品与服务解决方案 2010年SPSS公司被IBM并购 3 SPSS软件应用行业 SPSS软件是一款在很多行业的数据分析应用中久享盛名的统计分析工具 是世界上最早的统计分析软件 应用领域经济学教育学商业金融营销研究行业电子商务数据统计政府机构其它 4 SPSS的影响力 在国际学术界有一条不成文的规定 凡是用SPSS完成的计算和统计分析 可以不必说明算法 5 SPSS发展 1968年 斯坦福大学三位学生创建了SPSS 诞生了第一个用于大型机的统计软件1975年 在芝加哥成立SPSS总部1984年 首先推出了世界上第一个统计分析软件微机版本SPSS PC 并使其能很快地应用于自然科学 技术科学 社会科学的各个领域 世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图 数据的深入分析 使用方便 功能齐全等方面给予了高度的评价与称赞 1992年 推出Windows版本2000年 SPSS11 0起 SPSS全称为 StatisticalProductandServiceSolutions 即 统计产品和服务解决方案 标志着SPSS的战略方向正在做出重大调整 6 2009年 SPSS公司宣布重新包装旗下的SPSS产品线 定位为预测统计分析软件 PredictiveAnalyticsSoftware PASW 包括四部分 PASWStatistics formerlySPSSStatistics 统计分析PASWModeler formerlyClementine 数据挖掘DataCollectionfamily formerlyDimensions 数据采集PASWCollaborationandDeploymentServices formerlyPredictiveEnterpriseServices 企业应用服务2010年 随着2009年7月28日 IBM以12亿美元现金收购SPSS之后 各子产品家族名称前面不再以PASW为名 修改为统一加上IBMSPSS字样 IBMSPSSStatistics 统计分析产品 IBMSPSSModeler 数据挖掘产品 IBMSPSSDataCollectionfamily 数据采集产品 IBMSPSSCollaborationandDeploymentServices 企业应用服务 SPSS发展 7 SPSS发展 8 SPSS发展 9 SPSS认证简介 认证考试要求参加者回答一系列问题 然后应用SPSS软件完成一些任务 目前SPSSStatistics认证和SPSSModeler认证系列各有三个考试等级 如下 一 SPSSStatisticsCertification1 SPSSStatistics初级认证 考试费1000元 学生500元 2 SPSSStatistics中级认证 考试费1500元 学生750元 3 SPSSStatistics高级认证 考试费2000元 10 SPSS认证简介 二 SPSSModelerCertification1 SPSSModeler初级认证 考试费1000元 学生500元 2 SPSSModeler中级认证 考试费2000元 学生1000元 3 SPSSModeler高级认证 考试费3000元 11 SPSS认证简介 通过SPSS专业认证的好处1 认证证书 获得认可的专家证书和赠品 有权将付给您的认证证书用于广告和商务宣传 2 专业人才 增强您的职业潜能 帮助您不断提高技术支持水平 成为行业公认的技术人才 3 技术领先 不定期获得最近计算机产品资料和技术信息 这些资料将以期刊 技术文件或CD方式寄送给您 被SPSS邀请参加技术研讨会以及展览会 从SPSS提供的技术支持中得到优惠 12 SPSS基础内容 第7讲SPSS数据的编码 录入与整理第8讲统计报告第9讲描述性统计第10讲均值比较第11讲散点图 相关系数第12讲回归概念 回归系数第13讲SPSS综述 13 SPSS数据分析步骤 建立数据文件 数据加工整理 统计分析 解释分析结果 14 第7讲数据的编码 录入与整理 15 一 数据的编码 录入与整理 原理是研究者利用SPSS进行统计分析的必要前提 就是把通过问卷调查获得的资料转变为SPSS能够识别的数据文件 为各种统计分析做好准备 数据编码概念数据编码是指把需要加工处理的数据库信息 用特定的数字来表示的一种技术 根据一定数据结构和目标的定性特征 将数据转换为代码或编码字符 在数据传输中表示数据的组成 并作为传送 接受和处理的一组规则和约定 16 二 数据问卷与编码 举例 问卷量表 17 二 数据问卷与编码 举例 问卷编码方案 18 三 编码类型 数值型数据的编码数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值 通常采用三点计分 四点计分和五点计分等方式进行评分如选项A B C计分为1 2 3如选项A B C D计分为1 2 3 4编码示例中的第5 6题就是属于数值型编码第5题是正向数值型 被选项的程度越高 分值越大 第6题是反向数值型 被选项的程度越高 分值越小 19 三 编码类型 非数值型数据的编码非数值型数据的编码 首先要确定编码规则 然后根据规则对变量赋予分值 双值型变量的编码多采用 0 1 或 1 2 来赋值 如编码示例中的第1题多值型变量的编码采用 1 2 3 来赋值 如编码示例中的第2题通常对非数值型数据编码 主要起到分组的作用 不能进行各种算术运算 20 三 编码类型 多项选择题多项选择题就是题目答案的选项是多选项限定多选项分类法限定了一次最多可以选择项目的个数 不能直接对题目进行编码 必须先确定最多选择 并给每个选项建立一个变量 如编码示例中的第3题任意多项二分法表示每一次可以任选几个选项 编码方法把每一个被选项作为一个变量来定义 每个变量只能选择 1或0 如编码示例中的第4题 21 四 缺失值的处理 概念缺失值是指在数据采集与整理过程中丢失的内容 往往会给统计分析带来一些麻烦和误差 类型用户缺失值在问卷调查中把不回答的选项当作缺失值来处理缺失值可用研究者能识别的数字来表示如 0 9 99 系统缺失值指计算机默认的缺失方式 如输入数据空缺 输入非法字符等通常把缺失值标记为 22 四 缺失值的处理 缺失值处理方法替代法 采用统计命令或在相关统计功能中利用参数替代Transform ReplaceMissingValues剔出法 剔除有缺失值的题目或剔除有缺失值的整份问卷 23 五 数据处理中的操作术语 个案 Cases 一个研究对象就是一个个案 一个个案就是一条记录 在数据表格中表示为 一行 每一个个案记录的是一个研究对象各个属性的具体数值 如学生信息 姓名 性别 年龄等 个案 每一行为一条记录每一列为一个字段每个记录只能对应一个对象且仅为一个 字段 学生表 24 五 数据处理中的操作术语 样本 Sample 是指具有共同属性的所有研究对象 如学生的所有信息样本包含多个个案 在数据表格中表示为 n行 变量 Variable 是指问卷中每一个问题 数据库里字段 数据表格中表示为 一列 量值 Value 是指问卷中的答案 也称为观测值 在SPSS系统里 单元格中的数值就是变量值 25 六 定义变量 启动SPSS后进入数据编辑窗口 显示为一个空文件 输入数据前首先要定义变量 26 六 定义变量 定义变量所包含的内容 变量名 Name 变量的名称变量类型 Type 变量的类型宽度 Width 存储变量值的最大值 1 可存储1个字节的字符 2 可存储1个汉字 小数位数 Decimals 变量为数值类型时 小数后的位数变量标签 Label 对变量名的注释 光标在变量名上时 会显示该标签变量值标签 Values 变量标签的取值缺失值 MissingValues 定义缺失的值 例如 当定义99为缺失值时 当该变量的值为99时 把它认为是缺失值显示数据的列宽 Colums 与上面 宽度 不同 它只管显示对齐方式 Align 左对齐 右对齐 居中量度类型 Measure 定比变量 Scale 定序变量 Ordinal 定类变量 Nominal 只用于统计制图时坐标轴变量的区分和SPSS决策树模块的变量定义 27 六 定义变量 单击数据编辑窗口左下方的 VariableView 标签或双击列的题头 Var 打开变量定义窗口 进行变量定义 28 六 定义变量 定义变量名在定义变量窗口中Name下的单元格中输入变量名变量名必须以字母开头 长度不超过8个SPSS保留的关键词不能作为变量名AND OR NOT WITH TO BY GT GE LT LE EQ NE ALL等SPSS中允许使用中文变量名 但尽量不要使用 以免出现兼容性问题 29 六 定义变量 定义变量类型 宽度及小数位数在Type下单击单元格 打开变量类型窗口 选择变量类型常用变量类型有 数值型 Numeric 日期型 Date 货币型 Dollar 字符型 String 在Width Decimal下单元格 选择宽度和小数位数 系统默认为 8 和 2 或者在变量类型窗口中设置 30 六 定义变量 定义变量标签在Label下单击单元格 输入变量标签SPSS允许变量标签长度为255字节定义变量值标签变量值标签是对变量的每一可能取值进一步描述 当变量是定类或定序变量时 非常有用 变量值标签系统默认为None在Values下单击单元格 打开变量值标签窗口 输入变量值标签 31 六 定义变量 定义缺失值在Missing下单击单元格 打开缺失值窗口 输入缺失值Nomissingvalues 没有缺失值Discretemissingvalues 定义1 3个单一数为缺失值Rangeplusoneoptionaldiscretemissingvalues 定义指定范围为缺失值 同时指定另外一个不在这一范围的单一数为缺失值 32 六 定义变量 变量定义的信息复制如果有多个变量的类型相同 可以先定义一个变量 然后把该变量定义的信息复制给新变量操作步骤 先定义一个变量在该变量行号上单击右键 在快捷菜单中选择 Copy 选择同类型新变量所在行 单击右键 在快捷菜单中选择 Paste 33 七 数据的录入 定义完所有变量后 单击 DataView 标签 在数据编辑窗口输入数据 数据录入如果按逐行进行 按Tab键改变行数据录入如果按逐列进行 按Enter键改变列也可以通过方向键改变行或列系统默认的数据文件保存类型为 sav 34 八 数据的导入 SPSS具有强大的与其他软件共享数据文件的功能 所以能够导入多种格式的数据能够导入SPSS的数据文件 sys por xls slk w dbf dat syd sas7dbat等导入数据文件的操作步骤 执行菜单命令File Open Data 选择导入数据文件的类型通过复制粘贴导入数据在原系统中打开需要导入的数据文件复制粘贴到SPSS中 但要注意数据类型 可能出很多问题 35 八 数据的导入 例一 1 把Access中shift MIS mdb中的 学生表 信息导入到SPSS中 a 打开shift MIS mdb文件 选中 表 对象 再选中 学生表 36 八 数据的导入 例一 1 把Access中shift MIS mdb中的 学生表 信息导入到SPSS中 b 菜单上 文件 导出 保存类型 选择 MicrosoftExcel97 2003 xls 文件名自动为 学生表 导出 37 八 数据的导入 例一 1 把Access中shift MIS mdb中的 学生表 信息导入到SPSS中 c 启动SPSS File Open Data 文件类型 选择 Excel xls 找到 学生表 xls 文件后 打开 d 保存为 学生表 sav 38 八 数据的导入 例一 2 数据的导入将EXCEL文件2 recode xls导入到SPSS中启动SPSS 方法一 File Open Data 数据导入后 查看 VariableView 标签中的字段名 类型 宽度等 方法二 练习通过复制 粘帖的办法把2 recode xls中的数据通过复制 在SPSS中粘帖的办法导入到SPSS中 但可能会遇到一些问题 请思考如何解决这些问题 把导入后的数据文件保存为2 recode sav 39 九 数据的整理 概念数据整理是对录入的数据进行转换 检测 量表统分 个案选择 文件拆分与合并等操作 使原始数据生成后续研究所需要的数据 操作SPSS实现数据整理的功能主要集中在 Data 和 Transform 两个菜单 40 九 数据的整理 例二 数据分值的转换数据分值的转换是通过对数据进行重新编码来实现的 在SPSS中主要通过 Transform 菜单中的 Recode 命令来实现IntoSameVariables 编码后数据存放在原变量中 覆盖原数据IntoDifferentVariables 编码后数据存放在新定义的变量中 保留原数据 41 九 数据的整理 例二 数据分值的转换假设一套量表共10题 每题有A B C三个选项 现有10个被试作答 要求根据评分规则 将被试的原始数据选择转换为量表分数注意 1 2 4 7 8 10 正向题3 5 6 9 反向题 42 九 数据的整理 例二 数据分值的转换 原数据 转换后数据 43 九 数据的整理 例二 数据分值的转换数据输入 打开数据文件 2 recode sav Transform Recode IntoDifferentVariables打开 Recode 对话框 定义新变量名打开 OldandNewValue 对话框 定义转换规则以原文件名保存 44 九 数据的整理 例三 量表的统分在数据录入过程中 输入的是最原始 最稳定的反应选项 但在后续的统计分析中通常需要对量表的总分进行推断统计 量表的统分工作包括分量表的统分和总量表的统分 SPSS中通常用 Transform 菜单中的 Compute 命令实现量表的统分工作 45 九 数据的整理 例三 量表的统分以分值转化后的数据文件2 recode sav为例 假定该量表由2个分量表构成 其中1个量表由第1 2 5 8 9题组成 另一个量表由第3 4 6 7 10题组成 计算出每一个被试的分量表分和总量表分 46 九 数据的整理 例三 量表的统分打开数据文件2 recode sav Transform Compute 计算分量表分flb1 flb2和总量表分zlb 统分结果保存为2 lb sav 47 九 数据的整理 例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-湖南-湖南垃圾清扫与处理工一级(高级技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-湖北-湖北家禽饲养员三级(高级工)历年参考题库含答案解析
- 工业互联网平台漏洞扫描技术在金融行业的风险防控报告
- 2025-2030中国端氨基聚醚行业应用趋势及竞争格局预测报告
- 2025年事业单位工勤技能-河北-河北计算机文字录入处理员一级(高级技师)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-河北-河北堤灌维护工二级(技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-河北-河北假肢制作装配工一级(高级技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-江西-江西殡葬服务工二级(技师)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广西-广西理疗技术员四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广西-广西堤灌维护工三级(高级工)历年参考题库典型考点含答案解析
- (2025年标准)委托他人要账协议书
- 2025-2030中国青少年无人机教育课程体系构建与创新能力培养研究
- 煤矿安全规程新旧版本对照表格版
- 2025山东“才聚齐鲁成就未来”水发集团高校毕业招聘241人笔试参考题库附带答案详解(10套)
- 中学2025年秋季第一学期开学工作方案
- 儿童急救流程
- GB 11122-2025柴油机油
- 私募薪酬管理办法
- 经营废钢管理办法
- 药品经营企业讲课课件
- 广东省深圳市海韵中学2026届中考押题语文预测卷含解析
评论
0/150
提交评论