




已阅读5页,还剩63页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 Part SPSS简介 2020 2 7 2 SPSS软件的发展史 1968年 斯坦福大学三位学生创建了SPSS1968年 诞生第一个用于大型机的统计软件1975年 在芝加哥成立SPSS总部1984年 推出用于个人电脑的SPSS PC 1992年 推出Windows版本 同时全球自SPSS11 0起 2002年 SPSS全称为 StatisticalProductandServiceSolutions 即 统计产品和服务解决方案 2020 2 7 3 SPSS软件的发展史 2009年 SPSS公司宣布重新包装旗下的SPSS产品线 定位为预测统计分析软件 PredictiveAnalyticsSoftware PASW 包括四部分 PASWStatistics formerlySPSSStatistics 统计分析PASWModeler formerlyClementine 数据挖掘DataCollectionfamily formerlyDimensions 数据收集PASWCollaborationandDeploymentServices formerlyPredictiveEnterpriseServices 企业应用服务2010年 随着SPSS公司被IBM公司并购 各子产品家族名称前面不再以PASW为名 修改为统一加上IBMSPSS字样 2020 2 7 4 SPSS软件的特点 简便性 菜单操作兼容性 兼容中文数据 汉化 数据接口功能 功能性 具有丰富的统计分析功能 且针对性强 权威性 各领域广泛应用 结果具有权威性 2020 2 7 5 SPSS软件的运行方式 完全窗口菜单运行 简单易用 操作方便 程序运行 灵活丰富 最大程度发挥软件的效能 批处理运行 在ProductionFacility中运行程序 Include命令 可在系统菜单中嵌入用户自定义的命令 高级版本SPSS 2020 2 7 6 SPSS软件的模块 2020 2 7 7 SPSS操作界面 DataEditor 数据编辑器DataView 数据窗口VariableView 变量窗口OutputViewer 结果窗口 2020 2 7 8 SPSS统计分析结果保存 Html网页文件格式 HtmWord格式 Doc文本格式 TxtExcel格式 Xls其它格式 2020 2 7 9 SPSS帮助系统 Whatisthis 右击鼠标获取 Topics 点击帮助下拉菜单获取 对话框Help 点击对话框中的Help获取 语法帮助 点击帮助下拉菜单获取 其它帮助 2020 2 7 10 Part 数据库的建立 2020 2 7 11 数据资料的形式 主要有两种形式 原始资料 如调查问卷中的数据 已经录入成其它数据格式的资料 如Excel电子表格数据 需要将其内容读入SPSS中 2020 2 7 12 2 1 原始数据的录入 2020 2 7 13 数据录入步骤 数据录入 将每个观察单位的每个观察指标的观察值录入SPSS数据库中 步骤 三步曲 定义变量名指定变量属性录入数据 2020 2 7 14 数据录入 变量属性 变量名变量类型变量宽度小数位变量名标签变量值标签缺失值列宽数据对齐方式测量尺度 2020 2 7 15 数据录入 变量名的要求 首字符终须是字母或中文 不能是数字不能含有空格等非法字符不能以句点或 结尾不能超过64个字符同一个文件中变量名不能重复不能与SPSS保留字相同 ALL AND BY EQ GE GT LE LT NE NOT OR TO WITH等 2020 2 7 16 数据录入 变量类型 标签 SPSS中变量有三种基本类型 数值型 字符型和日期型 数值型 标准数值 逗号数值 圆点数值 科学计数法 美元数值 用户自定义六种Label用于定义变量名标签 可以在输出结果中直接显示 Value用于定义变量值标签 输出结果中也可以显示 2020 2 7 17 数据录入 测量尺度类型 分类尺度 仅对事物进行分类 不具运算意义 等级尺度 也对事物进行分类 但可以排序 定距尺度 用数值描述研究对象 可以进行加减运算 用于衡量不同类别之间的差距 但没能绝对 零点 不能进行乘除运算 定比尺度 同样用数值描述研究对象 但有一固定的绝对 零点 可以进行加减乘除运算 2020 2 7 18 数据类型 2020 2 7 19 SPSS数据窗口中的行与列 每一行表示一条记录 记录一个观察单位 case 所有变量的信息 每一列表示一个变量 记录所有观察单位某一个变量 race 的信息 2020 2 7 20 多选题数据的录入 多选题 MultipleResponse 指对一个被调查对象 回答某一个问题时可以有多个选项 例如 请问贵校招聘人才的途径有哪些 请问您获取新闻的方式常用的有哪些 等等 多选题的数据录入方式多重二分法 multipledichotomymethod 即将多选题的每一个选项拆解成一个0 1变量 每个变量同等对待 多重分类法 multiplecategorymethod 根据所有调查对象实际具有的最多的选项数确定变量个数 每个变量的取值是多分类且为多选题所有可能的选项 每个变量同等对待 2020 2 7 21 多选题数据的分析 多选题录入后 在对该数据进行分析之前 必须先定义一个多选题集 然后才能把该定义该多选题数据的全部变量作为一个变量来进行分析 菜单操作 Analyze MultipleResponse DefineSets 2020 2 7 22 2 1 外部数据的导入 2020 2 7 23 导入外部数据的方法 对于SPSS格式的外部数据 只要点击File Open Data 选择文件路径及文件名即可打开 对于非SPSS格式外部数据 导入的方式主要有三种 直接打开利用文本向导导入利用数据库ODBC接口导入 2020 2 7 24 导入Excel数据 首先在Excel中打开数据文件 了解文件的结构 文件中包含几张数据表 想要读入哪一张 需要读入数据表中的哪些数据 第一行是否是变量名然后通过File Open Data 选择文件类型 Excel 直接打开文件 2020 2 7 25 导入Excel数据 2020 2 7 26 导入文本 Text 数据 首先打开数据文件 查看文件结构 变量之间是固定宽度还是用某种分隔符区分 第一行是否是变量名 第一条记录从第几行开始 数据中的字符串变量是否使用了某种限定符进行分隔 SPSS可以通过两种菜单操作方式导入文本数据 1 File Open Data 选择文件类型 Text 2 File ReadTextData 2020 2 7 27 导入文本 Text 数据 2020 2 7 28 导入文本数据 Step1 2020 2 7 29 导入文本数据 Step2 分隔符分隔的文本文件 变量之间用符号 逗号 句号 空格 TAB键等 分隔 固定宽度的文本文件 每个变量在每一行中所占的列位置是固定 2020 2 7 30 导入文本数据 Step3 2020 2 7 31 导入文本数据 Step4 2020 2 7 32 导入文本数据 Step5 2020 2 7 33 导入文本数据 Step6 2020 2 7 34 从数据库中导入数据 SPSS可以直接导入很多类型的数据文件 对于不能直接打开的数据格式 SPSS提供了利用通用的数据库接口读取数据的方法 先配置ODBC 通过ODBC接口和数据库 以 MDB为例 进行连接 再在SPSS中打开数据库读取需要的数据 File OpenDatabase NewQuery 2020 2 7 2020 2 7 35 36 配置ODBC EPIInfo格式数据源 2020 2 7 37 利用ODBC从外部读取MDB格式数据 Step1 2020 2 7 38 Step2 3 利用ODBC从外部读取MDB格式数据 2020 2 7 39 利用ODBC从外部读取MDB格式数据 Step4 2020 2 7 40 利用ODBC从外部读取MDB格式数据 Step5 2020 2 7 41 利用ODBC从外部读取MDB格式数据 Step6 2020 2 7 42 获取外部数据的几点注意事项 变量名称原始数据文件中是否有变量名同一文件变量名称是否有重复变量名称是否符合SPSS规范变量属性建议导入外部数据后逐一修订变量属性 2020 2 7 43 2 3 数据保存 2020 2 7 44 数据保存 File Save 指定文件名和保存路径将文件保存为SPSS格式 File SaveAS 在对话框中可选择保存变量 且可以选择数据的保存格式 xls dbf dat等非SPSS格式 建议在录入和修改数据的过程中随时保存数据 2020 2 7 45 Part 数据库的整理 2020 2 7 46 数据整理 数据整理是进行统计分析之前必不可少的步骤 目的有二 发现数据的错误 识别异常值及探索数据的基本特征 从变量或文件的层次对数据结构进行调整 使数据能直接应用于统计分析 在SPSS软件中 数据文件的管理功能集中于Transform和Data两个主菜单之下 但数据整理过程中通常会涉及对数据进行描述性统计分析 所以整数整理也涉及Analyze菜单中的DescriptiveStatisitcs模块 2020 2 7 47 数据整理 数据的预处理 数据的审核发现数据中的错误查找重复记录识别异常值等数据文件的合并及新变量的产生缺失值替代数据的筛选 找出符合条件的数据数据的排序 发现数据的基本特征 2020 2 7 48 数据审核 对于原始数据 主要从完整性和准确性两个方面进行审核 对于二手数据 除了审核其完整性和准确性外 还应着重审核数据的适用性和时效性 2020 2 7 49 数据审核 探索性分析 2020 2 7 50 探索性分析 实例 2020 2 7 51 探索性分析 主界面 2020 2 7 52 探索性分析 对话框 2020 2 7 53 探索性分析 对话框 2020 2 7 54 探索性分析 结果 2020 2 7 55 探索性分析 结果 2020 2 7 56 文件的合并 Merge 及新变量的产生 文件的合并分为纵向合并和横向合并两种情形 纵向合并 即追加记录 AddCases 往往要求文件的数据结构相同 横向合并 即增加变量 AddVariables 往往要求两个文件同时包含一个相同的变量 匹配变量 利用Transform主菜单中的Compute功能产生新变量 2020 2 7 57 缺失值替代 在数据收集过程中 由于研究者或研究对象的原因 往往无法获得某些观察对象某些变量的取值 造成了变量取值的缺失 为保持数据的完整性 往往要求对研究对象进行重新观察来获取变量的取值并代替缺失值 但实际工作中大多数情况下无法实现这种重新观察 此时 可以借用统计学的方法来估计或替代变量的缺失值 SPSS软件的Transform菜单中提供了替代缺失值的功能模块 Transform ReplaceMissingValues 2020 2 7 58 数据的筛选 对审核过程中发现的错误应尽可能予以纠正 如果错误无法纠正 或有些数据不符合分析要求而又无法弥补 或只有部分数据符合分析要求时 就要对数据进行筛选 Data SelectCases 2020 2 7 59 数据排序 数据排序有利于研究者通过浏览数据发现一些明显的特征或趋势 还有助于对数据检查和纠正错误 同时还为分组等提供方便 在某些场合 排序本身可能就是分析的目的之一 2020 2 7 60 SPSS中变量层次的数据整理菜单 计算新变量 Compute变量转换 Recode VisualBander Count RankCases AutomaticRecode专用过程CreateTimeSeriesReplaceMissingValuesRandomNumberSeed 2020 2 7 61 SPSS中文件层次的数据整理 变量与数据属性简单命令 插入变量 记录 到达某条记录简单过程排序 拆分文件 选择和加权记录数据转置数据重构数据汇总查找重复记录产生无交互作用的正交设计表 2020 2 7 62 文件层次的数据整理 数据汇总 分类汇总 按指定的分类变量对观察值进行分组 对每组记录的各变量计算指定的描述性统计量 结果可以存入到新数据文件 也可直接替换当前数据文件 分类汇总的步骤 选择data Aggregate 指定分类变量和汇总变量选择计算汇总变量的描述性统计量将汇总结果保存到指定的文件中分类汇总产生的数据文件的记录数取决于分类变量的取值个数 分类变量可以指定多个 2020 2 7 63 文件层次的数据整理 查找重复记录 选择Data IdentifyDuplicateCase 在Definematchingcasesby框内选入希望查找重复取值的变量 Sortwithmatchinggroupsby框内设定重复的记录按照哪个变量的取值进行排序 Indicatorofprimarycases框内设定每一组重复的记录中第一或最后一个为主记录 结果窗口中还会给出对本次操作产生的新变量的汇总信息 2020 2 7 64 文件层次的数据整理 纵向合并文件 SPSS中纵向合并的条件待合并的两个数据文件其内容合并是有意义的 两文件的变量名全部相同两文件的变量属性全部相同先打开一个需要合并的文件作为当前文件 然后选择Data MergeFile AddCases两个文件中共有的变量名会自动对应匹配 并出现在Var
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广安市消防员考试笔试试题(含答案)
- 智能汽车油耗分析软件创新创业项目商业计划书
- 2025年新能源商用车辆市场需求与应用场景下的政策扶持与风险防范报告
- 2025年工业互联网平台边缘计算硬件架构产业投资策略研究报告
- 2025年工业互联网平台边缘计算硬件架构在智能机器人中的应用与优化报告
- 2025年物联网设备安全漏洞防护策略与技术方案报告
- 2025年社交媒体平台舆情监测与危机公关的社交媒体营销策略创新
- 2025年工业机器人柔性制造系统在电子信息设备回收与再利用中的应用优化研究报告
- 2025年广播影视行业融合发展的政策环境与产业风险防范策略研究
- 民法典知识义务培训课件
- 2024年保定交通建设投资集团有限公司招聘笔试冲刺题(带答案解析)
- 人教版六年级上册数学全册教案教学设计含教学反思
- 《消费心理学》课程教学大纲
- 华为员工股权激励方案
- 返工、返修作业指导书全套
- 《数学新课标》课件
- 跨文化商务交际导论 课件 Unit 1 Culture
- 2024年度企业预算表(制造企业)
- 中西翻译简史-研究的考试课题
- 静脉导管的维护
- 读书分享用兴趣点燃学生的运动细胞PPT模板宣传PPT动态PPT
评论
0/150
提交评论