已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲数据录入 获取与管理 2020 1 27 1 数据的直接录入 操作界面说明 2020 1 27 2 例 1 序号 2 性别 1男2女3 姓名 4 家庭月收入 a 3000以下b 3000 4999c 5000 6999d 7000 9999e 10000及以上5 出生年月日 6 你在选择购物商场的时候 关注以下哪些因素 a 交通条件b 促销活动c 购物环境d 服务质量e 其他7 请问你购物的打折信息主要来自以下哪些渠道 限选项 a 报纸b 杂志c 电视d 收音机e 网络f 朋友介绍g 手机短信h 其他8 每天上网的小时数 1 3 5 8 开放题2 4 单选题6 7 多选题 2020 1 27 3 如何建立数据库 操作步骤设计变量定义变量输入数据存盘以防断电 4 2020 1 27 SPSS数据文件的特点 5 SPSS数据文件是一种有结构的数据文件 年级性别问题1 问题n 11 422 2 31 1 文件结构 数据 个案case 变量名 变量 2020 1 27 设计变量 6 变量设计的基本原则不同观察对象的数据不能在同一条记录中出现每一个测量指标 影响因素只能占据一列的位置 即同一个指标的测量数值都应当录入到同一个变量中去最终的数据集应当能够包含原始数据的所有信息可以出现违反这些原则的例外情况 如重复测量数据具体的设计思路非调查问卷数据 需要根据具体的情况设计变量结构对于调查表数据的录入 问题就要简单得多 往往一张调查表对应了一个受访者 大多数情况下也就对应了一条记录但是存在例外情况 特别是当进行重复测量时 2020 1 27 7 定义变量 变量类型数值型应用最为广泛字符型由于分析 整理都较困难 建议尽量少用 改为编码录入日期型实际上是特殊的数值型变量 尽量少用 2020 1 27 8 定义变量 测量尺度标度测量 ScaleMeasurement 温度体重有序测量 OrdinalMeasurement 默认字母顺序表示大小顺序 等价于有序分类名义测量 NominalMeasurement 等价于无序多分类 2020 1 27 9 定义变量 变量名与变量值标签可用于对变量及变量值含义进行说明 使结果更易于阅读缺失值除非问卷中有特殊编码 否则按默认情况处理其它设置均按默认值处理 一般不需要更改 2020 1 27 1 在spss中定义变量2 开放题的录入3 单选题的录入 2020 1 27 10 多选题的录入1 多重二分法2 多重分类法3 多选题录入在spss中的实现Analyze MultipleResponse DefineSetsAnalyze Tables MultipleResponseSets 2020 1 27 11 外部数据的获取 电子表格数据如何导入spss中File Open Data 2020 1 27 12 文本数据如何导入spss中 File Open Data 2020 1 27 13 File菜单详解 新建数据文件在SPSS中 新建一个数据文件容易的不得了 已经到了什么都不用做的地步 数据文件的工作名称与存储名称打开其他格式的数据文件SPSS可以直接读入许多常用格式的数据文件利用通用数据库ODBC接口读取数据文件使用文本导入向导读入文本文件 2020 1 27 14 2020 1 27 15 File菜单详解 保存数据文件首次保存另存为注意事项善于使用 S存为其他格式时注意兼容性File菜单中的其他条目 2020 1 27 16 变量级别的数据管理 Transform菜单 功能特点 转换 Transform 菜单主要集中了一些对变量数值进行变换的过程 如对原始数据进行四则运算 对数据重新编码 求出变量的秩次等这些功能往往在统计分析的预处理中起着非常重要的作用 2020 1 27 17 功能特点 计算新变量 最常用和重要的过程 变量转换 包括Recode VisualBinning Count Rank AutomaticRecode这五个过程 它们实际上都可以被看成是compute过程在某一方面功能的强化和打包 专用过程 包括时间序列模型相关过程 自动数据准备相关过程和设定随机种子等过程 RunPendingTransforms 用于执行编程中被挂起 Pending 的数据整理操作 2020 1 27 18 计算新变量1 常用基本概念SPSS算术表达式SPSS函数SPSS条件表达式pute过程的分析实例Transform Compute 2020 1 27 19 对变量值进行分组合并Transform RecodeintoSameVariable 对原始变量的取值进行修改Transform RecodeintoDifferentVariable 根据原始变量的取值生成一个新变量来表示分组情况1 对连续变量进行分组2 分类变量类别的合并 2020 1 27 20 连续变量的可视化分段Transform VisualBinning提供了精确分组的功能 2020 1 27 21 将字符变量转换为数值变量Transform AutomaticRecode 2020 1 27 22 2020 1 27 23 变量的编秩所谓编秩 其实就是对记录按着某个变量值的大小来排序 用于非参数检验 Transform RankCases 2020 1 27 24 transform菜单的其他功能Count过程随机函数 2020 1 27 25 文件级别的数据管理 Data菜单 功能列表 对数据进行加工整理 比如根据统计分析的要求对数据进行分组 合并 加权 筛选等操作简单命令 包括插入变量 插入个案 到达某条个案 复制数据集等 它们的功能不言自明 常用的简单过程 包括排序 拆分文件 个案筛选和个案加权 这几个过程并不复杂 但使用的极为频繁 是大家必须要掌握的内容 数据重组向导 用于进行数据转置 或者对重复测量数据进行长型 宽型记录格式间的转换 文件合并向导 将几个数据文件合并为一个大的SPSS数据文件 含横向合并和纵向合并两种情况 2020 1 27 26 功能列表 数据字典相关向导 包括定义变量属性 复制变量属性 以及新建设定属性三个向导界面 对于较复杂的数据管理项目而言 这些都是非常有用的功能 重复个案与异常个案查找向导 同样用于复杂数据项目 用于简化数据管理工作 数据验证模块 同样真正复杂数据管理项目的需求而开发 用于数据自动查错 与统计模型密切相关的过程 正交设计过程是结合分析模块的一部分 用于生成结合分析所需的设计 定义日期变量过程用于时间序列数据的分析 其它过程 包括定义多重响应集 数据汇总过程等 2020 1 27 27 记录排序1 单变量排序 在变量名处单击右键 2 多变量排序 Data SortVariables 改变变量的顺序 Data SortCales 改变记录的顺序 2020 1 27 28 记录拆分用于将数据文件分组进行处理 如果希望分组进行相应的统计分析 或者只分析其中的一部分数据 则可以通过拆分数据集来加以实现 Data SplitFile 2020 1 27 29 Analyzeallcases 不拆分文件Comparegroups 按所选变量拆分文件 各组分析结果放在一起便于比较Organizeoutputbygroups 按所选变量拆分文件 各组分析结果单独放置GroupsBasedon 用于拆分文件的变量Sortthefilebygroupingvariables 拆分时将数据按所用的拆分变量排序Fileisalreadysorted 所用的拆分变量已经排过序了 2020 1 27 30 记录筛选 Data SelectCases 2020 1 27 31 Allcases 分析所有记录Ifconditionsatisfied 只分析满足条件的记录 需定义筛选条件Randomsampleofcases 按某种条件抽样Basedontimeorcaserange 基于时间或记录序号选择记录Usefiltervariable 使用筛选变量选择记录 取值为非0的记录被选中Filteroutunselectedcases 未被选中的变量被隔离 自动产生一个filter 变量Copyselectedcasestonewdataset 将选中的记录复制到一个新的数据集Deleteunselectedcases 未被选中的变量被删除 一般不要使用 2020 1 27 32 记录加权Data WeightCases 2020 1 27 33 数据汇总就是按指定的分类变量对观测值进行分组 对每组记录的各变量求指定的描述统计量 结果可以存入新数据文件 也可以替换当前数据文件 Data Aggregate 2020 1 27 34 BreakVariable s 指定分类变量SummariesofVariable s 指定汇总变量 共提供5组函数 Addaggregatedvariablestoactivedataset Createanewdatasetcontainingonlytheaggregatedvariables Writeanewdatafilecontainingonlytheaggregatedvariables Fileisalreadysortedonbreakvariable s Sortfilebeforeaggregating 2020 1 27 35 数据字典的定义与应用1 变量属性定义向导Data DefineVariableProperties对数据集中已存在的变量进一步定义其属性 2020 1 27 36 2 复制数据文件属性向导Data CopyDataProperties将定义好的数据字典直接应用到当前文件中 2020 1 27 37 2020 1 27 38 查找重复记录Data IdentifyingDuplicateCases 2020 1 27 39 数据文件的重新排列与转置1 数据的长型与宽型格式 2020 1 27 40 2 长型格式转换为宽型格式Data Rest
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年随州职业技术学院单招职业适应性考试题库及答案详解1套
- 2026年洛阳银行校园招聘考试备考试题及答案详解
- 2026年农业发展银行(青海省分行)人员招聘笔试备考题库及答案详解
- 2026年聊城职业技术学院单招职业倾向性测试题库附答案详解
- 辽阳县沙岭镇招聘社区网格员真题附答案详解
- 2026年长沙卫生职业学院单招职业倾向性测试题库附答案详解
- 洮南市那金镇招聘社区网格员真题附答案详解
- 2026年物流管理师技能鉴定模拟题
- 2025年国家开发银行(青岛市分行)人员招聘笔试考试题库及答案详解
- 2026年农业发展银行(江西省分行)人员招聘笔试备考题库及答案详解
- 2025年贵州省中考物理真题含答案
- DB5104∕T82-2023 康养产业项目认定规范
- 【政史地 高考西北卷】2025年高考招生考试真题政治+历史+地理试卷(适用陕西、山西、青海、宁夏四省)
- 氢氟酸仓库管理制度
- 中医护理艾箱灸操作流程
- 高考英语必背688个高频词汇清单
- 肺心病患者的健康教育
- 2025年3月29日全国事业单位联考E类《职测》真题及答案
- 第10课 金与南宋对峙 七年级历史下册人教统编2024版
- 美容师模拟试题+答案
- DLT 572-2021 电力变压器运行规程
评论
0/150
提交评论