




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 3 26 SPSS数据文件的建立步骤 2020 3 26 一 变量类型与测量尺度变量类型 数值型和字符型数值型 如分数 收入 销售额等字符型 如血型 性别等Tips SPSS默认的是数值型 2020 3 26 变量类型vs测量尺度例 性别 变量 1 男 2 女 成绩等级 变量 1 最高 2 中等 3 最低Question 1 在不同变量中意义有何不同 2020 3 26 测量尺度 数据的测量尺度表现为 定类尺度 定序尺度 定距尺度 定比尺度计量水平由低级到高级 2020 3 26 一般来说 数据的等级越高 应用范围越广泛 等级越低 应用范围越受限 不同测度级别的数据 应用范围不同 等级高的数据 可以兼有等级低的数据的功能 而等级低的数据 不能兼有等级高的数据的功能 2020 3 26 二 定义新变量 进入变量编辑窗口 名称 名称长度控制在8位以内 并尽量使用英文名称 类型 宽度 小数 标签 对变量进行解释值 可简化数据录入例 性别1 男2 女缺失 缺失值的处理方法 多用于严格的大型调查列 对齐 测量 变量的测量尺度 2020 3 26 二 定义新变量 练习题 ID城市北京广州上海深圳武汉性别男女文化程度大专及以下大专本科硕士研究生硕士研究生以上职位等级一般员工基层管理者中层管理者高层管理者企业规模小型 50人以下 中型 50 200人 大型 200人以上 企业性质国企机关事业单位外资合资年总收入月基本工资1月 12月份加班工资1月 12月奖金 虚拟100人 随机数据的产生 RAND 2020 3 26 Problems 名称 尽可能用英文变量类型 字符or数值型 宽度 小数点模拟数据的合理性 数据检查无数据vs缺失值变量命名必须唯一 不能有两个相同的变量名 SPSS数据文件的建立 1 数据的输入2 数据的检查3 数据整理 SPSS数据文件的建立 1 数据的输入 进入数据编辑的数据窗口 dataview 在SPSS中直接输入从外部文件导入 1 Excel xls 菜单 file open data 选择 xls文件类型直接从excel中copy paste到spssTips 简单但不智能 如变量名空缺 字符型变量缺失 2 文本文档 txt 菜单 file Readtextdata 2020 3 26 Exercise 1 导入SPSS自带的demo xls文件 导入时只要包含demo中的前三个变量2 导入SPSS自带的demo txt文件Tips C ProgramFiles SPSS tutorial sample files demo xls txt 2020 3 26 Problems 名称 尽可能用英文变量类型 字符or数值型 宽度 小数点模拟数据的合理性 数据检查无数据vs缺失值 2020 3 26 三 数据的录入和修改 进入数据编辑的数据窗口 dataview 1 在SPSS中直接录入Tips 使用键盘而非鼠标进行操作 2020 3 26 三 数据的录入和修改 2 从外部文件导入 1 Excel xls 菜单 file open data 选择 xls文件类型直接从excel中copy paste到spssTips 简单但不智能 如变量名空缺 字符型变量缺失 2 文本文档 txt 菜单 file Readtextdata 2020 3 26 第一步 你的文本文件和预定义格式是否相一致 2020 3 26 第二步 变量如何排列 变量名包括在文件最前面么 2020 3 26 第三步 第一条记录从第几行开始 你的记录是怎样存储在文件中的 你想导入多少条记录 2020 3 26 第四步 变量间用的是哪种分隔符 2020 3 26 第五步 定义在数据预览窗口中所选择的变量 2020 3 26 第六步 你愿意保存这次的文件 读入 格式设置以备下次使用吗 你是否愿意将以上操作粘贴为SPSS语句 2020 3 26 Exercise 1 导入SPSS自带的demo xls文件 导入时只要包含demo中的前三个变量2 导入SPSS自带的demo txt文件Tips C ProgramFiles SPSS tutorial sample files demo xls txt 2020 3 26 三 数据的录入和修改 数据必须输入正确才能保证正确的分析结果 但很难一次输入正确 所以就需要进行修改 一般包括数据的插入 删除 修改等 2020 3 26 三 数据的录入和修改 找到单元格 重新输入数据查找办法 1 移动指针到指定序号的观测值Data GotoCase2 查找指定变量中的指定数据 定位到单元格 Edit Find 或工具栏上的Find图标按钮 2020 3 26 三 数据的录入和修改 插入一个变量在现存变量的右边 直接在VariableView中定义在现存变量的中间 DataView或VariableView点击右键 insertvariables 菜单 Data InsertVariableTips 所添加的变量都在现存变量前一个位置删除一个变量DataView选中一列数据 右键clearVariableView选中一变量名 右键clear 2020 3 26 三 数据的录入和修改 插入一个观测值在最后 直接输入在中间 Data InsertCasesTips 结果是直接插入一空白行删除一个观测值选中观测量序号 后按Del 或右键clear批量数据调整 选中一列数据 鼠标右键cut copy pasteExercise 数据的录入和修改 2020 3 26 数据文件的管理 SPSS的一个重要功能 File Data Transform三大菜单 2020 3 26 数据文件的管理之File菜单详解 一 新建数据文件 略 二 导入外部数据 重点 三 保存数据文件Save保存为同一数据文件Saveas保存为不同数据文件 或者只保存文件中的部分变量ExampleinSPSS 2020 3 26 四 File菜单中的其他条目 DisplayDataInfo系统会在结果窗口中显示所选数据文件的详细情况 包括建立时间 标签设置 变量设置等信息GiveExample CacheData缓冲区 加快处理速度 用于处理远程数据 Print和Printview 打印和打印预览 2020 3 26 数据文件的管理之Utilities菜单详解 一 Utilities Variables菜单项 该菜单项用于显示各个变量的基本信息注 与FILE菜单中的DisplayDataInfo有所不同 前者单独显示各个变量的信息 后者显示整个文件的信息Giveexample二 Utilities Fileinfo菜单项 Thinking 比较File菜单中的displaydatainfo与Utilities菜单中的variables以及Displaydatainfo三者功能有何不同 2020 3 26 数据文件的管理之Utilities菜单详解 三 Utilities DefineSets 定义变量集用途 当数据文件中涉及到大量的变量 而我们所做的统计分析仅用到文件中的某几个变量时常常需要定义变量集 即将所要用到的变量定义成一个集合 Exercise 定义工资表中的变量集 2020 3 26 数据文件的管理之Data菜单详解 SortCases对话框 用途 将数据按照某一变量或某几个变量进行排序GiveExample 2020 3 26 数据文件的管理之Data菜单详解 Transpose对话框 对数据进行行列转置 原文件中的一行数据变为新文件中的一列数据 反之亦然可以在原数据文件中指定一个变量记录转置后的变量名GiveExample 性别为新变量名 将第一季度奖金进行转置 2020 3 26 数据文件的管理之Data菜单详解 MergeFiles对话框 Addcases从外部数据文件中增加记录 仅观测值 到当前数据文件中 称为纵向合并 两文件需具有相同的变量GiveExampleAddvariables从外部数据文件增加变量到当前数据文件 称为横向合并GiveExample 2020 3 26 Exercise Data 1 以文化程度 升 和职业等级 降 将工资表排序Tips 注意当两个变量的排序相反时 SPSS如何处理 2 以城市类型为新变量名 将工人全年加班费 12个变量 进行行列转置Tips 注意转换后文件的变量名 2020 3 26 Exercise Data 3 新建一个数据文件 其中含有 城市 和 地区 两个变量 每个变量有10个观测值 数值为随机数 然后将新文件的 城市 变量中所有观测值合并到 工资表 中4 新建一个数据文件 其中含有 id 和 area 两个变量 其中id变量的数值为100 110 area变量的数值为随机数 然后以id为keyvariable将新数据文件中的 area 变量合并到 工资表 中Tips 注意有无keyvariable的结果差异 2020 3 26 数据文件的管理之Data菜单详解 Aggregate对话框 用于对数据进行分类汇总 即按指定的分类变量对观测值进行分组 对每组记录的各变量值求指定的描述统计量 结果可以存入新数据文件 也可以替换当前数据文件 2020 3 26 BreakVariables 用于选择分组变量 AggregateVariables框 用于选择被汇总的变量 Name Label钮 用于定义新产生的汇总变量的名称和标签Function钮 用于定义汇总函数SaveNumberofcasesinbreakgroupasvariable复选框 用于定义一个新变量以存储同组的记录数 Createnewdatafile单选钮 定义一个新文件以存储汇总结果Replaceworkingdatafile单选钮 用汇总的结果替换原来的数据 2020 3 26 Aggregate对话框提供的函数形式 GiveExample 不同城市工人的平均年总收入 求数值概况求特殊值求观测值数求百分比求百分数 2020 3 26 数据文件的管理之Data菜单详解 SplitFile对话框 用于将数据文件分组 为进一步处理做准备Analyzeallcases单选框 选中本框不拆分文件 Comparegroups单选框 结果紧挨在一起便于相互比较 Organizeoutputbygroups单选框 各组分析结果单独放置 Groupsbasedon框 用于选择拆分数据文件的变量 Sortthefilebygroupingvariables单选框 将数据按所用的拆分变量排序 Fileisalreadysorted单选框 数据保持原状 不按所用的拆分变量排序 GiveExample 根据文化程度对工资表进行拆分 2020 3 26 数据文件的管理之Data菜单详解 SelectCases对话框 当不需要分析全部数据 而是按某种要求分析其中的一部分时使用例如 数据库中包括全省所有学生高考语文成绩 由于数据量太大 现在我们想只选取数据库中前5000个学生的成绩进行统计 以得到一个粗略的估计 2020 3 26 Allcases 分析所有的记录 Ifconditionissatisfied 只分析满足条件的记录 Randomsampleofcases 从原数据中按某种条件抽样 Basedontimeorcaserange 基于记录序号来选择记录 Usefiltervariable 使用筛选指示变量来选择记录 该变量取值为非0的记录将被选中Filtered 未被选中的记录只是被隔离Deleted 未被选中的记录将被删除 一般不要使用 2020 3 26 Exercise Data 5 计算工资表中不同性别的一月份平均加班费和一月份加班费总值6 只选取观测值中男性的数据 再计算不同性别的一月份加班费总值Tips 注意观察最后的结果与练习4最后的结果有何差异 2020 3 26 数据文件的管理之Transform菜单详解 Transform 主要针对数据中变量的变换 如根据已知变量产生一个新的变量Data 主要针对数据库的维护 如数据文件的合并 拆分 汇总等 2020 3 26 Transform菜单 Compute 计算一个新变量 Count 计数 比如60分以下有几人Recode 变量数值重新编码 比如考试分数转为及格或不及格Categorize 归类Rankcase 对调查对象进行排序 如对考分进行排名Automaticrecode 自动编码Createtimeseries 创造时间系列Replacemissingvaluve 缺失数据替代 用某一个数字 2020 3 26 1 Compute对话框 最常用 2020 3 26 Compute菜单中的函数介绍 1 Arithmetic函数 数学函数Abs 返回变量的绝对值Arsin 返回变量的反三角函数值Rnd 返回数值表达式四舍五入后得到的整数值Trunc 返回数值表达式截尾以后得到的整数值 2020 3 26 Compute菜单中的函数介绍 2 Randomnumbers 随机变量函数RV Normal mean stddev 返回来自指定均值和标准离差的正态分布的随机数RV EXP shape 返回服从指定参数的指数分布随机数RV Possion mean 返回服从指定均值的泊松分布的随机数RV Uniform min max 返回指定最小值和最大值的均匀分布的随机数Eg 如有100个case 想打乱它们的顺序 该如何解决 方法 首先产生一个均匀分布的随机数 然后按随机数进行排序后即可 2020 3 26 Compute菜单中的函数介绍 3 统计函数CFVAR 标准离差 均值 MAX 最大值MIN 最小值MEAN 均值SD 标准差SUM 求和VARIANCE 方差 2020 3 26 Compute菜单中的函数介绍 4 日期和时间函数Eg Date5 逻辑函数Eg ANY6 字符串函数Eg String7 转换函数converse 主要用于字符型变量与数值型变量的转换 2020 3 26 Demo 1 将 职位等级 由一般员工基层管理者中层管理者高层管理者这四个等级改变为一般员工基层管理者中高层管理者三个等级2 计算所有工人的第一月总收入 命名为sum Jan3 计算前五十名工人第一季度的月平均奖金 命名为mean bon4 将广州市工人的年总收入值增加10000 2020 3 26 计数 用于标示某个值或某些值在某个变量的取值中是否出现 SPSS会自动用数字1来标注满足所需条件的记录 例 如果想知道月基本工资在1000元以下的记录注意 千万注意 Count对话框有一个潜在的bug 当需要计算同时满足两个变量取值条件的记录数有多少时 直接用该对话框会得出完全错误的结果 2 Count对话框 Eg 如果想知道月基本工资在10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 铁路建设施工期间环境保护及生态修复合同
- 2025公务员铁警面试题目及答案
- 危险废物运输与环保风险评估与管理合同
- 期门穴穴位注射睡眠效果-洞察及研究
- 保定银行笔试题库及答案
- 专业分流面试题目及答案
- 暖通专业面试题及答案
- 河北计算机专业试题及答案
- 2025年小额贷款考试题及答案
- 消防安全活动培训反思课件
- 2025年度哈尔滨市平房区纪委监委公开招聘雇员2人考试参考题库及答案解析
- 2025年ARVR行业研究报告及未来行业发展趋势预测
- 情绪管理课2025年职场压力释放与心灵成长分析报告
- 2025年征地拆迁考试题及答案
- 巡游出租车考试题及答案
- 2025至2030中国方竹笋市场经营方向与竞争格局分析报告
- 2025年人教版三年级数学上册《混合运算》教案
- 2025医用眼科器械消毒处理标准流程
- 胸部穿刺教学课件
- 2025-2026学年苏教版(2024)小学科学三年级上册(全册)课时练习及答案(附目录P102)
- 食材配送培训计划
评论
0/150
提交评论