




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章数据文件操作与变换 1 4 1定义时间系列日期型变量数据 定义日期 2 说明 1 执行后 在数据窗口中为每个时间单位对应一个新的数值变量 变量名后带 如YEAR DAY MONTH 等 最后还附加了一个具有描述意义的字符变量DATE 2 如果在这之前已经定义了一组时间系列变量 则新建立的变量将全部替代原有的时间系列 3 若选择CasesAre框中的Notdated 则删除以前定义过的所有时间系列变量 3 4 2排序个案数据 排序个案 4 说明 1 排序变量可以是一个 也可以是多个 若为多个排序变量 则首先按第一个变量进行排序 在第一个排序变量的值相同时 再按第二个排序变量排序 依次类推 2 排序方式有两种 升序或降序 5 4 3数据文件转置变换数据 变换 6 7 说明 1 转置后形成一个新的数据文件 应该保存为另一个文件名 2 如果未将全部变量移入Variable s 框中 则转置后的数据文件中会将未选择变量的值全部丢失 3 转置后生成的新变量均为数值型 所以非数值型变量一般不进行转置 4 转置后生成一个新变量case lbl 用来存放进行转置的原变量名 5 命名变量无 系统会自动给转置后的新变量赋予var001 var002 var003 有 以命名变量的值为基础 对转置后的新变量进行命名 k 命名变量的值 1 2 3 或A B C 8 4 4数据文件的合并合并数据文件有两种方式 1 增加观测量2 增加变量一 增加观测量 a savb sav 9 10 11 12 说明 1 不配对合并 保留两个数据文件中的配对变量 同时将未配对变量加入合并后的数据文件中 2 配对合并 两个文件中的各一个变量 其含义相同 类型也相同 但变量名不同 通过配对合并可将这两个变量合成一个变量 其变量名仍然以工作数据文件中的变量名显示 注意 配对合并时 两个变量一定要具有相同的变量类型 宽度不一定相同 但当前工作数据文件中的变量宽度应大于或等于外部数据文件中的变量的宽度 否则合并后外部文件的观测量中相应变量值无法显示 3 合并的同时可剔除变量 4 为变量改名 未配对变量框中的变量可改名 5 可生成表明观测量来源的新变量 选中将个案源表示为变量 13 4 5分类汇总一 分类汇总的概念分类汇总就是按分类变量的不同取值对观测量进行分组 对每组观测量求描述统计量 生成新数据文件 在新数据文件中对应分类变量的每一个值产生一个观测量 qxn sav 14 若选择年龄作为分类变量 身高 体重作为汇总变量 函数选择为平均值 则分类汇总生成的数据文件如下 若选择年龄 性别为分类变量 身高 体重作为汇总变量 函数选择为平均值 则分类汇总生成的数据文件如下 15 二 分类汇总的方法1 从主菜单中单击 数据 展开下拉菜单 选择 汇总 弹出 汇总数据 对话框 16 2 在左侧的源变量框中选择一个或多个变量作为分类变量进入 分组变量 框中 3 在左侧的源变量框中选择一个或多个变量作为汇总变量进入 变量摘要 框中 即要求对这些变量的值进行分类汇总 4 名称与标签 单击此按钮可以修改分类汇总生成的新变量的名称及标签 如果不选择该选项 则系统自动给每个新变量赋予一个默认的变量名 在原始变量名后面加下划线和汇总函数名 5 函数 确定汇总变量的描述项 系统的默认函数为平均值 单击该按钮 弹出 汇总数据 汇总函数 对话框 17 18 6 个案数 选择此项 将源变量分组中的观测量数目作为一个新变量保存在生成的数据文件中 在右边的框中输入您为该变量取的变量名 也可以保留使用系统指定的默认变量名 7 关于新数据文件的存储方式 1 将分类汇总产生的新数据放在当前文件中 2 将分类汇总产生的新数据以新的数据集显示 3 将分类汇总产生的新数据以新的文件名保存 8 单击 确定 执行分类汇总功能 19 4 6拆分数据文件数据 拆分文件 20 4 7选择观测量数据 选择个案 21 4 8对观测量作加权处理采集数据时 若相同观测量 观测量的各变量值均相同 出现多次 通过设置一个频数变量 可以使具有相同变量值的观测量在数据表中只出现一次 但是 在进行统计分析时 为了原始数据的真实情况 必须对观测量作加权处理 例如 如下图所示的数据文件中 变量 频数 中记录的是相同观测量出现的次数 若不作加权处理 则在统计分析时将 频数 当作一个普通的变量看待 数据文件中的观测量数总共被认为是5个 qz sav 22 可按下列步骤对数据文件作加权处理 1 在主菜单中单击 数据 展开下拉菜单 从下拉菜单中选择 加权个案 选项 弹出对观测量作加权处理的对话框 23 2 选择对观测量作加权处理的方式 请勿对个案加权 对数据文件不作加权处理 这是系统默认状态 加权个案 选择此项表示要求作加权处理 3 当在上一步中选择了 加权个案 选项后 从左边源变量列表框中选择一个作为权变量的变量名 单击向右箭头按钮 送入 频率变量 下面的矩形框中 在此我们选择变量名 频数 作为加权变量 4 单击 确定 执行观测量加权 在执行加权处理后 从表面上看 数据文件没有发生任何变化 但是在随后进行统计分析时 会将频数变量的值重复计入到观测量出现的次数中 24 4 9对个案内的值计数有时候 我们要对某些变量值出现在一个观测量中的次数进行统计 例如 下图所示是对读者作的关于平时经常阅读的杂志种类的问卷调查数据 其中回答 y 表示平时经常阅读该杂志 回答 n 表示不经常阅读 为了了解每位被调查者经常阅读的杂志有几种 需要对每个观测量中变量值为 y 出现的次数进行计数 这类问题可以通过菜单项 对个案内的值计数 的功能予以实现 js sav 25 其操作步骤如下 1 在主菜单中单击T 转换 展开下拉菜单 从下拉菜单中选择 对个案内的值计数 2 执行 对个案内的值计数 操作后 观测量中特定变量值出现的次数 将通过创建一个新的变量 称为目标变量 来保存及显示 3 在主对话框左边的源变量列表框中选择要进行计数的变量名 中国青年 单击向一右箭头按钮 将它送入 变量 下方的矩形框中 4 单击 定义值 图标按钮 弹出选择计数变量值对话框 26 5 重复3 4两步 将剩下的变量送入 变量 下方的矩形框中 并分别定义计数变量值 6 使用条件表达式定义观测量子集 7 单击 确定 开始统计观测量中特定变量值出现的次数 27 4 10对变量值重新编码在采集数据时 得到的数据往往是多种多样的 为了便于统计分析 有时候我们不得不对原始数据重新编码 根据数据文件的具体情况 在SPSS中存在有两种不同的编码方式 1 重新编码为相同变量2 重新编码为不同变量一 重新编码为相同变量 e410 1 28 在上述数据文件中 按下列要求对salary进行重新编码 salary60000 4其操作步骤为 29 30 2020 3 19 31 32 二 重新编码为不同的变量例 e410 2 要求 对口味变量进行如下编码 好 1较好 2一般 3差 4其操作步骤如下 33 1 34 2 35 3 36 注 可一次同时对多个变量进行编码 但是这些变量必须具有相同的数据类型 如 37 4 11个案等级排序个案等级排序是根据某变量观测值的大小 按一定顺序排秩 生成一代表其秩次的新变量 数据本身顺序并不改变 它与 排序个案 不同 排序个案 是根据某变量观测值的大小将数据重新排列 并不生成新变量 个案等级排序的操作步骤如下 38 注 此处的 排序标准 必须是数值型的 非数值型需转换成数值型 39 40 结 处理同秩变量的不同方式身高低平均值高顺序等级到唯一值149111115122 53215122 5321574443161555416366651687776 41 4 12自动重新编码在许多统计分析过程中 当分类变量不是连续数时 产生的空白单元会降低系统性能且增加对存储容量的需求 而且 某些过程不允许使用字符型变量作为衡量因素水平的标准 而要求使用连续整数值 采用自动编码可以将字符串和数值转换成连续整数 以满足某些分析过程的特殊需要 自动编码的操作过程如下 e412 1 42 43 4 13创建时间变换利用已存在的时间系列变量值 通过函数变换产生新变量 这些新变量的值在许多时间系列的分析过程中将要用到 时间系列变换的操作如下 44 45 建立新变量时可使用的函数1 差值 差分 e413 1 按差分的阶数可分为一阶差分 二阶差分 其计算方法为 46 2 季节性差分 e413 2 在计算季节性差分之前 必须先定义一个包含有周期成份的日期时间变量 47 3 中心移动平均值 413 3 围绕当前值在一定范围内对变量的值求平均值 跨度为2时 40 75 48 38 2 38 39 2 2跨度为3时 41 67 48 38 39 3 48 4 向前移移动平均值求当前值的前方一定范围内的原始变量值的均值 49 5 运行中位数围绕当前值在一定范围内对原始变量值求出中值 跨度为2时 40 75 48 38 2 38 39 2 2跨度为3时 39 mid 48 38 39 50 6 累加求和 e413 6 计算从第一个变量值起直到当前变量值的总和 51 7 延迟当前变量的值等于相隔为延迟阶数的前面的变量值 52 8 提前当前变量的值等于相隔为前移阶数的后面的变量的值 53 9 平滑 54 4 14替换缺失值在分析带有缺失值的观测数据时 通常将带有缺失值的观测量排除在分析数据范围之外 但在进行时间系列的统计分析时 不能将带有缺失值的观测量排除在外 此时可用替换缺失值的方法进行处理 其操作步骤如下 55 56 替换缺失值的方法 1 序列平均值 用整列变量值的均值替代缺失值 如果变量值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年3月湖北东津国投集团及子公司社会招聘拟聘用人员考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025贵州普定县自然资源局招聘城镇公益性岗位人员考前自测高频考点模拟试题及答案详解(历年真题)
- 2025广东清远市英德市建筑工程检测站有限公司招聘员工1人模拟试卷及一套完整答案详解
- 2025黑龙江黑河市爱辉区花园社区卫生服务中心招聘非事业编制人员7人考前自测高频考点模拟试题及参考答案详解一套
- 2025南平延平太平镇卫生院招聘药房工作人员考前自测高频考点模拟试题及答案详解(新)
- 2025年菏泽市牡丹区公开招聘教师(110人)考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025年烟台市教育局所属事业单位卫生类岗位公开招聘工作人员(2人)模拟试卷有答案详解
- 2025恒丰银行成都分行春季校园招聘考前自测高频考点模拟试题及答案详解(夺冠)
- 2025福建漳州市供电服务有限公司招聘39人模拟试卷及参考答案详解1套
- 美国足球课件
- 2025年党员党的基本理论应知应会知识100题及答案
- 评估“蛇吞象”式海外并购模式的绩效与影响
- 【公开课】+地球的运动-地球的公转+课件-2024-2025学年七年级地理上学期人教版
- 研发人员晋升管理制度
- 国家保密培训课件
- 2025至2030年中国牛油果行业市场发展前景及投资规模预测报告
- 2025至2030中国快递行业发展现状及发展趋势与投资风险分析
- 雪花啤酒终端销售协议书
- 生产风险管理
- 2025年人保车险考试题及答案
- 《茉莉花》音乐课件
评论
0/150
提交评论