




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章数据文件的编辑和整理 1 在SPSS中 数据文件的编辑 整理等功能被集中在Edit Data Transform和Utilities四个菜单项中1数据的编辑2变量的操作 编辑和整理数据文件 2 1数据的编辑 1 1单元值的修改1 2增加和删除一个个案1 3数据的排序1 4数据的行列互换1 5选取个案子集1 6重复个案识别1 7数据分类汇总1 8缺失值的替代1 9数据次序确定 3 1 1单元值的修改 由于各种原因 已经输入的数据有时会需要修改 这就需要进行编辑 可用方向键或鼠标将黑框移动到要修改的单元 键入新值 Edit Gotocase 到达指定记录号的记录 Edit Find Replace 4 1 2增加和删除一个个案 Case 1 增加一个新的个案 即增加一个新的行 2 删除一个个案 5 1 3数据的排序 在数据文件中 可根据一个或多个排序变量的值重排个案的顺序 注意 是整个案例一起变动排序 而不是仅仅变量变动 多重排序时 指定排序变量的次序很重要 注意保留原来顺序的文件 以免发生混乱 6 1 3数据的排序 排序的目的 有时需要改变数据排列的顺序 按照一定的顺序重新排列 便于浏览 了解数据的整体情况 便于找出最大最小值 能够快捷的发现异常值 可以按照一个或者多个变量排序 7 1 4数据的行列互换 8 Data SelectCases 1 5选取个案子集 9 Data SelectCase If 1 5选取个案子集 条件表达式可使用现有变量名称 常数 算术运算符 逻辑运算符 关系运算符和函数 10 点击Filteroutunselectedcases 会生成一个名为filter 的新变量 表示选中还是没有选中 一旦该变量被删除 将自动取消样本抽样 点击Deletedunselectedcases 不符合条件的个案将被删除 保存文件后将无法恢复 完成以上操作后 SPSS的分析只对那些选中的个案进行 直到用户重新选取 点击Copyselectedcasestoanewdataset 可生成一个新的文件 只包含符合条件的个案 对当前文件没有影响 1 5选取个案子集 Data SelectCase Output 11 1 6重复个案识别 Data IdentifyDuplicateCases 12 1 7数据分类汇总 用户还可对数据编辑器中的数据按指定变量的数值进行归类分组汇总 SPSS中实现数据文件的分类汇总需要3个步骤 首先 需要指定分类变量和汇总变量 然后 计算机根据分类变量的若干个不同取值将个案数据分成若干类 并对每类个案计算汇总变量的描述统计量 最后 将分类汇总计算结果保存到一个文件中 13 Data AggregateData 14 Data AggregateData AggregateFunction 均值中位数求和标准差 第一个值最后一个值最小值最大值 加权个案数加权缺失数据数未加权个案数未加权缺失数据数 分类组中变量值 大于 界限值的个案数占该组总个案数的百分比 分类组中变量值 大于 界限值的个案数占该组总个案数的比率 15 结果文件中变量名和标签 16 1 8缺失值的替代 17 定义对相同值观测量的处理方式 定义秩次类型 1 9数据次序确定 18 Rank 普通秩次 Savage评分 以指数分布为基础的原始分秩次 Fractionalrank 分组例数之和占总例数的累积百分比 Fractionalrank 累积百分比分数 Sumofcaseweights 分组例数的权重之和 Ntiles 分位数 Proportionestimated 比例估计 是以一个特别秩次对应分布的累积比的估计Normalscore 正态分数 定义秩次类型 1 9数据次序确定 平均秩次 最小值 最大值或当作一个记录处理 19 2变量的操作 2 1增加和删除一个变量2 2指定加权变量2 3根据已存在的变量建立新变量2 4产生计数变量2 5变量的重新赋值2 6变量的自动赋值2 7变量定义信息的查询2 8变量集的定义和使用2 9数据文件的合并2 10数据文件的分组 20 2 1增加和删除一个变量 Variable 1 增加一个变量 1 菜单操作法 2 选中某列法 右击 3 VariableView标签页法 Edit InsertVariable 在当前列前插入新变量 21 VariableView标签页法 22 2 删除一个变量 删除一个变量 即删除一列数据 其方法和上面的增加一个变量相对应 例如 要删除第5个变量列 则可先单击第5列的列头 这时整个第5列被选中 然后按 Delete 键或选择 Edit 菜单的 Clear 命令 或者单击鼠标右键 在其快捷菜单中选择 Clear 项 该列即被删除 2 1增加和删除一个变量 Variable 在变量浏览窗口 单击变量的行头 这时整个行被选中 然后单击鼠标右键 在其快捷菜单中选择 Clear 项 23 2 2指定加权变量 在实际的统计中 经常需要计算数据的加权平均数 例如 希望了解某超市中某天售出商品的平均价格 如果仅以各种商品的单价平均数作为平均价格是不合理的 还应考虑到各商品的销售量对平均价格的影响 因此 以商品的销售量作为权重计算各种商品单价的加权平均数 才是我们需要求的数据 在SPSS处理中就需要将商品销售量作为加权变量 24 Data WeightCases 25 2 3根据已存在的变量建立新变量 有时需要通过对已经存在的变量进行处理 从而生成新的变量 选择 Transform 菜单的 ComputeVariable 项 弹出 ComputeVariable 计算变量 对话框 在该对话框中的 TargetVariable 目标变量 框中输入符合变量命名规则的变量名 目标变量可以是现存变量或新变量 26 27 SPSS函数种类 算术函数 ArithmeticFunctions 统计函数 StatisticalFunctions 随机变量函数 RandomVariableFunctions 反分布函数 InverseDistributionFunctions 累积分布函数 CumulativeDistributionFunctions 逻辑函数 LogicalFunctions 日期和时间函数 DateandTimeFunctions 缺失值函数 MissingValueFunctions 字符串函数 StringFunctions 转换函数 ConversionFunctions 28 条件表达式对话框 29 2 4产生计数变量 在统计过程中 往往需要进行一些计数工作 产生计数变量就是实现计数功能 它对所有个案或满足一定条件的个案 计算若干个变量中有几个变量的值落在指定的区间内 并将计数结果放入一个新变量中 30 2020 1 27 31 定义变量值 单个值 系统缺失值 系统缺失值或者用户缺失值 最大最小值区间 小于等于最大值的区间 大于等于最小值的区间 32 指定条件来确定参与计数的个案 33 增加了一个计数结果列lj 34 2 5变量的重新赋值 在数据编辑过程中 用户可对个案的某个变量的数值重新赋予新值 该操作只适用于数值型变量 在 Transform 菜单中的有 IntoSameVariables 和 IntoDifferentVariables 两种赋值方法供选择 其中 IntoSameVariables 是对变量自身重新赋值 IntoDifferentVariables 是赋值到其变量或新生成的变量 35 Transform菜单项 把新值赋给原变量的对话框 用于从原变量值按照某种一一对应关系生成新变量值 分为把新值赋给原变量和生成新变量两种情况 Transform Recode 36 recode过程对各组组限归属的确定方法 当相邻组的组限间断时 区间的上 下限均计入对应组 当相邻组的组限重叠时 则遵循 先定义的区间优先 原则 即重叠的组限值计入第一次出现该值的组 对于离散变量 应尽可能地采用间断组限 对于连续变量 为实现 上组限不计入 应按照变量值从高向低依次定义各组区间 为实现 下组限不计入 应按照变量值从低向高依次定义各组区间 37 用于从原变量值按照某种一一对应关系生成新变量值 分为把新值赋给原变量和生成新变量两种情况 Recode Transform菜单项 生成新变量的对话框 38 在上述两种赋值情况下 用户均可通过单击 If 按钮指定条件 来确定参与重新赋值的个案 与前面根据已存在的变量建立新变量方法不同的是 变量的重新赋值Recode不能进行运算 只能根据指定变量值作数值转换 且这种转换是单一数值的转换 39 2 6变量的自动赋值 AutomaticRecode 变量的自动赋值可以将字符型 数字型数值转变成连续的整数 排序 并将结果保存在一个新的变量中 其中字符型数据按照字母的顺序排序 大写字母优于小写字母 新变量将保留原变量标签和变量值标签 同时新变量的值按原变量的顺序重新赋予从1开始的连续整数值 如果原变量没有标签 新变量将原变量值作为新变量的变量值标签 40 Transform菜单项 41 2 7变量定义信息的查询 在SPSS数据编辑窗口中的 VariableView 标签中可以看到变量的定义信息 在其中还可以进行修改 在SPSS的 Utilities 菜单中还提供了变量信息的查询功能 42 Variables 对话框 43 2 8变量集的定义和使用 在SPSS的统计过程中 有时候收集到的变量会有很多个 在进行各种数据处理和统计分析时 所有变量都会显示在各个处理对话框的变量列表框中供用户选择 在众多变量中选择几个变量进行处理以及分析是很麻烦的 尤其是对于某几个经常需要进行操作的变量 SPSS提供了变量集 VariableSet 的概念 可以很好地解决上面所提出的问题 44 1 变量集的定义 变量集是指一些变量的集合 SPSS变量集的分类 系统变量集是SPSS系统已经定义好的 它包括以下两个集合 ALLVARIABLES 存放数据编辑窗口中所有的变量 NEWVARIABLES 存放数据编辑窗口中所有尚未保存的新定义变量 用户自定义变量集是用户根据实际数据分析需要定义的 它可以有许多个 一般把需要经常处理的 处理过程类似的若干个变量存放在一个用户自定义变量集中 45 2 定义用户变量集 Utilities DefineVariableSets 46 3 用户变量集的使用 如果仅仅定义用户变量集 而没有指定SPSS使用该变量集 那么这个定义的用户变量集是不会自动发生作用的 也就是说用户应该告知SPSS系统要使用哪个变量集 SPSS默认使用系统变量集 也就是说 SPSS默认在数据处理中 屏幕上列出数据文件所有的变量 如指定SPSS使用用户定义的变量集 那么在分析时 屏幕上就会只列出用户变量集中的那几个变量 从而简化了变量的选择过程 47 Utilities UseVariableSets 48 2 9数据文件的合并 统计分析的首要任务是将数据输入到计算机中 在数据量较大时 经常需要将一份大的数据文件分成几个小部分 分别由几个人输入 然后将若干个小的数据文件合并成一个大的数据文件 数据文件的合并有两种方式 纵向合并和横向合并 49 在纵向合并的两个数据文件中 数据含义不同的变量 变量名不应取相同的名称 50 必须有一个相同的公共变量 是两个数据文件横向对应连接的依据 合并前先按照该公共变量排序 51 2 10数据文件的分组 Split 在统计中 经常需要先按某个变量进行分组 然后再求各个组的统计分析 例如 想分别了解男生和女生的成绩情况 这时就需要按照性别变量 进行数据文件的分组 这种分组是系统内定义的 在数据管理器中并不一定明确体现 故亦可称之为分割 52 53 分组统计结果 用户一旦设置了分组 那么此后的所有分析都将按这种分组进行 除非取消数据分组的命令 54 SPSS运行环境设置 SPSS状态栏的显示和隐藏 数据编辑窗口最下面的状态栏用来显示SPSS当前的运行状态 当SPSS等待用户操作时 会显示 SPSSProcessorisready 的提示信息 55 状态栏 状态栏的显示或隐藏可以通过 View 菜单下面的 StatusBar 子菜单项来控制 当选中 Sta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《路德维希 费尔巴哈和德国古典哲学的终结》导读
- 专科牙医知识培训课件
- 产品买卖合同(15篇)
- 产品代理合同范文
- 2026届河南省濮阳县区联考数学九年级第一学期期末综合测试模拟试题含解析
- 手工艺文化传承集市策划书
- 2026届四川省雅安市名校数学九年级第一学期期末调研试题含解析
- 药品生产车间工艺与设备管理规范
- 中国银行晋中市太谷区2025秋招笔试金融学专练及答案
- 邮储银行和田地区于田县2025秋招半英文面试题库及高分答案
- 项目经理(总监)解锁申请表
- 物业管理存在的问题与对策
- 前列腺等离子电切术护理查房
- 儿童神经心理行为发育
- GB/T 4074.8-2009绕组线试验方法第8部分:测定漆包绕组线温度指数的试验方法快速法
- GB/T 19812.3-2017塑料节水灌溉器材第3部分:内镶式滴灌管及滴灌带
- GB/T 1682-1994硫化橡胶低温脆性的测定单试样法
- 企业消防安全基础知识培训讲义课件
- 自驾游免责协议书
- 商务英语翻译实务完整版教学ppt课件全套教程
- 第五章-中药指纹图谱课件
评论
0/150
提交评论