




已阅读5页,还剩49页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三部分数据管理 SPSS的主菜单Edit和Data能够建立数据文件 进行数据编辑 具有很强的数据管理功能 主要包括 定义变量属性 DefineVariableProperties 插入变量 InsertVariable 插入个案 InsertCase 个案排序 SortCases 合并数据文件 MergeFiles 拆分数据文件 SpliteFiles 汇总数据 AggregateData 识别重复个案 IdentifyDuplicateCases 及加权个案 WeightCases 等 1 数据管理分为四部分 一 变量管理二 个案管理三 数据文件管理四 变量的变换和计算 2 一 变量管理 1 插入变量或删除变量 建立数据集后 可在DataView或VaribleView中插入新变量 具体方法如下 方法1 在DataView中插入新变量将光标移至想要插入的位置单击右键或Data菜单InsertVariable 即可在当前光标所在的变量前插入一个 VAR00001 的新变量 双击该变量名 即可自动切换到VaribleView中 可以对该变量名进行编辑 并且定义其属性 3 方法2 在VaribleViewer下 将光标移至想要插入的位置单击右键或Data菜单InsertVariable 即可在当前光标所在的变量前插入一个 VAR00001 的新变量 可以对该变量名进行编辑 并且定义其属性 注意 插入或删除个案类似 例3 1调入数据文件02 1 sav 2 定义变量属性 DefineVariableProperties 定义变量属性 DefineVariableProperties 可为用户在建立变量 定性变量 定序变量 定距变量 的描述性变量标识过程中提供帮助 例3 2调入数据文件02 1 savData DefineVariableProperties 4 选中表示Unlabled 5 二 个案管理 1 插入个案 InsertCase 2 个案定位 GoToCase 3 个案排序 SortCase 4 识别重复个案 IdentifyDuplicateCases 5 选择个案 SelectCase 6 个案加权 WeightCases 6 1 插入个案 InsertCase 或删除个案 例3 3在数据文件02 1 sav的第10个个案前插入一个名为 王蒙 1975年2月28日出生 体检正常 的个案 将第5个个案删除 操作 将光标移到第10个个案 选择Edit InsertCase 即在第10个个案前插入一空行 也可右键快捷菜单操作 2 个案定位 GoToCase 使用GoToCase功能 可以方便 快捷的在大量数据中查找到指定的个案 以便对其进行编辑修改或在其前插入新个案 7 例3 4在数据文件cesd sav中 把第268个案的性别由 女 改为 男 选择Edit GoToCase 在CaseNumber框中输入268 OK 3 个案排序 SortCase SortCase能将数据文件中的数据 或字符 进行排序 排序的方法可以依据变量作为排序关键词 递增或递减排序 大小顺序或字典顺序 操作如下 用鼠标选择 DataSortCases 会弹出以下对话框 图2 12 选中 考试成绩 单击中间的黑三角 把这个变量移至右面的矩形框中 这个过程也可以通过双击 考试成绩 完成 再选择排序方式 升序或降序 点击 OK 就可以了 8 例3 5数据文件hong1 sav 试对体重从小到大排序 注意 排序变量可以为多个 具体步骤如下 1 选择var1作为第一排序变量 2 按照var1降或升如选降排列 3 选择var2作为第二排序变量 4 按照var1降或升如选升排列 5 单击OK 新数据覆盖原数据 9 4 识别重复个案 IdentifyDuplicateCases 用户在进行大样本量的调研工作中 可能重复访问某个被访对象或重复录入某份试卷 造成数据文件中包含重复个案 引起偏倚 利用识别重复个案 IdentifyDuplicateCases 用户可以对重复个案进行查找 并且进行剔除 操作 Data IdentifyDuplicateCases出现以下对话框 10 1 定义个案配对变量2 配对组中的排序变量 用户可选择1或多个变量作为排序依据 顺序可选升或降 3 新建变量 原始个案指示器 1表示原始个案0表示匹配个案每组最后一个个案为原始个案每组第一个个案为原始个案根据个案指示器的数值进行过滤 自动划出重复个案 11 4 对每组的匹配个案进行连续计数 创建一个顺序号为0 n的数值变量 其中0表示不匹配 5 将匹配个案移至文件的最上方6 显示新建变量的频数表 例3 5在数据文件Identify sav中查找 id 重复的个案 并且进行剔除 12 5 选择个案 SelectCase 在SPSS中 用户可按一定准则选择个案 然后进行统计分析 Analyze 或作图 Graphs 可以通过定义变量值或范围 日期 数学表达式 逻辑表达式或函数设定选择个案的准则 例3 6 对数据文件hong1 sav 用3种准则选择满足指定条件的部分个案并且进行频数分析 准则一 对数据文件hong1 sav中满足条件2 01 x6 3 00的体重 x6 的婴儿 对血红蛋白x5进行频数分析 操作 Data SelectCaseIfconditionissatisfied输入2 01 x6andx6 3 00Output中选择filteroutunselectedcases注意 生成一个新变量filter 满足条件的个案一 1 表示 未选中的个案的序号用斜划线化掉 13 准则二 在数据文件hong1 sav中 随机抽取30 的个案 对血红蛋白x5进行频数分析 在进行频数分析时 var为filter 没有也可 和x5 操作 Data SelectCase Randomsampleofcases后出现以下对话框 在所在个案中近似比例抽样 在前 个个案前精确抽取 个个案 注意 生成一个新变量filter 满足条件的个案一 1 表示 在进行频数分析时 var为filter 和x5 14 准则三 在数据文件hong1 sav中 选取第10 33例的婴儿 对血红蛋白x5进行频数分析 操作 Data SelectCase Basedontimeorcaserange Observation 注意 不生成一个新变量 在进行频数分析时 var为x5 对满足条件的个案进行分析 15 6 个案加权 WeightCases 个案加权 WeightCases 可在统计分析中对个案给予不同的权重 权重变量中的数值表示数据文件中单个个案的观察值 注意 当加权变量值为0 负值或缺失值的个案不参与分析 例3 7某地144名正常男子的红细胞数 1012 L 的整理数据见下表 试进行频数分布分析 16 建立数据文件weight sav 变量名为x 红细胞数 f 人数 2 对变量f进行加权 选择Data Weightcases 完成个案加权 3 对变量x进行频数分布分析 画相应的直方图 17 三 数据文件管理 1 数据的合并 统计分析的首要任务是将数据输入到计算机中 在数据量较大时 经常需要将一份大的数据文件分成几个小部分 分别由几个人输入 然后将若干个小的数据文件合并成一个大的数据文件 数据文件的合并有两种方式 纵向合并和横向合并 纵向合并就是将一个SPSS数据文件的内容追加到数据编辑窗口当前数据的后面 然后将合并后的数据重新显示在数据编辑窗口中 通过该方法 可以将两个或更多个数据文件合并在一起 1 纵向合并 18 纵向合并 操作 Date MergeFiles Addcases 例3 8将数据文件身高纵和 sav的个案追加到身高 sav中 1 打开数据文件身高 sav 2 Date MergeFiles Addcases出现如下对话框 3 利用AnexternalSPSSdatafile导入要追加的数据文件身高纵和 sav 4 匹配变量直接进入 对于未匹配变量 工作数据文件的变量用 标注 外部数据变量用 标注 可pair配对 19 注 选中Indicatecasesourceasvariable 合并后的数据文件会出现名为source01的变量 取值0和1 0代表个案来自工作数据文件 1代表个案来自外部数据文件 横向合并 横向连接 也就是变量值的合并 利用横向合并可以将两个或两个以上的具有相同个案的数据文件连在一起 即将SPSS数据文件的内容连接到当前数据编辑窗口的右边 然后将合并后的数据文件显示在数据编辑窗口中 横向合并实质是将两个数据文件 按照个案对应进行左右对接 20 实现数据文件的横向连接 必须有一个相同的公共变量 这个变量是两个数据文件横向对应连接的依据 同时将这一公共变量排序 注意 在合并的两个数据文件中 数据含义不同的变量 变量名不应取相同的名称 例3 9 将数据文件身高横合和 sav的个案追加到身高 sav中 1 打开数据文件身高 sav 2 Date MergeFiles Addvariables出现如下对话框 3 利用AnexternalSPSSdatafile导入要追加的数据文件身高横和 sav 4 匹配变量直接进入 工作数据文件的变量用 标注 外部数据变量用 标注 21 注 选中Indicatecasesourceasvariable 合并后的数据文件会出现名为source01的变量 取值0和1 0代表个案来自工作数据文件 1代表个案来自外部数据文件 22 数据文件的分组 split 数据文件的拆分是指将数据按某个或某几个变量分成一些供统计分析的分组 在统计中 经常需要先按某个变量进行分组 然后再求各个组的统计分析 例如 想分别了解男生和女生的成绩情况 这时就需要按照性别变量 进行数据文件的分组 这种分组是系统内定义的 在数据管理器中并不一定明确体现 故亦可称之为分割 注意 用户一旦设置了分组 那么此后的所有分析都将按这种分组进行 除非取消数据分组的命令 例3 10 将数据文件child sav按性别 年龄进行拆分 并对体重与身高进行描述性分析 1 打开数据文件child sav 2 Date SplitFile出现如下对话框 23 1 分析所有个案 不建立分组2 分组比较 各分组的结果放在一起进行比较 对于表格或图表 每个分组变量所产生的表将放在一起显示 3 分组安排输出结果 所有程序产生的分组结果将独立显示 4 分组依据 本例使用性别 年龄 可多选 5 按分组变量排序6 文件已排序 24 数据的行列转置 Transpose 行列转置可将数据文件中的个案 行 转换成变量 列 变量 列 转换成个案 行 行列转置可对新变量自动命名 并显示新变量名列表 使用行列转置可以自动产生一个包含原始变量名的字符串变量case 1b1 以便用户了解各个个案对应的原变量名 注意 如果数据文件中含有变量值是唯一的变量 可利用其作为名称变量Namevariable 该变量的值将用于生成转置后数据文件的变量名 例3 11 对数据文件body1 sav进行行列转置 1 打开数据文件body1 sav 2 Date Transpose出现如下对话框 25 也可以用此方法将数据再转换回原来的排列方式 注意 行列转置前 若对工作数据进行修改 请先保存数据文件 否则修改的信息会丢失 26 2020 1 15 27 数据分类汇总 AggregateData 用户还可对数据编辑器中的数据按指定变量的数值进行归类分组汇总 在SPSS中 实现数据文件的分类汇总需要3个步骤 首先 需要指定分类变量和汇总变量 然后 计算机根据分类变量的若干个不同取值将个案数据分成若干类 并对每类个案计算汇总变量的描述统计量 最后 将分类汇总计算结果保存到一个文件中 例3 12 对数据文件child sav按性别 年龄进行汇总数据 计算各组个案体重 身高 坐高 胸围及头围的平均数 1 打开数据文件child sav 2 Date AggregateData出现如下对话框 28 1 分组变量列表 选一个或多个数值型或字符型变量作为分组变量 2 汇总变量列表 显示在汇总文件中用汇总函数产生的新变量的名称及表达式 汇总的原变量必须是数值型 分组汇总提供的函数形式主要有以下几种 Mean 求该组的平均值Median 求该组所有观察值的中值Sum 求该组所有观察值的和Standarddeviation 求该组的标准差First 只保持该组的第一个数值Last 只保持该组的最后一个数值等等 29 常见汇总函数 30 31 Name lable选项可逐一为汇总变量定义变量名和标签 Numberofcases选项会在新文件中创建一个变量用来计数每一组观测值的数目 系统默认文件名为N BREAK 3 Save单选框 32 对于缺失值 可采取多种手段进行科学替代 这里的缺失值必须是系统或用户指定的缺失值 缺失值的代替 例3 13 替代数据文件收入 sav中的缺失值 1 打开数据文件收入 sav 2 Transform ReplaceMissingValues出现如下对话框 33 3 在变量名列中选择一个或多的存在缺失值的变量 使之添加到newvariables 这是系统自动产生用于替代缺失值的新变量 也可在name框处自己定义替代缺失值的新变量 Method共有以下几种替代方式 Seriesmean Meanofnearbypoints Medianofnearbypoints Linearinterpolation 用缺失值相邻两点的中点值做替代 Lineartrendatpoint 用线性拟合方式确定替代值 注意变量在选中状态时nameandmethod可用 4 确定替代方式 change ok 34 四 变量的变换和计算通过计算建立新变量 ComputeVariable 经过调查研究所得到的原始数据非常重要 很多时候对原始数据可以进行重新计算 如 从年收入中可以计算出一个新变量 月收入 等 从而生成新的变量 例3 14 现有某班的5门功课期末考试成绩 为了进一步的分析 需要先对数据进行整理 要求算出5门功课的总分 平均分 加权总分 语文 数学的权重为1 2 物理 化学的权重为1 生物的权重为0 7 35 1 打开数据文件test sav2 选择 Transform 菜单的 ComputeVariable 项 弹出如图所示的 ComputeVariable 计算变量 对话框 3 在该对话框中的 TargetVariable 目标变量 框中输入符合变量命名规则的变量名 4 在数值表达式框中输入表达式如图示 5 打开标签输入变量标签 ok 注意 函数的使用 36 例3 14 建立新变量 使得语文成绩 80的为一组 60 语文成绩 80的为一组 低于60的是一组 1 打开数据文件test sav2 选择 Transform 菜单的 ComputeVariable 项 弹出如图所示的 ComputeVariable 计算变量 对话框 3 在该对话框中的 TargetVariable 框中输入变量名group 4 在数值表达式框中输入 1 如图示 5 打开标签输入变量标签 语文分组 6 打开if 37 如图操作 continue ok重复这一过程 对目标变量grounp分别定义60 语文成绩 80的为一组 低于60的是一组的情况 38 产生计数变量 count Count过程用于标识某个值或某些值在某个变量的取值中是否出现 在统计分析中 有一项特定变量值计算功能 它可以计数在一个观测值中满足特定要求的那些变量值出现的次数 并将结果记录在一个新变量中 例3 15 统计一下数据文件test 1 sav中每个个案语文 数学 物理 化学4门课成绩有几门80分以上 1 打开数据文件test 1 sav2 选择Transform CountValuewithinCases弹出如下对话框 39 打开DefineValues对话框Continue ok 40 例 在某次调查中 有10个问题供调查者回答 回答正确为1 错误为0 请计算每个调查对象回答正确的题目数 数据文件为count sav 1 打开数据文件为count sav 2 选择Transform CountValuewithinCases3 目标变量定义为 正确题数 4 数值变量列表 q1 q2 q105 definevalues value 1 add6 continues ok 41 变量重新赋值 变量重新赋值功能是指将数据文件中的原变量按照某种一一对应的关系生成新变量值 可以用这个新变量值替代原变量值 也可以生成一个新变量的过程 这种操作只适用于数值型变量 在 Transform 菜单中的有 RecodeIntoSameVariables 和 RecodeIntoDifferentVariables 两种赋值方法供选择 选择命令 RecodeIntoSameVariables 时 系统将产生新变量值直接替代原变量值 执行 RecodeIntoDifferentVariables 命令 系统将为产生的新变量值赋给一个新变量 例 要求在 Employeedata sav 文件中 将原变量educ中的值教育的年数重新赋值为新变量edulever 教育的等级 系统缺失值仍为缺失值 教育年数为8的转化为第1等级 教育年数为12 15之间的转化为第2等级 教育年数为16 19的转化为第3等级 教育年数为19年以上的转化为第4等级 42 具体操作如下 InputVariable OutputVariable 框 educOutputVariable Name eduleverLable 教育的等级单击change按钮单击oldandnewvalues按钮OldnewSysmis sysmis8 112thru15 216thru18 319thruhighest 4单击continue按钮 ok 43 44 注意 在上述两种赋值情况下 用户均可通过单击 If 按钮指定条件 来确定参与重新赋值的个案 与前面根据已存在的变量建立新变量方法不同的是 变量的重新赋值Recode不能进行运算 只能根据指定变量值作数值转换 且这种转换是单一数值的转换 变量的自动赋值 AutomaticRecode 变量的自动赋值可以将字符型 数字型数值转变成连续的整数 并将结果保存在一个新的变量中 其中字符型数据按照字母的顺序排序 在SPSS中的的许多模块中 分类编码不连续会产生空白的统计格子 从而导致效能降低 增加内存的需要 如 gender用二分类变量 用f表示女 用m表示男 这是字符型数据 当转成1女2男时化为连续的数值型 例 将字符型变量 gender 自动重新赋值为数值型变量 新变量名 sex 45 具体操作步骤如下 1 打开数据文件Employeedata sav2 Transform AutomaticRecode3 varible newvarible gender4 newname sex单击 addnewname 5 recodestartingfrom lowestvalue 从最小值开始 ok 46 注 由自动重新编码产生的变量将保留变量的定义及值标识 对于无值标识的值 则将原值作为重新编码值的标识 并产生一个新旧值及值标识的对应表 47 变量定义信息的查询 在SPSS数据编辑窗口中的 VariableView 标签中可以看到变量的定义信息 在其中还可以进行修改 在SPSS的 Utilities 菜单下的Varible命令中还提供了变量信息的查询功能 在对话框左边的变量列表中选择某个变量 右边的 variableinformation 框中就会显示该变量的数据类型 变量标签 缺失值规定 变量值标签等信息 单击 goto 按
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 强筋健骨丸与钙片协同效应-洞察及研究
- 2023年公办幼儿园招聘合同制工作人员报名登记表
- 土木专业招聘试题模板及答案
- 专业眼科测试题及答案解析
- 基础俄语考研真题及答案
- 2025至2030中国零点夹紧系统行业项目调研及市场前景预测评估报告
- 销售基本礼仪培训
- 应急基础知识培训
- 党员生日活动策划
- 行政人事部年度工作总结计划
- 2025成人高考民法真题及答案
- 京东校招测评题库及答案
- 学会真学习拒绝假努力!课件-2026届高三下学期三模阶段性班会
- 焊工外聘协议书
- JT-T 329-2025 公路桥梁预应力钢绞线用锚具、夹具和连接器
- 2025-2030中国电子处方系统行业市场现状供需分析及投资评估规划分析研究报告
- 宿舍交接协议书范本
- 电泳工艺教程课件
- 2025年上海市黄浦区九年级中考英语一模试卷(含解析无听力原文及音频)
- 人工智能平台服务合同
- 2025《义务教育信息科技课程标准(2022年版)》测试题库及答案(共4套)
评论
0/150
提交评论