实习之数据管理_第1页
实习之数据管理_第2页
实习之数据管理_第3页
实习之数据管理_第4页
实习之数据管理_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,数据管理,在数据文件建立好之后,还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件的结构进行重新调整或转换,以便适合于相同的统计方法。,数据管理,文件级别的数据管理 变量级别的数据管理,文件级别的数据管理(1),SPSS中的Data菜单提供了文件级别的数据管理,可以对整个数据文件进行加工整理。,Insert Variable:插入变量 Insert Cases:插入记录 Go to Case:查找记录,简单命令(这些功能都可以用鼠标在数据表界面 直接完成),Sort Cases:记录排序 Split File:记录拆分 Select Cases:记录筛选 Weight Cases:记录加权,常用的简单过程(使用频繁,必须掌握),文件级别的数据管理(2),插入与删除变量插入新变量:点击鼠标把光标定位于欲插入新变量列上的任一单元格,点击data,展开下拉菜单,选择insert variable则产生了一个新变量,其他变量顺序后移,可对新变量进行命名和定义。删除变量:把光标定位于欲删除的变量名处,单击鼠标激活该列,点击edit菜单,用cut或clear删除,或用delete直接删除。,插入与删除纪录插入新纪录:点击鼠标把光标定位于欲插入新纪录行上的任一单元格,点击data,展开下拉菜单,选择insert case则产生了一个空行,并自动排定纪录序号,其他纪录顺序下移一行。删除纪录:把光标定位于欲删除的纪录的序号处,单击鼠标激活该行,点击edit菜单,用cut或clear删除,或用delete直接删除。,查找数据(指针定位)查找纪录:在下拉菜单中点击命令,找到后光标自动跳到该单元格,此处序号是系统自动给出的序号。查找变量值:先将光标移到与查询的变量之所在的列,在下拉菜单中点击命令。查找由当前观察序号向序号大的方向搜索,如果找不到则出现“not”,找到后光标自动跳到该单元格。,单变量排序:SPSS提供了一种简易操作方法,即在数据表格的变量名处单击右键,弹出右图多变量排序:使用Sort Cases过程来进行,查看详情,记录排序,记录排序,选中District ,选择升序选钮(默认),将District选入Sort by 框,选中Region,选择降序选钮,将Region选入Sort by 框,记录排序,注意:在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱,记录排序,记录拆分,1.选中此框不拆分文件,2.按所选变量拆分文件,各组分析结果放在一起便于比较,3.按所选变量拆分文件,各组分析结果单独放置,4.用于选择拆分数据文件的变量,5.要求将数据按所用拆分变量排序,6.数据集很大,且拆分变量已排序,选此可节省运行时间,1,2,3,4,5,6,记录拆分,记录筛选,1,2,3,4,5,1.分析所有记录,2.分析满足条件的记录, 按If按钮设定筛选条件,3.从原数据中按某种条件抽样,按Sample进行设定,4.基于时间或记录序号选择记录,按Range进行设定,5.使用筛选指示变量选择记录,非0值的记录被选中,6.未选中的记录被隔离,7.未选中的记录被删除,6,7,记录筛选,记录筛选,记录筛选单击展开下拉菜单,选择并单击,出现 对话框。记录拆分单击展开下拉菜单,选择单击,出现对话框。,记录加权,设置作为权重的变量,如第一行表示agecat1 gender1的人共33个,accid表示人数,应设为权重,记录加权,变量级别的数据管理(1),SPSS中的Transform菜单提供了变量级别的数据管理,可以对变量进行操作。,计算新变量(Compute):最常用,Recode:对变量值进行分组合并 Visual Bander:连续变量的可视化分段 Count:表示某个变量的取值中是否出现某个值,或 某个区间 Rank Cases:变量编秩 Automatic Recode:对记录按某个变量值的大小排序,变量转换,变量级别的数据管理(2),例1 数据fee.sav是上海和杭州16名住院病人的费用数据,计算上海的住院病人平均每天的住院费用,要求结果取整。,计算新变量,输入新变量名perfee,计算新变量,计算新变量,输入条件表达式,计算新变量,选择函数,输入函数表达式,计算新变量,例2 在数据fee.sav中生成新变量grade,当住院总费用小于5000元时取值为“相对较低”,大于等于5000元且小于7000元取值为“中等”,大于等于7000元且小于10000元为“较高”,大于等于10000元为“很高”。,变量值分组合并,新变量名grade,选入原变量total,变量值分组合并,变量值分组合并,三种Range的设置,所有的范围均包含了端

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论