




免费预览已结束,剩余12页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章变量级别的数据管理,2013.9,数据管理:对数据进行加工处理。对同一个数据需进行不同侧面的研究,可采取多种统计方法,不同的统计方法对数据文件结构的要求不同,这需要对数据文件的结构进行重新调整或转换,以便适用于相应的统计方法。数据管理直接关系到数据分析的结果。数据文件的管理功能集中于:“转换”(Transform)菜单变量级别管理“数据”(Data)菜单文件级别管理,“转换”(Transform)菜单的项目分为几类:计算新变量:“计算变量”(Compute)过程;变量转换:“重新编码”(Recode)“离散化”(VisualBander)“计数”(Count)“个案排秩”(RankCases)“自动重新编码”(AutomaticRecode),专用过程:日期/时间(Date/Time)创建时间序列(CreateTimeSeries)替换缺失值(ReplaceMissingValues)随机数字生成器(RandomNumberSeed)运行挂起的转换(RunPendingTransforms),3.1变量赋值所谓变量赋值是指在原有数据的基础上,根据用户的要求,使用SPSS算术表达式及函数,对所有记录或满足条件表达式的某些记录进行四则运算,并将结果存入一个用户指定的变量中。该变量可以是一个新变量,也可以是一个已经存在的变量。,3.1.1常用基本概念1.算术表达式(NumericExpression),用于进行变量转换,是由常量、变量名、算术运算符、圆括号等组成的式子。2.函数,有70余种系统函数,分为8类,包括算术函数、统计函数、分布函数、逻辑函数、字符串函数、日期时间函数、缺失值函数和其他函数。函数名(参数)是函数具体的书写形式,系统已经规定好的;圆括号中的参数可是一个或多个(多个参数之间用单字符逗号隔开);参数类型:常量、变量、算术表达式。3.条件表达式和逻辑表达式,是对指定部分记录进行计算和逻辑运算。如果上述三者同时出现,要先满足条件后计算。,3.1.2“计算变量”过程“计算变量”(Compute)利用算术符号和函数生成新结果,结果保存到指定变量中,指定变量可以是新变量,也可以是一个已存在的变量。,例3.1将年龄分为3组。又例1数据transform.sav平均成绩=(语文成绩+数学成绩+英语成绩)/3英语成绩在60分以上的学生语文和数学的平均成绩,又例2调整后工资计算“个人”所得税。调整后工资额小于1200元,税为0;工资额在1200-1700之间,税为(调整后工资额-1200)0.05;工资额在1700-3200元之间,税为(调整后工资额-1200)0.1-25;工资额在3200-6200元之间,税为(调整后工资额-1200)0.15-125。又例3辽宁样本家暴课题数据(部分)中,“出生年”变量计算为新变量“年龄”。,3.2对已有变量值的分组合并重新编码(Recode)连续变量转换为等级变量(分类变量或离散变量),如年龄、收入;将数值型变量转换为字符型变量,将字符型变量转换为数值型变量;将分类变量不同的变量等级进行合并,如教育程度;重新编码为相同变量(RecodeintoSameVariable)和重新编码为不同变量(RecodeintoDifferentVariable)。,3.2.1对连续变量进行分组合并连续变量转换为离散变量(等级或定序变量),生成新变量值,新值可赋给原变量,可生成新变量。通过两个过程实现:“重新编码”(Recode)和“离散化分段”(VisualBander)例3.2以例3.1运用“重新编码”过程操作。,又例数据transform.sav生成新变量grade。当英语成绩小于60分取值为“不及格”,60-70分为“及格”,70-80分为“良好”,大于等于80分为“优秀”。3.2.2分类变量类别的合并还以例3.1运用“重新编码”过程操作。又例数据transform.sav生成新变量grade2,将grade中的优秀、良好和及格合并为“PASS”等级,将“不及格”转化为“NOPASS”。,3.3连续变量的离散化3.3.1可视离散化过程“可视离散化”(VisualBander)SPSS12.0中新增的功能;可以进行等距分组,或等样本量分组;采用图形化的操作方式。例3.2将S3年龄变量等间距分为10组。,3.3.2最优离散化过程“最优离散化”过程是根据某些作为“关键指示变量”的分类变量,将原有的一个或多个连续变量按照该分类变量间差异最大化的优化原则离散化为分类变量,即可用离散化变量而非原始数据值进行后续分析。用于建模分析。当模型中的因变量为分类变量时,要对自变量进行离散化(分类化)。例3.3利用S3年龄变量对S4学历进行预测建模,要求基于此构思对S3进行最优离散化。,3.4变量的自动重编码与数值移动3.4.1变量的自动重编码“重新编码”(Recode)“自动重新编码”(AutomaticRecode)例3.4S0城市的数值分别为100、200、300,自动编码为S0new又例在transform.sav数据中,将字符型变量city转化为数值型变量newcity。3.4.2变量值的移动,3.5“转换”(Transform)菜单中的其他功能3.5.1指定数值的查找与计数“计数”(Count)过程:表示某个变量的取值中是否出现某个值,该值可是单个数值,可是指定区间,可给出条件,对部分数据进行操作。例3.5生成新变量S3Old,用于标识出S355的个案。S2性别为“条件”,3.5.2变量的编秩“个案排秩”(RankCases)编秩是对记录按照某个变量值的大小来排序。新变量代表名次举例:对按平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司电脑安全培训课件
- 汽车市场专员年终总结
- 公司用电安全培训心得课件
- 电解质紊乱病人的护理措施
- 湖北2025年初级招采人员考试(招标采购专业实务)试题库及答案
- 胰岛素C肽结果解读
- 生产部负责人工作总结
- 护士出科总结汇报
- 敦煌开店总结汇报
- 残疾人用工合同范本5篇
- 抑郁病诊断证明书
- 制定合同价格与结算条款的正确方法
- 零售药店医保培训试题及答案,零售药店医保培
- 江苏历年语文高考真题答案
- 外科学-第十一章-外科感染(含案例分析)课件
- 《ch棘皮动物》课件
- 中国服用过兴奋剂运动员名单 兴奋剂真的是毒品吗
- 小学英语语法时态讲解与归纳
- 《生存与修炼》熊厚音讲《道德经》教学文案
- 淘宝新店运营计划书文献
- 产教融合校企合作[可修改版ppt]课件
评论
0/150
提交评论