




已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,数据管理,在数据文件建立好之后,还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件的结构进行重新调整或转换,以便适合于相同的统计方法。,数据管理,文件级别的数据管理变量级别的数据管理,文件级别的数据管理(1),SPSS中的Data菜单提供了文件级别的数据管理,可以对整个数据文件进行加工整理。,InsertVariable:插入变量InsertCases:插入记录GotoCase:到达某条记录,简单命令(这些功能都可以用鼠标在数据表界面直接完成,很少用菜单操作,在此不详述),SortCases:记录排序SplitFile:记录拆分SelectCases:记录筛选WeightCases:记录加权,常用的简单过程(使用频繁,必须掌握),文件级别的数据管理(2),DefineVariableProperties:定义数据字典CopyVariableProperties:将预定义的数据字典直接引入当前数据文件,即复制外部数据文件属性到当前数据文件,变量与数据文件属性向导(对大型或连续性数据分析项目非常有用),Transpose:数据转置Restructure:数据文件的重新排列,数据重构向导,文件级别的数据管理(3),AddCases:纵向合并AddVariable:横向合并,文件合并过程(MergeFiles),DefineDates:定义日期变量过程,用于时间序列数据Aggregate:数据汇总过程IdentifyDuplicateCases:查找重复记录,其他过程,文件级别的数据管理(4),正交设计过程(OrthogonalDesign),单变量排序:SPSS提供了一种简易操作方法,即在数据表格的变量名处单击右键,弹出右图多变量排序:使用SortCases过程来进行,查看详情,记录排序,记录排序,选中District,选择升序选钮(默认),将District选入Sortby框,选中Region,选择降序选钮,将Region选入Sortby框,记录排序,注意:在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱,记录排序,记录拆分,1.选中此框不拆分文件,2.按所选变量拆分文件,各组分析结果放在一起便于比较,3.按所选变量拆分文件,各组分析结果单独放置,4.用于选择拆分数据文件的变量,5.要求将数据按所用拆分变量排序,6.数据集很大,且拆分变量已排序,选此可节省运行时间,1,2,3,4,5,6,记录拆分,记录筛选,1,2,3,4,5,1.分析所有记录,2.分析满足条件的记录,按If按钮设定筛选条件,3.从原数据中按某种条件抽样,按Sample进行设定,4.基于时间或记录序号选择记录,按Range进行设定,5.使用筛选指示变量选择记录,非0值的记录被选中,6.未选中的记录被隔离,7.未选中的记录被删除,6,7,记录筛选,记录筛选,记录加权,设置作为权重的变量,如第一行表示agecat1gender1的人共33个,accid表示人数,应设为权重,记录加权,定义数据字典,变量名、测量尺度等,变量列表,频数、标签、缺失值设定等,拷贝变量属性,自动生成值标签,定义数据字典,数据转置,Transpose:该过程用于对数据进行行列转置,即原来的一条记录转成为一个变量,而变量则转成为一个记录,两次Transpose过程后数据集会恢复原样(点此见具体操作)。,数据转置,将变量Group、x选入variable框,再点击OK键,转置前的数据集,转置后的数据集,注:未选中的变量id其数据信息在转置后丢失,数据转置,数据文件重新排列,Restructure:此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。,数据文件重新排列,数据文件重新排列,数据anxiety转换前后的长型格式和型格式,数据文件重新排列,文件纵向合并,*:当前数据集中的变量+:新添加数据集中的变量,左框:新、老数据文件中不匹配的变量名,右框:已匹配的变量名,选择完成后单击OK即可,AddCases:纵向合并,从外部数据文件中增加记录到当前数据文件中,相互合并的数据文件中应该有相同的变量。,文件纵向合并,文件横向合并,1.未被纳入的变量列2.被纳入合并后新数据集的变量列表3.记录匹配使用的关键变量,AddVariables:横向合并,从外部数据文件增加变量到当前数据文件,两个数据集要有一个一一对应的关键变量进行匹配合并,且记录应按关键变量升序后再合并。,1,2,3,文件横向合并,数据汇总,分组变量,被汇总变量,数据汇总,定义汇总函数,定义新产生汇总变量的名称和标签,Function,Name&Label,数据汇总,查找重复记录,希望查找重复值的变量,重复记录按该变量的取值排序,设定第一个还是最后一个重复记录为主记录,查找重复记录,PrimaryLast0表示相应的记录为重复记录,查找重复记录,变量级别的数据管理(1),SPSS中的Transform菜单提供了变量级别的数据管理,可以对变量进行操作。,计算新变量(Compute):最常用,Recode:对变量值进行分组合并VisualBander:连续变量的可视化分段Count:表示某个变量的取值中是否出现某个值,或某个区间RankCases:变量编秩AutomaticRecode:对记录按某个变量值的大小排序,变量转换,变量级别的数据管理(2),CreateTimeSeries:建立时间序列ReplaceMissingValues:缺失值替代RandomNumberSeed:设定随机种子,专用过程,变量级别的数据管理(3),控制命令,RunPendingTransforms:用于执行编程中被挂起的数据整理操作,专用于时间序列模型,例1数据fee.sav是上海和杭州16名住院病人的费用数据,计算上海的住院病人平均每天的住院费用,要求结果取整。,计算新变量,输入新变量名perfee,计算新变量,计算新变量,输入条件表达式,计算新变量,选择函数,输入函数表达式,计算新变量,例2在数据fee.sav中生成新变量grade,当住院总费用小于5000元时取值为“相对较低”,大于等于5000元且小于7000元取值为“中等”,大于等于7000元且小于10000元为“较高”,大于等于10000元为“很高”。,变量值分组合并,新变量名grade,选入原变量total,变量值分组合并,变量值分组合并,三种Range的设置,所有的范围均包含了端点,而前面设定的变换会优于后面的变换,因此应该将大于等于10000元最先设定,而将小于5000元最后设定。,变量值分组合并,变量值分组合并,变量值分组合并,变量值分组合并,务必选上该项,变量值分组合并,变量值分组合并,recode过程提供了精确分组的功能,但如果希望进行的分组是有规律的,比如等距分组,或等样本量分组,使用recode过程进行操作就显得非常麻烦,且可视化程度不高。此时可以考虑使用visualbander过程进行可视化分段。,连续变量的可视化分段,例3仍以数据fee.sav为例,按变量total将病人分为5组,5000元以下为第一组,5000元以上的按等间距的方式分4组。,连续变量的可视化分段,连续变量的可视化分段,连续变量的可视化分段,设定分段规则,连续变量的可视化分段,连续变量的可视化分段,自动填充值标签,连续变量的可视化分段,例4仍以数据fee.sav为例,查看变量total中是否出现值6890。,查看特定变量值,查看特定变量值,查看特定变量值,查看特定变量值,查看特定变量值,例5仍以数据fee.sav为例,根据城市分组计算住院总费用的秩次。,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 科技园区场地租赁分成及人才引进合同
- 草场租赁与草原生态补偿及资源保护合同
- 清算还款协议书范本
- 建筑工程测量员专业服务协议
- 出租车乘客安全保障合同协议书
- 花艺沙龙培训
- 2024年“工会杯”职工技能竞赛化学检验员赛项理论考试题库(浓缩500题)
- 高三化学一轮复习 训练题-物质结构与性质
- 工厂成本方面培训
- 植物护理幼儿园
- 公对公咨询居间协议书范本
- 七年级下册英语语法填空专项训练100题含答案5篇
- 卫生院“服务基层行”支撑材料(3.7放射防护管理)
- 2024年xx中学学生校服选用采购实施方案
- 英语阅读5篇(难度较高)
- 煤矿防灭火细则
- DL∕T 2622-2023 1000kV高压并联电抗器局部放电现场测量技术导则
- 农村社区基础设施和公共服务建设项目可行性研究报告
- ISO9001-ISO14001-ISO45001三体系内部审核检查表
- JT-T-1270.3-2019公路桥梁梳齿板伸缩装置第3部分:整体锚固式伸缩装置
- 【8物(人教版)】淮北市二中联考2023-2024学年八年级下学期期末考试物理试题
评论
0/150
提交评论