spss中数据管理PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-01-15 格式：PPT 页数：54 大小：1.46MB 积分：68 举报 版权申诉

已阅读5页，还剩49页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三部分数据管理 SPSS的主菜单Edit和Data能够建立数据文件进行数据编辑具有很强的数据管理功能主要包括定义变量属性 DefineVariableProperties 插入变量 InsertVariable 插入个案 InsertCase 个案排序 SortCases 合并数据文件 MergeFiles 拆分数据文件 SpliteFiles 汇总数据 AggregateData 识别重复个案 IdentifyDuplicateCases 及加权个案 WeightCases 等 1 数据管理分为四部分一变量管理二个案管理三数据文件管理四变量的变换和计算 2 一变量管理 1 插入变量或删除变量建立数据集后可在DataView或VaribleView中插入新变量具体方法如下方法1 在DataView中插入新变量将光标移至想要插入的位置单击右键或Data菜单InsertVariable 即可在当前光标所在的变量前插入一个 VAR00001 的新变量双击该变量名即可自动切换到VaribleView中可以对该变量名进行编辑并且定义其属性 3 方法2 在VaribleViewer下将光标移至想要插入的位置单击右键或Data菜单InsertVariable 即可在当前光标所在的变量前插入一个 VAR00001 的新变量可以对该变量名进行编辑并且定义其属性注意插入或删除个案类似例3 1调入数据文件02 1 sav 2 定义变量属性 DefineVariableProperties 定义变量属性 DefineVariableProperties 可为用户在建立变量定性变量定序变量定距变量的描述性变量标识过程中提供帮助例3 2调入数据文件02 1 savData DefineVariableProperties 4 选中表示Unlabled 5 二个案管理 1 插入个案 InsertCase 2 个案定位 GoToCase 3 个案排序 SortCase 4 识别重复个案 IdentifyDuplicateCases 5 选择个案 SelectCase 6 个案加权 WeightCases 6 1 插入个案 InsertCase 或删除个案例3 3在数据文件02 1 sav的第10个个案前插入一个名为王蒙 1975年2月28日出生体检正常的个案将第5个个案删除操作将光标移到第10个个案选择Edit InsertCase 即在第10个个案前插入一空行也可右键快捷菜单操作 2 个案定位 GoToCase 使用GoToCase功能可以方便快捷的在大量数据中查找到指定的个案以便对其进行编辑修改或在其前插入新个案 7 例3 4在数据文件cesd sav中把第268个案的性别由女改为男选择Edit GoToCase 在CaseNumber框中输入268 OK 3 个案排序 SortCase SortCase能将数据文件中的数据或字符进行排序排序的方法可以依据变量作为排序关键词递增或递减排序大小顺序或字典顺序操作如下用鼠标选择 DataSortCases 会弹出以下对话框图2 12 选中考试成绩单击中间的黑三角把这个变量移至右面的矩形框中这个过程也可以通过双击考试成绩完成再选择排序方式升序或降序点击 OK 就可以了 8 例3 5数据文件hong1 sav 试对体重从小到大排序注意排序变量可以为多个具体步骤如下 1 选择var1作为第一排序变量 2 按照var1降或升如选降排列 3 选择var2作为第二排序变量 4 按照var1降或升如选升排列 5 单击OK 新数据覆盖原数据 9 4 识别重复个案 IdentifyDuplicateCases 用户在进行大样本量的调研工作中可能重复访问某个被访对象或重复录入某份试卷造成数据文件中包含重复个案引起偏倚利用识别重复个案 IdentifyDuplicateCases 用户可以对重复个案进行查找并且进行剔除操作 Data IdentifyDuplicateCases出现以下对话框 10 1 定义个案配对变量2 配对组中的排序变量用户可选择1或多个变量作为排序依据顺序可选升或降 3 新建变量原始个案指示器 1表示原始个案0表示匹配个案每组最后一个个案为原始个案每组第一个个案为原始个案根据个案指示器的数值进行过滤自动划出重复个案 11 4 对每组的匹配个案进行连续计数创建一个顺序号为0 n的数值变量其中0表示不匹配 5 将匹配个案移至文件的最上方6 显示新建变量的频数表例3 5在数据文件Identify sav中查找 id 重复的个案并且进行剔除 12 5 选择个案 SelectCase 在SPSS中用户可按一定准则选择个案然后进行统计分析 Analyze 或作图 Graphs 可以通过定义变量值或范围日期数学表达式逻辑表达式或函数设定选择个案的准则例3 6 对数据文件hong1 sav 用3种准则选择满足指定条件的部分个案并且进行频数分析准则一对数据文件hong1 sav中满足条件2 01 x6 3 00的体重 x6 的婴儿对血红蛋白x5进行频数分析操作 Data SelectCaseIfconditionissatisfied输入2 01 x6andx6 3 00Output中选择filteroutunselectedcases注意生成一个新变量filter 满足条件的个案一 1 表示未选中的个案的序号用斜划线化掉 13 准则二在数据文件hong1 sav中随机抽取30 的个案对血红蛋白x5进行频数分析在进行频数分析时 var为filter 没有也可和x5 操作 Data SelectCase Randomsampleofcases后出现以下对话框在所在个案中近似比例抽样在前个个案前精确抽取个个案注意生成一个新变量filter 满足条件的个案一 1 表示在进行频数分析时 var为filter 和x5 14 准则三在数据文件hong1 sav中选取第10 33例的婴儿对血红蛋白x5进行频数分析操作 Data SelectCase Basedontimeorcaserange Observation 注意不生成一个新变量在进行频数分析时 var为x5 对满足条件的个案进行分析 15 6 个案加权 WeightCases 个案加权 WeightCases 可在统计分析中对个案给予不同的权重权重变量中的数值表示数据文件中单个个案的观察值注意当加权变量值为0 负值或缺失值的个案不参与分析例3 7某地144名正常男子的红细胞数 1012 L 的整理数据见下表试进行频数分布分析 16 建立数据文件weight sav 变量名为x 红细胞数 f 人数 2 对变量f进行加权选择Data Weightcases 完成个案加权 3 对变量x进行频数分布分析画相应的直方图 17 三数据文件管理 1 数据的合并统计分析的首要任务是将数据输入到计算机中在数据量较大时经常需要将一份大的数据文件分成几个小部分分别由几个人输入然后将若干个小的数据文件合并成一个大的数据文件数据文件的合并有两种方式纵向合并和横向合并纵向合并就是将一个SPSS数据文件的内容追加到数据编辑窗口当前数据的后面然后将合并后的数据重新显示在数据编辑窗口中通过该方法可以将两个或更多个数据文件合并在一起 1 纵向合并 18 纵向合并操作 Date MergeFiles Addcases 例3 8将数据文件身高纵和 sav的个案追加到身高 sav中 1 打开数据文件身高 sav 2 Date MergeFiles Addcases出现如下对话框 3 利用AnexternalSPSSdatafile导入要追加的数据文件身高纵和 sav 4 匹配变量直接进入对于未匹配变量工作数据文件的变量用标注外部数据变量用标注可pair配对 19 注选中Indicatecasesourceasvariable 合并后的数据文件会出现名为source01的变量取值0和1 0代表个案来自工作数据文件 1代表个案来自外部数据文件横向合并横向连接也就是变量值的合并利用横向合并可以将两个或两个以上的具有相同个案的数据文件连在一起即将SPSS数据文件的内容连接到当前数据编辑窗口的右边然后将合并后的数据文件显示在数据编辑窗口中横向合并实质是将两个数据文件按照个案对应进行左右对接 20 实现数据文件的横向连接必须有一个相同的公共变量这个变量是两个数据文件横向对应连接的依据同时将这一公共变量排序注意在合并的两个数据文件中数据含义不同的变量变量名不应取相同的名称例3 9 将数据文件身高横合和 sav的个案追加到身高 sav中 1 打开数据文件身高 sav 2 Date MergeFiles Addvariables出现如下对话框 3 利用AnexternalSPSSdatafile导入要追加的数据文件身高横和 sav 4 匹配变量直接进入工作数据文件的变量用标注外部数据变量用标注 21 注选中Indicatecasesourceasvariable 合并后的数据文件会出现名为source01的变量取值0和1 0代表个案来自工作数据文件 1代表个案来自外部数据文件 22 数据文件的分组 split 数据文件的拆分是指将数据按某个或某几个变量分成一些供统计分析的分组在统计中经常需要先按某个变量进行分组然后再求各个组的统计分析例如想分别了解男生和女生的成绩情况这时就需要按照性别变量进行数据文件的分组这种分组是系统内定义的在数据管理器中并不一定明确体现故亦可称之为分割注意用户一旦设置了分组那么此后的所有分析都将按这种分组进行除非取消数据分组的命令例3 10 将数据文件child sav按性别年龄进行拆分并对体重与身高进行描述性分析 1 打开数据文件child sav 2 Date SplitFile出现如下对话框 23 1 分析所有个案不建立分组2 分组比较各分组的结果放在一起进行比较对于表格或图表每个分组变量所产生的表将放在一起显示 3 分组安排输出结果所有程序产生的分组结果将独立显示 4 分组依据本例使用性别年龄可多选 5 按分组变量排序6 文件已排序 24 数据的行列转置 Transpose 行列转置可将数据文件中的个案行转换成变量列变量列转换成个案行行列转置可对新变量自动命名并显示新变量名列表使用行列转置可以自动产生一个包含原始变量名的字符串变量case 1b1 以便用户了解各个个案对应的原变量名注意如果数据文件中含有变量值是唯一的变量可利用其作为名称变量Namevariable 该变量的值将用于生成转置后数据文件的变量名例3 11 对数据文件body1 sav进行行列转置 1 打开数据文件body1 sav 2 Date Transpose出现如下对话框 25 也可以用此方法将数据再转换回原来的排列方式注意行列转置前若对工作数据进行修改请先保存数据文件否则修改的信息会丢失 26 2020 1 15 27 数据分类汇总 AggregateData 用户还可对数据编辑器中的数据按指定变量的数值进行归类分组汇总在SPSS中实现数据文件的分类汇总需要3个步骤首先需要指定分类变量和汇总变量然后计算机根据分类变量的若干个不同取值将个案数据分成若干类并对每类个案计算汇总变量的描述统计量最后将分类汇总计算结果保存到一个文件中例3 12 对数据文件child sav按性别年龄进行汇总数据计算各组个案体重身高坐高胸围及头围的平均数 1 打开数据文件child sav 2 Date AggregateData出现如下对话框 28 1 分组变量列表选一个或多个数值型或字符型变量作为分组变量 2 汇总变量列表显示在汇总文件中用汇总函数产生的新变量的名称及表达式汇总的原变量必须是数值型分组汇总提供的函数形式主要有以下几种 Mean 求该组的平均值Median 求该组所有观察值的中值Sum 求该组所有观察值的和Standarddeviation 求该组的标准差First 只保持该组的第一个数值Last 只保持该组的最后一个数值等等 29 常见汇总函数 30 31 Name lable选项可逐一为汇总变量定义变量名和标签 Numberofcases选项会在新文件中创建一个变量用来计数每一组观测值的数目系统默认文件名为N BREAK 3 Save单选框 32 对于缺失值可采取多种手段进行科学替代这里的缺失值必须是系统或用户指定的缺失值缺失值的代替例3 13 替代数据文件收入 sav中的缺失值 1 打开数据文件收入 sav 2 Transform ReplaceMissingValues出现如下对话框 33 3 在变量名列中选择一个或多的存在缺失值的变量使之添加到newvariables 这是系统自动产生用于替代缺失值的新变量也可在name框处自己定义替代缺失值的新变量 Method共有以下几种替代方式 Seriesmean Meanofnearbypoints Medianofnearbypoints Linearinterpolation 用缺失值相邻两点的中点值做替代 Lineartrendatpoint 用线性拟合方式确定替代值注意变量在选中状态时nameandmethod可用 4 确定替代方式 change ok 34 四变量的变换和计算通过计算建立新变量 ComputeVariable 经过调查研究所得到的原始数据非常重要很多时候对原始数据可以进行重新计算如从年收入中可以计算出一个新变量月收入等从而生成新的变量例3 14 现有某班的5门功课期末考试成绩为了进一步的分析需要先对数据进行整理要求算出5门功课的总分平均分加权总分语文数学的权重为1 2 物理化学的权重为1 生物的权重为0 7 35 1 打开数据文件test sav2 选择 Transform 菜单的 ComputeVariable 项弹出如图所示的 ComputeVariable 计算变量对话框 3 在该对话框中的 TargetVariable 目标变量框中输入符合变量命名规则的变量名 4 在数值表达式框中输入表达式如图示 5 打开标签输入变量标签 ok 注意函数的使用 36 例3 14 建立新变量使得语文成绩 80的为一组 60 语文成绩 80的为一组低于60的是一组 1 打开数据文件test sav2 选择 Transform 菜单的 ComputeVariable 项弹出如图所示的 ComputeVariable 计算变量对话框 3 在该对话框中的 TargetVariable 框中输入变量名group 4 在数值表达式框中输入 1 如图示 5 打开标签输入变量标签语文分组 6 打开if 37 如图操作 continue ok重复这一过程对目标变量grounp分别定义60 语文成绩 80的为一组低于60的是一组的情况 38 产生计数变量 count Count过程用于标识某个值或某些值在某个变量的取值中是否出现在统计分析中有一项特定变量值计算功能它可以计数在一个观测值中满足特定要求的那些变量值出现的次数并将结果记录在一个新变量中例3 15 统计一下数据文件test 1 sav中每个个案语文数学物理化学4门课成绩有几门80分以上 1 打开数据文件test 1 sav2 选择Transform CountValuewithinCases弹出如下对话框 39 打开DefineValues对话框Continue ok 40 例在某次调查中有10个问题供调查者回答回答正确为1 错误为0 请计算每个调查对象回答正确的题目数数据文件为count sav 1 打开数据文件为count sav 2 选择Transform CountValuewithinCases3 目标变量定义为正确题数 4 数值变量列表 q1 q2 q105 definevalues value 1 add6 continues ok 41 变量重新赋值变量重新赋值功能是指将数据文件中的原变量按照某种一一对应的关系生成新变量值可以用这个新变量值替代原变量值也可以生成一个新变量的过程这种操作只适用于数值型变量在 Transform 菜单中的有 RecodeIntoSameVariables 和 RecodeIntoDifferentVariables 两种赋值方法供选择选择命令 RecodeIntoSameVariables 时系统将产生新变量值直接替代原变量值执行 RecodeIntoDifferentVariables 命令系统将为产生的新变量值赋给一个新变量例要求在 Employeedata sav 文件中将原变量educ中的值教育的年数重新赋值为新变量edulever 教育的等级系统缺失值仍为缺失值教育年数为8的转化为第1等级教育年数为12 15之间的转化为第2等级教育年数为16 19的转化为第3等级教育年数为19年以上的转化为第4等级 42 具体操作如下 InputVariable OutputVariable 框 educOutputVariable Name eduleverLable 教育的等级单击change按钮单击oldandnewvalues按钮OldnewSysmis sysmis8 112thru15 216thru18 319thruhighest 4单击continue按钮 ok 43 44 注意在上述两种赋值情况下用户均可通过单击 If 按钮指定条件来确定参与重新赋值的个案与前面根据已存在的变量建立新变量方法不同的是变量的重新赋值Recode不能进行运算只能根据指定变量值作数值转换且这种转换是单一数值的转换变量的自动赋值 AutomaticRecode 变量的自动赋值可以将字符型数字型数值转变成连续的整数并将结果保存在一个新的变量中其中字符型数据按照字母的顺序排序在SPSS中的的许多模块中分类编码不连续会产生空白的统计格子从而导致效能降低增加内存的需要如 gender用二分类变量用f表示女用m表示男这是字符型数据当转成1女2男时化为连续的数值型例将字符型变量 gender 自动重新赋值为数值型变量新变量名 sex 45 具体操作步骤如下 1 打开数据文件Employeedata sav2 Transform AutomaticRecode3 varible newvarible gender4 newname sex单击 addnewname 5 recodestartingfrom lowestvalue 从最小值开始 ok 46 注由自动重新编码产生的变量将保留变量的定义及值标识对于无值标识的值则将原值作为重新编码值的标识并产生一个新旧值及值标识的对应表 47 变量定义信息的查询在SPSS数据编辑窗口中的 VariableView 标签中可以看到变量的定义信息在其中还可以进行修改在SPSS的 Utilities 菜单下的Varible命令中还提供了变量信息的查询功能在对话框左边的变量列表中选择某个变量右边的 variableinformation 框中就会显示该变量的数据类型变量标签缺失值规定变量值标签等信息单击 goto 按

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

spss中数据管理PPT课件.ppt

文档简介

温馨提示

最新文档

评论

spss中数据管理PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档