第2章--SPSS-数据文件的管理ppt课件

上传人：闯*** IP属地：广东上传时间：2020-04-27 格式：PPT 页数：60 大小：1.25MB 积分：25 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二章数据文件的编辑和整理,在SPSS中，数据文件的编辑、整理等功能被集中在Edit、Data、Transform和Utilities四个菜单项中1数据的编辑2变量的操作,编辑和整理数据文件,1数据的编辑,1.1单元值的修改1.2增加和删除一个个案1.3数据的排序1.4数据的行列互换1.5选取个案子集1.6重复个案识别1.7数据分类汇总1.8缺失值的替代1.9数据次序确定,1.1单元值的修改,由于各种原因，已经输入的数据有时会需要修改，这就需要进行编辑，可用方向键或鼠标将黑框移动到要修改的单元，键入新值。,Edit-Gotocase,到达指定记录号的记录,EditFind/Replace,1.2增加和删除一个个案（Case）,1增加一个新的个案（即增加一个新的行）2删除一个个案,1.3数据的排序,在数据文件中，可根据一个或多个排序变量的值重排个案的顺序。,注意：是整个案例一起变动排序，而不是仅仅变量变动，多重排序时，指定排序变量的次序很重要，注意保留原来顺序的文件，以免发生混乱。,1.3数据的排序,排序的目的：有时需要改变数据排列的顺序，按照一定的顺序重新排列；便于浏览，了解数据的整体情况；便于找出最大最小值；能够快捷的发现异常值；可以按照一个或者多个变量排序。,1.4数据的行列互换,Data-SelectCases,1.5选取个案子集,DataSelectCase：If,1.5选取个案子集,条件表达式可使用现有变量名称、常数、算术运算符、逻辑运算符、关系运算符和函数。,点击Filteroutunselectedcases，会生成一个名为filter_$的新变量，表示选中还是没有选中，一旦该变量被删除，将自动取消样本抽样；点击Deletedunselectedcases，不符合条件的个案将被删除，保存文件后将无法恢复；完成以上操作后，SPSS的分析只对那些选中的个案进行，直到用户重新选取。点击Copyselectedcasestoanewdataset，可生成一个新的文件，只包含符合条件的个案。对当前文件没有影响。,1.5选取个案子集,DataSelectCase：Output,1.6重复个案识别,DataIdentifyDuplicateCases,1.7数据分类汇总,用户还可对数据编辑器中的数据按指定变量的数值进行归类分组汇总。SPSS中实现数据文件的分类汇总需要3个步骤:首先，需要指定分类变量和汇总变量。然后，计算机根据分类变量的若干个不同取值将个案数据分成若干类，并对每类个案计算汇总变量的描述统计量。最后，将分类汇总计算结果保存到一个文件中。,DataAggregateData,DataAggregateData:AggregateFunction,均值中位数求和标准差,第一个值最后一个值最小值最大值,加权个案数加权缺失数据数未加权个案数未加权缺失数据数,分类组中变量值（大于）界限值的个案数占该组总个案数的百分比,分类组中变量值（大于）界限值的个案数占该组总个案数的比率,结果文件中变量名和标签,1.8缺失值的替代,定义对相同值观测量的处理方式,定义秩次类型,1.9数据次序确定,Rank（普通秩次）Savage评分（以指数分布为基础的原始分秩次）Fractionalrank（分组例数之和占总例数的累积百分比）Fractionalrank%（累积百分比分数）Sumofcaseweights（分组例数的权重之和）Ntiles（分位数）Proportionestimated：比例估计，是以一个特别秩次对应分布的累积比的估计Normalscore：正态分数,定义秩次类型,1.9数据次序确定,平均秩次、最小值、最大值或当作一个记录处理,2变量的操作,2.1增加和删除一个变量2.2指定加权变量2.3根据已存在的变量建立新变量2.4产生计数变量2.5变量的重新赋值2.6变量的自动赋值2.7变量定义信息的查询2.8变量集的定义和使用2.9数据文件的合并2.10数据文件的分组,2.1增加和删除一个变量（Variable）,1）增加一个变量,（1）菜单操作法；（2）选中某列法，右击；（3）VariableView标签页法。,Edit-InsertVariable,在当前列前插入新变量,VariableView标签页法,2）删除一个变量,删除一个变量，即删除一列数据。其方法和上面的增加一个变量相对应。例如，要删除第5个变量列，则可先单击第5列的列头，这时整个第5列被选中，然后按“Delete”键或选择“Edit”菜单的“Clear”命令，或者单击鼠标右键，在其快捷菜单中选择“Clear”项，该列即被删除。,2.1增加和删除一个变量（Variable）,在变量浏览窗口，单击变量的行头，这时整个行被选中，然后单击鼠标右键，在其快捷菜单中选择“Clear”项。,2.2指定加权变量,在实际的统计中，经常需要计算数据的加权平均数。例如，希望了解某超市中某天售出商品的平均价格。如果仅以各种商品的单价平均数作为平均价格是不合理的，还应考虑到各商品的销售量对平均价格的影响。因此，以商品的销售量作为权重计算各种商品单价的加权平均数，才是我们需要求的数据。在SPSS处理中就需要将商品销售量作为加权变量。,Data-WeightCases,2.3根据已存在的变量建立新变量,有时需要通过对已经存在的变量进行处理，从而生成新的变量。选择“Transform”菜单的“ComputeVariable”项，弹出“ComputeVariable”（计算变量）对话框。在该对话框中的“TargetVariable（目标变量）”框中输入符合变量命名规则的变量名，目标变量可以是现存变量或新变量。,SPSS函数种类,算术函数（ArithmeticFunctions）统计函数（StatisticalFunctions）随机变量函数（RandomVariableFunctions）反分布函数（InverseDistributionFunctions）累积分布函数（CumulativeDistributionFunctions）逻辑函数（LogicalFunctions）日期和时间函数（DateandTimeFunctions）缺失值函数（MissingValueFunctions）字符串函数（StringFunctions）转换函数（ConversionFunctions）,条件表达式对话框,2.4产生计数变量,在统计过程中，往往需要进行一些计数工作。产生计数变量就是实现计数功能，它对所有个案或满足一定条件的个案，计算若干个变量中有几个变量的值落在指定的区间内，并将计数结果放入一个新变量中。,定义变量值,单个值；系统缺失值；系统缺失值或者用户缺失值；最大最小值区间；小于等于最大值的区间；大于等于最小值的区间。,指定条件来确定参与计数的个案,增加了一个计数结果列lj,2.5变量的重新赋值,在数据编辑过程中，用户可对个案的某个变量的数值重新赋予新值。该操作只适用于数值型变量。在“Transform”菜单中的有“IntoSameVariables”和“IntoDifferentVariables”两种赋值方法供选择。其中“IntoSameVariables”是对变量自身重新赋值；“IntoDifferentVariables”是赋值到其变量或新生成的变量。,Transform菜单项,(把新值赋给原变量的对话框),用于从原变量值按照某种一一对应关系生成新变量值，分为把新值赋给原变量和生成新变量两种情况。,Transform-Recode,recode过程对各组组限归属的确定方法,当相邻组的组限间断时，区间的上、下限均计入对应组；当相邻组的组限重叠时，则遵循“先定义的区间优先”原则，即重叠的组限值计入第一次出现该值的组；对于离散变量，应尽可能地采用间断组限；对于连续变量，为实现“上组限不计入”，应按照变量值从高向低依次定义各组区间；为实现“下组限不计入”，应按照变量值从低向高依次定义各组区间。,用于从原变量值按照某种一一对应关系生成新变量值，分为把新值赋给原变量和生成新变量两种情况。,Recode,Transform菜单项,(生成新变量的对话框),在上述两种赋值情况下，用户均可通过单击“If”按钮指定条件，来确定参与重新赋值的个案。与前面根据已存在的变量建立新变量方法不同的是：变量的重新赋值Recode不能进行运算，只能根据指定变量值作数值转换，且这种转换是单一数值的转换。,2.6变量的自动赋值（AutomaticRecode）,变量的自动赋值可以将字符型、数字型数值转变成连续的整数（排序），并将结果保存在一个新的变量中，其中字符型数据按照字母的顺序排序（大写字母优于小写字母）。新变量将保留原变量标签和变量值标签，同时新变量的值按原变量的顺序重新赋予从1开始的连续整数值；如果原变量没有标签，新变量将原变量值作为新变量的变量值标签。,Transform菜单项,2.7变量定义信息的查询,在SPSS数据编辑窗口中的“VariableView”标签中可以看到变量的定义信息，在其中还可以进行修改。在SPSS的“Utilities”菜单中还提供了变量信息的查询功能。,“Variables”对话框,2.8变量集的定义和使用,在SPSS的统计过程中，有时候收集到的变量会有很多个。在进行各种数据处理和统计分析时，所有变量都会显示在各个处理对话框的变量列表框中供用户选择。在众多变量中选择几个变量进行处理以及分析是很麻烦的，尤其是对于某几个经常需要进行操作的变量。SPSS提供了变量集（VariableSet）的概念，可以很好地解决上面所提出的问题。,1）变量集的定义,变量集是指一些变量的集合。SPSS变量集的分类：系统变量集是SPSS系统已经定义好的，它包括以下两个集合：ALLVARIABLES：存放数据编辑窗口中所有的变量。NEWVARIABLES：存放数据编辑窗口中所有尚未保存的新定义变量。用户自定义变量集是用户根据实际数据分析需要定义的，它可以有许多个。一般把需要经常处理的、处理过程类似的若干个变量存放在一个用户自定义变量集中。,2）定义用户变量集,Utilities-DefineVariableSets,3）用户变量集的使用,如果仅仅定义用户变量集，而没有指定SPSS使用该变量集，那么这个定义的用户变量集是不会自动发生作用的。也就是说用户应该告知SPSS系统要使用哪个变量集。SPSS默认使用系统变量集，也就是说，SPSS默认在数据处理中，屏幕上列出数据文件所有的变量。如指定SPSS使用用户定义的变量集，那么在分析时，屏幕上就会只列出用户变量集中的那几个变量，从而简化了变量的选择过程。,Utilities-UseVariableSets,2.9数据文件的合并,统计分析的首要任务是将数据输入到计算机中。在数据量较大时，经常需要将一份大的数据文件分成几个小部分，分别由几个人输入，然后将若干个小的数据文件合并成一个大的数据文件。数据文件的合并有两种方式：纵向合并和横向合并。,在纵向合并的两个数据文件中，数据含义不同的变量，变量名不应取相同的名称。,必须有一个相同的公共变量，是两个数据文件横向对应连接的依据。合并前先按照该公共变量排序。,2.10数据文件的分组（Split）,在统计中，经常需要先按某个变量进行分组，然后再求各个组的统计分析。例如，想分别了解男生和女生的成绩情况。这时就需要按照性别变量，进行数据文件的分组（这种分组是系统内定义的，在数据管理器中并不一定明确体现，故亦可称之为分割）。,分组统计结果,用户一旦设置了分组，那么此后的所有分析都将按这种分组进行，除非取消数据分组的命令。,SPSS运行环境设置,SPSS状态栏的显示和隐藏,数据编辑窗口最下面的状态栏用来显示SPSS当前的运行状态。当SPSS等待用户操作时，会显示“SPSSProcessorisready”的提示信息。,状态栏,状态栏的显示或隐藏可以通过“View”菜单下面的“StatusBar”

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第2章--SPSS-数据文件的管理ppt课件

文档简介

温馨提示

最新文档

评论

第2章--SPSS-数据文件的管理ppt课件

文档简介

温馨提示

最新文档

评论

相关文档