文件管理与数据转换.ppt_第1页
文件管理与数据转换.ppt_第2页
文件管理与数据转换.ppt_第3页
文件管理与数据转换.ppt_第4页
文件管理与数据转换.ppt_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文件管理与数据转换数据整理(二),马敬东 华中科技大学同济医学院 医药卫生管理学院,文件管理,数据文件合并 使用SPSS,用户可以两种不同的方式从两个文件中合并数据,即: 合并具有相同变量但不同记录的两个文件; 合并具有相同记录但不同变量的两个文件。 合并具有不同记录的文件 合并包含有不同变量的文件,Add Case过程从第二个文件即外部SPSS数据文件向当前工作数据文件追加记录。因此,在合并数据之前,必须有一个文件是打开的。 完成这一功能只需在菜单中选择:Data Merge File Add Cases,此即打开了Add Cases Read File对话框,选好和当前工作数据文件合并的外

2、部数据文件后,按下”打开” ,此即打开了Add Cases Form对话框,再按下此框中的OK键就完成了两文件的合并工作。,左侧显示新老数据库中不匹配的变量名,星号表示当前数据集中的变量,加号则表示添加数据集中的变量。可以通过Rename,对不匹配的变量重新命名然后再加入。亦可以按住CTRL键,选中两者,然后按Pair按纽,强行加入。,返回,New Working Data File: 合并后新数据集的变量列表。 Excluded Varialbes:为被纳入的变量。 Match cases on key:定义关键变量。单选框中第一个含义为纳入两个文件提供的所有记录,第二个为以外部数据为主纳入

3、当前文件的变量,第三个为以当前工作表为主。 Key Variables:用于选入记录匹配使用的关键变量。 Include Case Source 在新数据集中加入一个变量,用以指示记录的来源。,记录排序 记录排序,即对数据文件的行进行排序。它常和文件合并、文件分解、生成汇总报告等相联系。 数据文件中,根据一个或多个排序变量的值重排记录顺序,可在菜单中选择Data Sort Cases,汇总数据 用户可根据一个或多个分组变量的值对记录进行汇总,生成每组只包含一条记录的新数据文件。 结果可以存入新的数据文件,也可以替换当前的数据文件。 在菜单中选用:Data Aggregate ,此即打开了Agg

4、regate Data对话框。,Break Variable (s):确定分组变量 Aggregate Variable (s):确定被汇总的变量 Name & Label:定义新产生的汇总变量和标签 Function:汇总函数 Save Number of cases in break group as variable: 用于定义一个新变量以存储同组的记录数 Create new data file: 创建新的数据文件以存储汇总结果 Replace working data file: 用汇总结果替换当前数据,返回,文件分割 在信息分析的实际过程中有时需要将一个数据上从逻辑上进行分割,以便

5、更好更直观的进行分析。这个时候需要应用到SPSS的文件分割过程,即将数据文件分组进行处理。 在DATA菜单中选择Split File,则会出现下面的对话框。,Analyze all cases: 不拆分文件; Compare groups:按所选择的变量,分组拆分文件,各组分析结果放在一起便于比较; Organize output by groups:按所选择的变量,分组拆分文件,各组分析结果分开放置; Sort the file by grouping variables: 根据分组变量进行排序; File is already sorted:文件已经排序。,选取记录子集 用户可以对所要分析

6、的记录进行有针对性的选择。欲选取分析的记录子集,须在菜单中选用:Data Select Cases , 即打开了对话框,如下图所示。,All cases 使用数据文件中的所有记录。此为缺省。如果当前过滤条件有效,用户可用这一选项将其关掉。 If condition is satisfied 用户可用条件表达式选取记录。条件表达式对每一记录返回真、非真、或缺失值。返回为真,则记录被选取;返回为非真或缺失,则记录被过滤。 Random sample of cases 用户想在所有的记录中随机的抽去一部分记录来进行统计分析,通过这一选项可选定抽取记录的一个百分比或确切的记录数。 Based on t

7、ime or case range 对于定义有日期变量的时间序列数据,用户可选取一个日期或时间区间。 Use filter variable 用户可定义过滤变量,选取或删除非零或非缺失的记录。 Filtered 此状态下,未被选取的记录不包含于分析记录子集但仍含于原数据文件中。在关闭过滤状态后,用户仍可使用未选取的记录。 Deleted 子状态下,未被选取的记录从数据文件中删除掉。,记录加权 如果数据文件中的每条记录代表一个以上的观测,用户可给Weight过程指定重复因子。欲根据加权变量值对记录加权,须在菜单中选用:Data Weight Cases,此即打开了Weight Cases对话框,

8、如下图所示,数据转换,计算值 在对其它变量数值运算、转换的基础上计算值而得到新的变量。 从菜单中选择:Transform Compute,就得到了计算值对话框,如下图所示。 Target Variable 接受计算值的变量名。目标变量可以是现存变量或新变量。 Numeric Expression 用于计算目标变量值的表达式。表达式能够使用现存的变量名、常数、算数运算符和函数。在此编辑框中可以自由输入和编辑表达式,也可以使用计算器板、变量表和函数表将元素粘贴到表达式中。,返回,计算器板 上面包括数字、算数运算符和逻辑运算符。可以象使用计算器一样使用它(用鼠标点取功能键)。 算数运算符 注意运算符

9、的运算顺序:函数首先被运算,其次是指数运算,最后是加和减。可通过括号来对先要执行的运算进行控制。 关系运算符和逻辑运算符 函数,算数函数 ABS(numexpr) 绝对值。 RND(numexpr) 舍入为最接近的整数。 TRUNC(numexpr) 截断成一个整数。 MOD(numexpr , modulus) 第一个自变数除以第二个自变数的余数。 SQRT(numexpr) 平方根。 EXP(numexpr) 指数。E是自乘到自变数的次方。 LG10(numexpr) 以10为底的对数。 LN(numexpr) 自然对数。 ARSIN(numexpr) 反正弦。 ARTAN(numexpr

10、) 反正切。 SIN (radians) 正弦。 COS (radians) 余弦。 统计函数 SUM(numexpr ,numexpr,) 表中所有自变数值的和。 MEAN(numexpr ,numexpr,) 表中所有自变数值的平均数。 SD(numexpr ,numexpr,) 表中所有自变数值的标准差。 VARANCE(numexpr ,numexpr,) 表中所有自变数值的方差。 CFUAR(numexpr ,numexpr,) 表中所有自变数值的变异系数。 MIN(numexpr ,numexpr,) 表中所有自变数值的最小值。 MAX(numexpr ,numexpr,) 表中所

11、有自变数值的最大值。 逻辑函数 RANGE (test,lo,hi, ) 当第一个自变数的值在其余自变数所定义的范围以内时为真。 ANY (test,value,value, ) 当第一个自变数的值与表中其余自变数值匹配时为真。,数值编码 可以通过对数值重新编码来修改数值。可以对现存变量中的数值重新编码,或根据现存变量的编码值产生新的变量。 重新编入相同变量: 要对现存变量重新编码,从菜单中选择:Transform Into Same Variable,这样就打开了相应的对话框,如下图所示。 重新编入不同的变量 依据现存变量重新编码的值产生新的变量。从菜单中选择: Transform Recode Into Different Variables基本操作和如何选项同“ Into Same Variables”。,Old Value 想重新编码为新值的当前值。 Value 输入单个值。 System-missing 系统缺失值。在数值表中以SYSMIS出现。 System-or User-missing 包括用户缺失值的所有缺失值。数值表中以MISSNG出现。 Range

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论