spsstrans菜单PPT课件.ppt_第1页
spsstrans菜单PPT课件.ppt_第2页
spsstrans菜单PPT课件.ppt_第3页
spsstrans菜单PPT课件.ppt_第4页
spsstrans菜单PPT课件.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章数据文件的处理 二 Transform菜单 1 Transform菜单 Compute 计算Recode 重新编码VisualBander 可视化分组Count 记数RankCases 个案排秩AutomaticRecode 自动重新编码CreatTimeSeries 创建时间序列ReplaceMissingValues 替换缺失值RandomNumberGenerators 随机数发生器 2 本章主要内容 变量计算自动编码重新编码个案排秩记数 3 变量计算 1目的 根据SPSS算术表达式以及函数 对所有个案或满足条件的部分个案计算产生新变量 4 变量计算 算术表达式 常量变量算术运算符 乘方 圆括号函数 由 组成的式子 5 变量计算 条件表达式 简单条件表达式 复合条件表达式 And OR NOT SPSS函数算术函数统计函数分布函数逻辑函数字符函数日期函数缺失值函数其他函数 6 1 Arithmetic函数 数学函数Abs 返回变量的绝对值Arsin 返回变量的反三角函数值Mod 返回数值表达式除以模数后的余数 要求模数不能为0Rnd 返回数值表达式四舍五入后得到的整数值Trunc 返回数值表达式截尾以后得到的整数值 变量计算 7 2 统计函数 Statistical CFVAR 变异系数 标准差 均值 MAX 最大值 MIN 最小值 MEAN 均值 SD 标准差 SUM 求和 VARIANCE 方差 变量计算 8 3 随机变量函数 Randomnumbers RV Normal mean stddev 返回来自指定均值和标准差的正态分布的随机数RV EXP shape 返回服从指定参数的指数分布随机数RV Possion mean 返回服从指定均值的泊松分布的随机数RV Uniform min max 返回指定最小值和最大值的均匀分布的随机数 变量计算 9 4概率密度函数 PDF 5累计分布函数 CDF 6逆分布函数 IDF 7 字符串函数 string 8 转换函数 converse 主要用于字符型变量与数值型变量的转换9日期时间函数 DateCreation 10缺失值函数 MissingValues 10 变量计算 步骤 1 Transform Compute 2 在NumericExpression框给出SPSS算术表达式和函数 3 在Target框中存放计算结果的变量名 TypeandLable 目标变量的类型和标识 4 如果对符合一定条件的个案进行变量计算 选择If 11 变量计算 实例1 Test sav现有5门功课的考试成绩 要求算出5门功课的总分 平均分 加权总分 语文权重1 1 数学权重1 2 物理权重1 0 化学权重1 0 生物权重0 7 COMPUTEtotal chinese math physics chemist biology EXECUTE COMPUTEaverage chinese math physics chemist biology 5 EXECUTE COMPUTEwaverage chinese 1 1 math 1 2 physics chemist biology 0 7 5 EXECUTE 12 在Compute对话框中定义了计算表达式 目标函数 以及设置了计算条件后 单击主对话框的Paste按钮 系统随即打开Systax窗口 该窗口显示如下格式的命令语句 1 未设置计算条件情况下 COMPUTE命令语句 COMPUTE变量名 计算表达式 EXECUTE 其中 命令关键字COMPUTE 变量名即定义的目标变量名 它既可以是在主对话框Taget框中新定义的变量名 也可以是当前工作文件中已经存在的变量 13 等号 计算表达式 表达式后接一个点 表示语句中止 计算表达式中的变量必须是工作文件中存在的变量 EXECUTE 为执行语句 例如 假设表达式中的变量都是当前工作文件已经定义过的变量 则下列语句都是合法的COMPUTE命令 COMPUTEaverage math十chemical 3 用鼠标将COMPUTE命令和EXECUTE命令选中 单击Syntax窗口工具条中的箭头按钮或执行RUN ALL菜单命令 结果将显示到数据窗口 14 掌握COMPUTE命令的结构后 需要执行变量计算命令时 可以直接打开Syntax窗口自行编写COMPUTE命令语句 而且允许并列多个COMPUTE命令语句 这样可以一次计算多个新变量值 大大地提高计算效率 2 设置计算条件情况下 IF命令语句 IF 关系表达式或逻辑表达式 新变量 计算表达式 EXECUTE 表示在关系表达式或逻辑表达式为真的条件下计算新变量值 例如 下列语句都是合法的IP命令 IF sex 1 salary 0 95 salary十125 15 IF score 90Ortotal 450 grade 1用鼠标将IF命令行到EXECUTE命令行选中 单击窗口中的箭头按钮或执行Run All菜单命令 计算结果将显示到数据窗口 与 1 相同也允许同时并列多个IF命令语句 也可以和COMPUTE命令语句并列 执行新变量的计算 SPSS的每个统计功能对话框中都设有Paste按钮 当对话框内选项设置确定以后 单击该按钮 系统按照设定的选项将需执行的命令以SPSS语法程序显示在Syntax窗口 在该窗口可以进一步地编辑 然后执行Run All菜单命令 或者选择其中部分程序语句 执行Run Select菜单命令 输出结果或显示于数据窗口 或显示于Output窗口 16 练习 变量计算 职工基本情况数据 依据职称级别计算实发工资 假设职称1至4的工资分别上调50 30 20 10 17 自动重新编码 目的 将字符型或数值型数据转化成连续的整数分类编码不连续会产生空白的统计格子而导致效能降低 增加内存需求某些模块不能使用字符变量或不连续的整数值作为因子水平 18 步骤 1 Transform AutomaticRecode 2 将分组变量选择到Variable NewName框中 3 NewName框后输入存放分组结果的变量名 单击NewName 4 在RecodeStartingfrom框中选择单变量分组按升序还是降序 自动重新编码 19 实例 职工基本情况数据 对基本工资重新编码新变量为srlb1 变量标签 基本工资类别1 自动重新编码 AUTORECODEVARIABLES sr INTOsrlb1 PRINT 20 重新编码 目的 根据统计研究的需要 将数据按照某种标准重新划分成不同的组别 分为在相同的变量中重新编码及在不同的变量中重新编码两个功能 21 2020 2 4 22 分组数目的确定 Sturges的经验公式 重新编码 23 组距的确定 组距是一个组的上限和下限之差 重新编码 24 InSameVariables步骤 1 Transform Recode InSameVariables 2 分组变量选择到NumericVariables 3 单击OldandNewValues进行分组区间定义 重新编码 25 InSameVariables步骤 指定分组区间的上限和下限 并在NewValue框中给出该区间对应的分组值 单击Add确认分组区间并加到Old New框中 Change 修改分组区间Remove 删除分组区间 5 仅对符合一定条件的个案分组 击If 重新编码 26 IntoDifferentVariables步骤 1 Transform Recode IntoDifferentVariables 2 分组变量选择到NumericVariablesOutput 3 在OutputVariable后输入存放分组结果的变量名 单击Change确认Lable 输入相应的变量名标签 重新编码 27 4 单击OldandNewValues进行分组区间定义 5 仅对符合一定条件的个案分组 击If 重新编码 28 实例1 职工基本情况数据 对基本工资进行分组新变量为srlb2 变量标签 基本工资类别2 若基本工资 1000 编码为1 若基本工资不低于1000 编码为2 重新编码 RECODEsr 1000thruHighest 2 ELSE 1 INTOsrlb2 VARIABLELABELSsrlb2 基本工资类别2 EXECUTE 29 练习 已知产妇及婴幼儿体检数据 试对婴儿体重按如下方式分组 x63 00kg g 3 重新编码 30 练习 已知产妇及婴幼儿体检数据 hong1 dbf 试对婴儿体重按如下方式分组 x63 00kg x6 3 重新编码 31 个案排秩 对某变量计算每个数值的秩秩 从小到大或从大到小时每个数值的相应序号 对相同数值的秩取他们的平均序号只能对数值变量排秩 32 个案排秩 具体操作方法 按Transform RankCases顺序逐一单击鼠标键 打开RankCases对话框 Variable 排秩的变量By 分组排秩 选择分组变量Assignrank1to 中可选择秩的排列方式RankTypes 排秩方法Ties 结的排秩方法DisplaysummaryTables 表示要在输出结果窗中显示新变量的名称 标签 秩类型等总结性信息 33 实例1 职工基本情况数据 对工资排秩 练习 职工基本情况数据 按照不同性别对工资排秩 RANKVARIABLES sr A RANK PRINT YES TIES MEAN RANKVARIABLES sr A BYxb RANK PRINT YES TIES MEAN 34 计数 1目的 对所有个案或满足某条件的部分个案 计算若干变量中有几个变量的值落在指定区间 并将记数结果存入一个新变量的过程 35 计数 2关键 参与记数的变量记数区间 36 计数 记数区间 单个变量值 Value 系统缺失值 System missing 系统缺失值或用户缺失值 Systemorusermissing 给定最大值和最小值区间 nthroughm 小于等于某指定值的区间 Lowestthroughn 小于等于某指定值的区间 nthroughhighest 37 计数 3步骤 1 Transform Count 2 将参与计数的变量选到NumericVariables 3 在TargetVariable框中输入存放计数结果的变量名 在TargetLabel框中输入变量名标签 38 计数 4 单击DefineValues定义计数区间 Add 增加计数区间Change 修改计数区间Remove 删除计数区间 5 仅对符合一定条件的个案计数 击If 39 计数 练习 Test sav 现有5门功课的考试成绩 要求算出每个学生优 90以上 良 80 89 中 60 79 不及格 59以下 的门数 COUNTcountcj2 chinesemathphysicschemistbiology 80thru89 VARIABLELABELScountcj2 考试成绩良门数 EXECUTE COUNTcountcj1 chinesemathphysicschemistbiology 90thruHighest VARIABLELABELScountcj1 考试成绩优门数 EXECUTE 40 作业1 职工基本情况数据 先按职称升序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论