SPSS菜单简介课件_第1页
SPSS菜单简介课件_第2页
SPSS菜单简介课件_第3页
SPSS菜单简介课件_第4页
SPSS菜单简介课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学科研数据的处理与分析 第二讲、数据编辑处理菜单简介,SPSS,1,PPT学习交流,1.File菜单,SPSS,新建 打开 打开数据库 从文本文档读取 保存 另存为 显示数据文件信息 建立数据缓冲区 打印 打印预览 切换服务器 停止运算 最近使用过的数据 最近使用过的文件 退出,2,PPT学习交流,New & Open,New:新建数据(data)、新建语法输入(syntax)、新建输出窗口(output)、新建草稿输出(draft output)和新建脚本(script) Open:也有5个命令,基本与新建相同;在打开.xls文件时请先退出Excel,否则系统提示出错;打开后Excel文件

2、中的所有数据都会再现,默认type为numeric,measure为scale;而.xls文件中的文字有时会消失,可通过定义type为string,以及复制粘贴的方法再现(请注意excel文件的变量以及数据编排方式,否则在读取数据后还要作进一步转换),SPSS,3,PPT学习交流,Read Text Data,实际上该功能可以用Open命令完成 请注意.txt文件中变量属性、变量值的编排规则,否则在读取数据后还要作进一步转换,SPSS,4,PPT学习交流,Save & Save As,Save:save命令将保存文件中的所有内容;有时在我们处理数据的过程中系统会生成一些临时的变量,如果不想将它

3、们也一起保存,可以采用save as命令,选择想保留的变量名称另存为其他文件,SPSS,5,PPT学习交流,2.Edit菜单,SPSS,撤销操作 恢复所撤销动作 剪切 复制 粘贴 粘贴变量 清除 寻找 系统参数设置,6,PPT学习交流,Paste Variables,在运算时我们可能会用到存在于其他文件中的变量及其所对应的变量值;通常的做法是选择该变量的变量值,复制粘贴到新的数据文件中,但是这样作仅仅拷贝了变量值,而对于该变量的其他信息,例如type、label、values等信息仍然需要重新定义 该命令只复制粘贴所选变量的属性,而不粘贴其取值。 在variable view中使用使用copy

4、、paste 命令则可拷贝该变量的变量设置信息,SPSS,7,PPT学习交流,Find,查找指定变量中的指定数据;例如要查找SPSS自带的1991 U.S. general social survey文件中age变量为50的个体 首先打开该文件,在data view中单击age变量所在列的任一单元格,点击find或直接从工具栏中点击,在弹出的对话框中键入50,点击Find next即可,SPSS,8,PPT学习交流,3.Data菜单,SPSS,定义变量属性 拷贝数据属性 生成时间系列周期 插入变量 插入观察单位 转到观察单位 排序 行列转置 改变排列格式 合并变量或观察单位 分类汇总 正交设计

5、 拆分文件 选择特定观察单位 加权,9,PPT学习交流,Define Variable Properties*,该命令所提供的功能主要是针对nominal和ordinal类型的变量,可以在该命令的对话框中完成variable view中一些主要设置,例如type、label、value、missing、measure的设置 它的最大好处在于可以快速定义这些属性(比如通过复制另外一个类似变量的属性),以及给出一个类似频数分布表的直观视图,SPSS,10,PPT学习交流,Copy Data Properties*,该命令与edit菜单下的paste variable相似,同时define vari

6、able properties也可以提供类似功能将源变量属性复制至目标变量 与前面不同的是在该命令下,源变量与目标变量可以不同在同一数据中,SPSS,11,PPT学习交流,Inset Variable / Case,Inset Variable:有时在编辑好的数据中要添加新变量,通过该命令可以在选择的变量前(当前列)插入一个新变量;在工具栏中有相同功能的快捷按钮“ ” Inset Case:添加新观察单位,可以在当前行(case)前插入新case,在工具栏中有相同功能的快捷按钮“ ”,SPSS,12,PPT学习交流,Go to Case,到达指定记录号的观察单位(case),该命令在观察单位极

7、多时非常有用。在工具栏中有相同功能的快捷按钮“ ”,SPSS,13,PPT学习交流,Sort Case,可以将某个变量的变量值从大到小或从小到大排列;便于输入结束后进行查找,纠错,SPSS,14,PPT学习交流,Transpose,通过该命令可以将原先的case转变为一个variable,而variable则转变为case。该命令在读取一些以非标准格式记录的数据时十分有用 例如我们读取一个.txt文件,该文件中的记录不是很规范,经过转置后可以纠正,SPSS,15,PPT学习交流,SPSS,16,PPT学习交流,Restructure,许多时候按照“标准格式”输入的数据不一定可以立即满足我们的分

8、析要求。例如,在重复测量模型中,我们需要将同一个体多次的测量值并排在同一行上才可以分析,但是原始数据并非如此,详见SPSS11.5自带数据文件anxiety.sav,SPSS,17,PPT学习交流,SPSS,18,PPT学习交流,SPSS,将选择的变量转变为观察单位 (将横行数据转换为纵列),将选择的观察单位转变为变量 (将纵列数据转换为横行),所有数据横纵颠倒,19,PPT学习交流,20,PPT学习交流,用于确定哪些 数据可以排作 一行 : Subject,用于确定数据 按何种顺序排 列:Trail,21,PPT学习交流,SPSS,用于确定哪些 数据可以排作 一行,用于确定数据 按何种顺序排

9、 列,22,PPT学习交流,23,PPT学习交流,推荐使用按照trail排列,24,PPT学习交流,25,PPT学习交流,推荐保留未处理的变量,推荐保留未处理的个案,26,PPT学习交流,SPSS,27,PPT学习交流,Merge Files,用于合并数据,包括了两个过程,纵向合并(add cases),横向合并(add variables),SPSS,28,PPT学习交流,Merge Cases,从外部的数据文件中增加记录(case)到当前数据文件中,当前的文件中变量的个数不改变,但是观察单位数增多 例如研究者研究某人群的血磷值的分布情况,先期观察了10例;而后又观察了15例;两次观察的变量

10、都是血磷值,变量个数没有改变,为了分析方便考虑将两次的结果合并,称为纵向合并,SPSS,29,PPT学习交流,SPSS,30,PPT学习交流,Merge Variables,从外部文件添加变量(variable)到当前文件中 例如,某研究者观察某人群的血磷值,而后又观察了相同人群的年龄、性别,为了分析需要将两次结果合并,称为横向合并 合并前后相比,观测对象例数没有改变,但是变量个数增多了,SPSS,31,PPT学习交流,Merge Variables,横向合并对两个数据的要求比较高,系统默认是按照相同的记录号进行合并,或者使用一个关键变量(key variables)进行匹配合并。如果两个数据

11、文件的记录数(cases)不一样多,则会丢失部分记录,甚至合并失败。 现有两个文件,损伤1与损伤2;损伤1中包含了190号病例(其中有缺号)的性别、年龄、血小板值;损伤2则包含了11100号病例的收缩压、舒张压、脑损伤情况。,SPSS,32,PPT学习交流,SPSS,33,PPT学习交流,SPSS,34,PPT学习交流,切记:在将两份数据横向合并之前必须将它们各自按照匹配变量的升序进行排列,使用之前的sort cases命令,SPSS,35,PPT学习交流,Split File,拆分文件 一旦使用该功能,Data Editor下方的状态栏将会显示;如果将来进一步的统计分析不需要对原文件拆分(后

12、续的统计分析命令大多都有分组因素,通常不需要将cases拆分),请将拆分数据还原,SPSS,36,PPT学习交流,Orthogonal Design,正交表设计;该命令提供了设计(Generate)与生成(Display)正交表的功能 但是该命令所生成的正交表与理论课教材中的表格不同,表现在其表头中不出现误差列,其具体操作见方差分析,SPSS,37,PPT学习交流,Select Cases,很多时候我们不需要分析所有数据,而是按照某种要求分析其中的一部分 现研究者想分析cars.sav文件中,产于美国的汽车的输出功率,SPSS,38,PPT学习交流,SPSS,39,PPT学习交流,SPSS,4

13、0,PPT学习交流,Weight Cases,通常每一行就是一个Case,但是这一规定有时将会使输入数据十分繁琐;现某研究者要研究两种药物的疗效是否有别,分别观察了A药100例(30例无效,70例有效),B药100例(21例无效,79例有效);按照默认要求数据文件中必须至少设定两个变量,分别是:药物(1A,2B)以及治疗效果(0无效,1有效),每行代表一个case,需要输入200行! 如果直接使用有效或无效的频数将大大减少输入工作量。因此遇到上述情况时,通常增加一个变量:频数直接将30、70、21、79输入工作区中,但必须为系统指定分析时调用该列频数,这就是weight cases过程,SPS

14、S,41,PPT学习交流,4.Transform菜单,SPSS,计算生成新变量 设定伪随机函数的种子 计数并生成新计数变量 重新编码 等级化连续型数值变量 排序并生成新变量 自动排序 自动生成时间序列变量 填充时序变量中的缺失值 完成尚未结束的转换命令,42,PPT学习交流,Compute,SPSS,新变量名称,当前文件中的变量,新变量值的计算式,常用的函数,43,PPT学习交流,Compute,不等号 逻辑“and” 逻辑“or” 逻辑“not” 乘方,SPSS,44,PPT学习交流,Compute中的常用函数,对数转换:LG10(num) 、LN(num) 抗体滴度、病原体含量、变异系数等

15、正态性转换 倒数转换:直接用1/变量值波动很大的数据正态性转换 平方根转换:SQRT(num)满足泊松分布的数据或轻度偏态数据正态性转换 角度转换:平方根反正弦,ARSIN(num)与SQRT(num)联用率或百分比的正态性转换,SPSS,45,PPT学习交流,Compute中的常用函数,已知统计量求曲线下面积 (Cumulative Distribution Functions) CDF.BINOM(quant, n, prob)二项分布 CDF.CHISQ(quant, df)卡方分布 CDF.F(quant, df1, df2)F分布 CDF.NORMAL(quant, mean, st

16、ddev)正态分布 CDF.POISSON(quant, mean)泊松分布 CDF.T(quant, df)t分布 CDFNORM(z)标准正态分布,SPSS,46,PPT学习交流,某研究者随机抽样调查160名正常人,测得其脉搏均数为67次/分,标准差为5.7次/分;请问其中脉搏超过70次/分的人约有多少?(假设脉搏满足正态分布) 已知某地人群的脉搏均数为67次/分,标准差为5.7次/分;某研究者随机抽样调查160名正常人,请问抽到脉搏均数超过70次/分的样本可能性有多大? 根据以往经验,一般的胃溃疡患者有20发生胃出血;现某医院观测65岁以上胃溃疡病人304例,有80例发生胃出血,问老年患

17、者是否较容易发生胃出血? 卫生标准规定儿童化妆品含菌量不得超过500个/ml,现检查此种化妆品1ml,测得细菌数目为502个,问能否据此认为该化妆品不合格?,SPSS,47,PPT学习交流,Compute中的常用函数,已知曲线下面积求统计量 (Inverse Distribution Functions): IDF.CHISQ(p, df)卡方分布 IDF.F(p, df1, df2)F分布 IDF.NORMAL(p, mean, stddev)正态分布 IDF.T(p, df)Students t分布 (注意以上函数中的p表示曲线左侧面积),SPSS,48,PPT学习交流,已知方差分析中p=

18、0.021,df1=6,df2=12,求F值为多少? 已知自由度为211时,双侧概率值为0.0001,求t值? 在标准正态分布曲线下,单侧曲线下面积为0.178时,u值为多少?,SPSS,49,PPT学习交流,日期函数的运算,将不规范的日期转换为规范的日期:DATA.DMY(日,月,年) 计算两个规范日期间的天数:XDATA.TDAY(靠后的日期靠前的日期),SPSS,50,PPT学习交流,日期函数的运算,提取日期变量的信息: 提取日期对应的小时0-23 XDATA.HOUR(日期变量) 提取日期对应的天 1-7 XDATA.WKDAY(日期变量)* 提取日期对应的天1-31 XDATA.MDAY(日期变量) 提取日期对应的周1-5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论