spss授课_数据管理_新PPT课件.ppt_第1页
spss授课_数据管理_新PPT课件.ppt_第2页
spss授课_数据管理_新PPT课件.ppt_第3页
spss授课_数据管理_新PPT课件.ppt_第4页
spss授课_数据管理_新PPT课件.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,李国春流行病学和卫生统计教研室,南京中医药大学,统计软件SPSS10.0,.,2,主窗口(SPSSDataEditor),数据编辑窗口(*.sav),结果输出窗口(*.spo),DataViewer,VariableViewer,(outputviewer),.,3,定义变量,Name,Label,Values,Type,Width,Decimals,Missing,Measure,必需填写,.,4,.,5,数据管理(DataManage),数据文件的建立与录入基本统计学原理统计数据的描述基本概念SPSS建立数据库的方式直接建立spss系统数据文件(.sav)从外部调用其它数据文件SPSS操作定义数据库结构及数据库录入应用实例数据文件的整理与转换,.,6,统计软件包归根到底是要以数据为对象,对数据进行分析。学会建立一个正确的数据文件及进行数据管理是做好统计分析的第一步,是为分析做好准备工作。一、数据文件的建立与录入(一)、基本统计学原理1、统计数据的描述(数据编码)医学统计数据结构由变量(variable)、变量值(value)、观察单位或记录(recordorcase)(在数理统计中称为一个概率事件)等组成(举例:实际就是建立一类似Foxpro数据库,)。统计数据的描述就是将原始数据经编码以后以某种规范的格式输入电脑。,数据管理(datamanage),.,7,数据的结构与特点(举例),表100名高血压病人治疗后的临床记录,.,8,统计数据实际是科研数据,让我们先研究一下科研数据结构(以实验研究为例)。实验研究的三要素为:实验因素(factor)与处理(treatment)实验效应(effect)实验对象(unitorcase)注:实验因素:即为各种影响因素(independentvariableorfactor),在临床研究中可能是各种预后因素。在spss的数据结构中称这些影响因素或预后因素为自变量(independent)或因素(factor)或分组变量。实验效应:是指受试对象接受实验处理后所出现的实验结果,通常由人或动物相应的各项指标来反映。在数据结构中这些指标也称作各种因变量(dependentvariable)或反应变量(responsevariable)实验对象:就是一个个记录(recordorcase)SPSS中在Variable视窗中建立数据结构(类似:建立库结构)。,变量(Variable),.,9,医数结学据构,变量variable,变量值value,记录或病例recordorcase,.,10,变量值,.,11,.,12,.,13,原始数据,.,14,.,15,变量(指标)与变量值(VariableorValue):描述研究单位的各种特征。连续型的变量离散型的变量两分类与多分类(有序与无序)医学统计学中资料类型总结如下:(不同的数据资料类型一般要选择不同的统计方法)数值变量(计量资料)如身高、体重等医学统计(measurement)有序分类(等级资料)如疗效资料分类变量(ordinal)二项分类如性别(category)无序分类(binomialD)(nominal)多项分类如血型(计数资料)(nultinomialD)我们一般根据不同的变量资料类型选择不同的统计方法。,2、基本概念解释,.,16,统计软件中数据录入格式(举例说明),统计表格格式,统计分析格式,.,17,自变量(Independentvariable)、协变量(covariate)、因变量(dependentvariable)、哑变量(dummyvariable)。注:哑变量或伪变量定性变量或等级变量转换成定量变量比较难办,叫做指标的数量化。定性指标的数量化是引入指示变量、即取值(0、1)的两分变量X变量就称为哑变量。如性别:0为男性,1为女性。协变量混杂因素中的定量变量我们可以作为协变量来处理。观察单位(ObservationorCase):医学研究中依据研究目的而确定的最小研究单元(unit),有狭义的个体和广义的个体。如:一个人、一个动物、一个家庭。,.,18,数据编辑窗DataEditor的DataView界面的二维表格,DataEditorSPSS术语中文解释统计学概念二维表datafile数据文件总体或样本一行case样品、病例一个概率事件行号casenumber样品编号观测量序号一列variable变量对象的特征列号variablename变量名特征名称单元格中的数值value变量值对象的某特征值,.,19,(二)、SPSS建立数据库的方式SPSS所处理的数据文件有两种来源:1、是在SPSS环境下新建数据文件直接用DataEditor(数据编辑器)建立(也称为系统数据库):数据文件的格式一般为每行一个记录(case),每列一个变量(variable)。往往不同的统计分析方法需要不同的数据文件的格式。注:数据文件的后缀为.sav2、是从外部调用已建立的数据文件能与其它软件共享数据,与其它软件数据有转换接口。读取纯文本文件(ReadTextDataASCII)读取Excel文件读取其它数据库(FOXPRO)文件注:通过其它数据库转换而来的数据文件在数据结构上可能有些不同。,.,20,.,21,(三)SPSS操作1、定义数据库结构及数据录入定义数据库结构定义数据结构(库结构)定义变量(definevariable内容包括:变量名、类型、变量标签、变量值标签、定义缺失值、数据列对齐方式、变量的度量尺度(scale定量变量、ordinal等级变量、nominal定性变量)注:系统默认变量名称:var00001var00002数据录入SPSS在数据编辑器中定义变量,输入、修改数据,形成一个可供SPSS分析的数据文件,可使用“Edit”菜单项中的各种功能可以对数据文件进行编辑处理。编辑完注意要存盘,默认扩展名为.sav,也可用Saveas存盘并可保存为其它类型的数据文件。,.,22,定义变量结构:变量变量名类型宽度小数点变量标签变量值标签VariableTypeWidthDecimalslabelvalue编号numbernumeric20编号性别sexnumeric10性别1:男2:女年龄agenumeric20年龄身高heightnumeric51身高体重weightnumeric41体重,增加原始资料的可读性,.,23,SPSS数据文件结构(红色表示可以省略),变量名,变量类型,标签,变量名标签,变量值标签,变量缺失值,变量列格式,变量度量方法,.,24,空白工作区,.,25,Heightnumeric51身高,.,26,2、是从外部调用已建立的数据文件读取文本文件(ReadTextData*.dat,*.txt),例:某地120名7岁男童身高(cm)资料如下,描述其特征。,123.60121.03115.42113.40124.02123.41122.81125.83112.33122.91124.79110.12117.91126.32116.55113.31114.38127.22112.80120.13120.62124.84117.17109.85118.96116.66117.44121.68118.82117.63120.05119.90115.24121.42125.64124.24118.17120.07115.12118.76116.74128.35124.43115.36113.59125.36120.62120.10122.46120.51113.26118.44122.30117.36116.46121.33120.88111.86117.99112.65117.44124.44118.69121.40118.61130.75118.31121.44117.16129.65111.36115.26120.78123.84123.16121.23126.14118.65119.19116.02115.78119.01116.63120.63114.30119.96116.63128.41117.42123.32114.09118.58116.73117.11117.97108.13126.42119.66119.69118.38115.16115.01119.48127.58122.14122.63115.57123.70123.39119.59123.40119.72120.60115.50123.78118.41118.82114.56119.45118.11,(医学统计学陈启光等主编),(文本转换),.,27,读取Excel文件(*.xls),.,28,读取其它数据库(FOXPRO*.dbf)文件,.,29,二、数据文件的整理与转换(可以认为是分析前处理)(一)、基本统计学问题在多数情况下,原始数据难以满足数据分析的要求,医学研究人员在进行统计分析之前,为了获得符合统计分析的数据或变量,有时要对原始数据文件的变量进行加工、修改、变换或建立新变量,这就是软件要对数据进行整理转换的统计学基础(70个函数介绍)。有时我们可能要在数据分析前使用其中的一些方法,也有可能是在数据分析的过程中,也有可能是对数据的后处理(前一次统计分析是后一次分析的基础)。有些课本中称该过程为分析前处理,但不是很全面。,.,30,1、数据的整理数据的整理是对原始数据中的变量或个体进行增加、删除、排序、倒置、合并和加权等的处理过程。2、数据的转换在整理数据时,常需要把某些变量的数据进行变换,这些数据的变换是通过一个有效的数值表达式或使用SPSS的内部函数(常用的有对数、平方根、倒数、百分位数的平方根反正弦等)来实现。另外连续变量还可以变换为分类变量。,.,31,变量变换:方差齐性化、正态化、曲线直线化在原变量的基础上转化为新变量,(在Transform菜单中实现转换过程),参数检验:t检验、方差分析等非参数检验:秩和检验等,.,32,变量变换,对数变换,倒数变换,平方根变换,平方根反正弦变换,.,33,(二)、SPSS操作1、对话框介绍对话框总体介绍:大多数的菜单命令能打开一个对话框,对话框和窗口的主要区别在于不能任意改变大小,只能在当前窗口串移动或关闭。用户在对话框中选择要分析的变量、设置参数,然后提交系统执行,可完成SPSS的大部分操作。虽然SPSS的对话框各不相同,但都由基本的项目组成,现将其列表如下:标签标签代表一个对话框由多个部分组成,常位于对话框的首行,单击标签名称,就可在对话框中显示相应的内容。文本框用户可在文本栏中,输入信息,如变量名、变量标签名、文本名等。变量列表栏常位于对话框的左边,按照某一顺序列出数据文件中的所有变量。分析变量栏放置选择的进行统计分析的变量。,.,34,下拉列表栏右边有一个向下的箭头按钮,单击该按钮便可打开下拉列表栏,用户可从中选择某个选项单选栏单选栏中的选项一次必须选择其一,单击某个选项,则此选项就被加一黑色的框表示选中。复选栏复选栏中的选项可选择多个、不选或全选。打钩表示选中。移动变量按钮把变量列表栏中选中的变量加到分析变量栏。把变量分析栏中的变量送回变量列表栏。OK将整个对话框中进行的全部操作提交系统执行。Paste将整个操作过程中选择的命令、参数等粘贴到Syntax窗中。Reset放弃刚刚进行的的操作,恢复到操作前的状态,相当于“什么命令也没有做”,并关闭对话框。Cancel本次操作作废,返回到上一级对话框或主菜单。Continue提交选择,返回到上一级对话框。Help打开帮助。,.,35,打开按钮这类按钮带“”标记,如Save单击此按钮可打开下一级子对话框。展开按钮这类按钮带有“”,单击它可将当前对话框展开。单选按钮这类对话框有一个的标记,单击此标记,表示选择。复选按钮这类按钮左边有一个标记,打钩表示选中。关闭按钮单击此按钮,关闭当前对话框。对话框控制栏对话框的标题栏,点击并拖动鼠标(变成高亮度)可移动对话框的位置。数据文件的整理sort-casego-to-case(查找观察值)split-filemerge-fileaggregate(分组汇总)weight(加权)select-case(抽样)数据的变换computecountrecodeautomatic-recodecategorize-variablerankcase(求秩)missing-values(缺失值的处理)2、应用实例,.,36,这是一个典型的对话框,变量列表栏,分析变量栏,文本框,展开按钮,移动变量按钮,打开按钮,单选框,命令按钮,关闭,对话框控制栏,.,37,标签,复选框,.,38,下拉列表,.,39,Data菜单的功能介绍,DefinedatesInsertvariableInsertcaseGotocaseSortcasesTransposeMergeFileAddvariable&addcaseAggregateSplitfileSelectcasesWeightcases,.,40,.,41,A数据集,数据串接,数据并接,B数据集,A,B,B,A,B,A,对话框操作,.,42,.,43,Merge(横向合并),.,44,Merge(纵向合并),.,45,加权(Weightcase),.,46,Transform菜单的功能介绍,ComputeCountRecodeIntosamevariableIntodifferentvariableRankcasesAutomaticrecodeReplacemissingValues,.,47,.,48,SPSS中实现数据变换和整理功能的菜单为Transform。例:,身高2,(BMI为身高体重指数),由于原始数据中只有体重和身高变量,这时,需要对原始数据文件中的变量进行加工、修改、变换而建立新变量BMI。,体重,BMI=,.,49,.,50,SPSS中计算器功能键介绍:算术运算*乘方*乘法/除法+加法减法比较运算=等于v=不等于大于=大于或等于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论