




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章数据录入与数据获取,本章主要解决两个问题:第一个问题,根据问题类型的不同,将会从开放题、单选题和多选题的录入方式为例进行介绍。第二个问题,重点介绍如何用SPSS直接读取Excel类型和文本格式的数据,以及如何用ODBC接口读取数据库文件。,2.1.1统计软件中数据的录入格式(1)不同观测对象的数据不能在同一记录中出现,即同一观测数据应当独占一行。(2)每一个观测量指标或影响因素只能占据一列的位置,即同一指标的数量观测值都应当录入到同一个变量中去。,2.1数据格式概述,即:一个观测占一行,一个变量占一列,在录入数据时,归纳为以下三步:第一步:定义变量名;第一步:指定每个变量的各种属性;第一步:录入数据。变量名不能与spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。,2.1.2变量属性介绍,一、变量的储存类型,SPSS中,变量有三种的基本类型:数值型、字符型和日期型。,标准数值型,逗号数值型,圆点数值型,科学技术法数值型,美元数值型,用户自定义型,数值型:数值型的数据是0-9的阿拉伯数字和其他符号,如美元符号、逗号或圆点组成的。,字符型:字符型数据的默认显示宽度为8个字符位,系统不区分变量名中的大小写字母,并且不能进行数学运算。注意:在输入数据时不应输入引号,否则双引号将会作为字符型数据的一部分。,日期型:日期型数据是用来表示日期或时间的。日期型数据的显示格式有很多,SPSS以菜单方式列出日期型数据的显示格式以供用户选择。事实上,SPSS存储中的日期型变量是该实践与1582年10月14日零点相差的秒数。,关于日期型格式的几点说明:,“m”在年与日(字母y与d)之间表示月份;在时与秒(字母h与s)之间表示“分”钟。“mmm”表示要求书写英文月份单词的前三个字母组成的缩写。“ddd”三个字母d表示要求用从元月一日算起的日数表示日期。指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用“/”或“”作分隔符的具体日期,回车后,系统将自动将输入的格式转化为指定的格式,显示在单元各种。,二、变量的测量尺度,在SPSS中使用Measure属性对变量的测量尺度进行定义。,(1)定类尺度(NominalMeasurement):定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。,特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的变量只能计算频数和频率。,在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥原则。,(2)定序尺度(OrdinalMeasurement):定序尺度是对事物之间的等级或顺序差别的一种测度,可比较优劣或排序。,特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能排序,不能进行运算。,(3)定矩尺度(IntervalMeasurement):定矩尺度是对事物类别或次序之间间距的测度。,特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差距是多少;定居变量通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减运算。,(4)定比尺度(ScaleMeasurement):定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样表现为数值。,特点:定必变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个侧度至之间笔直的特点,因此它可以进行加、减、乘、除运算,而定居变量值可进行加减运算。,三、变量名与变量标签值,Label:定义变量名标签Value:定义变量值标签,四、缺失值,Spss中缺失值有用户自定义缺失值和系统缺失值两大类。,在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失值为零。,2.2数据的直接录入,2.1.1操作界面说明,DataView表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。,VariableView表用来定义和修改变量的名称、类型及其他属性,如图所示。,如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量Var00001,Var00002等。,在VariableView表中,每一行描述一个变量,依次是:Name:变量名。变量名必须以字母、汉字及开头,总长度不超过8个字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个字符不能是句号。Type:变量类型。变量类型有8种,最常用的是Numeric数值型变量。其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数加一个逗号)等。Width:变量所占的宽度。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在DateView中所显示的列宽(默认列宽为8)。Align:数据对齐格式(默认为右对齐)。Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种(默认为等间距尺度)。,为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接打开和保存下述类型的文件:SPSSDOS版本产生的数据文件*.sys;Excel报表程序产生的数据文件*.xls;DBASE数据库格式文件*.dbf;SAS统计软件产生的数据文件。,2.2.2开放题和简单单选题的录入,一、在spss中定义变量,录入数据的第一步是定义变量属性,随后才能进行数据录入。,二、开放题的录入,三、单选题的录入单选题的录入可以采用字符直接录入、字符代码+值标签、数值代码+值标签三种方式。,2.2.3多选题的录入,一、多重二分法(MultipleDichotomyMethod)所谓多重二分法,是在编码的时候,对应每一个选项都要定义一个变量,有几个选项就有几个变量,这些变量均为二分类,他们各自代表对一个选项的选择结果。二、多重分类法(MultipleCategoryMethod)多重分类法,也是利用多个变量对一个多选题的答案进行定义,应该用多少个变量,由被访者实际可能给出的最多答案数而定。,一份简单的调查问卷,多项选择题提供几个备选择答案,从其中选择多个答案如:在下列品牌中您信任哪些品牌?被诊断为高血要后你采取了以下哪些辅助治疗手段?如:高考时报考学校(1)北京大学(2)清华大学(3)人民大学(4)北京理工大学(5)北京师范大学(6)北京外国语大学多项选择题不能在SPSS中直接存储,因为SPSS的一个变量只能有一个取值,多项选择题的处理方法思路:将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。编码方式:多选项二分法(multipledichotomizemethod)多选项分类法(multiplecategorymethod),多选项二分法将每个答案作为一个变量,每个变量只有两个取值(0或1)。例如:,多选项分类法:预先估计多选项问题可能被选择的最多答案数.为每个答案建立一个变量,取值为多选项问题的可选答案.例如:,三、多选题录入在spss中的实现,2.3外部数据的获取,SPSS读入非SPSS类型的文件数据,有三种主要方式:直接打开,利用文本导向读入文本数据以及利用数据库OBDC接口读入数据。,2.3.1电子表格数据如何导入spss中,SPSS中可以直接读入许多常用格式的数据文件,选择菜单FileOpenData或直接单击快捷键工具栏上的快捷按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能够看到可以直接打开的数据文件格式。,2.3.2文本数据如何导入spss中,第一步:首先,在OpenFile文件框中选中文件,单击“打开”,系统会自动启动文本倒入向导对话框。,第二步:选择“NO”并单击“下一步”按钮。,用某种字符区分,固定宽度,第三步:分别选择“Delimited”和“yes”,然后单击“下一步”按钮。,第四步,第五步,第六步,第七步,2.4数据的保存,2.4.1存为spss格式2.4.2存为其他数据格式,SPSS数据的录入与保存,录入时应注意:黑框确定当前数据单元。录入带有变量值标签的数据:手工输入代码,屏幕显示变量值标签。数据保存:操作保存格式:(1)*.sav:SPSS数据文件(默认)。(2)*.dbf:dbase数据文件。(3)*.xls:Excel工作表文件。注意:有些信息会丢失,SPSS数据的编辑,(一)打开数据文件菜单选项:File-Open-.sav(二)数据定位按个案号码定位菜单:Data-Gotocase-输入样本号按值定位光标定位到某列变量上-Edit-Find.,SPSS数据的编辑,(三)插入和删除一个个案插入:data-insertcase删除:选定待删行,鼠标右键找到Cut(四)插入和删除一个变量插入:光标定位到某列变量上-Data-InsertVariable(插到某列前)或鼠标右键删除:选定列,鼠标右键Cut项,SPSS数据的编辑,(五)数据移动、复制和删除定义源数据块鼠标右键:cutcopyclear确定目标单元鼠标右键:paste,数据文件的合并,目的:将两个SPSS数据文件合并到一个数据文件中。文件合并的方式:纵向合并横向合并,(一)纵向数据合并(1)含义:将磁盘上的一个SPSS数据文件追加到当前dataeditor窗口中的数据文件中。(2)前提:两个SPSS数据文件应可以合并的内容,且最好有相同的变量名和变量类型。(3)菜单选项:data-mergefile-addcases,数据文件的合并,数据文件的合并,(二)横向数据合并(1)含义:将磁盘上的一个SPSS数据文件中的若干个变量增加到当前dataeditor窗口的数据文件中。(2)前提:a.两个数据文件必须有一个共同的变量名为关键字段-合并的依据;b.两个数据文件应事先按关键字段升序排序。,数据文件的合并,(二)横向数据合并(3)菜单选项:data-mergefile-addvariable(4)选项说明:mathcasesonkeyvariablesinsortedfiles:以关键字作为合并标志。Bothfilesprovidecases:合并后
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度洗车行业市场拓展承包合同
- 2025版企业孵化器研发成果转化合同
- 2025年度农业保险担保合同
- 2025年度艺术品保管与展览运营合同
- 2025版煤炭运输合同能源管理协议
- 2025年注册会计师考试《会计》会计差错更正易错题精讲试题
- 2025年乡村医生农村慢性病防控技能考试试题
- 中级会计财税专业试题及答案
- 2025年花艺师职业资格考试花卉行业政策法规试题卷
- 2025年护士执业资格考试康复护理学护理法律法规试题解析试卷
- 血液透析中心护士手册
- 高一年级英语学法指导市公开课一等奖省赛课获奖课件
- 2024年《防治煤与瓦斯突出细则》培训课件
- 2024-2025学年人教精通版四年级英语上册全册教案
- 运维巡检服务方案
- 河南航空港发展投资集团招聘笔试真题2024
- 微机五防系统培训课件
- 心脏骤停后高质量目标温度管理专家共识2024
- 气道解剖知识
- 教学课件-《燃烧学(第2版)》徐通模
- 《中国心衰指南深度解析》课件
评论
0/150
提交评论