SPSS数据的录入_第1页
SPSS数据的录入_第2页
SPSS数据的录入_第3页
SPSS数据的录入_第4页
SPSS数据的录入_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一讲,数据输入,学习目的,学会常用数据的录入方法 掌握资料录入前的工作,.,3,本章主要内容,一 录入数据 录入单选数据 录入多选数据 二 统计分析前的准备工作,包括: 资料的审查 资料编码,一 录入单选数据,变量/指标名称 变量/指标类型 变量/指标的显示方式 录入数据,.,5,SPSS11.0变量定义项目,SPSS11.0中变量定义的一共有10个项目:变量名(name)、变量类型(type)、变量长度(width)、小数位数(decimals)、变量标签(label)、变量值标签(values)、缺省值(missing)、变量显示宽度(columns)、变量对齐方式(align)、变量测

2、量尺度(measure)。 注意区分变量的标签(Variable Labels)与变量值的标签(Value Labels)。,.,6,定义变量,步骤: 首先启动SPSS,进入 SPSS 的主画面 - 数据编辑窗口 激活定义变量对话框 定义变量名 定义变量类型 定义变量标签和变量值标签 定义变量的显示格式,.,7,定义变量名 定义变量名应遵循如下原则: (1)变量名最长不超过8个字符(4个汉字)。 (2)首字符必须是英文字母或汉字,不能以下划线“”或圆点“.”结尾。 (3) 变量名不能使用SPSS的保留字。SPSS的保留字有:ALL、AND、BY、OR、NOT、EQ、GE、GT、LE、LT、NE

3、、TO、WIIH等。 (4)变量名中不能有空格或某些特殊符号,如!、?和等。 (5)系统中不区分变量名中的大小写字符。例如WANG与wang被认为是同一变量。,.,8,定义变量标签(Variable Label),定义标签是对该变量名所表示的数据项内涵的进一步说明。由于变量名最多只能由8个字符组成,8个字符不足以表示该变量的内涵。而变量标签最多可由256个字符组成。在统计分析过程的输出中会在变量名对应的位置显示该变量的标签,有助于理解输出结果。变量标签为可选项(option),可以定义,也可以不定义。,.,9,定义变量取值标签(Value label),每个变量名对应一个数据项,每个变量取不同

4、的值,表示数据项中的不同信息。有时为了更好理解统计分析过程中的输出结果,要给变量的取值(简称变量值)赋以标签。那么在输出结果的相应位置上就会出现该标签,使读者一目了然。并不是所有变量值都要取标签,一般来说离散变量才给变量值定义标签。,.,10,例如:变量名 变量值 变量取值(标签)Gender 1 男2 女,.,11,定义变量类型,变量类型种类(见下表): Numeric“ 标准数值型变量,系统默认 Comma 带逗点的数值型变量:千进位用逗号分隔, 小数与整数间用圆点分隔 “Dot” 圆点数值型变量:千进位用圆点分隔,小数与整数间用逗号分隔 “Scientific notation” 科学计

5、数法 “Date” 日期型变量 “Dollar” 带美元符号的数值型变量 “Custom currency” 自定义变量 String 字符型变量,.,12,变量的类型,.,13,概率事件(观测量):在数据编辑器的二维表中, 每列为一个变量,每行记录 一次观测(Case),一次观 测的值,输入数据,数据编辑器,录入数据,.,14,定义缺省值,.,15,数据录入,数据录入的一般方式: (1)按变量输入数据 (2)按观察序号输入数据 (3)按全屏幕任意单元格输入数据,.,16,保存数据,单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这

6、里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入变量名并回车,可以看到数据管理窗口左上角由Untitled变为了现在的新变量名。,SPSS for Windows提供两种数据保存方式:1.保存为SPSS for Windows数据文件中2.保存为其他格式的数据文件SPSS的文件类型数据文件:扩展名为.sav结果文件:扩展名为.spo图形文件:扩展名为.cht命令文件:扩展名为.sps,.,18,SPSS11.0中变量定义的操作,单击Variable View 进入;,单击, 定义 变量 名,单击,定义变量类型,定义变量标签,变量标签值,定义测度层次,定义变量宽度,定

7、义对齐方式,定义变量类型对话框,定义变量标签值对话框,定义变量定义缺省值对话框,.,19,资料审查 资料编码,一、统计分析前的准备工作,.,20,资料审查,主要考察三个方面: 资料的完整性 资料的统一性 资料的合格性,.,21,资料的完整性,包括资料总体上的完整性和每份资料的完整性。 资料总体的完整性主要考虑问卷发放的数量、回收率等。 每份资料的完整性主要看问卷的填答情况,是否是有效问卷。,.,22,资料的统一性审查,检查所有问卷、报表填答的方法是否统一。 检查统一指标的数值所使用的量度单位是否统一,不同的表格对同一指标所使用的计算方法是否统一。 对于统计资料,尤其要注意: 指标的定义和分析的

8、标准是否与自己的研究分类相一致; 审查指标总体范围是否一致,.,23,资料的合格性审查,审查提供资料者的身份是否符合规定的调查对象的身份。 审查所提供的资料是否符合填答的要求。 审查所提供的资料是否正确。通常有三种方法: 判断检验:依据已知情况来判断是否真实正确。 逻辑检验:从资料的逻辑关系来检验是否正确。 计算检验:通过各种数字的运算来检验是否正确。,.,24,编码,几个基本概念 编码 变量与取值 变量标签与取值标签,.,25,几个基本概念,编码:将文字资料转化为数字形式的过程。编码的过程实质上就是确定变量、变量取值以及选择的过程,变量与变量取值 变量: 变量是概念的一种类型,是概念的具体化

9、。概念是对研究范围内同一类现象的概括性表述。概念、变量、陈述、形式共同构成了理论。例如,公民这一概念,具体化为一个国家的所有公民后,就成为了变量。变量反映了概念的可变动性,说明了现象在规模、重量、密度、速度等方面的变化。(袁方) 反映对象某一特性的指标。例如,性别、年龄等 变量取值:是变量所有可供选择的范围。例如性别的取值范围是男、女,那么;年龄的取值范围是0-100岁(当然有长寿的)。,变量标签(label)与取值标签(value label) 标签:标签是对物体的说明,是对物体信息的描述。例如,中药箱子里的标签是提醒医生药的具体地点;商品标签则说明了商品的产地、质量、品牌等信息。 变量标签

10、是对变量的说明。例如gender=“性别” 取值标签是对取值的说明。例如1=男,2=女。,比如:您的性别: (1)男 (2)女,变量的取值,选择为 2,这种情况被称为预先编码,编码就是确定变量、变量取值和变量取值标签(选择),又比如:您认为打工的外地人对太原市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,选择,这种情况被称为边缘编码,.,30,再比如:您有几个儿子?几个女儿? 1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,还比如:请将您的父母的学历写在下面的横线上。 父亲:中学 母亲: 小学 编码步骤是: (1)编码

11、:将学历按照“未上过学”=1,“小学”=2,“中学”=3依次列出 (2)各变量为“父亲学历、母亲学历”,取值为“未上过学,小学,中学,” (3)输入问卷时,按照编码中的“小学”=2,“中学=3”输入“父亲学历 3”,“母亲学历 2”即可。,这种情况称为事后编码,要尽量少用。,附带说明:关于无回答与不适用的编码,无回答:建议采用“99”/”9”/”999”等作为无回答的编码 不适用:采用“98”/998”等作为编码,.,33,几种常见的编码方式,封闭性问卷 单项选择题 多项选择题 多项排序选择题 固定选择项 不固定选择项 开放性问卷,.,34,2,1,.,35,有6个选项,故应设6个变量,运用0

12、-1编码方法 编码,即:1,0,1,0,1,1。 此外,多选还有另外一种编码方法,即直接编码输入法,编码为1,3,5,6, , 。(此处“ ”表示无回答,我们建议使用“99”),1 3 5 6,.,36,3 1 6,问题012:您择业中考虑的主要因素有(依据重要性大小排列,限选三项),1 经济收入 2 专业对口 3 发展前途 4 地理区位 5 个人爱好 6 风险大小 7 劳动强度 8 社会福利 9 社会地位 10 其他,因为是依据重要性大小排列,限选三项,故应设三个变量,编码依次为3,1,6。,.,37,例如:择业中考虑的主要因素(依据重要性先后排列),1、经济收入 2、专业对口 3、发展前途

13、 4、地理区位 5、个人爱好 6、风险大小 7、劳动强度 8、社会福利 9、其他,3 1 6 4 7 8 5,因为是依据重要性排列,不限制选项,故应设九个变量,编码依次为: 3,1,6,4,7,8,5,99,99。,(利用99表示未回答或者空),.,38,择业中考虑的主要因素(多选),1、经济收入 2、专业对口 3、发展前途 4、地理区位 5、个人爱好 6、风险大小 7、劳动强度 8、社会福利 9、其他,编码应为:1,0,1,1,1,0,1,1,0。 或1,3,4,5,7,8,0,0,0。(此处用0表示未选择),应该设置9个变量,,.,39,开放性问卷的处理方法,对回答进行分类。一般首先随机抽取一部分问卷,了解回答的情况,依据回答对问卷进行分类,主要考虑语气强弱、观点确定等方面。 建立回答类别与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论