spss1数据编码、录入与整理_第1页
spss1数据编码、录入与整理_第2页
spss1数据编码、录入与整理_第3页
spss1数据编码、录入与整理_第4页
spss1数据编码、录入与整理_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Spss 数据分析第八讲 数据的编码、录入与整理1教师信息教师:张晓黎电子信箱:办公室:学院楼B420电话: 答疑:周四下午在学院楼B4202SPSS基础内容与数据分析步骤第8讲 SPSS数据的编码、录入与整理第9讲 描述性统计第10讲 均值比较第11讲 散点图、相关系数 第12讲 回归概念、回归系数 第13讲 SPSS其他第14讲 spss大作业建立数据文件 数据加工整理用模型分析数据解释分析结果31.数据处理中的操作术语个案(Cases)一个研究对象就是一个个案;一个个案就是一条记录;在数据表格中表示为“一行”每一个个案记录的是一个研究对象各个属性的具体数值,如学生信息(姓名、性别、年龄等

2、)样本(Sample)是指具有共同属性的所有研究对象,如学生的所有信息样本包含多个个案,在数据表格中表示为“n行”变量(Variable)是指问卷中每一个问题,数据库里字段,数据表格中表示为“一列”量值(Value)是指问卷中的答案,也称为观测值,在SPSS系统里,单元格中的数值就是变量值41.数据处理中的操作术语变量个案样本量值52.数据的编码、录入与整理数据编码把通过问卷调查获得的资料转变为SPSS能够识别的数据文件。数据编码步骤定义变量变量名:以字母为首,长度不超过8位的字母数字字符串变量类型宽度及小数位数变量标签:对变量的解释说明数值标签:对变量每一取值的解释说明缺失值录入数据问卷结果

3、输入62.1 定义变量启动SPSS后进入数据编辑窗口,显示为一个空文件,输入数据前首先要定义变量。建立数据文件定义数据文件结构录入、修改、保存数据72.1 定义变量-变量视图variable view变量名(Name):变量的名称变量类型(Type):变量的类型宽度(Width):存储变量值的最大值(1可存储1个字节的字符,2可存储1个汉字)小数位数(Decimals):变量为数值类型时,小数后的位数变量标签(Label):对变量名的注释。光标在变量名上时,会显示该标签变量值标签(Values):变量取值的标签定义缺失值(Missing Values):定义缺失的值,例如,当定义99为缺失值时

4、,当该变量的值为99时,把它认为是缺失值显示数据的列宽(Colums):与上面“宽度”不同,它只管显示对齐方式 (Align):左对齐、右对齐、居中量度类型(Measure):定量变量(Scale)、等级变量(Ordinal)、定性变量(Nominal)。只用于统计制图时坐标轴变量的区分和SPSS决策树模块的变量定义。82.1 定义变量-变量视图variable view单击数据编辑窗口左下方的“Variable View”标签或双击列的题头(Var),打开变量定义窗口,进行变量定义。92.1 定义变量定义变量名在定义变量窗口中Name下的单元格中输入变量名变量名必须以字母开头,长度不超过8个

5、SPSS保留的关键词不能作为变量名AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等SPSS中允许使用中文变量名,但尽量不要使用,以免出现兼容性问题102.1 定义变量定义变量类型、宽度及小数位数在Type下单击单元格,打开变量类型窗口,选择变量类型常用变量类型有:数值型(Numeric)日期型(Date)货币型(Dollar)字符型(String)在Width、Decimal下单元格,选择宽度和小数位数,系统默认为“8”和“2”;或者在变量类型窗口中设置112.1 定义变量定义变量标签在Label下单击单元格,输入变量标签SPSS允许变量标签长度为255

6、字节定义变量值标签变量值标签是对变量的每一可能取值进一步描述,当变量是定性或定序变量时,非常有用。变量值标签系统默认为None 在Values下单击单元格,打开变量值标签窗口,输入变量值标签 122.1 定义变量定义缺失值在Missing下单击单元格,打开缺失值窗口,输入缺失值No missing values:没有缺失值Discrete missing values:定义13个单一数为缺失值Range plus one optional discrete missing values:定义指定范围为缺失值,同时指定另外一个不在这一范围的单一数为缺失值132.1 定义变量缺失值处理的概念缺失值

7、是指在数据采集与整理过程中丢失的内容,往往会给统计分析带来一些麻烦和误差。类型用户缺失值在问卷调查中把不回答的选项当作缺失值来处理缺失值可用研究者能识别的数字来表示如“0、9、99”系统缺失值指计算机默认的缺失方式,如输入数据空缺、输入非法字符等通常把缺失值标记为“.”缺失值处理方法替代法:采用统计命令或在相关统计功能中利用参数替代Transform Replace Missing Values剔出法:剔除有缺失值的题目或剔除有缺失值的整份问卷142.1 定义变量变量定义的信息复制如果有多个变量的类型相同,可以先定义一个变量,然后把该变量定义的信息复制给新变量操作步骤:先定义一个变量在该变量行

8、号上单击右键,在快捷菜单中选择“Copy”选择同类型新变量所在行,单击右键,在快捷菜单中选择“Paste” 由学号复制得到152.2数据的录入-数据视图Data View定义完所有变量后,单击“Data View”标签,在数据编辑窗口输入数据。数据录入如果按逐行进行,按Tab键改变行数据录入如果按逐列进行,按Enter键改变列系统默认的数据文件保存类型为“.sav”16示例1-数据问卷与编码问卷量表序号调查内容选项1您的性别:(1)男 (2)女2你的文化程度:(1)没上过学 (2)小学 (3)初中 (4)高中 (5)大专以上3您想选择下列哪些择偶条件(任选三项):(1)相貌 (2)文化水准 (

9、3)气质风度 (4)志同道合 (5)人品 (6)家庭条件 (7)个人收入 (8)其他4您购买房屋时,会考虑哪些因素(任选):(1)离工作地点的远近 (2)小孩所就读的学校 (3)居家附近的环境5您对心理学感兴趣:(1)不感兴趣 (2)感兴趣 (3)非常感兴趣6您对学英语感到厌恶:(1)不厌恶 (2)厌恶 (3)非常厌恶17示例1-数据问卷与编码问卷编码方案保存为wenjuan.sav变量名编码样例第1题1-男 ;0-女男1第2题1-没上过学;2-小学;3-初中;4-高中;5-大专以上小学2第3题-11-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭条件;7-个人收入;8-其

10、他文化水准2第3题-21-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭条件;7-个人收入;8-其他志同道合4第3题-31-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭条件;7-个人收入;8-其他人品5第4题-工作1-选;0-不选选1第4题-学校1-选;0-不选不选0第4题-环境1-选;0-不选选1第5题A B C(A-1,B-2,C-3)A1第6题A B C(A-3,B-2,C-1)A318示例1-数据问卷与编码1.数值型数据的编码数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值。如数值类型。通常采用三点计分、四点计分和五点计分等方式进行评分

11、如选项A、B、C计分为1、2、3如选项A、B、C、D计分为1、2、3、4编码示例中的第5、6题就是属于数值型编码第5题是正向数值型(被选项的程度越高,分值越大)第6题是反向数值型(被选项的程度越高,分值越小)变量名编码样例第5题A B C(A-1,B-2,C-3)A1第6题A B C(A-3,B-2,C-1)A319示例1-数据问卷与编码2.非数值型数据的编码非数值型数据的编码,首先要确定编码规则,然后根据规则对变量赋予分值。如字符串类型。双值型变量的编码多采用“0、1”或“1、2”来赋值;如编码示例中的第1题多值型变量的编码采用 “1、2、3、”来赋值;如编码示例中的第2题通常对非数值型数据

12、编码,主要起到分组的作用,不能进行各种算术运算变量名编码样例第1题1-男 ;0-女男1第2题1-没上过学;2-小学;3-初中;4-高中;5-大专以上小学220示例1-数据问卷与编码3.多项选择题多项选择题就是题目答案的选项是多选项限定多选项分类法限定了一次最多可以选择项目的个数;不能直接对题目进行编码,必须先确定最多选择,并给每个选项建立一个变量;如编码示例中的第3题任意多项二分法表示每一次可以任选几个选项;编码方法把每一个被选项作为一个变量来定义,每个变量只能选择“1或0”;如编码示例中的第4题变量名编码样例第3题-11-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭条件

13、;7-个人收入;8-其他文化水准2第3题-21-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭条件;7-个人收入;8-其他志同道合4第3题-31-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭条件;7-个人收入;8-其他人品5第4题-工作1-选;0-不选选1第4题-学校1-选;0-不选不选0第4题-环境1-选;0-不选选121示例1-结果变量定义如下部分数据录入如下223.数据的导入SPSS具有强大的与其他软件共享数据文件的功能,所以能够导入多种格式的数据能够导入SPSS的数据文件:*.sys、*.por、*.xls、*.slk、*.w*、*.dbf、*

14、.dat、*.syd、*.sas7dbat等导入数据文件的操作步骤:执行菜单命令File Open Data选择导入数据文件的类型 通过复制粘贴导入数据在原系统中打开需要导入的数据文件复制粘贴到SPSS中(但要注意数据类型,可能出很多问题)23示例2-数据的导入把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS中.步骤:打开shift-MIS.mdb文件,选中“表”对象,再选中“学生表”。菜单上,文件导出,“保存类型”选择“Microsoft Excel ”,文件名自动为“学生表” “导出”启动SPSS,文件File打开Open数据Data,“文件类型”选择“Excel

15、(*.xls)”,找到“学生表.xls”文件后“打开” 从第1行读取变量名选择数据表保存为:student.sav24示例2-数据的导入将EXCEL文件2-recode.xls导入到SPSS中方法一:Data.数据导入后,查看“Variable View”标签中的字段名、类型、宽度等。方法二:练习通过复制、粘帖的办法把2-recode.xls中的数据通过复制,在SPSS中粘帖的办法导入到SPSS中,但可能会遇到一些问题,请思考如何解决这些问题?把导入后的数据文件保存为2-recode.sav254.数据的整理数据整理是对录入的数据进行转换、检测、量表统分、个案选择、文件拆分与合并等操作,使原始

16、数据生成后续研究所需要的数据。SPSS实现数据整理的功能主要集中在“数据Data”和“转换Transform”两个菜单数据重新编码重新编码为相同变量Into Same Variables:编码后数据存放在原变量中,覆盖原数据重新编码为不同变量Into Different Variables:编码后数据存放在新定义的变量中,保留原数据26示例3-数据分值的转换假设一套量表共10题,每题有A、B、C三个选项,现有10个被试作答。要求根据评分规则,将被试的原始数据选择转换为量表分数注意:1、2、4、7、8、10:正向题3、5、6、9:反向题量表评分规则 题号选项12345678910A1131331

17、131B2222222222C331311331310名被试的作答结果表 题号被试123456789101ABBBABCACB2ABBCABCACB3ACBBABCABB4BBBBBACBCB5ACABBABABC6BCABABBBBA7BCCCABCABB8ACABBABACB9ABBBBACACB10BBBBABCBCC27示例3-步骤步骤打开数据文件(2-recode.sav)Transform Recode Into Different Variables 定义新变量名打开“Old and New Value”对话框,定义转换规则注意先对正向题1、2、4、7、8、10进行分值转换重置R

18、eset再对反向题3、5、6、9进行分值转换28示例3-结果原数据转换后数据295.数据的计算量表的统分在数据录入过程中,输入的是最原始、最稳定的反应选项,但在后续的统计分析中通常需要对量表的总分进行推断统计。量表的统分工作包括分量表的统分和总量表的统分, “转换Transform计算变量Compute”命令实现量表的统分工作30例4-量表的统分以分值转化后的数据文件2-recode.sav为例。假定该量表由2个分量表构成,其中1个量表由第1、2、5、8、9题组成,另一个量表由第3、4、6、7、10题组成。计算出每一个被试的分量表分和总量表分。31例4-步骤打开数据文件2-recode.sav

19、。Transform Compute (计算分量表分flb1、flb2和总量表分zlb)flb1=tt1+tt2+tt5+tt8+tt9flb2=tt3+tt4+tt6+tt7+tt10zlb=flb1+flb2保存处理结果32例5-数据的排序在数据统计分析中,通常需要限定选择部分个案进行研究,如抽取40%个案来研究在SPSS中,主要通过“数据Data 排序个案Sort Cases”题目:以数据文件2-recode.sav为例,找出变量zlb的高低分的分组。以总个案的40%为界限确定高低分33例5-步骤打开数据文件2-recode.sav DataSort Cases 以zlb变量的值降序排序

20、 确定高分组和低分组的起点分数值因为以总个案的40%为界限确定高低分,所以高分组和低分组各取4个个案10*40%=4(4个个案)根据排序可以确定高分组和低分组的起点分数值分别为22和20Transform Recode Into Different Variables按右图将变量zlb的旧值转换为变量zlb1的新值。变量zlb1即是对高分组和低分组的分组结果。34例5-步骤35例6-数据的选择以SPSS系统随带数据文件Anxiety.sav为例,限选前20个个案进行后续统计分析。步骤打开数据文件Anxiety.sav。数据Data 选择个案 Select Cases “基于时间或个案范围”选择前20个个案。36例6-数据的选择选择所有个案按指定条件选择个案对个案进行随机抽样按比例大概抽样精确抽样按范围选择个案多余数据保留在原表中多余数据被删除37例7-数据的计数打开数据文件Anxiety.sav。转换Transform 对个案内的值计数 Count Values with cases 选择计数变量sc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论