




已阅读5页,还剩54页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS基础与Access数据库,第七讲数据的编码、录入与整理,1,2,教师信息,姓名:郑戟明电话:67703855E-mail:shift_zjm办公室:学院楼B421部门:商务信息学院计算机教学部,一、SPSS简介,3,SPSS的名称,1968年美国斯坦福大学两名研究生研制,原名SPSS,英文名称社会科学统计软件包(StatisticalPackagefortheSocialSciences)首字母的缩写。1994-1998年间陆续并购SYSTAT等公司,统计软件的3S指的就是SPSS、SAS、SYSTAT2000年改名为“StatisticalProductandServiceSolutions”,即“统计产品与服务解决方案”2010年SPSS公司被IBM并购。,4,SPSS软件应用行业,SPSS软件是一款在很多行业的数据分析应用中久享盛名的统计分析工具,是世界上最早的统计分析软件。应用领域经济学教育学商业金融营销研究行业电子商务数据统计政府机构其它,5,SPSS的影响力,在国际学术界有一条不成文的规定:凡是用SPSS完成的计算和统计分析,可以不必说明算法。,6,SPSS发展,1968年:斯坦福大学三位学生创建了SPSS,诞生了第一个用于大型机的统计软件1975年:在芝加哥成立SPSS总部1984年:首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。1992年:推出Windows版本2000年:SPSS11.0起,SPSS全称为“StatisticalProductandServiceSolutions”,即“统计产品和服务解决方案”。2009年:SPSS公司宣布重新包装旗下的SPSS产品线,定位为预测统计分析软件(PredictiveAnalyticsSoftware)PASW,包括四部分:统计分析、数据挖掘、数据采集、企业应用服务2010年:IBM收购SPSS之后,各子产品名称统一加上IBMSPSS字样:统计分析产品、数据挖掘产品、数据采集产品、企业应用服务,7,SPSS发展,8,SPSS发展,9,SPSS基础内容,第7讲SPSS数据的编码、录入与整理第8讲统计报告第9讲描述性统计第10讲均值比较第11讲散点图、相关系数第12讲回归概念、回归系数第13讲SPSS综述,10,SPSS数据分析基本步骤,11,二、数据处理的基本概念,12,数据的编码、录入与整理,原理是研究者利用SPSS进行统计分析的必要前提。就是把通过问卷调查获得的资料转变为SPSS能够识别的数据文件,为各种统计分析做好准备。数据编码概念数据编码是指把需要加工处理的数据库信息,用特定的数字来表示的一种技术。根据一定数据结构和目标的定性特征,将数据转换为代码或编码字符,在数据传输中表示数据的组成,并作为传送、接受和处理的一组规则和约定。,13,数据问卷量表,14,数据问卷编码方案,15,编码类型(数值型数据),数值型数据的编码数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值通常采用三点计分、四点计分和五点计分等方式进行评分如选项A、B、C计分为1、2、3如选项A、B、C、D计分为1、2、3、4编码示例中的第5、6题就是属于数值型编码第5题是正向数值型(被选项的程度越高,分值越大)第6题是反向数值型(被选项的程度越高,分值越小),16,编码类型(非数值型数据),非数值型数据的编码非数值型数据的编码,首先要确定编码规则,然后根据规则对变量赋予分值。双值型变量的编码多采用“0、1”或“1、2”来赋值如编码示例中的第1题多值型变量的编码通常对非数值型数据编码,主要起到分组的作用,不能进行各种算术运算,17,编码类型(多项选择题),多项选择题的编码多项选择题就是题目答案的选项是多选项限定多选项分类法限定了一次最多可以选择项目的个数;不能直接对题目进行编码,必须先确定最多选择,并给每个选项建立一个变量如编码示例中的第3题任意多项二分法表示每一次可以任选几个选项;编码方法把每一个被选项作为一个变量来定义,每个变量只能选择“1或0”如编码示例中的第4题,18,缺失值的概念,什么是缺失值缺失值是指在数据采集与整理过程中丢失的内容,往往会给统计分析带来一些麻烦和误差。缺失值类型用户缺失值在问卷调查中把不回答的选项当作缺失值来处理缺失值可用研究者能识别的数字来表示如“0、9、99”系统缺失值指计算机默认的缺失方式,如输入数据空缺、输入非法字符等通常把缺失值标记为“.”,19,缺失值处理方法,替代法:采用统计命令或在相关统计功能中利用参数替代在SPSS中,执行菜单命令“TransformReplaceMissingValues”来替代缺失值剔出法:剔除有缺失值的题目或剔除有缺失值的整份问卷,20,数据处理中的操作术语,个案(Cases)一个研究对象就是一个个案;一个个案就是一条记录;在数据表格中表示为“一行”每一个个案记录的是一个研究对象各个属性的具体数值,如学生信息(姓名、性别、年龄等),21,字段,学生表,个案,数据处理中的操作术语,样本(Sample)是指具有共同属性的所有研究对象,如学生的所有信息样本包含多个个案,在数据表格中表示为“n行”变量(Variable)是指问卷中每一个问题,数据库里字段,数据表格中表示为“一列”量值(Value)是指问卷中的答案,也称为观测值,在SPSS系统里,单元格中的数值就是变量值,22,三、创建数据文件,23,24,数据处理的流程,定义变量,启动SPSS后进入数据编辑窗口,显示为一个空文件,输入数据前首先要定义变量定义变量主要就是定义数据文件的结构,25,定义变量的方法,单击数据编辑窗口左下方的“VariableView”标签或双击列的题头(Var),打开变量定义窗口,进行变量定义。,26,定义变量的内容,变量名(Name):变量的名称变量类型(Type):变量的类型宽度(Width):存储变量值的最大值小数位数(Decimals):变量为数值类型时,小数后的位数变量标签(Label):对变量名的注释。光标在变量名上时,会显示该标签变量值标签(Values):变量标签的取值缺失值(MissingValues):定义缺失的值,例如,当定义99为缺失值时,当该变量的值为99时,把它认为是缺失值显示数据的列宽(Colums):与上面“宽度”不同,它只管显示对齐方式(Align):左对齐、右对齐、居中量度类型(Measure):定比变量(Scale)、定序变量(Ordinal)、定类变量(Nominal)。只用于统计制图时坐标轴变量的区分和SPSS决策树模块的变量定义。,27,定义变量名,在定义变量窗口中“Name”下的单元格中输入变量名变量名必须以字母开头,长度不超过8个SPSS保留的关键词不能作为变量名AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等SPSS中允许使用中文变量名,但尽量不要使用,以免出现兼容性问题,28,定义变量类型、宽度及小数位数,在“Type”下单击单元格,打开变量类型窗口,选择变量类型常用变量类型有:数值型(Numeric)日期型(Date)货币型(Dollar)字符型(String),29,定义变量标签和变量值标签,定义变量标签在“Label”下单击单元格,输入变量标签SPSS允许变量标签长度为255字节定义变量值标签变量值标签是对变量的每一可能取值进一步描述,当变量是定类或定序变量时,非常有用。变量值标签系统默认为None在“Values”下单击单元格,打开变量值标签窗口,输入变量值标签,30,定义缺失值,在“Missing”下单击单元格,打开缺失值窗口,输入缺失值Nomissingvalues:没有缺失值Discretemissingvalues:定义13个单一数为缺失值Rangeplusoneoptionaldiscretemissingvalues:定义指定范围为缺失值,同时指定另外一个不在这一范围的单一数为缺失值,31,变量定义的信息复制,如果有多个变量的类型相同,可以先定义一个变量,然后把该变量定义的信息复制给新变量操作步骤:先定义一个变量在该变量行号上单击右键,在快捷菜单中选择“Copy”选择同类型新变量所在行,单击右键,在快捷菜单中选择“Paste”,32,数据的录入,定义完所有变量后,单击“DataView”标签,在数据编辑窗口输入数据。数据录入如果按逐行进行,按“Tab”键改变行数据录入如果按逐列进行,按“Enter”键改变列系统默认的数据文件保存类型为“.sav”,33,数据的导入,SPSS具有强大的与其他软件共享数据文件的功能,所以能够导入多种格式的数据能够导入SPSS的数据文件:*.sys、*.por、*.xls、*.slk、*.w*、*.dbf、*.dat、*.syd、*.sas7dbat等导入数据文件的操作步骤:执行菜单命令“FileOpenData”选择导入数据文件的类型通过复制粘贴导入数据在原系统中打开需要导入的数据文件复制粘贴到SPSS中特别要注意数据类型,34,数据的导入(示例1),示例1:把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS中操作步骤:打开shift-MIS.mdb文件,选中“学生表”单击右键,在快捷菜单中选择“导出”,选择导出类型“Excel(X)”,确定保存位置、文件名和文件格式启动SPSS,执行菜单命令“FileOpenData”,在“OpenData”窗口中选择文件类型“Excel(*.xls)”,选择“学生表.xls”文件以“学生表.sav”为文件名保存,35,数据的导入(示例2),示例2:将EXCEL文件“2-recode.xls”导入到SPSS中方法一:执行菜单命令“FileOpenData”导入数据数据导入后,查看“VariableView”标签中的字段名、类型、宽度等方法二:练习通过复制、粘帖的办法把“2-recode.xls”中的数据通过复制,在SPSS中粘帖的办法导入到SPSS中把导入后的数据文件保存为“2-recode.sav”,36,四、数据的整理,37,数据整理的概念,什么是数据整理数据整理是对录入的数据进行转换、检测、量表统分、个案选择、文件拆分与合并等操作,使原始数据生成后续研究所需要的数据。数据整理操作方法SPSS实现数据整理的功能主要集中在“Data”和“Transform”两个菜单中,38,数据分值的转换,数据分值的转换是通过对数据进行重新编码来实现的。在SPSS中主要通过Recode命令来实现RecodeIntoSameVariables:编码后数据存放在原变量中,覆盖原数据RecodeIntoDifferentVariables:编码后数据存放在新定义的变量中,保留原数据,39,数据分值的转换(示例3),示例3:假设一套量表共10题,每题有A、B、C三个选项,现有10个被试作答。要求根据评分规则,将被试的原始数据选择转换为量表分数注意:1、2、4、7、8、10:正向题3、5、6、9:反向题,40,示例3结果,41,原数据,转换后数据,示例3操作步骤,打开数据文件“2-recode.sav”执行菜单命令“TransformRecodeRecodeIntoDifferentVariables”打开“RecodeIntoDifferentVariables”对话框,定义新变量名打开“RecodeIntoDifferentVariables:OldandNewValue”对话框,定义转换规则数据文件以原文件名保存,42,量表的统分,在数据录入过程中,输入的是最原始、最稳定的反应选项,但在后续的统计分析中通常需要对量表的总分进行推断统计。量表的统分工作包括分量表的统分和总量表的统分,SPSS中通常用“ComputeVariable”命令实现量表的统分工作,43,量表的统分(示例4),示例4:以分值转化后的数据文件“2-recode.sav”为例进行量表的统分。假定该量表由2个分量表构成,其中1个量表由第1、2、5、8、9题组成,另一个量表由第3、4、6、7、10题组成。计算出每一个被试的分量表分和总量表分。,44,示例4操作步骤,打开数据文件“2-recode.sav”。执行菜单命令“TransformComputeVariable”(计算分量表分flb1、flb2和总量表分zlb)统分结果保存为“2-lb.sav”,45,数据的排序,在数据统计分析中,有时需要对一个或多个变量进行排序在SPSS中,主要通过菜单命令“DataSortCases”来实现,46,数据的排序(示例5),示例5:以数据文件“2-lb.sav”为例,对变量zlb进行由低到高的排序。如果变量值相同,再对flb1、flb2变量进行排序。,47,示例5操作步骤,打开数据文件“2-lb.sav”执行菜单命令“DataSortCases”添加变量zlb、flb1、flb2进行排序,都是升序排序结果以原文件名保存,48,数据的限选,在进行统计分析或作图时,经常需要选择一定数量的个案来进行添加分析。在SPSS中,主要通过菜单命令“DataSelectCases”来实现,49,数据的限选(示例6),示例6:以数据文件“Anxiety.sav”为例。要求限选前20个个案进行后续统计分析。,50,示例6操作步骤,打开数据文件“Anxiety.sav”执行菜单命令“DataSelectCases”设置前20个个案文件另存为“select.sav”,51,数据加权,举例比如在跳水比赛中,每个运动员完成动作的难度是不同的,两位选手由于所选动作的难度系数不同,尽管完成各自动作的质量相同,但得分也是不相同的,难度系数大的运动员得分应该高些,难度系数实际上起着权重的作用。某人射击十次,其中二次射中10环,三次射中8环,四次射中7环,一次射中9环,那么他平均射中的环数为:(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《第二单元 创建高级动画 第7课 遮罩动画 较复杂的遮罩动画》说课稿教学反思-2023-2024学年初中信息技术人教版八年级上册
- 新兴市场营销合同
- 施工现场准备教学设计-2025-2026学年中职专业课-主体结构工程施工-建筑类-土木建筑大类
- 2025年安全生产安全操作培训考试题及答案大全
- 客服管理试题及答案
- 2025年标准化渔场承包合同
- 公司农作物种子繁殖制种收购合同
- 商务技能合作转让合同书2025
- 2025年个人果园转让合同
- 2025年无人机测绘操作员初级考试重点
- 初中英语中考专题训练阅读理解-应用文篇
- 《古文观止 上下 》读书笔记思维导图PPT模板下载
- YC/T 210.2-2006烟叶代码第2部分:烟叶形态代码
- GB/T 22000-2006食品安全管理体系食品链中各类组织的要求
- GB/T 20671.1-2006非金属垫片材料分类体系及试验方法第1部分:非金属垫片材料分类体系
- 熵权法教学讲解课件
- 医师病理知识定期考核试题与答案
- 课堂因“融错·容错·溶措”而精彩
- 阳光晾衣房钢结构专项施工方案
- 安宁疗护服务流程
- 热分析DSC培训new
评论
0/150
提交评论