




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS的数据采集和整理,本讲主要内容:SPSS数据采集数据格式与问卷题目类型数据录入数据获取SPSS数据整理变量级数据整理文件级数据整理,数据类型,SPSS统计分析要求的数据格式,问题的类型,单选题-3,5字符串型开放题-2数字型开放题-1,4,7多选题-6,问卷示例:1、调查序号。2、您的姓名。3、性别。1)男2)女4、您的出生年月日。5、您的职业。1)工人2)农民3)教师4)其他6、获取新闻的主要方式有。1)报纸2)杂志3)电视4)收音机5)网络7、每天收看新闻的小时数。,Back,数据的录入,数据编辑器包括两个视图:1.变量视图:定义变量10个属性2.数据视图:录入数据,定义变量属性-变量名,变量名命名要求:变量名的第一个字符必须为字母,后面可跟任意字母、数字、句点或、#或$等符号;变量名不能以句点结尾;最后一个字符可以为下划线但应避免(可能会与分析过程中自动产生的变量造成冲突);,12版之前变量名的长度一般不能超过8个字符;空格和特殊字符(如!、-、?、和*等)不能用于变量名;每个变量名必须保证是唯一的,不区分大小写;下面的关键词不能用作变量名:ALLNEEQTOLELTGEBYORGTANDNOTWITH,定义变量属性-变量类型type,数字型数值型(Numeric):是默认的形式逗号型(Comma):小数点前数据每三位数用逗点分开小数点型(Dot):小数点前数据每三位数用句点分开科学计数型(Scientificnotation)美元型(Dollar),定制货币型(Customcurrency):SPSS只提供美元型变量作为现成的货币描述量。若为人民币型变量则必须进行定义。方法如下:进入dataeditor窗口-edit-option-currency-在prefix选项中输入¥等即可一次可定义5个不同的货币类型。日期格式型(Date)字符串型(String),定义变量属性-变量标签label,变量标签:对变量的含义解释,定义变量属性-值标签value,值标签:对变量值进行说明。例如对性别变量标注值标签:1=男2=女(若变量为数值型)或:m=男f=女(若变量为字符串型),定义变量属性-测量尺度measure,变量测量尺度:定类变量(Nominal):名义变量定(/有)序变量(Ordinal):有序变量定距和定比变量(Scale):尺度变量,定义变量属性-缺失值missing,定义缺失值的类型:没有缺失值:默认方式定义离散缺失值定义连续范围内的缺失值和离散缺失值,Back,录入数据-开放题的录入,数据录入时每行对应一个记录(case)、每列对应一个变量。开放题的录入:1、序号2、姓名3、出生年月日mm/dd/YYYY,录入数据-单选题的录入,不含其它单选题,如:性别。1)男2)女数据录入三种方式:字符字符加值标签数值加值标签。便于后续分析,推荐采用。,含其它单选题,如:您的职业。1)工人2)农民3)教师4)其他可通过设置两个变量来处理,第一个变量为单选题,若选择“其他”的纪录,则通过第二个开放型变量进行说明。,录入数据-多选题的录入,如:您通常获取新闻方式有。1)报纸2)杂志3)电视4)收音机5)网络case1:杂志、网络case2:报纸、电视、收音机,多选题两种录入方法多重二分法(multipledichotomymethod):每个选项作为一个只有两个取值(选为1、未选为0)的变量。该方法会出现很多数据为0的现象,录入数据工作量大。,多重分类法(multiplecategorymethod):选项最多的记录有几个选项就设置几个变量。设上题最多有四种获取新闻的方式,在变量视图中:,在数据视图中:,适用于:选项较多、可用于需要排序的回答、常出现数据缺失的情况。多选题变量集的定义:Multipleresponse(多重响应)菜单:Table模块,Back,数据的获取,用SPSS可获取的数据:读取SPSS格式的数据读取Excel等格式的数据读取文本数据(“分隔”和“固定宽度”)读取数据库格式数据(1)配置ODBC(2)在SPSS中通过ODBC和数据库进行连接,并读取数据,数据的获取-读取EXCEL数据,将数据文件个人工资.xls,读入SPSS中,并保存,以备进一步数据整理和分析。注意以下问题:第一行是否是变量名从哪张工作表(worksheet)中读取数据读取数据的范围(如D1:E6),与“复制+粘贴”不同:第一行可自动定义为变量名,软件会自动识别变量的属性。字符串原样再现(若采用“复制+粘贴”方法,则出现缺失值),但视为字符型变量。(注意:excel应用软件关闭,SPSS才能读取数据),数据的获取-读取文本格式数据,如何读取固定宽度的文本格式数据:以文件demo.txt为例。在此例中,我们读入年龄、婚否、收入等变量数据,可以用记事本打开文件进行观察数据排列形式,再在SPSS中读入相关数据。在软件上分六步实现(略)。,数据的获取-读取数据库数据,SPSS通过菜单File-Open-Data可以直接打开16种外部数据文件格式,如文本文件、EXCEL、Lotus、dBase、SAS文件等。,其他数据文件格式,SPSS可以利用通用数据库ODBC接口读取数据。例:通过SPSS读取Access2000数据库中数据northwind.mdb,把Access数据库中的如下数据表转化为SPSS文件:产品.sav;订单.Sav;订单明细.sav。,方法是:先设置ODBC数据源配置:文件打开数据库新建查询添加数据源选中MSAccessDatabase配置选择选中northwind.mdb确定(3次)读取数据:File-opendatabase-newquery-选中配置好的文件northwind-下一步-将左边数据库拖到右边-下一步-完成,数据的保存,SPSS获得的数据可以保存为:SPSS格式的文件*.sav(最常见)。其他格式文件,如excel、dbase、sas等22种不同格式的文件。,Back,SPSS的数据整理,数据整理包括两个级别的整理:变量级数据整理:对变量进行操作,如计算新变量、变量编码等,这些功能主要集中在transform(转换)菜单上。文件级数据整理:对文件结构进行处理,如文件行列互换、结构变换、文件拆分、合并等。这些功能主要集中在data(数据)菜单上。,变量级数据整理,Compute(计算)RankCases(个案排序/编秩)Recode(重新编码)AutomaticRecode(自动重新编码)VisualBander(可视化分段)Count(计数),变量级数据整理-新变量生成(Compute),利用算术符号和函数生成新变量(Compute),举例:销售总额=单价*数量*(1一折扣)(订单明细.sav)平均成绩=(语文成绩+数学成绩+英语成绩)/3(transfer.sav)计算英语成绩高于70分的平均成绩计算上海学生的平均成绩注意:1)在英文输入状态下输入函数式2)利用if按钮设定计算条件3)字符串条件加“”号,如city=上海,姓名-姓+名,对数据雇员.sav利用函数concat(姓氏,名字)生成新变量“姓名”,注意:1)在变量视图中调整姓氏和名字变量宽度(4位);2)生成新变量的种类改为字符串型。,变量级数据整理-新变量生成(Rank),RankCases(编秩)就是对记录按某个变量排序,并生成代表名次的新变量“R+原变量名”,举例:transfer.sav按英语成绩排名,分数最高的为第一名。注意以下问题:相同分数(ties)的名次处理:同小、同中、同大、不间断若按多个变量排序,只能按相同的升降方向排序,Date菜单中的SortCases过程也可对数据进行排序,Rank与Sort不同在于:Sort不会生成反映排名序列号的新变量Sort对多个变量排序时可采用升序、降序、混合序例1:个人工资模拟数据.xls,请按工资对个人排序,最高的放在第一行。如果两个人的工资相同,男性排在前。例2:个人工资模拟数据.xls,请在性别内按工资对个人进行降序排列。,变量级数据整理-新变量生成(Recode),将数值型变量转换为字符型,例:将成绩60-100分-记为及格0-59分-记为不及格将字符型变量转换为数值型,例:及格-记为1不及格-记为2将几个小类别合为一个类别。例:“A”+“B”-“优良”,“C”+“D”-“中等”“E”-“差”,变量级数据整理-新变量生成(visualbander),Recode过程可进行准确分组,visualbander过程可进行有规律分组,如:等组距分组。例:按成绩分组90100为A,8090为B,7080为C,6070为D,60以下为E等比例分组例:A级人数占总人数的25%B级占25%C级占25%,D级占25%按平均数和标准差作分割点,Back,文件级数据整理,Mergefile(合并文件)Splitfile(记录拆分)Selectcases(记录筛选)Weightcases(记录加权)Aggregate(数据汇总)Transpose(数据转置)Restructure(数据重新构造),文件级数据整理-合并文件(mergefile),合并相同变量数据的不同个体-增加记录(sample3.sav,sample4.sav)合并相同个体的不同变量数据-增加变量。注意应先排序(transfer.sav,transfer3.sav)用菜单可以一次合并两个文件,一个是SPSS格式,另一个可以用SPSS直接打开用Syntax可以合并多个文件,文件级数据整理-文件拆分(Splitfile),例如对文件transfer.sav按学生所在城市拆分四组。便于以后分组分析。拆分状态在窗口右下角显示”spliton”,文件级数据整理-记录筛选(Selectcases),将符合条件的数据筛选出来进行分析,相当于transform菜单某些功能中的if按钮筛选状态在窗口右下角显示”filteron”,文件级数据整理-记录加权(Weightcases),若各记录出现频数不同,则必须给出加权变量加权状态在窗口右下角显示”weighton”,文件级数据整理-数据分类汇总(aggregate),将记录组合并到单个摘要记录中,并创建新的分类汇总数据文件。基于一个或多个分组变量的值分类汇总记录。新数据文件包含每个组的记录。例如,可按省聚合县数据,并创建一个新的数据文件,其中省是分析单位。以transfer.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030钠离子电池产业链布局节奏与价格战预警分析
- 2025-2030钙钛矿光伏组件量产稳定性挑战与下一代光伏技术路线比选
- K12在线教育课程设计与实施方案
- 2025-2030费托蜡行业研发投入与技术创新能力评估
- 2025-2030费托蜡终端用户采购行为特征与营销策略报告
- 2025-2030费托蜡下游应用市场潜力与增长趋势分析
- 工程材料抽样检验流程与标准
- 2025年高考大题政治题库及答案
- 八年级英语短语记忆技巧分享
- 幼儿园食品安全管理操作规范
- 2025年10月自考15040习概押题及答案
- 安徽省宿州市埇桥区教育集团2024-2025学年上学期九年级第一次月考数学试卷
- 24.1.1《圆》数学人教版九年级上册教学课件
- 汾酒白酒招商手册
- 甜米酒创业计划书
- 塔吊租赁服务技术实施方案技术标
- 员工组织承诺的形成过程内部机制和外部影响基于社会交换理论的实证研究
- 优质课件:几代中国人的美好夙愿
- 2023年真空镀膜机行业市场分析报告及未来发展趋势
- 物业礼仪规范培训方案
- 约谈记录表模板
评论
0/150
提交评论