SPSS.ppt_第1页
SPSS.ppt_第2页
SPSS.ppt_第3页
SPSS.ppt_第4页
SPSS.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 SPSS数据与数据文件,2.1 数据的来源与分类,数据是数据分析的关键之一,数据通常和我们研究的对象联系在一起。个体就是一组数据描述的对象;变量就是一个个体的任意特征。将数据按照不同的标准进行分类,有助于对数据来源和用途及其分析方法的深入理解和研究。,2.1.1观测数据与试验数据 观测数据:是爱自然的未被控制的条件下观测到的数据,如社会商品零售额,消费价格指数,降雨量等。抽样调查、普查都是重要的观测研究,得到的数据是观测数据。 试验数据:是在人工干预和操纵下产生的数据,这种数据通常来自于科学和技术试验。 将数据分为观测数据和实验数据是基于观测的对象是在自然的还是在可控的实验条件下产生的。他们是数据最根本的两个来源。 对这两种类型的数据要通过建立文件才能使用SPSS进行分析。,2.1.2一手数据与二手数据 一手数据:针对特定的研究问题,通过专门收集、调查或试验取得的数据称为一手数据。(要通过建立文件才能使用SPSS进行分析) 二手数据:由各种媒体、机构发布的数据,如证券市场行情、物价指数、利率、国民生产总值等,对于数据分析人员来说,可以根据研究的问题,从这些数据中加以选择,这样间接得到的数据称为二手数据。(要通过外部文件引入才能使用SPSS进行分析) 一手数据和二手数据是根据数据分析人员获取数据的方式是直接还是间接的来划分的。,2.1.3时间序列数据与横截面数据 这是计量经济学中的数据分类方法。 时间序列数据是对同一研究对象按时间顺序收集得到的数据,如国内生产总值、失业率等。这类数据是按照一定的时间间隔如每日、每周、每月、每季、每年收集的; 横截面数据是指在同一时点上不同研究对象的数据的集合,如2007年沪深股市上市公司中期业绩。 由这两类数据衍生出合并数据,合并数据中既有时间序列数据又有横截面数据。 时间序列数据和横截面数据是数据沿时间与个体两个维度上的视图。,2.2 数据文件的建立,建立数据文件步骤: 1、定义变量:定义变量名、指定变量类型、宽度、小数位数、定义变量标签、变量值标签。 2、数据录入与编辑 3、保存数据文件,2.2 .1 数据类型,1. 常量与变量 (1) SPSS 常量 (a)数值型常量 数值型常量就是程序在SPSS 语句中的数字,一般使用两种书写方式,一种是普通书写方式例如26 、38.4 等;另一种书写方式是科学记数法,用于表示特别大或特别小的数字例如1.23E18 、2.56E-16 等。,(b) 字符串常量 字符串常量是被单引号或双引号括起来的一串字符,如果字符串中带有字符“ ”,则该字符串常量必须使用双引号括起来例如 :“BOY S BOOK ”,(2)SPSS 变量 (a) 为变量命名应该遵循以下四个原则 SPSS 变量的变量名由字符组成。 首字母是字母,其后可为字母或数字或除“?、!、*” 以外的字符,但应该注意不能以连接线“-”和圆点“. ” 作为变量名的最后一个字符。 变量名不能与SPSS 保留字相同,SPSS 的保留字有ALL AND BY EQ GE GTLE LT NE NOT OR TO WITH 系统不区分变量名中的大小写字符例如ABC 和abc 被认为是同一个变量,(b) 变量类型与默认长度 SPSS 变量有三种基本类型:数值型、字符型、日期型。定义时有以下可选的数据类型: Numeric(标准数值型) Comma(带逗点的数值型) Dot(逗点作小数点的数值型) Scientific Notation(科学记数法) Date(日期型) Dollar(带有美元符号的数值型) CustomCurrency(自定义型) String(字符型),(c)变量标签和变量值标签,返回,(d) 变量的格式 变量值标签是对变量的可能的取值所附加的进一步说明对分类变量往往要定义其取值标签当然变量值标签也是一个可选择的属性可以定义也可以不定义 例如: 变量 值 值标签 Sex f Female m Male,e)变量度量(Measurement) 在统计学上按照对事物描述的精确尺度,将所采用的测量尺度从低级到高级分为4个层次:定类尺度、定序尺度、定距尺度(interval measurement)和定比尺度。下面是SPSS可以定义的变量测量尺度类型 scale: 定距数据 Ordinal:定序数据 Nominal:定类数据,2 操作符与表达式 (1) 算术运算符与算术表达式 (2) 比较算符与比较表达式 (3) 逻辑运算符与逻辑表达式,数学运算操作符 关系运算符 逻辑运算符 + 加 (GT) :大于 | Or :或 * 乘 =(GE) : 大于等于 * * 幂 = EQ 等于 ( ) 括号 = NT 不等于,输入数据之前首先要定义变量定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式(显示宽度对齐方式缺失值标记等) (1) 对一般文件的变量定义 (2) 调查问卷中开放题的变量定义 (3)调查问卷中简单单选题变量定义(值标签) (4)调查问卷中对多选题变量定义(a.多重二分法 b.多重分类法),2.2.2 变量的定义,Name Sex X 1 X2 X3 y Wang M 35 69 0.70 1 600 Ning F 40 74 2.50 2600 Peng M 42 64 2.00 2 100 Gu M 40 74 3.00 2650 Hu F 37 72 1 . 1 0 2400 You M 45 68 1 .50 2200 Lu F 43 78 4.30 2750 Lou M 37 66 2.00 1 600 Chan M 44 70 3.20 2750 Shen F 42 65 3.00 2500 Zhou F 4 1 64 2.70 2400 Deng M 38 72 2.5 2200,调查问卷例子 1.姓名 2.性别:1男 2女 3.出生年月: 4.家庭收入a.3000以下 b.30004999 c.50006999 d.70009999 e.10000以上 5.请问你购物的打折信息主要来自那些渠道: a.报纸 b.杂志 c.电视 d.网络 e.朋友介绍 f.手机短信g.其他,请指出 6,每天上网的小时数:小时 7,你在选择购物商场的时候,关注那些因素 a.交通条件b.促销活动 c.购物环境 d.服务质量 e.其他,Data View和Variable View,返回,定义变量的普通方法,返回,定义变量类型,返回,定义值标签,返回,定义用户缺失值,返回,列格式、对齐、测度方式,返回,定类尺度(Nominal ):对事物的类别或属性的一种测度,可按某属性对其分类或分组 定序尺度(ordinal ):对事物之间等级或顺序差别的一种测度,可以比较优劣或排序 定比尺度(scale):能够测算两个测度值之间比值的一种计量尺度,表现为数值,2.2.3 数据录入与编辑,数据输入方法 1按变量输入数据 2按观测量输入数据(case) 概率事件观测量(Cases) 在数据编辑器的二维表格中每行都是数据文件的一个记录,在统计学中称作一个概率事件。在SPSS 的菜单中或帮助信息中用Cases 这个单词表示,每个Cases 是由各变量的一定的值组成,是一个事件或者说是对一个被观测对象的各种特征的实测值组成。因此相对应变量来说可以称之为观测量单元格中的数据即是某个观测量中的一个值,因此可以称之为变量值,也可以称之为某个观测值,在Help 信息中往往使用Case 这个单词。,对一般文件的数据录入 a按变量输入数据 b按观测量输入数据(case) (2) 调查问卷中开放题的数据录入 a按变量输入数据 b按观测量输入数据(case) (3)调查问卷中简单单选题数据录入 a.直接录入 b.字符代码+值标签 c.数值代码+值标签 (4)调查问卷中对多选题数据录入 a.多重二分法 b.多重分类法,2.2.4 数据文件的保存,1、 文件类型 SPSS(*.sav) (6.0以上) SPSS(*.sys) (4.0版) SPSS Portable (*.por) Tab-delimited (*.dat) Fixed ASCII (*.dat) Excel (*.xls),1-2-3 Rel 3.0 (*.wk3) 1-2-3 Rel 2.0 (*.wkl) 1-2-3 Rel 1.0 (*.wks) SYLK (*.slk) dBASEIV(*.dbf) dBASEIII(*.DBF) dBASEII(*.dbf),2、保存数据文件 在数据编辑器中定义变量输入修改数据形成一个可供SPSS 分析的数据文件,使用Edit 菜单项中的各种功能可以对数据文件进行编辑处理。 如果将数据文件存盘磁盘数据文件的扩展名为SAV ,利用菜单项File 的Data或Save As 功能展开的对话框指定存储路径位置和磁盘文件名,将数据窗中的数据保存为.sav格式的数据文件或者其他的数据文件如数据库文件等。,Name Sex X 1 X2 X3 y Wang M 35 69 0.70 1 600 Ning F 40 74 2.50 2600 Peng M 42 64 2.00 2 100 Gu M 40 74 3.00 2650 Hu F 37 72 1 . 1 0 2400 You M 45 68 1 .50 2200 Lu F 43 78 4.30 2750 Lou M 37 66 2.00 1 600 Chan M 44 70 3.20 2750 Shen F 42 65 3.00 2500 Zhou F 4 1 64 2.70 2400 Deng M 38 72 2.5 2200,表 3-1 待 入的数据,简单数据定义和输入实例,2.2.5 数据编辑,数据编辑器 1.数据编辑器的组成 (1) 窗口标题栏 (2) 窗口状态栏 (3) 数据输入栏 (4) 数据显示区,2 数据编辑器的功能概述 (1) 变量与观测量的编辑功能 (2) 数据编辑功能,已输入数据的修改 1 在一个区域中修改数据 2 恢复删除或修改前的数据,数据的剪切复制与粘贴 (1) 选择变量 (2) 选择观测量 (3) 选择属于某个变量的若干个连续的单元格 (4) 选择属于某个观测量的若干个连续的单元格,变量观测量的插入与删除 1 插入一个变量 2 删除一个变量 3 插入一个观测量 4 删除一个观测量,恢复删除或修改前的数据 如果对本次的修改与删除不满想恢复操作前的状态,只要使用鼠标单击系统菜单中的Edit 展开下拉菜单选择第一项Undo 鼠标单击之即可,2.3其他格式数据文件的导入,直接打开(如excel文件) 使用数据库查询打开 使用导入向导导入文本文件,2.3.1 Excel文件读入,步骤: 1, file-open-data 弹出文件操作对话框 2,通过查找范围查找要转换文件所在路径 3,选择要打开文件类型:exel(*.xls) 4,找到要转换的文件选定,按“打开”按钮 弹出一个对话框 5,保留默认选项,选择“ok” 6,将读入的文件保存file-save,选择正确路径,根据要求命名保存即可。,2.3.2使用导入向导导入文本文件,1,选择菜单File=Read Text Data,系统就会弹出Open File对话框,文件类型自动跳到了Text (*.txt)。选中要读入的文件,打开 2,does your file match a preddfined format 选择 “no”,选下一步 3,how are your variables arranged 一般选择Delitmited are variable names included at the top of your file,根据御览窗口可以看到第一行是变量还是数据,一般选择:yes ,然后选择“下一步”,4,The first cases of data begins on which 默认:2(因为第一行一般是变量名) How are your cases represented? 一般选择:each line How many cases you want to import 通常选择:all 选好后选择“下一步”,5,which delimiters appear between variables?变量间用的哪种分隔符,一般系统会自己有判断,选择默认的即可 What is the text qualifier 数据中采用的是什么文本限定符,一般选择“none”默

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论