已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章SPSS数据文件的建立与管理,1,-,本章内容,SPSS数据文件SPSS数据的结构和定义方法SPSS数据的录入和编辑SPSS数据的保存读取其他格式的数据文件SPSS数据文件的合并,2,-,2.1SPSS数据文件,2.1.1SPSS数据文件的特点:SPSS是一个有别于其他文件的特殊格式的文件,SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,数据的内容才是那些待分析的具体数据。基于上述特点,建立SPSS数据文件时应完成两项任务,即描述数据的结构和录入编辑数据。,3,-,2.1.2SPSS数据的组织方式,(1)原始数据的组织方式数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。SPSS数据文件的结构就是对每个变量及相关特征的描述。,4,-,(2)频数数据的组织方式,5,-,6,-,2.2SPSS数据的结构和定义方法,SPSS数据的结构是对SPSS每列变量及其相关属性的描述,主要包括变量名、数据类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、度量尺度等信息。,7,-,变量名(Variablename),变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。3.SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。,8,-,数据类型(Type),数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型:数值型、字符型和日期型。数值型(1)标准型(Numeric)(2)科学记数法型(ScientificNotation)(3)逗号型(Comma)(4)圆点型(Dot)(5)美元符号型(Dollar)(6)用户自定义型(CustomCurrency)字符型(String)日期型(Date),9,-,数值型,数值型是SPSS最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。其中的标准型(numeric)是SPSS默认的数据类型,默认的显示宽度为8位,包括正负符号位、小数点和小数位在内,小数位默认为2位。如果数据的实际宽度大于8位,spss将自动按照科学计数法显示,数据的显示并不影响数据的存储,也不影响数据的计算。,10,-,字符型(String),字符型也是SPSS较常用的数据类型,由一个字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。字符型数据的默认显示宽度为8个字符,不能够进行算术运算,并区分大小写字母。字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。,11,-,日期型(Data),日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。显示格式:dd-mmm-yyyy;mm/dd/yyyy。,12,-,标准数值型,逗号数值型,圆点数值型,科学技术法数值型,美元数值型,用户自定义型,日期型,用户自定义型,图示,13,-,变量宽度(Width)、显示宽度(Columns),每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。,14,-,变量名标签(Variablelabel),变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。,15,-,变量值标签(Valuelabel),变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。,16,-,缺失数据(Missingvalues),数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。SPSS中说明缺失数据的方法是指定用户缺失值。这样,SPSS在分析时,就能够将这些缺失值与正常的数据区分开来,并依据用户指定的缺失值处理策略对其进行处理或分析。SPSS还有一类默认的缺失值,称为系统缺失值,数值型变量用圆点表示,字符型用空格表示。,17,-,SPSS中说明缺失数据的基本方法是指定用户缺失值。用户缺失值可以是:对字符型或数值型变量,用户缺失值可以是1至3个特定的离散值(Discretemissingvalues);对一个数值型变量,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间以外的离散值(Rangeplusoneoptionaldiscrete)。,18,-,SPSS用户缺失值定义窗口,19,-,变量对齐格式(Align),定义显示对齐方式,对齐方式分为右对齐、左对齐和中间对齐,系统中,数值型变量默认为右对齐,字符型变量默认为左对齐,20,-,度量尺度(Measure),统计学依据数据的度量尺度将数据划分为:定类数据(Nominal),如民族、宗教信仰、性别、党派;定序数据(Ordinal),如职称、职务、对某事物的赞同程度;定距数据(Scale),如身高、体重。,21,-,(1)定类尺度(NominalMeasurement):定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。用:名义(N)表示。如,1.男2.女特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的变量只能计算频数和频率。在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥原则。,22,-,(2)定序尺度(OrdinalMeasurement):定序尺度是对事物之间的等级或顺序差别的一种测度,可比较优劣或排序。用:序号(O)表示。如:1.教授2.副教授3.讲师4.助教。特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能排序,不能进行运算。,23,-,(3)定距尺度(IntervalMeasurement):定矩尺度是对事物类别或次序之间间距的测度。如温度。特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差距是多少;定距变量通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减运算。,24,-,(4)定比尺度(ScaleMeasurement):定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样表现为数值。如,销售收入、工资等。特点:定比变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个测度值之间比值的特点,因此它可以进行加、减、乘、除运算,而定距变量值可进行加减运算。由于后两种测度尺度在绝大多数统计分析时没有本质上的区别,在spss中统称为“度量(S)”,25,-,通常建立SPSS数据文件时应首先定义数据的结构部分,然后再输入数据,但实际应用中,边录入、边分析、边修改数据结构的情况也是常见的。数据的结构定义完成之后,可以在VariableView卡片中浏览,也可以通过菜单选项Utilities/Variable来实现。,26,-,2.3SPSS数据的录入与编辑,2.3.1录入定义好SPSS数据结构后,可将具体的数据输入到SPSS中,最终形成SPSS数据文件。SPSS数据的录入操作在数据编辑窗口中的DataView卡片中实现。其操作方法与EXCEL基本类似,也是以电子表格的方式进行录入。录入带有变量值标签的数据时,可以在下拉按钮中的值标签列表中选择一个作为输入。,27,-,【数据视图】表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。,28,-,【变量视图】表用来定义和修改变量的名称、类型及其他属性,如图所示。,如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量Var00001,Var00002等。,29,-,2.3.2SPSS数据的编辑,数据必须输入正确才能保证正确的分析结果。但很难一次输入正确,所以就需要进行修改,一般包括数据的定位、插入、删除、修改、复制等。,30,-,2.3.2.1SPSS数据的定位,数据的定位目的是将当前数据单元定位到某个特定的单元中。有两种定位方式:1、按个案号码定位:Data+GotoCase将当前单元格定位在任何单元格中,选择菜单Data-GotoCase,出现如下对话框,输入欲定位的个案号码并确认,31,-,2、按变量值定位:Edit+Find将当前单元定位在某变量列的任何一个个案上选择菜单Edit-Find,出现如下对话框输入定位变量值并确认于是,SPSS自动对指定的变量进行搜索,并将当前单元定位于定位变量值相等的第一个个案上。,32,-,2.3.2.2插入和删除一个个案,插入一个个案,即在数据编辑窗口的某个个案前插入一个新个案:将当前数据单元确定在一个个案上,选择菜单Data+InsertCase(或工具栏插入个案图标按钮)删除一个个案,在欲删除的个案号码上单击鼠标左键,于是待删除的个案数据全部反向显示;单击鼠标右键,从弹出菜单中选择cut选项。,33,-,2.3.2.3插入和删除一个变量,插入一个变量,即在数据编辑窗口的某个变量前插入一个新变量:将当前数据单元确定在一个变量上,选择菜单Data+InsertVariable删除一个变量,在欲删除的变量名上单击鼠标左键,于是待删除的数据全部反向显示;单击鼠标右键,从弹出菜单中选择cut选项。,34,-,2.3.2.4数据的移动、复制和删除,数据的移动、复制和删除:与一般的应用程序相同选择操作对象(变量、个案、若干连续单元等)剪切:Edit+Cut(Ctrl+X)复制:Edit+Copy(Ctrl+C)粘贴:Edit+Paste(Ctrl+V)恢复删除或修改前数据Edit+Undo(或工具栏Undo图标按钮),35,-,2.4SPSS数据的保存,2.4.1SPSS支持的数据格式1、SPSS文件格式,扩展名为.sav2、Excel格式文件,扩展名为.xls3、dbf格式文件,扩展名为.dbf4、文本格式文件,扩展名为.dat,36,-,将数据保存为SPSS数据文件或其他格式的数据文件的基本操作是:File+Save,对于新的:提示文件名和类型;对于旧的,覆盖原来的,不再提问;File+SaveAs,另存一个数据文件,也有格式(类型)问题;Variable按钮允许用户指定保存哪些变量,不保存哪些变量,变量名前画叉的变量将被保存到磁盘中。将数据保存为Excel文件格式时,Writevariablesnamestospreadsheet选项呈可用状态,它的作用是指定是否将SPSS变量名写入Excel工作表的第一行上。,37,-,2.5读取其他格式的数据文件,SPSS能够直接读取其他格式的数据文件,并将其保存为SPSS格式的数据。1.直接读取其他格式的数据文件:(1)选择菜单File+Open+Data;(2)选择数据文件的类型,并输入数据文件名。2.使用数据库查询打开利用通用数据库ODBC接口读取数据文件在9.0及以前版本中非常重要3.使用文本向导读入文本文件:选择菜单File+ReadTextData,38,-,直接打开,SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单File=Open=Data或直接单击快捷工具栏上的OpenFile按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:,39,-,注:读入Excel文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口,但也可以指定仅读取工作表中某个区域内的数据(如A5:B10)。工作表上的一行数据为SPSS中的一个个案。如果Excel工作表文件第一行或指定读取区域内的第一行存储了变量名信息,则应选择Readvariablenames项,即以第一行的文字信息作为SPSS的变量名,否则不选。,40,-,使用数据库查询打开,SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文件,比如FoxPro3.0以上版本的*.dbf文件就不能直接打开。为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口数据库查询。实际上,SPSS在这里使用的是一种叫ODBC(OpenDatabaseCapture)的数据接口,该接口被大多数数据库软件和办公软件(如MSOffice)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。由于SPSS10.0可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。但是,在9.0及以前的版本中,该查询仍是直接打开EXCEL95、97及2000数据文件的唯一办法。,41,-,ODBC数据引擎是独立于各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MSOffice)。选择菜单File=OpenDatabase=NewQuery,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。,42,-,使用文本导入向导读入文本文件,选择菜单File=ReadTextData,系统就会弹出OpenFile对话框,和前面的情况完全一样,只是文件类型自动跳到了Text(*.txt)。实际上,该功能在SPSS中已被整合到了OpenFile对话框中之所以在菜单上保留该条目的原因是读入纯文本的情况非常普遍,放在这里更加醒目。例:现有一数据文件以纯文本的形式保存,且第一行为变量名,请将其读入SPSS。在Fil
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年低空经济产业集群创新平台研究报告
- 2026-2031中国除尘设备市场供需预测与投资战略研究报告
- 2026-2031中国贵州白酒行业发展现状分析与市场前景预测报告
- 2026-2031中国供应链行业分析与发展策略研究报告
- 2025年药店岗前培训试题及答案
- 2025年新任领导干部法律知识考试试题库及答案
- 2025燃气公司笔试题及答案
- 2025年起重装卸机械操作工中级职业技能鉴定试题库及解析
- 2025年新版动车司机考试试卷及答案
- 2026-2031中国泡沫镍行业市场供需态势及投资潜力研判报告
- 2026云南云天化石化有限公司校园招聘9人考试笔试备考题库及答案解析
- 海域云:2025年中国户用储能行业出海研究报告
- 社交礼仪知识互动试题及答案
- 2025贵阳市城市建设投资集团有限公司第二批招聘笔试考试参考试题附答案解析
- 护理干预在预防下肢深静脉血栓形成中的应用
- 承装修安全生产管理制度
- 2025物流师考试试题及答案物流师考试真题及答案
- 2025-2026学年天一大联考高二物理第一学期期末质量跟踪监视模拟试题含解析
- 配电室安全检查要点和监管培训
- 市政府办公文材料审核办法
- 2026年中国食品检验检测市场调查与市场前景预测报告
评论
0/150
提交评论