第2章统计数据的收集与预处理_第1页
第2章统计数据的收集与预处理_第2页
第2章统计数据的收集与预处理_第3页
第2章统计数据的收集与预处理_第4页
第2章统计数据的收集与预处理_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS 19统计分析使用教程 电子工业出版社1第二章统计数据的收集与预处理SPSS 19统计分析使用教程 电子工业出版社2主要内容主要内容2.1 统计数据的收集统计数据的收集2.2 SPSS数据文件的建立数据文件的建立2.3 SPSS数据文件的编辑数据文件的编辑2.4 SPSS数据加工数据加工 SPSS 19统计分析使用教程 电子工业出版社32.1.1 问卷设计问卷设计1问卷的构成问卷的构成(1)标题(2)导语(前言)(3)正文(4)结束语2.1统计数据的收集统计数据的收集SPSS 19统计分析使用教程 电子工业出版社42.1.1 问卷设计问卷设计2问卷的问题类型问卷的问题类型(1)封闭型问

2、题(2)开放型问题2.1统计数据的收集统计数据的收集SPSS 19统计分析使用教程 电子工业出版社52.1.1 问卷设计问卷设计3问卷中量表的主要类型问卷中量表的主要类型(1)连续评分量表(2)分项评分量表(Likert量表)2.1统计数据的收集统计数据的收集SPSS 19统计分析使用教程 电子工业出版社62.1.1 问卷设计问卷设计4问卷设计的注意事项问卷设计的注意事项(1)目的明确(2)先易后难,先简后繁(3)提出的问题要具体,避免提一般性问题(4)单选问题的备选答案应完整划分答案空间(5)多选题的备选答案必须分布在两个以上的维度上,并且至少有一部分不是互相排斥的(6)问题的陈述及备选答案

3、不能有多重含义(7)问题设计的用语要含义明确,不能让应答者产生不同的理解(8)在问题的陈述中,要对所询问行为的时间、方式、目的做必要的限定2.1统计数据的收集统计数据的收集SPSS 19统计分析使用教程 电子工业出版社72.1.1 问卷设计问卷设计4问卷设计的注意事项问卷设计的注意事项(9)对于得不到诚实回答而又必须了解的数据,可以通过变换问题的提法来获得相应的数据,或者通过了解相对数据来判断总体的情况(10)问卷不能太长,以2030分钟为宜;商场拦截类的问卷,以35分钟为宜2.1统计数据的收集统计数据的收集SPSS 19统计分析使用教程 电子工业出版社82.1.2 问卷分析问卷分析信度分析效

4、度分析2.1统计数据的收集统计数据的收集SPSS 19统计分析使用教程 电子工业出版社9主要内容主要内容2.1 统计数据的收集统计数据的收集2.2 SPSS数据文件的建立数据文件的建立2.3 SPSS数据文件的编辑数据文件的编辑2.4 SPSS数据加工数据加工 SPSS 19统计分析使用教程 电子工业出版社102.2 SPSS数据文件的建立数据文件的建立2.2.1 统计数据的度量尺度统计数据的度量尺度名义尺度(名义尺度(Norminal)即定类尺度,它仅仅是一种标志,用于区分变量的不同值,即定类尺度,它仅仅是一种标志,用于区分变量的不同值,类别数据之间没有次序关系。类别数据之间没有次序关系。例

5、如,人口的性别、商品的例如,人口的性别、商品的名称、身份证、商店类型等。名称、身份证、商店类型等。定序尺度(定序尺度(Ordinal)是对事物之间等级或顺序差别的一种测度。例如,考试成是对事物之间等级或顺序差别的一种测度。例如,考试成绩(优、良、中、差)、人的身高等级(高、中、矮)、绩(优、良、中、差)、人的身高等级(高、中、矮)、学历等级(博士、硕士、学士)等。学历等级(博士、硕士、学士)等。间隔尺度(间隔尺度(Scale) 定距尺度(Interval),是对事物类别或次序之间间距的测度。例如,100分制考试的成绩、重量、温度等。 定比尺度(Ratio),是指能够测度值之间比值的一种计量尺度

6、。例如,员工的月收入、企业产值等。 SPSS 19统计分析使用教程 电子工业出版社112.2 SPSS数据文件的建立数据文件的建立统计数据的度量尺度统计数据的度量尺度 不同的度量尺度的统计数据在SPSS的数据文件中,对应不同的变量数据类型。 名义尺度名义尺度-数值型、字符型数值型、字符型 定序尺度定序尺度-数值型、字符型数值型、字符型 间隔尺度间隔尺度-数值型数值型SPSS 19统计分析使用教程 电子工业出版社122.2 SPSS数据文件的建立数据文件的建立2.2.2、SPSS数据文件的特点数据文件的特点 人员编号性别部门体检日期体重健康状况1女通信学院08/10/200455好2女计算机学院

7、08/10/200446好3女外语学院08/10/200450一般4男通信学院08/10/200456差5男管理学院08/11/200451差6男光电学院08/11/200453好7女光电学院08/11/200450一般8男通信学院08/12/200450好9女计算机学院08/12/200445一般10男管理学院08/13/200456好变量个案样本 变量值SPSS 19统计分析使用教程 电子工业出版社132.2 SPSS数据文件的建立数据文件的建立2.2.3 输入数据建立数据文件输入数据建立数据文件 SPSS数据文件的建立包括两个方面,首先进行数据的结构定义,其次录入数据。(1)数据的结构定

8、义)数据的结构定义结构定义包括:名称、类型、宽度、小数、标签、值、缺失值、列、对齐、度量标准、角色SPSS 19统计分析使用教程 电子工业出版社142.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义名称 命名规则:高版本的SPSS的变量名长度可多达64位,但是由于老版本的SPSS变量名长度应在8位之内,为了避免与老版本及其他软件出现兼容问题,变量名一般仍控制在8位之内且尽量避免中文,必要的中文说明可以放在Label栏中加以说明。首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。变量名必须唯一且不区分大小写字母

9、。允许汉字作为变量名,汉字总数一般不超过4个。变量名不能与SPSS的保留字相同。SPSS的保留字包括:all、by、eq、ge、gt、leIt、ne、not、or、to、with。系统不区分变量名的大小写。SPSS 19统计分析使用教程 电子工业出版社152.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义变量类型SPSS 19统计分析使用教程 电子工业出版社162.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义变量类型具体说明如下表所示:中 文 名说 明标准数值型变量值为数字的变量。值以标准数值格式显示,数据编辑器接受以标准格式或科学

10、计数法表示的数值。默认总长度8位,小数位2位带逗号的数值型变量 默认总长度8位,小数位2位,其值在显示时整数部分从右至左每3位用一个逗号做分隔符,值的小数指示符右侧不能包含逗号带圆点的数值型变量 默认总长度8位,小数位2位,其值在显示时整数部分从右至左每3位用一个圆点做分隔符,值的小数指示符右侧不能包含句点科学计数法数值型变量 默认总长度8位,小数位2位,它的值以嵌入的E及带符号的10 次幂指数形式显示。数据编辑器为此类变量接受带或不带指数的数值。指数前面可以加上带符号(可选)的E或D,或只加上符号,例如,123、1.23E2、1.23D2、1.23E+2及1.23+2日期型变量 既可表示日期

11、又可表示时间,用户可根据实际情况自行选择。其值以若干种日历日期或时钟时间格式中的一种显示,从列表中选择一种格式,输入日期时可以用斜杠、连字符、句号、逗号或空格作为分隔符美元符号型数值变量 主要用来表示货币数据,显示时前面带美元符号($),每3位用逗号分隔,并用句点作为小数分隔符。可以输入带或不带前导美元符号的数值设定货币型变量 一种数值变量,其值以定制货币格式中的一种显示,定制货币格式是在“选项”对话框的“货币”选项卡中定义的。定义的定制货币字符不能用于数据输入,但显示在数据编辑器中字符串型变量 默认总长度8位,字符串值可以包含任何字符,可包含的最大字符数不超过定义的长度SPSS 19统计分析

12、使用教程 电子工业出版社172.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义变量宽度设置变量宽度。一般无需调整,直接采取默认值。它的大小可通过Width栏后边的微调按钮调整小数位数 若变量类型为数值型,则可设置变量的小数位数,其他类型的变量则不能设置。小数位数默认为两位变量名标签考虑到与老版本的兼容问题,变量名最好限制为8位以内,并且尽量避免中文,这就有可能不能完全描述清楚变量的信息,此时就可在标签中对变量名做进一步的说明。利用Label栏,不仅可以对变量详细说明,而且还可以采用中文,大大方便了用户对变量的理解。SPSS 19统计分析使用教程 电子工业出版社18

13、2.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义变量值标签(Values)变量值标签是对变量的可能取值附加的进一步说明,标签内容最多可以有120个字符,通常仅对类型或分类变量的取值指定值标签例如,将变量Departmt定义为数值型变量时,可以按照下表中规定的值和值标签,具体定义方法见下图。变量值变量值标签1通信学院2计算机学院3管理学院4光电学院5外语学院SPSS 19统计分析使用教程 电子工业出版社192.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样

14、就可以更好地利用其他的有效数据。列宽 定义变量在数据窗口中显示的宽度。对齐定义变量值显示的对齐方式,默认为左对齐。度量标准根据统计数据的类型定义度量尺度,度量尺度在数据分析中的作用不是很明显,但是如果用户要进行交互式绘图就必须定义好度量尺度。SPSS 19统计分析使用教程 电子工业出版社202.2 SPSS数据文件的建立数据文件的建立(1)数据的结构定义)数据的结构定义缺失值 SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。 角色 输入:变量将用作输入(例如预测变量、自变量)。 目标:变量将用作输出或目标(例如因变量)。 两者:变量将同

15、时用作输入和输出。 无:变量没有角色分配。 分区:变量用于将数据划分为单独的训练、检验和验证样本。 拆分:设定此角色是为与SPSS Modeler 相互兼容,具有此角色的变量不会在SPSS Statistics 中用作拆分文件变量。SPSS 19统计分析使用教程 电子工业出版社212.2 SPSS数据文件的建立数据文件的建立(2)数据的录入)数据的录入录入数据的一般方法 逐行录入从Word或Excel中直接复制粘贴到数据文件中连续粘贴相同值录入带有变量值标签的数据输入定义了变量值标签的数据时,可以直接输入变量值,也可以通过下拉列框的形式输入,如图2.3所示。SPSS 19统计分析使用教程 电子

16、工业出版社222.2 SPSS数据文件的建立数据文件的建立2.2.4 从其他数据文件导入数据建立数据文件从其他数据文件导入数据建立数据文件 (1)直接打开)直接打开选择菜单“文件打开数据”,弹出“打开文件”对话框左键单击“文件类型”,即可看到SPSS所能打开的数据文件类型,如下表所示文件扩展名具 体 描 述SPSS(*.sav)当前版本SPSS 19数据文件SPSS/PC+(*.sys)低版本SPSS数据文件Systat(*.syd *.sys)Systat格式数据文件SPSS Portable(*.por)SPSS的ASCII数据文件Excel(*.xls ,*.xlsx, *.xlsm)各

17、种版本的Excel数据文件,此种数据格式常用Lotus(*.w*)Lotus数据文件Sylk(*.slk)Sylk数据文件dBase(*.dbf)dBase数据文件,Foxpro下的dbf文件需转换为dBase文件才能打开SAS(*.sas7bat,*.sd7,*sd2,*.ssd01,*.xpt )各种版本和类型的SAS数据文件,一种统计学软件的数据文件格式SPSS 19统计分析使用教程 电子工业出版社23232.2 SPSS数据文件的建立数据文件的建立2.2.4 从其他数据文件导入数据建立数据文件从其他数据文件导入数据建立数据文件 (1)直接打开)直接打开其中用的最多的是直接打开Excel

18、的数据文件。在打开Excel格式的文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口中,但也可指定仅读取工作表某个区域内的数据。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息,则应选择打开对话框上的复选框“Read variable names form the first row of data”,即以工作表第一行或指定读取区域内的第一行上的文字信息作为SPSS的变量名;如果不选此项,SPSS的变量名将自动取名为V1、V2等。SPSS 19统计分析使用教程 电子工业出版社242.2 SPSS数据文件的建立数据文件的建立2.2.4 从其他数据文

19、件导入数据建立数据文件从其他数据文件导入数据建立数据文件 (2)数据库查询方式)数据库查询方式如果数据为数据库格式的文件,可以同用数据库查询的方式导入数据到SPSS中。其操作步骤如下:第1步 选择菜单“文件打开数据库新建查询”,弹出数据库向导窗口。这里显示了所有可以打开的数据源类型。第2步 用户根据打开文件的向导选择要打开的文件类型并逐步打开文件。SPSS 19统计分析使用教程 电子工业出版社252.2 SPSS数据文件的建立数据文件的建立2.2.4 从其他数据文件导入数据建立数据文件从其他数据文件导入数据建立数据文件 (3)从文本文件导入)从文本文件导入文本格式的数据文件是一种最通用格式的数

20、据文件,SPSS提供了专门读取文本文件的功能。选择菜单“文件打开文本数据”,弹出“打开文件”对话框,选择要导入的文本文件名后会出现文本数据的向导,该向导是一个分为6步的打开向导,根据文本文件的格式和导入数据的需求进行每一步的设置即可。SPSS 19统计分析使用教程 电子工业出版社26主要内容主要内容2.1 统计数据的收集统计数据的收集2.2 SPSS数据文件的建立数据文件的建立2.3 SPSS数据文件的编辑数据文件的编辑2.4 SPSS数据加工数据加工 SPSS 19统计分析使用教程 电子工业出版社272.3 SPSS数据文件的数据文件的编辑编辑2.3.1 数据文件的合并数据文件的合并SPSS

21、提供两种形式的合并:一是横向合并,从外部文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件中增加观测量到当前数据文件中。V1V2V3V4+V1V2V3V4V1V2V1V2+V1V2横向合并横向合并纵向合并纵向合并SPSS 19统计分析使用教程 电子工业出版社282.3 SPSS数据文件的数据文件的编辑编辑2.3.1 数据文件的合并数据文件的合并(1)横向合并)横向合并单击单击“浏览浏览”按钮选按钮选择要合并的择要合并的SPSS数据数据文件的文件名文件的文件名从左边文本框中选择从左边文本框中选择需合并的变量到此框需合并的变量到此框中中SPSS 19统计分析使用教程 电子工业出版社29

22、2.3 SPSS数据文件的数据文件的编辑编辑2.3.1 数据文件的合并数据文件的合并(1)横向合并)横向合并 纵向合并数据文件的操作方法同横向合并的方法类似,操作不再赘纵向合并数据文件的操作方法同横向合并的方法类似,操作不再赘述,但需注意以下几点:述,但需注意以下几点:两个待合并的两个待合并的SPSS数据文件的内容合并起来应具有实数据文件的内容合并起来应具有实际意义;际意义;两个数据文件的结构最好一致;两个数据文件的结构最好一致;不同数据文件中含义相同的变量最好用相同的变量名,不同数据文件中含义相同的变量最好用相同的变量名,数据类型要相同数据类型要相同SPSS 19统计分析使用教程 电子工业出

23、版社302.3 SPSS数据文件的数据文件的编辑编辑2.3.2 数据文件的拆分数据文件的拆分 所谓的拆分并不是要把数据文件分成几个,而是根据实际情况,根据变量对数据进行分组,为以后的分组统计分析提供便利SPSS 19统计分析使用教程 电子工业出版社312.3 SPSS数据文件的数据文件的编辑编辑2.3.2 数据文件的拆分数据文件的拆分选项1:不拆分,也用于取消原来的拆分;选项2、3:对数据拆分,并选择拆分的变量到“分组方式”框中。数据拆分后排序的方式SPSS 19统计分析使用教程 电子工业出版社322.3 SPSS数据文件的数据文件的编辑编辑2.3.2 数据文件的拆分数据文件的拆分 “分割文件

24、”对话框中,“比较组”与“按组组织输出”的区别在于:前者将分组统计结果输出在同一张表格中,以便于不同组之间的比较;后者将分组统计结果分别输出在不同的表格中。通常选择第一种输出方式。若要取消数据拆分,只需选择“分析所有个案,不创建组”即可。 对数据可以进行多重拆分,类似于数据的多重排序,多重拆分的次序决定于选择拆分变量的前后次序。SPSS 19统计分析使用教程 电子工业出版社332.3 SPSS数据文件的数据文件的编辑编辑2.3.3数据的选取数据的选取数据的选取即按条件选取观测量进行分析选择观测量的目的 有时为了进行特定的分析,需要从所有的数据资料中选择一些数据进行统计分析。例如:有学生的成绩数

25、据,如果只分析男同学的成绩,则要进行选择观测量为男性的数据。SPSS 19统计分析使用教程 电子工业出版社342.3 SPSS数据文件的数据文件的编辑编辑2.3.3数据的选取数据的选取1)全部个案:所有的观测量都被选择,该)全部个案:所有的观测量都被选择,该选项可用于解除原来的观测量选择。选项可用于解除原来的观测量选择。2)如果条件满足:表示按指定条件选择观测)如果条件满足:表示按指定条件选择观测量量3)随机个案样本:对观测量进行随机抽样,)随机个案样本:对观测量进行随机抽样,即对数据编辑窗口中的所有个案进行随机筛即对数据编辑窗口中的所有个案进行随机筛选,包括两种方式的随机筛选,一是近似抽选,

26、包括两种方式的随机筛选,一是近似抽样(样(Approximately)即键入抽样比例后由)即键入抽样比例后由系统随机抽取;二是精确抽样(系统随机抽取;二是精确抽样(Exactly)即)即要求从第几个观测量起抽取多少个。要求从第几个观测量起抽取多少个。4)基于时间或个案全距)基于时间或个案全距:顺序抽样,单击:顺序抽样,单击“范围范围”按钮可以定义从第几个观测量到按钮可以定义从第几个观测量到第几个观测量。第几个观测量。5)使用筛选器变量:用指定的变量)使用筛选器变量:用指定的变量(只能为只能为数字型变量数字型变量)作过滤,即依据过滤变量的取值作过滤,即依据过滤变量的取值进行样本选取,变量值为非进

27、行样本选取,变量值为非0或非系统缺失值或非系统缺失值的个案将被选中。这种方法通常用于排除包的个案将被选中。这种方法通常用于排除包含系统缺失值的个案。含系统缺失值的个案。设置被选择个案的输出形式:设置被选择个案的输出形式:1)生成一个名为)生成一个名为filter_$的的新变量,取值为新变量,取值为0或或1;2)选中的个案输出到新的数)选中的个案输出到新的数据文件中据文件中SPSS 19统计分析使用教程 电子工业出版社352.3 SPSS数据文件的数据文件的编辑编辑2.3.3数据的加权数据的加权 所谓权重是指同一个观测量值在所有的观测量里出现的次数或频率。SPSS的观测量加权功能是在数据文件中选

28、择一个变量,这个变量里的值是相应的观测量出现的次数,这个变量叫做权变量。 SPSS中指定加权变量的本质是数据复制,例如表2-5是工人每天生产产品的数量,第一行数据表示当天生产产品 数量为20各的工人有3个,将“工人数”作为加权变量后,实际是将数据转换成表2-6所示的数据进行分析。产品数量工人数203表2-5产品数量202020表2-6SPSS 19统计分析使用教程 电子工业出版社362.3 SPSS数据文件的数据文件的编辑编辑2.3.3数据的加权数据的加权 一旦指定了加权变量,在以后的分析处理中加权是一直有效的,直到取消加权为止;只有数值型的变量才能作为加权变量。SPSS 19统计分析使用教程

29、 电子工业出版社37主要内容主要内容2.1 统计数据的收集统计数据的收集2.2 SPSS数据文件的建立数据文件的建立2.3 SPSS数据文件的编辑数据文件的编辑2.4 SPSS数据加工数据加工 SPSS 19统计分析使用教程 电子工业出版社382.4 SPSS数据数据加工加工2.4.1变量的计算变量的计算输入新生成的变量的变量名输入计算的式子SPSS中提供的用于计算的函数,利用这些函数可以生成指定分布的随机数、生成给定参数的概率密度函数等。 SPSS 19统计分析使用教程 电子工业出版社392.4 SPSS数据数据加工加工2.4.2 数据可视离散化数据可视离散化 SPSS提供的数据可视离散化功

30、能可将连续的数值型数据按由小至大的顺序加以分组(测量值由最低分至最高分分组),从而可将等距或比率变量转换为间断变量SPSS 19统计分析使用教程 电子工业出版社402.4.2 数据可视离散化数据可视离散化 见书见书Page 41例例2-5 2.4 SPSS数据数据加工加工将需要划分组段的变量“评价结果”选择到此框中。选择“转换可视离散化”,弹出右图所示的变量选择对话框SPSS 19统计分析使用教程 电子工业出版社412.4 SPSS数据数据加工加工2.4.2 数据可视离散化数据可视离散化 见书见书Page 41例例2-5 输入存储组段值的新变量的名称单击此按钮设置组段分割点SPSS 19统计分析使用教程 电子工业出版社422.4.2 数据可视离散化数据可视离散化 (1)按照变量值等间距划分)按照变量值等间距划分 :在在“第一个分割点的位置第一个分割点的位置”输入第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论