




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章,统计数据的收集与预处理,主要内容,2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工,2.1.1问卷设计1问卷的构成(1)标题(2)导语(前言)(3)正文(4)结束语,2.1统计数据的收集,2.1.1问卷设计2问卷的问题类型(1)封闭型问题(2)开放型问题,2.1统计数据的收集,2.1.1问卷设计3问卷中量表的主要类型(1)连续评分量表(2)分项评分量表(Likert量表),2.1统计数据的收集,2.1.1问卷设计4问卷设计的注意事项(1)目的明确(2)先易后难,先简后繁(3)提出的问题要具体,避免提一般性问题(4)单选问题的备选答案应完整划分答案空间(5)多选题的备选答案必须分布在两个以上的维度上,并且至少有一部分不是互相排斥的(6)问题的陈述及备选答案不能有多重含义(7)问题设计的用语要含义明确,不能让应答者产生不同的理解(8)在问题的陈述中,要对所询问行为的时间、方式、目的做必要的限定,2.1统计数据的收集,2.1.1问卷设计4问卷设计的注意事项(9)对于得不到诚实回答而又必须了解的数据,可以通过变换问题的提法来获得相应的数据,或者通过了解相对数据来判断总体的情况(10)问卷不能太长,以2030分钟为宜;商场拦截类的问卷,以35分钟为宜,2.1统计数据的收集,2.1.2问卷分析信度分析效度分析,2.1统计数据的收集,主要内容,2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工,2.2SPSS数据文件的建立,2.2.1统计数据的度量尺度名义尺度(Norminal)即定类尺度,它仅仅是一种标志,用于区分变量的不同值,类别数据之间没有次序关系。例如,人口的性别、商品的名称、身份证、商店类型等。定序尺度(Ordinal)是对事物之间等级或顺序差别的一种测度。例如,考试成绩(优、良、中、差)、人的身高等级(高、中、矮)、学历等级(博士、硕士、学士)等。间隔尺度(Scale),定距尺度(Interval),是对事物类别或次序之间间距的测度。例如,100分制考试的成绩、重量、温度等。,定比尺度(Ratio),是指能够测度值之间比值的一种计量尺度。例如,员工的月收入、企业产值等。,2.2SPSS数据文件的建立,统计数据的度量尺度,说明:不同的度量尺度的统计数据在SPSS的数据文件中,对应不同的变量数据类型。名义尺度-数值型、字符型定序尺度-数值型、字符型间隔尺度-数值型,2.2SPSS数据文件的建立,2.2.2、SPSS数据文件的特点,变量,个案,样本,变量值,2.2SPSS数据文件的建立,2.2.3输入数据建立数据文件SPSS数据文件的建立包括两个方面,首先进行数据的结构定义,其次录入数据。(1)数据的结构定义结构定义包括:名称、类型、宽度、小数、标签、值、缺失值、列、对齐、度量标准、角色,2.2SPSS数据文件的建立,(1)数据的结构定义名称命名规则:高版本的SPSS的变量名长度可多达64位,但是由于老版本的SPSS变量名长度应在8位之内,为了避免与老版本及其他软件出现兼容问题,变量名一般仍控制在8位之内且尽量避免中文,必要的中文说明可以放在Label栏中加以说明。首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。变量名必须唯一且不区分大小写字母。允许汉字作为变量名,汉字总数一般不超过4个。变量名不能与SPSS的保留字相同。SPSS的保留字包括:all、by、eq、ge、gt、leIt、ne、not、or、to、with。系统不区分变量名的大小写。,2.2SPSS数据文件的建立,(1)数据的结构定义变量类型,2.2SPSS数据文件的建立,(1)数据的结构定义变量类型具体说明如下表所示:,2.2SPSS数据文件的建立,(1)数据的结构定义变量宽度设置变量宽度。一般无需调整,直接采取默认值。它的大小可通过Width栏后边的微调按钮调整小数位数若变量类型为数值型,则可设置变量的小数位数,其他类型的变量则不能设置。小数位数默认为两位变量名标签考虑到与老版本的兼容问题,变量名最好限制为8位以内,并且尽量避免中文,这就有可能不能完全描述清楚变量的信息,此时就可在标签中对变量名做进一步的说明。利用Label栏,不仅可以对变量详细说明,而且还可以采用中文,大大方便了用户对变量的理解。,2.2SPSS数据文件的建立,(1)数据的结构定义变量值标签(Values)变量值标签是对变量的可能取值附加的进一步说明,标签内容最多可以有120个字符,通常仅对类型或分类变量的取值指定值标签例如,将变量Departmt定义为数值型变量时,可以按照下表中规定的值和值标签,具体定义方法见下图。,2.2SPSS数据文件的建立,(1)数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。列宽定义变量在数据窗口中显示的宽度。对齐定义变量值显示的对齐方式,默认为左对齐。度量标准根据统计数据的类型定义度量尺度,度量尺度在数据分析中的作用不是很明显,但是如果用户要进行交互式绘图就必须定义好度量尺度。,2.2SPSS数据文件的建立,(1)数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。角色输入:变量将用作输入(例如预测变量、自变量)。目标:变量将用作输出或目标(例如因变量)。两者:变量将同时用作输入和输出。无:变量没有角色分配。分区:变量用于将数据划分为单独的训练、检验和验证样本。拆分:设定此角色是为与SPSSModeler相互兼容,具有此角色的变量不会在SPSSStatistics中用作拆分文件变量。,2.2SPSS数据文件的建立,(2)数据的录入录入数据的一般方法逐行录入从Word或Excel中直接复制粘贴到数据文件中连续粘贴相同值录入带有变量值标签的数据输入定义了变量值标签的数据时,可以直接输入变量值,也可以通过下拉列框的形式输入,如图2.3所示。,2.2SPSS数据文件的建立,2.2.4从其他数据文件导入数据建立数据文件(1)直接打开选择菜单“文件打开数据”,弹出“打开文件”对话框左键单击“文件类型”,即可看到SPSS所能打开的数据文件类型,如下表所示,23,2.2SPSS数据文件的建立,2.2.4从其他数据文件导入数据建立数据文件(1)直接打开,说明:其中用的最多的是直接打开Excel的数据文件。在打开Excel格式的文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口中,但也可指定仅读取工作表某个区域内的数据。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息,则应选择打开对话框上的复选框“Readvariablenamesformthefirstrowofdata”,即以工作表第一行或指定读取区域内的第一行上的文字信息作为SPSS的变量名;如果不选此项,SPSS的变量名将自动取名为V1、V2等。,2.2SPSS数据文件的建立,2.2.4从其他数据文件导入数据建立数据文件(2)数据库查询方式如果数据为数据库格式的文件,可以同用数据库查询的方式导入数据到SPSS中。其操作步骤如下:第1步选择菜单“文件打开数据库新建查询”,弹出数据库向导窗口。这里显示了所有可以打开的数据源类型。第2步用户根据打开文件的向导选择要打开的文件类型并逐步打开文件。,2.2SPSS数据文件的建立,2.2.4从其他数据文件导入数据建立数据文件(3)从文本文件导入文本格式的数据文件是一种最通用格式的数据文件,SPSS提供了专门读取文本文件的功能。选择菜单“文件打开文本数据”,弹出“打开文件”对话框,选择要导入的文本文件名后会出现文本数据的向导,该向导是一个分为6步的打开向导,根据文本文件的格式和导入数据的需求进行每一步的设置即可。,主要内容,2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工,2.3SPSS数据文件的编辑,2.3.1数据文件的合并SPSS提供两种形式的合并:一是横向合并,从外部文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件中增加观测量到当前数据文件中。,+,+,横向合并,纵向合并,2.3SPSS数据文件的编辑,2.3.1数据文件的合并(1)横向合并,单击“浏览”按钮选择要合并的SPSS数据文件的文件名,从左边文本框中选择需合并的变量到此框中,2.3SPSS数据文件的编辑,2.3.1数据文件的合并(1)横向合并纵向合并数据文件的操作方法同横向合并的方法类似,操作不再赘述,但需注意以下几点:两个待合并的SPSS数据文件的内容合并起来应具有实际意义;两个数据文件的结构最好一致;不同数据文件中含义相同的变量最好用相同的变量名,数据类型要相同,2.3SPSS数据文件的编辑,2.3.2数据文件的拆分所谓的拆分并不是要把数据文件分成几个,而是根据实际情况,根据变量对数据进行分组,为以后的分组统计分析提供便利,2.3SPSS数据文件的编辑,2.3.2数据文件的拆分,选项1:不拆分,也用于取消原来的拆分;选项2、3:对数据拆分,并选择拆分的变量到“分组方式”框中。,数据拆分后排序的方式,2.3SPSS数据文件的编辑,2.3.2数据文件的拆分,说明:“分割文件”对话框中,“比较组”与“按组组织输出”的区别在于:前者将分组统计结果输出在同一张表格中,以便于不同组之间的比较;后者将分组统计结果分别输出在不同的表格中。通常选择第一种输出方式。若要取消数据拆分,只需选择“分析所有个案,不创建组”即可。对数据可以进行多重拆分,类似于数据的多重排序,多重拆分的次序决定于选择拆分变量的前后次序。,2.3SPSS数据文件的编辑,2.3.3数据的选取数据的选取即按条件选取观测量进行分析选择观测量的目的有时为了进行特定的分析,需要从所有的数据资料中选择一些数据进行统计分析。例如:有学生的成绩数据,如果只分析男同学的成绩,则要进行选择观测量为男性的数据。,2.3SPSS数据文件的编辑,2.3.3数据的选取,1)全部个案:所有的观测量都被选择,该选项可用于解除原来的观测量选择。,2)如果条件满足:表示按指定条件选择观测量,3)随机个案样本:对观测量进行随机抽样,即对数据编辑窗口中的所有个案进行随机筛选,包括两种方式的随机筛选,一是近似抽样(Approximately)即键入抽样比例后由系统随机抽取;二是精确抽样(Exactly)即要求从第几个观测量起抽取多少个。,4)基于时间或个案全距:顺序抽样,单击“范围”按钮可以定义从第几个观测量到第几个观测量。,5)使用筛选器变量:用指定的变量(只能为数字型变量)作过滤,即依据过滤变量的取值进行样本选取,变量值为非0或非系统缺失值的个案将被选中。这种方法通常用于排除包含系统缺失值的个案。,设置被选择个案的输出形式:1)生成一个名为filter_$的新变量,取值为0或1;2)选中的个案输出到新的数据文件中,2.3SPSS数据文件的编辑,2.3.3数据的加权所谓权重是指同一个观测量值在所有的观测量里出现的次数或频率。SPSS的观测量加权功能是在数据文件中选择一个变量,这个变量里的值是相应的观测量出现的次数,这个变量叫做权变量。SPSS中指定加权变量的本质是数据复制,例如表2-5是工人每天生产产品的数量,第一行数据表示当天生产产品数量为20各的工人有3个,将“工人数”作为加权变量后,实际是将数据转换成表2-6所示的数据进行分析。,表2-5,表2-6,2.3SPSS数据文件的编辑,2.3.3数据的加权,说明:一旦指定了加权变量,在以后的分析处理中加权是一直有效的,直到取消加权为止;只有数值型的变量才能作为加权变量。,主要内容,2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工,2.4SPSS数据加工,2.4.1变量的计算,输入新生成的变量的变量名,输入计算的式子,SPSS中提供的用于计算的函数,利用这些函数可以生成指定分布的随机数、生成给定参数的概率密度函数等。,2.4SPSS数据加工,2.4.2数据可视离散化SPSS提供的数据可视离散化功能可将连续的数值型数据按由小至大的顺序加以分组(测量值由最低分至最高分分组),从而可将等距或比率变量转换为间断变量,2.4.2数据可视离散化见书Page41例2-5,2.4SPSS数据加工,将需要划分组段的变量“评价结果”选择到此框中。,选择“转换可视离散化”,弹出右图所示的变量选择对话框,2.4SPSS数据加工,2.4.2数据可视离散化见书Page41例2-5,输入存储组段值的新变量的名称,单击此按钮设置组段分割点,2.4.2数据可视离散化,(1)按照变量值等间距划分:在“第一个分割点的位置”输入第一个断点处的取值在“宽度”栏内输入一个组段内变量值的长度,“分割点数量”栏内自动出现断点的数目,2.4SPSS数据加工,图中提供了三种自动划分组段的方法,(2)按相等比例的观测值数目进行分组:在“分隔点数量”栏内输入断点的数目,系统自动将每组观测值数目的比例输出到“宽度”内,(3)基于变量的均值和标准差来产生组段划分,2.4SPSS数据加工,2.4.2数据可视离散化划分组段后的结果,2.4SPSS数据加工,2.4.2数据重新编码数据的重新编码是将变量重新赋值,即将数据文件中的原变量的值按照某种一一对应的关系生成新变量值,可以用这个新变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论