统计数据的收集与预处理_第1页
统计数据的收集与预处理_第2页
统计数据的收集与预处理_第3页
统计数据的收集与预处理_第4页
统计数据的收集与预处理_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据的收集与预处理精选课件主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工精选课件2.1统计数据的收集2.1.1问卷设计1.问卷的构成〔1〕标题〔2〕导语〔前言〕〔3〕正文〔4〕结束语精选课件2.1统计数据的收集2.1.1问卷设计2.问卷的问题类型〔1〕封闭型问题〔是否式、选择式、评判式〕〔2〕开放型问题精选课件2.1统计数据的收集2.1.1问卷设计3.问卷中量表的主要类型〔1〕连续评分量表〔2〕分项评分量表〔Likert量表〕〔3〕排序量表精选课件2.1统计数据的收集2.1.1问卷设计4.问卷设计的本卷须知〔1〕目的明确〔2〕先易后难,先简后繁〔3〕提出的问题要具体,防止提一般性问题〔4〕单项选择问题的备选答案应完整划分答案空间〔5〕多项选择题的备选答案必须分布在两个以上的维度上,并且至少有一局部不是互相排斥的〔6〕问题的陈述及备选答案不能有多重含义〔7〕问题设计的用语要含义明确,不能让应答者产生不同的理解〔8〕在问题的陈述中,要对所询问行为的时间、方式、目的做必要的限定精选课件2.1统计数据的收集2.1.1问卷设计4.问卷设计的本卷须知〔9〕对于得不到老实答复而又必须了解的数据,可以通过变换问题的提法来获得相应的数据,或者通过了解相对数据来判断总体的情况〔10〕问卷不能太长,以20~30分钟为宜;商场拦截类的问卷,以3~5分钟为宜精选课件2.1.2问卷分析信度分析效度分析2.1统计数据的收集精选课件主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工精选课件2.2SPSS数据文件的建立2.2.1统计数据的度量尺度名义尺度〔Norminal〕即定类尺度,它仅仅是一种标志,用于区分变量的不同值,类别数据之间没有次序关系。例如,人口的性别、商品的名称、身份证、商店类型等。定序尺度〔Ordinal〕是对事物之间等级或顺序差异的一种测度。例如,考试成绩〔优、良、中、差〕、人的身高等级〔高、中、矮〕、学历等级〔博士、硕士、学士〕等。间隔尺度〔Scale〕定距尺度〔Interval〕,是对事物类别或次序之间间距的测度。例如,100分制考试的成绩、重量、温度等。定比尺度〔Ratio〕,是指能够测度值之间比值的一种计量尺度。例如,员工的月收入、企业产值等。精选课件2.2SPSS数据文件的建立统计数据的度量尺度说明:不同的度量尺度的统计数据在SPSS的数据文件中,对应不同的变量数据类型。名义尺度数值型、字符型定序尺度数值型、字符型间隔尺度数值型精选课件2.2SPSS数据文件的建立2.2.2、SPSS数据文件的特点

人员编号性别部门体检日期体重健康状况1女通信学院08/10/200455好2女计算机学院08/10/200446好3女外语学院08/10/200450一般4男通信学院08/10/200456差5男管理学院08/11/200451差6男光电学院08/11/200453好7女光电学院08/11/200450一般8男通信学院08/12/200450好9女计算机学院08/12/200445一般10男管理学院08/13/200456好样本

变量变量值个案精选课件2.2SPSS数据文件的建立2.2.3输入数据建立数据文件SPSS数据文件的建立包括两个方面,首先进行数据的结构定义,其次录入数据。〔1〕数据的结构定义结构定义包括:名称、类型、宽度、小数、标签、值、缺失值、列、对齐、度量标准、角色精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义名称命名规那么:高版本的SPSS的变量名长度可多达64位,但是由于老版本的SPSS变量名长度应在8位之内,为了防止与低版本及其他软件出现兼容问题,高版本变量名一般仍控制在8位之内且尽量防止中文,必要的中文说明可以放在Label栏中加以说明。首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。变量名必须唯一且不区分大小写字母。允许汉字作为变量名,汉字总数一般不超过4个。变量名不能与SPSS的保存字相同。SPSS的保存字包括:all、by、eq、ge、gt、leIt、ne、not、or、to、with。系统不区分变量名的大小写。精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义变量类型精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义变量类型具体说明如下表所示:精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义变量宽度设置变量宽度。一般无需调整,直接采取默认值。它的大小可通过Width栏后边的微调按钮调整小数位数假设变量类型为数值型,那么可设置变量的小数位数,其他类型的变量那么不能设置。小数位数默认为两位变量名标签考虑到与低版本的兼容问题,变量名最好限制为8位以内,并且尽量防止中文,这就有可能不能完全描述清楚变量的信息,此时就可在标签中对变量名做进一步的说明。利用Label栏,不仅可以对变量详细说明,而且还可以采用中文,大大方便了用户对变量的理解。精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义变量值标签(Values)变量值标签是对变量的可能取值附加的进一步说明,标签内容最多可以有120个字符,通常仅对类型或分类变量的取值指定值标签例如,将变量Departmt定义为数值型变量时,可以按照下表中规定的值和值标签,具体定义方法见以下图。变量值变量值标签1通信学院2计算机学院3管理学院4光电学院5外语学院精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。列宽定义变量在数据窗口中显示的宽度。对齐定义变量值显示的对齐方式,默认对齐方式为数值变量在右边,字符串变量在左边,此设置只影响数据编辑器中的显示。度量标准根据统计数据的类型定义度量尺度,度量尺度在数据分析中的作用不是很明显,但是如果用户要进行交互式绘图就必须定义好度量尺度。精选课件2.2SPSS数据文件的建立〔1〕数据的结构定义缺失值SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。角色输入:变量将用作输入〔例如预测变量、自变量〕。目标:变量将用作输出或目标〔例如因变量〕。两者:变量将同时用作输入和输出。无:变量没有角色分配。分区:变量用于将数据划分为单独的训练、检验和验证样本。拆分:设定此角色是为与SPSSModeler相互兼容,具有此角色的变量不会在SPSSStatistics中用作拆分文件变量。精选课件2.2SPSS数据文件的建立〔2〕数据的录入录入数据的一般方法逐行录入从Word或Excel中直接复制粘贴到数据文件中连续粘贴相同值录入带有变量值标签的数据输入定义了变量值标签的数据时,可以直接输入变量值,也可以通过下拉列框的形式输入,如图,从中选择值标签即可。精选课件2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件〔1〕直接翻开选择菜单“文件→翻开→数据〞,弹出“翻开文件〞对话框左键单击“文件类型〞,即可看到SPSS所能翻开的数据文件类型,如下表所示精选课件2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件〔1〕直接翻开说明:其中用的最多的是直接翻开Excel的数据文件。在翻开Excel格式的文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口中,但也可指定仅读取工作表某个区域内的数据。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息,那么应选择翻开对话框上的复选框“从第一行数据中读取变量名〞,即以工作表第一行或指定读取区域内的第一行上的文字信息作为SPSS的变量名;如果不选此项,SPSS的变量名将自动取名为V1、V2等。精选课件2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件〔2〕数据库查询方式如果数据为数据库格式的文件,可以同用数据库查询的方式导入数据到SPSS中。其操作步骤如下:第1步选择菜单“文件→翻开数据库→新建查询〞,弹出数据库向导窗口。这里显示了所有可以翻开的数据源类型。第2步用户根据翻开文件的向导选择要翻开的文件类型并逐步翻开文件。精选课件2.2SPSS数据文件的建立2.2.4从其他数据文件导入数据建立数据文件〔3〕从文本文件导入文本格式的数据文件是一种最通用格式的数据文件,SPSS提供了专门读取文本文件的功能。选择菜单“文件→翻开文本数据…〞,弹出“翻开文件〞对话框,选择要导入的文本文件名后会出现文本数据的向导,该向导是一个分为6步的翻开向导,根据文本文件的格式和导入数据的需求进行每一步的设置即可。精选课件主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工精选课件2.3SPSS数据文件的编辑2.3.1数据文件的合并SPSS提供两种形式的合并:一是横向合并,从外部文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件中增加观测量到当前数据文件中。横向合并V1V2+V3V4V1V2V3V4纵向合并V1V2+V1V2V1V2精选课件2.3SPSS数据文件的编辑2.3.1数据文件的合并〔1〕横向合并单击“浏览〞按钮选择要合并的SPSS数据文件的文件名从左边文本框中选择需合并的变量到此框中精选课件2.3SPSS数据文件的编辑2.3.1数据文件的合并〔1〕横向合并纵向合并数据文件的操作方法同横向合并的方法类似,操作不再赘述,但需注意以下几点:两个待合并的SPSS数据文件的内容合并起来应具有实际意义;两个数据文件的结构最好一致;不同数据文件中含义相同的变量最好用相同的变量名,数据类型要相同精选课件2.3SPSS数据文件的编辑2.3.2数据文件的拆分SPSS23版本在“数据〞菜单中提供了两种方法:一是“拆分文件…〞,这种拆分并不是要把一个数据文件分成几个数据文件,而是按照需求,根据变量对数据进行分组,为以后的分组统计分析提供便利;二是“拆分为文件〞,这种拆分是将拆分后的数据写入新的SAV文件,按拆分变量的值或值标签生成多个SAV文件。精选课件2.3SPSS数据文件的编辑2.3.2数据文件的拆分

1.拆分文件在进行数据分析的时候,有时需要对数据文件按某个变量进行拆分,这种拆分并不是要把数据文件分成几个,而是根据实际情况,根据变量对数据进行分组,为以后的分组统计分析提供便利。第一步数据组织第二步翻开主对话框第三步选择拆分方式第四步按产品分组统计销售总量和销售总额精选课件2.3SPSS数据文件的编辑2.3.2数据文件的拆分

2.拆分为文件拆分为文件是将数据文件按拆分变量的值或值标签,拆分为多个数据文件。第一步数据组织第二步翻开“将数据集拆分为单独的文件〞对话框第三步拆分文件生成设置精选课件2.3SPSS数据文件的编辑2.3.3数据的选取数据的选取即按条件选取观测量进行分析选择观测量的目的有时为了进行特定的分析,需要从所有的数据资料中选择一些数据进行统计分析。例如:有学生的成绩数据,如果只分析男同学的成绩,那么要进行选择观测量为男性的数据。精选课件2.3SPSS数据文件的编辑2.3.3数据的选取第一步数据组织第二步翻开“选择观测量〞对话框第三步指定选择个案的方式第四步设置选中个案的输出形式第五步设置选择个案的条件精选课件2.3SPSS数据文件的编辑2.3.3数据的加权

所谓权重是指同一个观测量值在所有的观测量里出现的次数或频率。SPSS的观测量加权功能是在数据文件中选择一个变量,这个变量里的值是相应的观测量出现的次数,这个变量叫做权变量。

SPSS中指定加权变量的本质是数据复制,例如表2-5是工人每天生产产品的数量,第一行数据表示当天生产产品数量为20的工人有3个,将“工人数〞作为加权变量后,实际是将数据转换成表2-6所示的数据进行分析。表2-5产品数量工人数203产品数量202020表2-6精选课件2.3SPSS数据文件的编辑2.3.3数据的加权

说明:一旦指定了加权变量,在以后的分析处理中加权是一直有效的,直到取消加权为止;只有数值型的变量才能作为加权变量。精选课件主要内容2.1统计数据的收集2.2SPSS数据文件的建立2.3SPSS数据文件的编辑2.4SPSS数据加工精选课件2.4.1变量的计算2.4SPSS数据加工输入新生成的变量的变量名输入计算的式子SPSS中提供的用于计算的函数,利用这些函数可以生成指定分布的随机数、生成给定参数的概率密度函数等。精选课件2.4SPSS数据加工2.4.2数据可视分箱SPSS提供的数据可视分箱功能可将连续的数值型数据按由小至大的顺序加以分组〔测量值由最低分至最高分分组〕,从而可将等距或比率变量转换为间断变量精选课件2.4SPSS数据加工2.4.2数据可视分箱

见书Page38例2-5

选择“转换→可视分箱〞,弹出右图所示的变量选择对话框将需要划分组段的变量“评价结果〞选择到此框中。精选课件2.4SPSS数据加工2.4.2数据可视分箱

见书Page38例2-5

单击此按钮设置组段分割点输入存储组段值的新变量的名称精选课件2.4SPSS数据加工2.4.2数据可视分箱

图中提供

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论