SPSS统计数据的收集与预处理.ppt_第1页
SPSS统计数据的收集与预处理.ppt_第2页
SPSS统计数据的收集与预处理.ppt_第3页
SPSS统计数据的收集与预处理.ppt_第4页
SPSS统计数据的收集与预处理.ppt_第5页
免费预览已结束,剩余76页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章,统计数据的收集和预处理,主要内容,2.1统计数据的收集,2.2SPSS数据文件的建立,2.2SPSS数据文件的编辑,2.2SPSS数据处理,2.1.1问卷设计1。问卷的构成(1)标题(2)引言(3)正文(4)结论,2.1统计数据的收集,2.1.1问卷设计2。问卷的问题类型(1)封闭式问题(2)开放式问题,2.1统计数据收集,2.1.1问卷设计3。主要问卷类型(1)连续评定量表(2)部分评定量表(李克特量表)(3)等级量表,2.1统计数据收集,2.1.1问卷设计4。问卷设计中的注意事项(1)明确的目的(2)先简单后困难,先简单后复杂(3)要问的具体问题,避免一般性问题(4)单选项问题的备选答案应完全划分到答案空间(5)多选项问题的备选答案必须分布在两个以上的维度。并且至少一些陈述和问题的替代答案不是相互排斥的(6)它们不能有多重含义(7)在问题设计中使用的术语应该有明确的含义,并且应答者不能有不同的理解(8)在问题的陈述中,询问行为的时间、方式和目的应该被定义为必要的,2.1统计数据的收集,2.1.1问卷设计4。问卷设计中的注意事项(9)对于不能如实回答但必须理解的数据,可以通过改变问题的提法获得相应的数据,或者通过理解相关数据来判断整体情况(10)问卷不宜过长,20-30分钟为宜;店铺截取问卷需要3-5分钟,2.1统计数据的收集,2.1.2问卷分析的信度分析和效度分析,2.1统计数据的收集,主要内容,2.1统计数据的收集,2.2SPSS数据文件的建立,2.2SPSS数据文件的编制,2.2SPSS数据的处理,2.2 SPSS数据文件的建立,2.2.1统计数据的标准尺度,即固定尺度,这只是区分变量不同值的一个标志, 类别数据之间没有区别,例如,人口的性别、商品的名称、身份证、商店的类型等。 序数是衡量事物之间等级或顺序差异的尺度。例如,考试成绩(优、良、中、差)、人的身高等级(高、中、低)、教育水平(博士、硕士、学士)等。间隔是对事物类别或顺序之间距离的度量。例如,100分检查的结果、重量、温度等。固定比率(Ratio),指可以测量值之间比率的测量尺度。例如,员工的月收入、企业产值等。2.2 SPSS数据文件的建立和统计数据的测量尺度表明,不同测量尺度的统计数据对应于SPSS数据文件中不同的变量数据类型。标称尺度-数值型、字符型排序尺度-数值型、字符型区间尺度-数值型,建立2.2 PSS数据文件,2 . 2 . 2 SPSS数据文件的特征、变量、案例、样本、变量值,建立2.2 PSS数据文件,建立2.2.3输入数据建立数据文件SPSS数据文件包括两个方面,首先定义数据的结构,然后输入数据。(1)数据结构定义结构定义包括:名称、类型、宽度、小数、标签、值、缺失值、列、对齐、测量标准、作用,2.2建立SPSS数据文件,(1)数据结构定义名称命名规则:高版本SPSS的变量名长度可达64位,但由于老版本SPSS的变量名长度应在8位以内, 为了避免与旧版本和其他软件的兼容性问题,变量名一般控制在8位以内,尽量避免中文,必要的中文解释可以放在标签栏中。 第一个字符应该以英文字母开头,后面可以跟except!“*”以外的字母或数字。下划线和点不能是变量名的最后一个字符。变量名必须是唯一的,不能区分大小写。允许使用汉字作为变量名,汉字总数一般不超过4个。变量名不能与SPSS的保留字相同。SPSS的保留词包括,2.2 PSS数据文件建立,(1)数据结构定义变量类型,2.2 PSS数据文件建立,(1)数据结构定义变量类型具体描述如下表所示:2.2 PSS数据文件建立,(1)数据结构定义变量宽度设置变量宽度。通常不需要调整,直接采用默认值。它的大小可以通过“宽度”列后面的微调按钮进行调整。如果变量类型是数字,则可以设置变量的十进制数,而其他类型的变量则不能。十进制数字默认为两个变量名标签。考虑到与旧版本的兼容性,变量名应限制在8位以内,尽可能避免使用中文,因为中文可能不能完全描述变量的信息。在这种情况下,可以在标签中进一步解释变量名。标签栏的使用不仅可以详细解释变量,还可以使用中文,极大地方便了用户对变量的理解。2.2SPSS数据文件的建立,(1)数据结构定义变量值标签(Values)变量值标签是对变量可能值的进一步解释,标签内容最多可有120个字符,通常只指定值类型或分类变量的值标签。例如,将变量Departmt定义为数值变量时,可以遵循下表中指定的值和值标签。具体的定义方法如下图所示。2.2建立SPSS数据文件,(1)数据定义缺失值的结构SPSS统计软件的另一个特点是缺失数据可以通过制作缺失值来定义,以便其他有效数据可以更好的使用。列宽定义数据窗口中显示的变量的宽度。对齐定义变量值显示的对齐,默认为左对齐。指标根据统计数据的类型定义指标。度量在数据分析中的作用并不明显,但是如果用户想要制作交互式绘图,他们必须很好地定义度量。2.2建立SPSS数据文件,(1)数据定义缺失值的结构SPSS统计软件的另一个特点是缺失数据可以通过制作缺失值来定义,以便其他有效数据可以更好的使用。角色输入:变量将用作输入(如预测变量、自变量)。目标:变量将用作输出或目标(如因变量)。两者:变量将被用作输入和输出。无:变量没有角色分配。划分:变量用于将数据划分为单独的训练、检查和验证样本。拆分:此角色被设置为与SPSSModeler兼容。具有此角色的变量将不会用作SPSSStatistics中的拆分文件变量。2.2SPSS数据文件的建立,(2)数据录入的一般方法是从Word或Excel中逐行直接复制并粘贴到数据文件中连续粘贴同样的值到带有变量值标签的数据中(变量值标签可以使我们在输入数据时更加方便)当输入定义变量值标签的数据时,可以直接输入变量值或以下拉列框的形式输入,如图2.3所示。2.2建立SPSS数据文件,2.2.4从其他数据文件导入数据建立数据文件(1)直接打开选择菜单文件打开数据,弹出打开文件对话框,左键点击文件类型,可以看到SPSS可以打开的数据文件的类型。如下表所示,23,2.2建立SPSS数据文件,2.2.4从其他数据文件导入数据建立数据文件(1)直接打开,表示:最常用的是直接打开Excel数据文件。当以Excel格式打开文件时,默认情况下,SPSS会将Excel工作表中的所有数据读入SPSS数据编辑窗口,但它也可以指定只读取工作表中某个区域的数据。如果变量名信息存储在Excel工作表文件的第一行或指定读取区域的第一行,则应选择打开对话框中的“读取变量名称表单第一行数据”复选框,即工作表第一行或指定读取区域第一行的文本信息用作SPSS的变量名。如果未选择此项,SPSS的变量名将自动命名为V1、V2等。,2.2SPSS数据文件建立,2.2.4从其他数据文件导入数据建立数据文件(2)数据库查询方法如果数据是数据库格式文件,可以使用相同的数据库查询方法将数据导入SPSS。操作步骤如下:步骤1:选择菜单“文件打开数据库新建查询”打开数据库向导窗口。这里显示了所有可以打开的数据源类型。步骤2用户根据打开文件的向导选择要打开的文件类型,并逐步打开文件。2.2建立SPSS数据文件,2.2.4从其他数据文件导入数据建立数据文件(3)从文本文件导入文本格式数据文件是最常见的格式数据文件之一,SPSS提供了读取文本文件的特殊功能。选择菜单“文件打开文本数据.”,将弹出“打开文件”对话框。选择要导入的文本文件的名称后,将出现文本数据向导。该向导是一个6步打开向导,每个步骤可以根据文本文件的格式和导入数据的需要来设置。主要内容2.1统计数据的收集2.2建立SPSS数据文件2.3编辑SPSS数据文件2.4处理SPSS数据,2.3编辑SPSS数据文件,2.3.1合并数据文件SPSS提供两种合并形式:一是横向整合,将外部文件中的变量添加到当前数据文件中;第二种是垂直合并,即把外部数据文件中的观测数据添加到当前数据文件中。水平整合,垂直合并,编辑2.3 PSS数据文件,合并2.3.1数据文件(1)水平整合,点击“浏览”按钮选择要合并的SPSS数据文件的文件名,从左侧文本框选择要合并的变量,编辑2.3 PSS数据文件,2.3.1合并数据文件(1)水平整合中垂直合并数据文件的操作方法与水平整合相似。此处不再重复操作,但应注意以下几点:待合并的两个SPSS数据文件内容的合并应具有实际意义;两个数据文件的结构最好是一致的;不同数据文件中具有相同含义的变量最好使用相同的变量名和数据类型。2.3SPSS数据文件的编辑和2.3.2数据文件的拆分所谓数据文件的拆分并不意味着将数据文件拆分成几个,而是根据实际情况根据变量对数据进行分组,为以后的分组统计分析提供方便。编辑2.3SPSS数据文件,拆分2.3.2数据文件,选项1:不拆分,也用于取消原来的拆分;选项2和3:分割数据,并将分割变量选择到“分组方法”框中。数据拆分后排序、编辑SPSS数据文件2.3、拆分数据文件2.3.2的方法表明,在“拆分文件”对话框中,“比较组”和“按组组织输出”的区别在于:前者将分组统计结果输出到同一个表中,便于不同组之间的比较;后者分别在不同的表中输出分组统计结果。通常选择第一种输出模式。要取消数据拆分,只需选择“分析所有案例而不创建组”。数据可以分为多个部分,类似于数据的多重排序。多个部分的顺序取决于选择拆分变量前后的顺序。2.3、2.3SPSS数据文件编辑,2.3.3数据选择数据选择即根据观测测量的选择条件分析选择观测测量目的有时为了进行具体分析,需要从所有数据中选择一些数据进行统计分析。例如,有关于学生表现的数据。如果只分析男生的结果,那么男生的数据应该用选择视图来衡量。2.3编辑SPSS数据文件,2.3.3数据选择,以及1)所有情况:选择了所有观测测量,这可用于取消原始观测测量选择。(2)如果条件满足,则表示根据规定的条件选择观测;(3)随机病例样本:随机抽样观察,即在数据编辑窗口中随机筛选所有病例,包括两种方式的随机筛选;一种是近似抽样,即系统在输入抽样比例后进行随机抽样;第二个是精确采样,即从第一次观察中需要提取多少样本。4)基于时间或案例跨度:按顺序采样,单击“范围.”按钮定义要进行的观察次数。5)使用过滤变量:使用指定的变量(仅数字变量)进行过滤,即根据过滤变量的值选择样本。将选择变量值不是0或缺少值的情况。此方法通常用于排除包含缺失系统值的案例。设置所选案例的输出形式:1)生成一个名为filter_$的新变量,其值为0或1;2)选定的病例被输出到新的数据文件,2.3编辑SPSS数据文件,以及2.3.3数据加权。所谓的加权是指在所有观测测量中相同观测值出现的次数或频率。SPSS的观察加权函数是在数据文件中选择一个变量。该变量中的值是相应观察发生的次数。这个变量被称为权重变量。SPSS中规定的加权变量的本质是数据重复。例如,表2-5显示了工人每天生产的产品数量。第一行数据显示,当天有3名工人生产了20种产品。将“工人数量”作为加权变量后,数据实际上转换成表2-6所示的数据进行分析。表2-5、表2-6、2.3编辑SPSS数据文件和2.3.3数据加权:一旦指定了加权变量,加权将保持有效,直到在随后的分析和处理中取消加权。只有数值变量可以用作加权变量。主要内容2.1统计数据的收集2.2建立SPSS数据文件2.3编制SPSS数据文件2.4 PSS数据处理2.4 PSS数据处理2.4变量的计算2.4.1输入新生成变量的变量名,输入计算公式,在SPSS中提供函数进行计算,使用这些函数可以生成指定分布的随机数,给定参数的概率密度函数等。2.4SPSS数据处理,2.4.2数据的可视化离散化由SPSS提供的可视化离散化函数可将连续数值数据从小到大分组(测量值从最低到最高分组),从而将等距或比率变量转换为不连续变量。2.4.2数据的可视化离散化显示在第41页案例2-5,5,2.4SPSS数据处理中,在此框中选择要分组的变量“评估结果”。选择“转换可视化离散化”弹出右图所示的变量选择对话框,2.4SPSS数据处理,2.4.2可视化离散化参见第41页示例2-5,输入存储段值的新变量的名称,点击此按钮设置段分段点,2.4.2可视化数据离散化。(1)按变量值的等间距分割:在“第一分割点的位置”中输入第一个断点处的值,在“宽度”栏中输入组段中变量值的长度,“分割点的数量”栏中自动出现的断点数量,以及2.4秒的数据处理。该图提供了三种自动划分组段的方法、(2)按观察值的数量等比例分组:在“划分点数”栏中输入断点的数量。系统自动输出每组中观察值的数量与“宽度”的比例,(3)根据变量的平均值和标准偏差产生分段划分,2.4 PSS数据处理,2.4.2数据的可视化离散化和分段划分的结果,2.4 PSS数据处理,2.4.2数据记录是重新

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论