




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
管理统计分析工具SPSS简介,SPSS(statistical package for the social science,社会科学统计分析软件包)是由美国SPSS公司自80年代初开发的大型统计学软件包。 90年代以来,由于MS Windows的普及,SPSS公司于1992、1993、1994年相继推出了Windows操作系统的5.0、6.0及6.1版本,随着Windows95与WindowsNT3.5以上版本的32位操作系统的出现,SPSS公司又相继推出SPSS for Windows的7.016.0,目前最新版本为16.0,但还不是十分成熟。其实自11.0后,各版本的功能相差不大,新版本只是在一些细节方面略有改进。 本课程SPSS13.0为蓝本,介绍如何利用SPSS实现统计方法在管理学中的应用。,(一)SPSS运行界面,启动SPSS SPSS的主窗口:标准的微软窗口形式(Windows风格),包括 标题栏 菜单栏 工具栏 工作区 状态栏,SPSS统计分析均可通过:菜单、对话框实现,2019/6/15,(二)系统运行方式,完全窗口菜单运行管理方式 简单 我们使用此方法 程序运行管理方式 在语句窗口(Syntax) 中直接编写程序后运行 可重复运行 保留以前DOS的方式,显示兼容性 混合运行管理方式(以上两种方法的结合) 在菜单中选择Paste到语句窗口生成程序Run 实际中运用最多,可以看其语句是如何写的,就像现在的Access,可以看其SQL语句,2019/6/15,(三)窗口及其功能,数据编辑窗口Data Editor,用于编辑数据文件 。 输出窗口-Output,用于显示SPSS处理结果或错误信息。 语句窗口-Syntax,用于显示和编辑SPSS程序,以便运行。 统计图形编辑窗口-Chart,用于对图形的编辑、修改和打印。 帮助窗口-Help,用于显示帮助信息。,整个数据分析大致可分为四步: 第一步,数据文件的建立-编辑-整理 可以是用New建立新文件, 也可以是用Open打开已经建立的数据文件; 为满足分析需要而进行的数据预处理有:变换,增删,修改,文件合并,编码等等的操作; 通常需要对变量进行定义与有关描述。 第二步,选择统计分析方法 可以通过菜单提示逐级选择操作,(在Analyze中选择合适的统计分析方法,或者在Graphic中选择制作图形方法),也可以通过编写程序的方法进行操作(将要处理的命令在Syntax窗口中用程序的方式编写保存,运行该程序即可,无需要进行菜单的选择,但这要求对程序命令非常熟悉),第三步,选择分析变量、设置有关的分析参数 (在打开的各级菜单对话框中进行设置) 第四步,查看、解释输出的计算结果 (在SPSS Viewer的Output窗口中看结果,可以复制到文字编辑软件如Word中进行编辑处理),数据文件的建立 数据编辑、整理与转换 信度和效度检验 多选题的处理,第二讲 数据文件的建立与预处理,SPSS的数据文件是一种有结构的数据文件,由数据结构和数据内容两部分组成,其中结构部分用于定义数据类型、宽度、取值说明、默认值等,而内容才是我们具体要分析的数据。因此SPSS中建立数据文件时应完成两项工作:(1)定义数据文件结构;(2)录入SPSS原始数据。 类似于Foxpro中数据表的建立。,在数据编辑窗口可以显示两张表(如同EXCEL中的工作表,单击标签切换),分别是数据窗口Data View和变量窗口Variable View,通过点击左下端的2个同名窗口切换标签按钮实现相互切换。 数据窗口Data View: 数据编辑区是SPSS的主要操作窗口,是一个二维平面表格,用于对数据进行各种编辑;,一、数据文件的建立,17,窗口类型介绍,数据编辑窗口,变量编辑窗口,在Variable View表中,类同于在VFP中定义一个数据表结构,定义各个字段。 SPSS 中的变量有十个属性: 变量名(Name) 变量类型(Type) 变量长度(Width) 小数点的位数(Decimals) 变量名标签(Label) 变量值标签(Values) 缺失 值(Missing) 列的显示宽度(Columns) 对齐方式(Align) 测量层次(Measure)。 要定义一个变量时,至少要定义变量名和变量类型。,变量定义选项:,变量名,类型,数据位,小数位,标签,数值标签,缺失值,数据量度,变量定义编辑窗口,栏宽,对齐方式,1.变量的命名 SPSS 中的变量名由不多于 8 个英文字符组成,或者四个汉字(用汉字名,有时兼容性出问题),尽量见名识义。 变量名的首字符必须是字母或汉字,后面的则可以是字符或数字。 不能包含下列符号:“?”、“!”和“*”。不 能以下划线“-”和园点“.”作变量名的最后一个字符。 变量名不能与 SPSS 的保留字相同。 SPSS 的保留字有 ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、OT、WITH。 系统不区分变量名的大写和小写,如abc 和 ABC 被视为同一变量名。 同一个数据文件中,不能有两个同名的变量。,2.变量类型与默认长度 一般情况下,SPSS 中的变量有三种类型:数值型、字符型、日期型。 (类型很关键,选择了什么类型,就决定了能够进行什么运算。) 在数据窗口中单击 Variables View 按钮,进入变量编辑窗口,单击 Type 列中某个变量所在的单元格,再单击此格中的设置按钮, 进入 Variables Type(变量类型设置)对话框:,数值(默认),逗号,点,科学记数,日期时间,货币,自定义数据类型,字符串型,3.变量标签与变量值的标签 1)变量标签 Variable labels 变量标签是对变量名附加的解释说明,增加结果数据的可读性。 由于变量名不能超过八个字符,有时不能清楚地表达变量的含义,这时要靠变量标签来对变量名加以解释。如果变量名有标签,系统在输出时以标签代替变量名输出。,2)变量值标签 Value labels 是对变量的具体数值所代表的意义的标注。 大多数变量值都是以符号或数字来表示的。但对于定类变量和定序变量,用数字或符号不能够很明确地表现出变量值的意义时,可以用变量值标签来说明它们所代表的实际意义。 如:性别、民族、政治面貌、学历等,在数据库中往往不直接用男女、汉族、共青团员、大学本科等表示,而是用数字或者字母代码表示。节约存贮空间、节省录入时间等。统计数据的代码化是很有效的一种处理手段。,Nominal :定名(类)尺度,是对事物的类别或者属性的一种度量,按照事物的某种属性对其进行分类或分组,表示事物之间的区别。此类变量中的“数字”不具有数值意义,不反映事物本身的数量状况,所以不能进行加减乘除和比较大小的运算,如:性别,若用“1”表示男性,“2”表示女性,这里的1、2只是表明类别的不同,是一种分类符号,没有级别的高低之分。 相应变量为定类变量。 当输入的是数字时,系统默认的是 Scale,当输入的是字符串时,系统默认的是 Nominal。,4.变量的层次(度量类型)measure 变量的层次有三种:,Ordinal :定序尺度。 对事物之间等级或者顺序差别的一种度量,可以比较优劣或者排序(主要标志);具有某种逻辑顺序,具有高低、大小、强弱的差异;只表明等级顺序,并不反映等级之间的具体差异量。 相应变量为定序变量。 例如,药物疗效这一属性常可分为治愈、有效、无效和恶化四个等级鲜明的级别,分别用1、2、3、4表示,又如表示学历,1、2、3、4、分别表示小学、初中、高中、大专、本科等。比赛的冠亚季军等。 成绩的优良中差等,变量的取值并不反映该个体的确切定量值,只反映类别的等级或秩次(rank)。,Scale :尺度数据。 能够反映事物数量方面的差异,不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少 ,结果表现为数值。如可以是身高、体重、血压等连续型的数据,也可以是年龄、次数等离散型数据,还可以是表示时间或者货币的数据,但不能是字符型数据。 相应的变量数据为:定距数据、定比数据。,定距数据:对事物类别或次序之间间距的测度所形成的数据。 例3: 摄氏温度对不同地区温度的测量。 问: 20的乙地和10 的丙地相比,前者暖和1倍吗? 特点: 1、可准确指出类别之间的差距是多少; 3、计量结果可以进行加减运算; 4、“0”是测量尺度上的一个测量点,并不代表“没有”。,定比数据(比率尺度):是能够测算两个测度值之间比值的数据。 例4:职工月收入、企业产值、企业销售收入3亿元,人的身高176厘米、体重65公斤,某地区的人均国内生产总值25000元/人等,都是定比数据。 特点: 1、 “0”表示“没有”,即它有一固定的绝对“零点”,因此它可进行加、减、乘、除运算。,4、案例:名册表的数据文件 零售商调查问卷录入表,如何建立SPSS数据文件?,1、数据编辑 插入操作:插入新变量(在数据界面或变量界面) 插入新个案(指定位置或末尾追加) 删除操作:删除变量(列)、个案(行)、数值 选择相应行列或格(涂黑后) -若Edit-Clear(或del) 表示永久性删除(不可恢复) -若Edit-Cut 表示临时性删除(可撤消或用粘贴, 后者达到复制的效果),二、SPSS数据编辑、整理与转换,修改操作(修改数据或修改变量定义) 复制操作(C-V) Copy-paste 移动操作(X-V) cut-paste 快速定位个案 以上编辑操作均可由鼠标右键或Edit菜单进行。 2、数据文件整理 数据文件输出:存储(save)、更名存储(Save as) 打印输出(Print)、文件与变量信息报告utilities 数据文件读入:文本文件(File-Read text data)、 EXCEL文件(file-open)、数据库文件(Databasenew query)。 以上均按提示操作,且也可直接“复制粘贴”方式实现。 结果略有区别。,案例:打开文本文件、Excel文件。,案例:另存为Excel文件。,数据文件整理(DATA的功能) 样品排序(sort case)城乡数据 行列转置(作图需要)(transpose) 文件合并(merge file)-试卷数据P96 文件拆分(Split file) 分组综合(Aggregate)职工数据 加权(weights)(抽样中样本单位的权数含义) 选择个案(select case) 案例城乡人口数量及比重、 试卷数据 职工数据,3、数据变换 以上是对文件进行的操作,实际数据处理时,需要对变量进行各种预处理。主要有: 计算(compute)城乡数据 重编码(建立新变量/覆盖旧变量)职工数据 计数职工数据 排秩城乡数据 自定义重编码 生成时间序列 替换缺失值 案例城乡人口数量及比重、职工数据,三、问卷的信度和效度检验 在进行问卷调查,涉及到大量的态度测量。为了保证问卷具有较高的可靠性和有效性,往往对问卷调查结果进行信度和效度分析,方法包括逻辑分析和统计分析。 (一)信度(Reliability):即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。主要包括重测信度、复本信度、折半信度、 系数信度四类。 (二)效度(Validity):即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型:内容效度、准则效度和结构效度。效度分析有多种方法,其测量结果反映效度的不同方面。常用方法主要有单项与总和相关效度分析 、准则效度分析、结构效度分析几种。,1.信度分析 重测信度(Test-Retest Reliability)相关分析 用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。【Analyze】【Correlate】【Bivariate】 复本信度(Alternate-form Reliability)相关分析 让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。实际调查中很难使调查问卷达到这种要求,应用较少 。 折半信度(Split-half Reliability)- Reliability Analysis 将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。按Analyze】【Scale】【Reliability Analysis】将左边方格内的变项依所需次序分前后半选入右边items的方格内,在左下角的Model框中选取Split-half 内部一致性(Internal Consistency Coefficient)-计算系数 系数评价的是量表中各题项得分间的一致性,属于内在一致性系数,是最常用的信度系数。按【Analyze】【Scale】【Reliability Analysis】将左边方格内的变项全选入右边items的方格内,在左下角的Model框中选取Alpha 。 案例:信度分析的SPSS上机操作、心理测试的信度分析、大学生心理,2.效度分析 单项和总和相关效度分析相关分析 测量问卷的内容效度,是指所选题项能否代表所要测量的内容或主题。方法:计算每个项目的分数和总和的相关系数,如果相关系数低,说明该问题的鉴别力低。 准则效度分析-相关分析 根据某种已经得到肯定的理论,选择一个与问题直接有关系的独立标准,把它看成自变量,然后分析问题所测特性与该自变量的相关性,显著相关的问题被认为是有效的问题。 结构效度分析(construct Validity)因子分析 研究者在设计问卷时实际上往往假设有某种结构存在,通过因子分析可以考察设计的问题是否能测量出真正的结构。 案例:结合具体的问题进行相关分析和因子分析、大学生心理数据,四、多选变量的概念与分类,多选变量的概念:在当前社会实践活动中,大量存在这样的变量,对于一个确定的观测对象,该变量有几个值与之对应。 如当问到你喜欢什么颜色时,你可能喜欢红色,也喜欢蓝色和绿色。如果让你按喜欢程度排一下顺序,你的回答可能是:红色第一,蓝色第二,绿色第三。这就构成了对一个问题(变量)的多个选择。这种问题称作多项选择题。目前,市场研究或许多领域对某事物评价的研究中常常遇到这样的问题。 可以选多个,分为限选和不限选: 限选:如在11种工作种类中,选你最喜欢的,最多可选4种(Var1-Var4);求所有人最喜欢哪种(哪种被选的频率最高)?(4个分类变量) 不限选:如在所列的20种电器中,你家所拥有的电器,不限选(Var1-Var20),求哪种电器最普遍?(20个二分变量),四、多选变量的概念与分类(续),多选变量的分类与代码:多选变量的分类取决于对问题的设计和对数据的整理及其数据文件的建立。 多选二分变量集及其编码(多选二分法):多选二分变量集是由若干个二分变量组成的变量集。这些二分变量反映了一个问题的多个可能的答案。如对下面问题有9个可能的答案,每个可选择的答案由一个变量表示,每个变量的值只能有表明“是”和“否”的两个代码。,左边的表格为向顾客发放的颜色调查,在选择服装时,您喜欢什么颜色作为主体颜色,在答案的“”中打“” (可多选) 这是一组问题,每个问题均有两个答案,回答者只能选择其中一种。在建立数据文件时,变量名使用相同的变量主名,后面加以不同序号组成,本组问题的9个变量名是color1-color9。而答案的编码规则为:回答“是”变量值为1,回答“否”变量值为0,其他值为缺失值。,四、多选变量的概念与分类(续),多选变量的分类与代码:多选变量的分类取决于对问题的设计和对数据的整理及其数据文件的建立。 多选分类变量集及其编码(多选分类法):多选分类变量集是由若干个分类变量组成的变量集。每个分类变量都有两个以上的值作为回答者的答案的代码。如上面有关选择服装的主体颜色,您可以选择最喜欢的三种,在提供的10种答案前中的中填写喜欢的顺序号(最喜欢的为,其次为、)。 红 橙 黄 绿 青 蓝 紫 黑 白 说不清 这是一个问题,每个问题可以有三个答案。在建立数据文件时,要建立三个变量color1-color3表示回答者按喜欢程度选择的三个颜色。而答案的编码规则为:按填写的顺序值编码,如A表示选择红色,I表示选择白色,J表示说不清。如选择结果为黑、红、蓝,则变量color1的值为H,变量color2的值为A,变量color3的值为F。当然也可以使用数字编码。,四、多选变量的概念与分类(续),解决多选问题的SPSS过程: 首先将每个题的若干答案组成一个综合变量即变量集(Set),然后对综合变量的各种取值进行分析。 多选问题的分析在SPSS中是通过Analyze + Multiple Response中的各项功能实现的。 Define Sets -建立多选二分变量或多选分类变量集(用一个变量代表多个变量),并应用于频数表和交叉表。 Frequencies:对多选变量集进行频数分布分析 Crosstabs:对多选变量集与其他变量集或与原基本变量进行交叉表分析。,例子:Q1 你经常使用的搜索引擎是哪几个? A百度 B Google C雅虎 D其他,假设有5个被访者,分别选择了 1.A ;2.A、B;3.A、B、C;4.B、C、D ;5.A、D,一、数据录入 有两种录入法,分别是二分法和分类法。,1 二分法,数据结构如下,二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。选项选中为1,不选中为0(也可以自己定义)。,2 分类法,数据结构如下,分类法的话,就是把选项序号依次输入到SPSS里面就可以了。变量个数等于同时选中的选项个数的最大值。,二、多选题定义 SPSS中处理多选题,其实有两个模块。 一个是在菜单 Analyze - Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。 另一个就是在 Data - Define Multiple Respones Sets 中(也可以在 Analyze - Tables - Multiple Respones Sets 中打开,其实是一样的。,1 二分法: 1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 “
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京市北科发展科技有限公司招聘4人备考考试题库附答案解析
- 2025江苏泰州市泰兴市人民医院社会化规范化培训(第3批)招录4人备考考试题库附答案解析
- 2025山东枣庄山亭区凫城镇公共服务类乡村公益性岗位招聘2人备考练习试题及答案解析
- 2025青海海南同德县教育局招聘临聘教师6人备考考试题库附答案解析
- 2025江西吉安市人才发展集团有限公司招聘劳务外包人员1人备考考试题库附答案解析
- 2025河南省驻马店市树人高级中学招聘教师3人备考考试题库附答案解析
- 2025秋季河北邯郸市中心医院博硕人才引进55人备考考试题库附答案解析
- 2026中国工商银行广东省分行秋季校园招聘1300人备考考试题库附答案解析
- 2025年河北保定博野县中医医院招聘工作人员13人备考考试题库附答案解析
- 工厂安全培训教育课件
- “一网统管”在城市治理协同中的障碍与解决路径研究
- 2025至2030中国电线电缆行业十四五发展分析及投资前景与战略规划报告
- 运输承运商管理制度
- 2025至2030全球与中国氘代化合物行业市场发展现状及竞争格局与前景预测报告
- 安全二级培训试题及答案
- 婚后老公赌博协议书
- 拆迁商铺置换协议书
- 《当代建筑设计理念》课件
- 航空质量意识培训
- 空白个人简历表格模板
- 中国低空经济城市发展指数(LCDI) 2025(发布版)
评论
0/150
提交评论