




已阅读5页,还剩116页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
环境科研数据的统计与分析SPSS软件的应用(DataProcessingandAnalysesofSPSS),授课老师:曹承进E-mail:cjcaoTel华东师范大学资环学院研究生专业课程,2012年10月15日,.,2,知识点回顾,.,3,SPSS系统参数的设置11个选项组:常规设置、显示输出设置、数据变量设置、货币变量设置、脚本参数设置、标签输出设置、图形设置、文件位置设置、枢轴表参数设置、多重归因设置和语法编辑器设置,常规参数的设置很重要。启动:编辑(Edit)菜单选项(Options)命令。,知识点回顾,.,4,SPSS数据的基本概念、属性及定义方法统计数据按照对事物计量的精确程度,可将所采用的计量尺度由低级向高级分为:名义尺度、定序尺度、定距尺度和定比尺度。按照度量尺度有低级到高级分为:定类尺度、定序尺度和间隔尺度。SPSS常量包括:数值型、字符型和日期型3种类型;SPSS变量包括:数值型、字符型和日期型,系统默认为标准数值型变量,SPSS定义变量时至少应定义变量名和变量类型,其他属性可以采用默认值。一个完整的SPSS数据结构包括:变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量尺度以及数据的显示属性。,知识点回顾,.,5,数据的获取、数据编辑器和数据文件SPSS数据可以由原始数据录入和二手数据获取两种途径而得到;SPSS中录入数据和Excel类似,以电子表格的方式录入。数据编辑器主要由4部分构成:标题选项组、当前数据栏、输入数据栏和数据显示区。其功能包括:编辑变量和观测量,编辑数据,定义系统参数。创建SPSS数据文件需要完成2个主要步骤:首先在“变量视图”视区定义变量及其属性;其次在“数据视图”视区录入数据文件的具体内容。SPSS数据的录入方法包括:按单元格输入、按变量输入和按观测量输入和输入带有变量值标签数据。,知识点回顾,.,6,SPSS数据的编辑主要包括:查看变量信息、数据的定位、变量的插入和删除、观测量的插入和删除、数据的剪切、复制和粘贴、撤销操作等内容。,知识点回顾,SPSS数据编辑的实现:数据编辑窗口“数据视图”。,.,7,SPSS实用数据文件操作主要包括:数据文件的打开、保存;数据排序;数据文件分解;数据文件合并;数据文件转置;清除数据;数据文件的转换。通过实例了解SPSS实用数据文件的操作。,知识点回顾,.,8,SPSS基本统计分析功能,.,9,.,10,描述性统计分析(利用基本统计分析模块)“分析”菜单选择“描述性统计分析”命令,报告分析(统计报告分析)“分析”菜单“报告”命令,“分析”菜单,.,11,基本统计量的定义及计算,.,12,SPSS基本统计量,均值、中位数、众数、百分位数(四分位数)等,样本方差、样本标准差、均值标准误差、极差、离散系数等,偏度和峰度,以上内容详见第一讲。,.,13,统计报告,.,14,SPSS的报告功能是以表格的形式,按照一定的要求对数据进行列表以表现数据的内在联系。运用“报告”功能可以得到许多统计学的基本指标,如:平均数、方差、偏度等;能进行检验单变量的特征及与多变量间的相互关系;可以按照用户规定的格式输出报表。,.,15,在线分析处理报告(OLAP),该过程对于按照一个或多个分组变量所分的组,计算所考察的连续变量的总体值、均值以及其他基本统计量,并以分层的方式输出结果,表中每一层是依据一个分组变量的结果输出。建立或打开一个数据文件“分析”菜单“报告”“OLAP立方”,摘要变量框:数值变量,SPSS自动对其中的变量作摘要分析。,分组变量框:从左侧源变量框中选取值有限的数值型或字符型变量;SPSS按照每个分组变量的类别进行摘要分析。,.,16,在线分析处理报告示例,示例:职工数据文件。选择“基本工资”作为摘要分析变量;选择“文化程度”作为分组变量。,.,17,在线分析处理报告示例结果输出,.,18,个案摘要报告,也称观测量摘要报告,用于按指定分组统计量不同水平的交叉汇编,对变量进行记录列表,并计算相应的统计量。主要为定量数据的描述服务,可以预览及打印数据。建立或打开一个数据文件“分析”菜单“报告”“个案汇总”,所有变量的变量列表。,需要进行记录汇总分析的变量,选多个,系统会在同一张表格内依次分析。,用于选择分组变量,仅表示分类。,确定是否输出详细的记录列表。,.,19,个案摘要报告示例,示例:以“Employeedata.sav”文件为例,熟悉个案摘要报告的用法,要求为该数据文件中的前12个观测值制作一个“员工信息概述表”,按照变量gender(性别)对数据进行分组,对每组以及所有的变量salary(基本工资)、prevexp(工作经历)和jobcat(人员类别)计算它们的观测量数目、均值和极值,并且不排除缺失值。,.,20,个案摘要报告示例,.,21,个案摘要报告示例,.,22,个案摘要报告示例,.,23,个案摘要报告示例,.,24,个案摘要报告示例,案例处理摘要表:列出了参与概述分析的所有有效观测量数、被排除的观测量数以及全部观测量数和它们所占的百分比。,.,25,行形式摘要报告,行形式摘要报表和列形式摘要报表时用于生成复杂报表的,可对输出表格进行精确定义;输出结果为纯文本格式。建立或打开一个数据文件“分析”菜单“报告”“按行汇总”,.,26,行形式摘要报告示例,示例:以“Cars数据”为例。要求对car.sav按不同产地和气缸数计算汽车功率(horse)以及汽车加速到60mph所需时间(accel)的计数、平均数及标准差,并给出在不同产地中,该时间在20s以上车型所占比例。,.,27,行形式摘要报告示例,.,28,列形式摘要报告,与行形式摘要报告不同的地方在于,行变量为分组变量值,列变量为进行分析的变量,且对每个分析变量只有一个统计量输出。建立或打开一个数据文件“分析”菜单“报告”“按列汇总”,.,29,频数分析,.,30,SPSS频数分析,频率,也称频数,就是一个变量在各个变量值上取值的个案数。例如:要了解学生某次考试的成绩,需要计算学生所有分数取值,以及每个分数取值有多少人,则需要用到频数分析。SPSS的频数分析过程可以对单变量的多数类型的数据进行操作,也可以产生多个统计量和统计图形。,.,31,SPSS频数分析主要功能,主要功能在SPSS中可以方便地产生详细的频数分布表即对数据按组进行归类整理,形成各变量的不同水平的频数分布表和常用图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识;可以按要求给出某个百分点的数值更适用于对分类变量以及不服从正态分布的连续性变量进行描述。频数分析是在描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。,.,32,SPSS频数分析操作步骤,操作步骤建立或打开数据文件数据编辑窗口主菜单“分析”菜单“描述统计”选项“频率”命令。,.,33,SPSS频数分析操作步骤,输出结果中出现的统计量,.,34,SPSS频数分析操作步骤,.,35,SPSS频数分析操作步骤,.,36,SPSS频数分析操作步骤,.,37,SPSS频数分析实例分析,实例分析以数据文件“学生体检数据.sav”为例,对变量“体重”进行简单的频率分析。要求计算最大值、最小值、平均值等统计量,同时输出带正态分布曲线的直方图。打开“学生体检数据.sav”数据编辑窗口主菜单“分析”菜单“描述统计”选项“频率”命令。打开主对话框。,.,38,SPSS频数分析实例分析,.,39,SPSS频数分析实例分析,将所设定的统计过程及选择项对应的程序粘贴到程序编辑器,.,40,SPSS频数分析实例分析,.,41,SPSS频数分析实例分析,.,42,描述性分析,.,43,SPSS描述性分析,描述性统计量是研究随机变量变化综合特征(参数)的重要工具,它们集中描述了变量变化的特征,如果仅需要了解统计量的值,使用描述性分析计算更加简洁扼要。,.,44,SPSS描述性分析主要功能,主要功能SPSS的描述性分析过程的功能主要以计算数值型单变量的统计量为主,但没有图形功能。调用描述性分析过程可对变量进行描述性统计量分析计算并列出一系列相应的统计指标,包括:平均值、算术和、标准差、最大值、最小值、方差、全距和均值标准误差等;可将原始数据转换成标准Z分值存入数据库在数据集中生成一个新的变量,该变量自动命名为“Z+原始变量名”,大小即为原变量的标准常态变换结果。所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。,.,45,SPSS描述性分析操作步骤,操作步骤建立或打开数据文件数据编辑窗口主菜单“分析”菜单“描述统计”选项“描述”命令。,.,46,SPSS描述性分析操作步骤,指定输出哪些基本统计量以及输出结果显示的顺序。系统默认:均值、标准差、最大值和最小值。,.,47,SPSS描述性分析操作步骤,进行Bootstrap分析过程。,.,48,SPSS描述性分析实例分析,实例分析以数据文件“学生体检数据.sav”为例,对某校3个班级中16名学生的体检数据进行描述性分析,以班级为单位列表计算年龄、体重、身高的统计量,要求包括极差、最小值、最大值、均值、标准差和方差。在本例中需要对所有数据进行分组,以班级作为分组变量打开“学生体检数据.sav”数据编辑窗口主菜单“数据”菜单“拆分文件”命令。打开“拆分文件”对话框。描述性分析,.,49,SPSS描述性分析实例分析,.,50,SPSS描述性分析实例分析,.,51,SPSS描述性分析实例分析,实例分析以数据文件“学生体检数据.sav”为例,对某校3个班级中16名学生的体检数据进行描述性分析,以班级为单位列表计算年龄、体重、身高的统计量,要求包括极差、最小值、最大值、均值、标准差和方差。在本例中需要对所有数据进行分组,以班级作为分组变量打开“学生体检数据.sav”数据编辑窗口主菜单“数据”菜单“拆分文件”命令。打开“拆分文件”对话框。描述性分析“拆分后的文件”数据编辑窗口主菜单“分析”菜单“描述统计”选项“描述”命令。打开“描述性分析”主对话框。,.,52,SPSS描述性分析实例分析,.,53,SPSS描述性分析实例分析,.,54,SPSS描述性分析实例分析,.,55,SPSS描述性分析实例分析,结果包括:观测量个数、最小值、最大值、均值、标准差和方差;随着年龄的增加,体重和身高的平均值都在明显增加;同时,相应的标准差也有增大的趋势。,原数据集,.,56,探索性分析,5,.,57,SPSS探索性分析,探索性分析可以对变量进行更为深入详尽的统计分析,主要用于对数据的性质、分布特点等完全不了解时,检验数据是否有错误,获得数据的基本特征,及对数据规律做出初步的观察。在常用描述性统计指标的基础上,探索性分析增加了有关数据详细分布特征的文字与图形描述,同时也为以方差齐性为目的的变量交换提供线索。,.,58,SPSS探索性分析主要功能,主要功能可以检查数据是否有错误、考查样本分布特征以及对样本分布规律作初步考查通过分析奇异值和错误数据产生的原因,决定是否从数据文件中剔除或者进行相关处理。该过程和SPSS其他过程(如均值比较模块、相关性分析模块的很多过程)都提供了常用的检验变量相关性的方法提供了在分组和不分组的情况下的常用统计量与图形其结果一般以图形的方式将奇异值、非正常值、丢失的数据以及数据本身的特点表示出来。可以用于确定奇异值、丢失值和进行假设检验探索性分析的因变量必须是定距型变量,分组变量可以是定序型或者定类型变量。,.,59,SPSS探索性分析操作步骤,操作步骤建立或打开数据文件数据编辑窗口主菜单“分析”菜单“描述统计”选项“探索”命令。,.,60,SPSS探索性分析操作步骤,.,61,SPSS探索性分析操作步骤,.,62,SPSS探索性分析操作步骤,.,63,SPSS探索性分析操作步骤,.,64,SPSS探索性分析操作步骤,.,65,SPSS探索性分析操作步骤,.,66,SPSS探索性分析操作步骤,.,67,SPSS探索性分析操作步骤,.,68,SPSS探索性分析操作步骤,.,69,SPSS探索性分析操作步骤,.,70,SPSS探索性分析操作步骤,进行Bootstrap分析过程。,.,71,SPSS探索性分析实例分析,实例分析以数据文件“height.sav”为例,该数据文件包含某地城市和农村12岁身高数据各60例,试利用探索性分析过程进行数据分析。打开“height.sav”数据编辑窗口主菜单“分析”菜单“描述统计”选项“探索”命令。打开“探索性分析”对话框。,.,72,SPSS探索性分析实例分析,.,73,SPSS探索性分析实例分析,.,74,SPSS探索性分析实例分析,.,75,SPSS探索性分析实例分析,.,76,SPSS探索性分析实例分析,.,77,SPSS探索性分析实例分析,显示了数据的基本情况。每组有效数据各60例,无缺失数据。,.,78,SPSS探索性分析实例分析,输出的描述性统计量。利用变量地区(area)将数据分成2组输出;增加了数据的置信区间(默认的95%置信度)。,.,79,SPSS探索性分析实例分析,输出数据的M均值估计。表下方注释分别给出了4种估计方法的权重系数;若由表中计算的均值和M均值有很大的差距,则应当注意数据是否有异常值。,.,80,SPSS探索性分析实例分析,输出分位点信息。Tukey的枢纽是指绘制箱图时所用的分位点数据。,.,81,SPSS探索性分析实例分析,输出了两组的极值信息,通过该表可以快速查找异常值。,.,82,SPSS探索性分析实例分析,输出正态性检验结果表。分别采用K-S和S-W两种检验方法来确定变量是否服从正态分布;一般显著性水平Sig.0.05代表接受原假设。由于表中两种方法的Sig.的值均大于0.05,因此接受变量服从正态分布的假设。,.,83,SPSS探索性分析实例分析,输出方差齐性检验表。从上至下分别表示依赖于均值、中位数、中位数调整自由度,以及去掉极值的均值的检验结果;由由显著性水平Sig.大于0.05可以确认方差是齐次的。,.,84,SPSS探索性分析实例分析,输出地区的身高茎叶图,包括:频数、茎、叶3部分,茎是整数部分、叶是小数部分、Stemwith表示茎宽。每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,表示实际数据中由频数表示的数目这么多个值靠近该近似值。,.,85,SPSS探索性分析实例分析,输出地区身高数据的正态Q-Q图和反趋势正态Q-Q图。从图形看,数据很好地服从了正态分布,和前文结论相吻合。,.,86,SPSS探索性分析实例分析,两个地区身高的箱图:“绘图”选项里选的是“按因子水平分组”,所以两地区的箱图绘制在同一张图上。方箱上下边为四分位数,中心粗线为中位数,变量的30%的观测值落在这一区域中;方箱上下两条纵向直线是触须线,其外的两端线为本体的最大值和最小值,本体指除离群值外的变量值;离群值用“。”表示,其旁的的数据是指该离群值记录号。,.,87,列联表分析,6,.,88,SPSS列联表分析,在考虑变量之间的关系时,通常分析变量之间的相关程度。对于数值型变量,通常计算相关系数和进行回归分析,而对于定类型变量则通常采用列联表过程进行分析。列联表给出了多个变量在不同取值下的数据分布,从而分析变量之间的相互关系。,.,89,SPSS列联表分析主要功能,主要功能列联表检验的零假设是两个变量X和Y相互独立,计算一个统计量,与列联表中频数取值和零假设下期望取值之差有关,当很大时否定零假设。可进行计数资料和某些等级资料的列联表分析一个行变量和一个列变量可以形成一个二维列联表,再指定一个控制变量就形成一个三维列联表;如果指定多个行、列、控制变量,就会形成一个复杂的多维列联表。分析中可对二维和多维列联表(RC表)资料进行统计描述和检验,并计算相应的百分数指标。可计算四格表确切概率且有单双侧、对数似然比检验以及线性关系的M-H检验,.,90,SPSS列联表分析操作步骤,操作步骤建立或打开数据文件数据编辑窗口主菜单“分析”菜单“描述统计”选项“交叉表(列联表)”命令。,.,91,SPSS列联表分析操作步骤,.,92,SPSS列联表分析操作步骤,.,93,SPSS列联表分析操作步骤,.,94,SPSS列联表分析操作步骤,.,95,SPSS列联表分析操作步骤,.,96,SPSS列联表分析操作步骤,.,97,SPSS列联表分析操作步骤,.,98,SPSS列联表分析操作步骤,.,99,SPSS列联表分析操作步骤,.,100,SPSS列联表分析操作步骤,.,101,SPSS列联表分析操作步骤,.,102,SPSS列联表分析操作步骤,.,103,SPSS列联表分析操作步骤,.,104,SPSS列联表分析操作步骤,执行Bootstrap分析过程,.,105,SPSS列联表分析操作步骤,.,106,SPSS列联表分析实例分析,实例分析以数据文件“吸烟与气管炎.sav”为例,要求进行简单的四格表卡方检验分析,探讨吸烟者与不吸烟者患慢性气管炎的比例的不同,说明吸烟与患慢性气管炎之间的关系。数据的预处理打开“吸烟与气管炎.sav”数据编辑窗口主菜单“数据”菜单“加权个案”命令。打开“加权个案”对话框,进行加权个案设置。,.,107,SPSS列联表分析实例分析,实例分析以数据文件“吸烟与气管炎.sav”为例,要求进行简单的四格表卡方检验分析,探讨吸烟者与不吸烟者患慢性气管炎的比例的不同,说明吸烟与患慢性气管炎之间的关系。数据的预处理打开“吸烟与气管炎.sav”数据编辑窗口主菜单“数据”菜单“加权个案”命令。打开“加权个案”对话框。列联表分析数据编辑窗口主菜单“分析”菜单“描述统计”选项“交叉表”命令。打开“交叉表(列联表)分析”对话框。,.,108,SPSS列联表分析实例分析,.,109,SPSS列联表分析实例分析,.,110,SPSS列联表分析实例分析,.,111,SPSS列联表分析实例分析,产生了4个图表,包括:数据摘要表、列联表、卡方检验结果和分组条图。,.,112,SPSS列联表分析实例分析,给出了数据的基本情况,.,113,SPSS列联表分析实例分析,给出了22列联表,与原始数据在形式上基本是一致的。,.,114,SPSS列联表分析实例分析,计算的统计量包括:值、自由度、双侧近似概率、双侧精确概率、单侧精确概率。,使用了5种检验方法,结论:各种检验方法显著性水平都是远小于0.05,所以有理由拒绝吸烟与患病是独立的原假设,认为吸烟与患气管炎是相关的。,注释a主要用于决定选择何种卡方检验方法的结果。,.,115,SPSS列联表分析实例分析,相当于之前的“Smoke*result”列联表,.,116,基本统计分析包括统计报告分析、基本统计量的计算以及数据的探索性分析。基本统计分析是通过“分析”菜单下的“报告分析”和“描述性统计分析”两项功能来实现的。通过实例了解SPSS的主要统计报告操作,在线处理报告、个案摘要报告、行形式摘要报告、列形式摘要报告。SPSS的频数分析过程可以对单变量的多数类型的数据进行操作,也可以产生多个统计量和统计图形。频数分析的主要功能包括:在SPSS中可以方便地产生详细的频数分布表;可以按要求给出某个百分点的数值。SPSS频数分析的操作步骤:建立或打开数据文件数据编辑窗口主菜单“分析”菜单“描述统计”选项“频率”命令。以数据文件“学生体检数据.sav”为例,进行了简单的频率分析操作。,学习小结,.,117,描述性统计量是研究随机变量变化综合特征(参数)的重要工具,如果仅需要了解统计量的值,使用描述性分析计算更加简洁扼要。SPSS的描述性分析过程的功能主要以计算数值型单变量的统计量为主,但没有图形功能。主要包括:调用描述性分析过程可对变量进行描述性统计量分析;可将原始数据转换成标准Z分值存入数据库。SPSS描述性分析的操作步骤:建立或打开数据文件数据编辑窗口主菜单“分析”菜单“描述统计”选项“描述”命令。以数据文件“学生体检数据.sav”为例,开展了描述性分析操作。,学习小结,.,118,探索性分析主要用于对数据的性质、分布特点等完全不了解时,检验数据是否有错误,获得数据的基本特征,及对数据规律做出初步的观察。SPSS探索性分析的主要功能:可以检查数据是否有错误、考查样本分布特征以及对样本分布规律作初步考查;和SPSS其他过程(如均值比较模块、相关性分析模块的很多过程)都提供了常
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年春季中国石油大庆石化分公司高校毕业生招聘15人(黑龙江)考前自测高频考点模拟试题带答案详解
- 2025春季内蒙古包头市东河区机关所属事业单位引进高层次和紧缺急需人才51人模拟试卷及答案详解(易错题)
- 2025年中国光大银行社会招聘模拟试卷及答案详解(全优)
- 2025河北沧州市任丘园区产业发展集团有限公司招聘10人模拟试卷有完整答案详解
- 2025广东湛江市霞山区司法局招聘司法协理员拟聘用人员(第一批)模拟试卷及答案详解(夺冠)
- 2025年洛阳宜阳县选聘县属国有集团公司部长10名模拟试卷及答案详解(名校卷)
- 2025年湖北正源电力集团有限公司招聘146名高校毕业生(第三批)考前自测高频考点模拟试题附答案详解
- 2025贵州黔晨综合发展有限公司招聘录用人员模拟试卷附答案详解(黄金题型)
- 2025广西梧州市公安局第二批公开招聘警务辅助人员160人考前自测高频考点模拟试题及一套答案详解
- 2025年“才聚齐鲁成就未来”山东土地乡村振兴集团有限公司招聘2人考前自测高频考点模拟试题及答案详解(考点梳理)
- 铝电解工(铝电解操作工)职业技能考试题(附答案)
- 2024微信小程序技术支持与维护服务合同3篇
- 新闻记者职业资格《新闻采编实务》考试题库(含答案)
- 常用公司员工请假条模板
- 河北美术版小学六年级上册书法练习指导教案
- 高中化学-金属钠的性质及应用教学设计学情分析教材分析课后反思
- 工程量清单及招标控制价编制方案
- 04S519小型排水构筑物(含隔油池)图集
- 工程施工人员安全教育培训【共55张课件】
- 双碱法脱硫操作专项规程
- 人教版七年级上学期英语第一次月考试卷(含答案解析)
评论
0/150
提交评论