SPSS统计软件应用_第1页
SPSS统计软件应用_第2页
SPSS统计软件应用_第3页
SPSS统计软件应用_第4页
SPSS统计软件应用_第5页
已阅读5页,还剩142页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

艾尔.巴比曾说过,根据其多年的教学和研究经验发现,许多学生都会对统计学望而却步,有时候统计会让他们觉得自己像:

马戏团的小丑;

头发长见识短的呆子;

秃头鸭子;

不会冒泡的啤酒;

没有按钮的遥控器;

球场上的瘸子;

凑不整的零钱;

开不足马力的推进器……SPSS统计软件应用第一讲:SPSS的概述与数据录入方法第一节SPSS概述

SPSS的全称是StatisticalProgramforSocialSciences,即社会科学统计程序。该软件直观易用,是公认的最优秀的统计分析软件包之一。首先,采用电子表格形式作数据管理器,使用户变量命名、定义数据格式、数据输入与修改等过程一气呵成,免除了DOS版本在文本方式下数据录入的诸多不便;其次,采用菜单方式选择统计分析命令,采用对话框方式选择子命令,简明快捷,无需死记大量繁冗的语法语句;第三,采用对象连接和嵌入技术,使计算结果可方便地被其他软件调用,数据共享,提高工作效率。一、SPSS安装方法1.开机,启动Windows。2.将SPSS系统安装光盘放入光盘驱动器(如果电脑有备份可以直接打开备份程序)。3.启动Windows的资源管理器,双击光盘驱动器图标,在目录窗中找到setup应用程序,鼠标双击之,启动安装程序。4.开始安装后,按照提示一步步地进行下述操作,每步操作均要认真阅读屏幕显示的信息和提示。5.输入软件系列号码、用户姓名和单位名称。6.选择安装的类型6.1Typital项典型安装;6.2Compact项按照最低要求安装;6.3Custom项已经熟悉SPSS软件的用户可以选择此项,安装的模块由用户自己指定。7根据安装过程的提示,依次顺序插换原盘直至安装完成。二、SPSS的界面初识

1.SPSS的主窗口

SPSS的主窗口名为SPSSforWindows,此为窗口的标题栏,当它呈蓝底白字时,表示该窗口为活动窗口,意即用户可对之进行操作。非活动窗口的标题栏呈白底黑字,用户对之不能操作。激活窗口的方法是点击该窗口的标题栏。标题栏的左侧(即窗口的左上角)为窗口控制钮,点击它选择窗口的还原、移动、大小变换、最小化、最大化、关闭和与其它窗口的切换。2.SPSS的数据编辑窗口SPSSforWindows启动后即在屏幕上显示主画面,即数据编辑窗。主画面的最上行是由7个菜单项组成的主菜单,每个菜单项都包含一系列的功能。当在数据窗中输入了数据或读入了一个数据文件后,可以使用各主菜单中的各功能进行分析工作。鼠标光标对准选中的菜单项,单击鼠标键则可展开一个下拉菜单,在其中选择要执行的功能进行具体的分析。2.1File:文件管理菜单,有关文件的调入、存储、显示和打印等;2.2Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等;2.3View:窗口外观控制菜单,状态栏、工具栏、表格线的显示及隐藏,字体设置等。2.4Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等;2.5Transform:数据转换处理菜单,有关数值的计算、重新赋值、排序、缺失值替代等;2.7Analyze:统计菜单,有关一系列统计方法的应用,比如概括描述、均值比较、相关、回归等分析;2.7Graphs:作图菜单,有关统计图的制作;2.8Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;2.9Windows:窗口控制菜单,有关窗口的排列、选择、显示等;2.7Help:求助菜单,有关帮助文件的调用、查寻、显示等。点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的选项,完成特定的功能。第二节:数据的录入方法

数据录入可通过spss\word\foxpro\excel等途径输入数据。最常用的是foxpro和spss。一、通过spss窗口直接录入数据如果样本不大,变量不多,可以直接在spss窗口输入数据。

1.打开spss,在变量浏览窗口定义变量及数据的类型属性(1)Name:变量名称变量就是具有一个以上不同取值的概念,而那些只有一个固定不变的取值的概念,则叫做常量。“性别”是一个包括“男性”和“女性”两个取值的变量;“职业”是一个包括工人、农民、教师、医生等多个取值的变量;“文化程度”是一个包括文盲半文盲、小学、初中、高中、大专以上五个取值的变量。离散变量(Discretevariable)指变量的取值的最基本单位不能够再细分,一般直接称为离散变量。如家庭的人口数。连续变量(Continuousvariable)指变量的取值的最基本单位还可以再细分,如人的身高。(2)Type:变量类型

①numeric:数值型,同时定义数值的宽度(Width),即整数部分+小数点+小数部分的位数,默认为8位;定义小数位数(DecimalPlaces),默认为2位。最常用。

②comma:带逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型。不常用。

③dot:3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为12.345,00(实际是12345E-4)。不常用。④scientificnotation:科学记数型,同时定义数值宽度(Width)和小数位数(DecimalPlaces),在数据管理窗口中以指数形式显示。如定义数值宽度为9,小数位数为2,则345.678显示为3.46E+02。不常用。

⑤date:日期型。有27种表示方法。用户可从系统提供的日期显示形式中选择自己需要的。如选择mm/dd/yy形式,则1995年6月25日显示为06/25/95。

⑥dollar:货币型。用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有$。

⑦customcurrency:自定义型。显示为整数部分每3位加一逗号,用户可定义数值宽度和小数位数。如12345.678显示为12,345.678。

⑧string:字符型。选中该项后,可在数据输入时输入中文或英文符号。③Width:宽度。④Decimals:小数位数,默认为2位小数。⑤Label:变量标签,解释变量的含义。⑥Values:对标签进行定义。变量变量标签变量值变量值标签v1性别FFemaleMMalev2身高1≤1.49m21.50-1.59m31.60-1.69m41.70-1.79m5≥1.80m⑦Missingvalues:定义缺省值。问卷中有一些特殊情况的编码,如被调查者不回答、打错、不需要填答等情况,要进行缺省值的处理。缺省值又叫用户缺省值(Usermissingvalue)

Nomissingvalues:没有缺省值。

Discretemissingvalues:定义1—3个单一数的缺省值。

Rangeplusoneofoptionalmissingvalues:定义指定范围为缺省值,同时指定另外一个不在这一范围内的单一数为缺省值。宽度为1的变量:单项选择题的缺省值一般是0、9,当答案有9选项时,就为0;或设定一个范围也可。多向选择题的缺省值就可设为9,或设定一个范围。宽度为2及以下的变量:缺省值设为99,或设一个范围均可。依此类推,视具体情况而定。⑧Columns:定义数据管理器纵列的长度⑨Align:字符排序方向。有三种选择:左对齐、右对齐、居中。⑩Measure:数据测量层次选择。

scale:连续型变量,是测量的最高层次。

ordinal:定序型变量;

nominal:定类型变量。2.在数据浏览窗口输入数据打开spss—输入数据—保存。二、通过foxpro录入数据特点:适用于大型调查;通用性好;输入速度快;易于修改。1.建库

create*dbf(此处要定义变量名、类型及宽度)

①变量名称②变量类型③宽度。④小数位数。

2.操作append加数字appendfrom合盘edit编辑browse浏览delete删除insert插入3.存盘并转换为spss数据格式导出到foxpro2.0版本,然后在spss窗口打开foxpro2.0版本的数据表,在file里点击saveas,把新的数据文件保存在制定的位置即完成数据转换。4.定义变量的其它属性①Label:变量标签,解释变量的含义。②Values:对标签进行定义。③Missingvalues:定义缺省值。④Columns:定义数据管理器纵列的长度⑤Align:字符排序方向。⑥Measure:数据亮度选择。第二章:统计中常用的数据编辑

第一节:个案查找、排序与选择

输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统提供了如下主要方法。一、个案查找Data—GotoCase二、个案排序

Cases排序是重新排列数据行的先后次序,即以人为指定的某个变量值为基准进行升序排序Cases(默认方式)或降序排序Cases。步骤:

(1)单击Data--SortCases;(2)单击需排序的变量—右箭头,让所选变量进入Sortby文本框内。(3)SortOrder有2个含义:

Ascending升序排序,此为默认方式;Descending降序排序。(4)单击图中的OK按钮,显示排序结果。

注意:用户也可选多个变量,当多个变量同时排序时,系统将按变量选择的先后逐级依次排序,即SPSS将先根据第1个变量排列数据行,当第1个变量值相同时再根据第2个变量值排序。三、选择个案如何在一个数据库或一个目标数据文件中限选部分个案(SomeCases)进行统计分析。这是常用的按部门或按地区的统计方法。1.几种常见的选择个案情况:Allcases:表示所有的观察例数都被选择,该选项可用于解除先前的选择;IfConditionisSatisfied:表示按指定条件选择,限选某个子总体进行统计;Randomsampleofcases:表示提取随机样本进行统计;

Basedontimeorcaserange:表示按照顺序限选一定范围内的Cases统计;Usefiltervariable:表示用指定的变量作过滤,用户先选择1个变量,系统自动在数据管理器中将该变量值为0的观察单位标上删除标记,系统对有删除标记的观察单位不作分析。若用户在SelectCases对话框的UnselectedCasesAre框中选Deleted项,则系统将删除所有被标上删除标记的观察单位。

没有选中的个案处理:filtered(过滤)或deleted(删除)

调用SelectCases命令完成定义后,SPSS将在主窗口的最下面状态行中显示FilterOn字样;若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示FilterOn字样,意味着数据选择命令依然有效。2.限选某个子总体进行统计限选某个子总体是指限选数据库或目标数据文件中某类个案的数据进行统计。

步骤:1)单击Data中的SelectCases按钮进入对话框;2)从对话框中选择“IfConditionisSatisfied”命令按钮,单击If按钮,进入设置表达式;3)在设置表达式的文本框中按照选取的需要输入表达式,单击“Continue”按钮;4)单击OK按钮确认选择并显示结果。说明:如选择filtered,则被打上斜杠“/”的Cases是落选的。

3.提取随机要本进行统计

提取随机样本,是从数据库或目标数据中提取一定比例的数据行(Cases)进行统计分析。

例3:目标数据共有72个Cases,要求随机抽取30%的Cases进行样本统计。

步骤:

1)单击Data,进入SelectCases对话框;

2)单击对话框中的中的“Randomsampleofcases”

下面的“Sample”按钮,进入抽样类型对话框,输入需要的抽样要求后,点击Continue-OK按钮,获得结果。4.限选一定范围内的若干个Cases

限选一定范围内的n个Cases是指依次选择数据文件中若干连续的Cases进行统计,比如需要限选前30个,或后30个或其他范围的进行统计。

步骤:

1)单击Data中的SelectCases按钮进入对话框;

2)从对话框中选择“Basedontimeorcaserange”下的range按钮,进入设置范围对话框;

3)输入个案的选取范围,点击Continue-OK按钮,获得结果。

第二节:数据的增删、合并与拆分一、数据的增删

1.增加一个新的变量列例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则可先激活第2列的任一单元格,然后选Data菜单的InsertVariable命令项,系统自动为用户在第2列前插入一个新的变量列,原第2列自动向右移一列成为第3列。

Data—Insertvariable

2.增加一个新的个案

例如要在第6个观察单位前增加一个观察单位(亦即在第6行前增加一行,使原来的第6行下移成为第7行),则可先激活第6行的任一单元格,然后选Data菜单的InsertCase命令项,系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。

Data—InsertCase

3.删除一个个案 例如要删除第9行(即删除这个观察单位的所有观察值),则可先点击第9行的行头,这时整个第9行被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,该行即被删除。

4.删除一个变量列

例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,该列即被删除。

二、合并数据

1.合并个案从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用AddCases对话框完成,相互合并的数据文件中应该有相同的变量。

Data–Mergefiles–Mergecases–选中需要合并的数据文件(在AddCases对话框中,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicatecasesourceasvariable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。)

–OK即可。2.合并变量

从外部数据文件增加变量到当前数据文件,称为横向合并,用AddVariable对话框完成,相互合并的数据文件中应包含同样的记录。

Data–Mergefiles–Mergevariables–选中需要合并的数据文件–OK即可。三、数据的拆分Data–SplitFile用于将数据文件分组进行处理:Analyzeallcases:和下面的两个单选框为一组,选中本框不拆分文件;Comparegroups:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较;Organizeoutputbygroups:按所选变量拆分文件,各组分析结果单独放置;Groupsbasedon框:用于选择拆分数据文件的变量;Sortthefilebygroupingvariables:将数据按所用的拆分变量排序;Fileisalreadysorted:数据保持原状,不按所用的拆分变量排序。第三章:常用的数据转换

第一节:数据的运算与缺失值的替代

一、数据的运算与新变量的生成

如果原始数据中只有月收入变量,但在统计中需要计算年收入,则应创建新变量来表示年收入,它等于月收入乘以12,类似的很多。这些都可以通过compute命令实现。

1.步骤:

1)单击spss菜单行中的transform,进入compute对话框,Compute...命令项既可对选定的变量进行运算操作,又可通过运算操作让系统生成新的变量。

2)在弹出的ComputeVariable对话框中,首先在TargetVariable指定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量),然后点击Type&Label...钮确定是数值型变量,还是字符型变量,或加上变量标签;

3)在NumericExpression框中键入运算公式,系统提供计算器和82种函数(在Functions框内)让用户使用;若点击If...钮会弹出ComputeVariable:IfCases对话框,用户可指定符合条件的变量参与运算。

4)点击OK钮即可在数据管理器中产生一个新变量。二、缺失值的替代

对于缺失值,可采取多种手段进行科学替代。

1.选Transform菜单的ReplaceMissingValues...命令项;在弹出的ReplaceMissingValues对话框中,先在变量名列中选1个或多个存在缺失值的变量点击钮,使之进入NewVariable(s)框,这时系统自动产生用于替代缺失值的新变量;2.点击Method的下箭头选择缺失值的替代方式:

1)Seriesmean:用该变量所有非缺失值均数做替代;

2)Meanofnearbypoints:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定义;

3)Medianofnearbypoints:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任意定义;

4)Linearinterpolation:用缺失值相邻两点非缺失值的中点值做替代;

5)Lineartrendatpoint:用线性拟合方式确定替代值。第二节:数据重新编码在数据管理器中,用户可对各单元的数值重新赋予新值。选Transform菜单的Recode命令项,此时有两种选择:一是对变量自身重新赋值(IntoSameVariables...);二是对新生成的变量进行赋值(IntoDifferentVariables...)。

一、对变量自身重新赋值(IntoSameVariables...)

步骤:

1.单击spss菜单行中的transform,进入recode对话框;

2.单击对话框中的IntoSameVariables;

3.在弹出的RecodeintoSameVariables对话框中,先在变量名列中选1个或多个变量点击钮使之进入NumericVariables框;

4.点击OldandNewValues...钮,弹出RecodeintoSameVariables:OldandNewValue对话框,用户根据实际情况确定旧值和新值;

5.点击Continue钮返回,再点击OK钮即可。二、对新生成的变量进行赋值(IntoDifferentVariables...)

1.单击spss菜单行中的transform,进入recode对话框;

2.单击对话框中的IntoDifferentVariables;

3.在弹出的RecodeintoDifferentVariables对话框中,先在变量名列中选1个或多个变量点击钮,使之进入NumericVariableOutputVariable框,同时在OutputVariable框确定一赋值变量,命名后点击Change按钮;

4.点击OldandNewValues...钮,弹出RecodeintoDifferentVariables:OldandNewValue对话框,用户根据实际情况确定旧值和新值;

5.点击Continue钮返回,再点击OK钮即可。

在两种赋值情况下,用户均可点击If...钮指定条件来确定观察单位。 与Compute方法不同的是:Recode方法不能进行运算,只能根据指定变量值作数值转换,且这种转换是单一数值的转换。第四章:频数分布与描述统计

初学者具备了前几章的预备知识并获得原始数据或可执行的*.sav目标数据之后,接下来可进行统计分析。统计分析的第1步是采用SPSS的Frequencies过程,计算变量的频次分布。比如某次调查中,需要统计男性人数、女性人数、男女性别比例、婚姻状况、人均收入等。本章综合运用Frequencies和Descriptives过程进行完整的描述统计。第一节:选用Frequencies过程进行频次统计

Frequencies过程既可统计频次分布,又可简单探测数据的真伪。比如,当在频率表中看出sex=3(非男非女)时,可以立即断定数据输入有误。一、数据准备

打开数据管理窗口,即打开需要进行统计的原始数据。二、统计分析过程

1.激活DescriptiveStatistics菜单,选其中的Frequencies...命令项,弹出Frequencies对话框;

2.在对话框左侧的变量列表中选择要统计的变量名,点击钮使之进入Variable(s)框;

3.点击Statistics...钮,选择SPSS展示的各种统计量

在弹出的Frequencies:Statistics对话框中,可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算,选好后点击Continue钮返回Frequencies对话框。

SPSS展示的16种统计量的详解:

①PercentileValues:用于百分比的计算。

Quartiles四分位的百分比。

Cutpointsfor…数据的等分。默认为10等分。

Percentile[s]百分位数的值。如测量20%、40%、60%、80%、100%位的值。②Dispersion:离散趋势测量的统计量。·Std.deviation标准偏差,标准差。·Varince方差。方差等于标准偏差的平方。·Range全距。·Minimum数据的最小值。·Maximum数据的最大值。·S.E.mean均值的标准误差。③CentralTendency:集中趋势测量的统计量。·Mean均值。·Median中位数。·Mode众数。·Sum和数。④ValuesAregroupMidpoints:数据的组心。⑤Distribution:形状(分布)测量的统计量。·Skewness偏态系数或称偏度。·Kurtosis峰态系数或称峰度。4.选择Charts画图单击Charts按钮进入,在弹出的Frequencies:Charts对话框中,SPSS默认为无图形输出。但可根据数据类型选择条形图、直方图或圆形图。图形中的数值比较,可以采用百分比比较,也可以采用频次比较,默认为彩用百分比比较。点击Continue钮返回Frequencies对话框。5.单击“Format……”命令按钮,指定输出的格式。

Format对话框主要用于指定频率表的输出格式。其中,Orderby选项框中的4个格式是常用的,分别是:·Ascendingvalues:按照数据编码升序显示频率表;·Descendingvalues:按照数据编码降序显示频率表。·Ascendingcounts:按照观察值的频次,升序显示频率表;·Descendingcounts:按照观察值的频次,降序显示频率表;注意:选择默认的Ascendingvalues(数值递增)为妥。三、统计结果解释

1.系统对变量的原始数据作频数分布表,Frequency为频数、Percent为各组频数占总例数的百分比、Validpercent为各组频数占总例数的有效百分比、CumPercent为各组频数占总例数的累积百分比;

2.输出各基本统计指标,如均数,标准误,中位数,众数等;

3.最后系统输出数据分布形状图表。

第二节:采用Descriptives过程描述数据

Frequencies过程用于数字型变量或字符串型变量的数据汇总,汇总时可统计出:(1)均值、(2)标准偏差、(3)最小值、(4)最大值、(5)众数、(6)中位数、(7)均值的标准误差、(8)方差、(9)偏态系数、(10)偏态系数的标准误差、(11)全距(Range)、(12)峰态系数、(13)峰态系数的标准误差、(14)求和等14种统计量。Frequecies过程还可画出数据的圆形图、余形图、直方图。

Descriptives过程则用于区间型(定距)数距和比例型(定比)数据的数据汇总,汇总时可统计出上述除“众数、中位数”以外的12种统计量。一、Descriptives过程的最佳功能

Descriptives过程虽然不能画出圆形图、条形图、直方图,但在只需要统计量而不要频率表及图形的情况下,反而显得简捷易行。所以,Descriptives更适合对区间以上变量进行数据分析。Descriptives过程的最佳功能在于,它能计算变量的标准分。二、在对话话中进行Descriptives的描述统计

采用Descriptives对话框进行描述统计的步骤如下:

1.打开目标数据文件;

2.激活Statistics菜单选DescriptiveStatistics中的Descriptives...命令项;

3.弹出Descriptives对话框中,在对话框左侧的变量列表中选择要进行描述性分析的变量,点击

钮使之进入Variable(s)框;

4.点击Options...钮,弹出Descriptives:Options对话框,框中各指标的意义与本章本章第一节一致;

5.选好项目后点击Continue钮返回Descriptives对话框,再点击OK钮即可。

第五章:列联表分析一、定类—定类型

1.打开目标数据文件,进入Analyze主菜单;

2.激活Statistics菜单选DescriptiveStatistics中的Crosstabs命令项;

3.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Row(s)框,作为分布表中的行变量;

4.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Column(s)框,作为分布表中的列变量;

5.单击statistics按钮,打开statistics对话框,选择要进行分析的统计量。

1)Chi-square选项,可以输出四中检验结果:一是行、列变量相互独立的皮尔逊卡方检验系数,是常用的检验方法;二是似然比卡方检验,用于对数线性模型的检验;三是费雪精确检验,当样本小于20时效果很好;四是耶茨校正卡方检验,为卡方检验的校正值,总小于卡方值。2)Nominal栏,适用于定类变量的统计量①Contingencycoefficient选项,描述两个变量之间关联性高低的统计量;其数值在0—1之间,0表示行列变量之间没有关联,接近1表示行列之间有很强的关联。其值的大小与行列数目的多少有关。②PhiandCramer’V选项,用来表示两个变量之间关联性高低的统计量。③Lambda选项,0—1之间,0表示自变量不能预测因变量,1表示自变量能完全预测因变量。④Uncertaintycoefficient选项,不确定性系数,表示使用一个变量的值来预测其他变量的值可能发生的错误。不确定系数越接近于1,表明从第一个变量获得的有关第二个变量的值的信息越多,越接近于0,则相反。6.单击cells按钮,打开cells对话框,选择行列显示结果。6.1counts计数栏:观察值和预期值;6.2percentages百分比栏在交叉汇总列表中,行和列都可以相互交换位置,因此没有严格意义上的自变量和因变量。但如果已经有了研究的自变量和因变量,一般情况下:如果自变量是行变量,则选择行百分比作比较;如果自变量是列变量,则选择列百分比作比较。7.观察统计结果二、定类—定序型交叉分析第五章:等级相关分析一、步骤:

1.打开目标数据文件,进入Analyze主菜单;

2.激活Statistics菜单选DescriptiveStatistics中的Crosstabs命令项;

3.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Row(s)框,作为分布表中的行变量;4.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Column(s)框,作为分布表中的列变量;

5.单击statistics按钮,打开statistics对话框,选择要进行分析的统计量。1)Chi-square选项,可以输出四中检验结果2)ordinalbyordinal栏,适用于定序—定序型的统计量

Gamma系数是一个定序—定序变量间的统计系数值,范围在-1—1之间。绝对值越接近1,表明两个变量之间高度关联,越接近0,表明关联度越低。6.对统计结果进行分析

第七章:相关分析第一节:简单线性相关分析的概念

1、两个变量间的简单线性相关分析相关分析是研究变量音密切程度的一种常用统用方法。线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,通常用r表示。如果一个变量Y可以确切地用另一个变量X的线性函数表示,这种关系是确切的,则两个变量间的相关系数是1或-1。一般情况下,相关系数在—1~1之间。

一般情况,两个变量的对应关系不具有唯一性。例如身高与体重的关系,相同身高的人会有不同的体重。研究他们之间线性关系的密切程度使用相关分析。研究它们之间的因果关系使用回归分析。

2.相关分析的SPSS过程在Analyze下拉菜单中的Correlate命令项具有三个相关分析功能命令。

①Bivariate命令项调用Correlations过程和Nonparcorr过程。

②Partial命令项调用PartialCorr过程。

③Distance命令项调用Proximities过程。第二节:两个变量间的简单相关分析两两变量间的相关,包括两个连续变量间的相关和两个等级变量间的秩相关。在进行相关分析之前,应该使用graphs菜单中的Scatter命令做散点图,进行初步观察,确认两个变量间有相关趋势,再按下列步骤进行相关分析。

1、建立数据文件

2、选择分析变量按Analyze→Correlate→Bivariate顺序单击菜单项,展开二元变量相关分析主对话框,如图所示。在主对话框左面的变量表中选择变量。3、CorrelationCoefficients栏中列出相关分析类型,有三个选择项:

(1)Pearson皮尔逊相关,系统默认的相关分析方法。只有正态分布的等间隔测度的变量才使用这种相关分析。(2)Spearman斯皮尔曼相关,调用Nonparcorr过程计算分类变量间的期皮尔曼秩相关系数。(3)Kendall’stau-b肯德尔τ-b,调用Nonparcorr过程计算定序型变量间的相关,考虑结点的影响。4、TestofSignificance栏,显著性检验选择项(1)Two-tailed双尾t检验,系统默认的检验方式,当事先不知道相关方向(正相关还是负相关)时选择此项。(2)Onetailed单尾t检验,如果事先知道相关方向可以选择此项。无论选择以上哪一个选择题,均显示假设成立的概率水平。针对的零假设是:总体中两个变量不相关。

5、Flagsignificantcorrelations,要求在输出结果中,相关系数右上方使用“*”表示显著性水平为5%,用“**”表示其显著性水平为1%。

6、Options对话框中的选择项

在主对话框中单击Options按钮,展开Options对话框。

(1)统计量选择项在Statistics栏中有两个有关统计量的选择项,只有在主对话框中选择了Pearson相关分析方法时才可以选择这两个选择项。①Meansandstandarddeviations要求设计算并输出均值与标准差。②Cross-productdeviationsandcovariances要求计算并输出叉积离差阵和协方差阵。

(2)缺失值处理方法选择项①Excludecaseslistwise选项剔陶所有带有缺失值的观测量。系统默认此项。②Excludecasespairwise选项成对剔除带有缺失值的观测量。选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。

例1:简单相关分析例题以1962—1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关分析为例。见data-7-01。首先,建立H0:1962年—1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间不相关。操作步骤:

1、建立或打开数据文件

2、选择分析变量按Analyze→Correlate→Bivariate顺序单击菜单项,展开二元变量相关分析主对话框,在源变量栏中选择分析变量deposit和income,单击向右箭头按钮,将分析的变量移至variables矩形框中。3、选择Pearson皮尔逊相关,系统默认的相关分析方法。

4、TestofSignificance栏,显著性检验选择项(1)Two-tailed双尾t检验,系统默认的检验方式,当事先不知道相关方向(正相关还是负相关)时选择此项。(2)Onetailed单尾t检验,如果事先知道相关方向可以选择此项。

5、Flagsignificantcorrelations,要求在输出结果中,相关系数右上方使用“*”表示显著性水平为5%,用“**”表示其显著性水平为1%。

6、在Options对话框中选中Meansandstandarddeviations要求设计算并输出均值与标准差;在缺失值处理方法选择项中采用Excludecaseslistwise选项剔出所有带有缺失值的观测量。系统默认此项。7.选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。8.结果分析

通过统计结果发现,国民收入和存款余额的相关系数为0.975,显著度=0.001,明显小于0.01,说明国民收入和存款余额之间是高度相关的。

例2:生成矩形相关矩阵的简单相关例题以一组银行雇员数据为例,见data-7-2。要求观察起始工资和现工资与雇员本人各方面条件的关系。变量有:起始工资、现有工资、年龄、工作时间、以前工作经验。

首先建立假设其次,操作步骤:

1、建立或打开数据文件

2、选择分析变量按Analyze→Correlate→Bivariate顺序单击菜单项,展开二元变量相关分析主对话框,在源变量栏中选择分析变量需要统计的变量,单击向右箭头按钮,将分析的变量移至variables矩形框中。

3、选择Pearson皮尔逊相关;

4、选择Two-tailed双尾t检验;

5、选中Flagsignificantcorrelations复选项;

6、在Options对话框中选中Meansandstandarddeviations要求设计算并输出均值与标准差;在缺失值处理方法选择项中采用Excludecaseslistwise选项剔出所有带有缺失值的观测量。7.选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。8.结果分析

表中皮尔逊相关系数虽然均很小,但是双尾检验表明:(1)当前工资与工作时间不相关(sig.=0.067>0.05),当前工资与年龄呈负相关(sig.=0.001),当前工资与以前工作经验呈负相关(sig.=0.034)。(2)起始工资分析与(1)同理。第三节:偏相关分析

1、偏相关分析简单相关分析计算两个变量间的相关系数,分析两个变量线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。偏相关分析就是排除其他变量干扰后所测量到的两个变量真正的相关系数,即偏相关分析是控制“第三者”后所获得的甲乙二者的“净”相关系数。

例如身高、体重与肺活量之间的关系如果使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系。但实际上,如果对体重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?结论是否定的。正是因为身高与体重有着线性关系,体重与肺活量存在线性关系,因此,得出身高与肺活量之间存在着较强的线性关系的错误结论。

偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。实际生活中有许多这样的关系,例如可以控制年龄和工作经验两个变量的影响,估计工资收放与受教育程度之间的相关关系。可以在控制了销售能力与各种其他经济指标的情况下,研究销售量与广告费用之间的关系等。

2.偏相关的阶偏相关分析可对一个或多个变量进行控制。

1)当控制1个变量的影响时,称为1阶偏相关;若控制2个变量的影响时,则称为2阶偏相关。

2)零阶相关:一般的相关(无控制变量)被称为零阶相关。3.偏相关分析的操作1)按Analyze→Correlate→Partial顺序单击菜单项,展开偏相关分析主对话框。2)从源变量表中选择分析变量送入Variables矩形框中。选择控制变量送入Controlling框。3)在TestofSignificance栏中选择假设检验类型,有两个选择项:①Two-tailed双尾检验选项,用于有正负相关两种可能的情况,是系统默认的方式。②One-tailed单尾检验选项,用于只可能是正向或只可能是负向相关的情况。4)是否显示实际的显著性水平选择Displayactualsignificancelevel在显示相关系数的同时,显示实际的显著性概率。不选择此项,其显著性概率使用星号“*”代替,表示其显著性概率在5%-1%之间。“**”表示其显著性概率小于或等于1%。5)Options窗中的选择项主对话框中单击Options按钮,展开对话框。①Statistics统计量选择项Meansandstandarddeviations复选项要求计算并显示各分析变量的均值和标准差。Zero-ordercorrelations复选项要求显示零阶相关矩阵,即Pearson相关矩阵。②MissingValues处理缺失值观测量的选择项。Excludecaseslistwise选项剔陶所有带有缺失值的观测量。系统默认此项。Excludecasespairwise选项成对剔除带有缺失值的观测量。6)选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。4.应用实例使用四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度这四个气候因素哪个因素有关(data-7-3)。这四个气候因素彼此均有影响,分析时应对生长量与4个气候因素分别求偏相关,在求生长量与一个气候因素的相关时,控制其它因素的影响,然后比较相关系数,按照4个气候因素对生长量的影响大小排队。

1)按Analyze→Correlate→Partial顺序单击菜单项,展开偏相关分析主对话框。

2)为操作方便,首先确定第一次分析的变量和控制变量。第一次分析变量是生长量与月平均日照数,控制变量是其余3个气候因素。所以,从源变量表中选择生长量、月平均日照数作为分析变量送入Variables矩形框中;选择月平均气温、月降雨量、月平均湿度作为控制变量送入Controlling框。3)指定选择项

在主对话框中的选择项中使用系统默认值:双尾检验,并显示显示实际的显著性水平。在Options窗中的选择项中要求计算并显示各分析变量的均值和标准差;显示Pearson相关矩阵;对缺失值得处理使用系统默认值。4)选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。5)结果分析

由零阶相关矩阵可知,生长量与湿度的相关系数最小,sig.=0.232。初步结论是生长量与月平均湿度无关外,与其他几个气候因素均有明显的线性关系。由于各气候因素的相互影响,生长量与各变量之间的相关系数并没有反映出各变量之间的真实情况,因此应该看偏相关的结果。通过偏相关结果可知,在控制了其他气候因素之后,生长量与月平均日照数的相关系数为0.6318,sig.=0.068,可认为二者不相关。6)首次分析完成后,依次对其他几个气候因素进行相应分析(过程相同),依次来确定各气候因素在控制其它变量后的相关系数,并比较各影响的大小。

通过比较分析得出结论:中山柏生长量与气温关系最密切,相关系数为0.9774(sig.=0.000),其次是湿度,相关系数是0.7310(sig.=0.025),生长量与日照时间和降雨量没有线性关系。第八章:均值比较和方差分析第一节:相关比率一、步骤:

1.打开目标数据文件,进入Analyze主菜单;

2.激活Statistics菜单选DescriptiveStatistics中的Crosstabs命令项;

3.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Row(s)框,作为分布表中的行变量;4.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Column(s)框,作为分布表中的列变量;

5.单击statistics按钮,打开statistics对话框,选择要进行分析的统计量。1)Chi-square选项,可以输出四中检验结果

2)NominalbyInterval栏,适用于定类—定距型的统计量

Eta系数是一个定类变量为自变量,定距变量为因变量的统计系数值,范围在0—1之间。越接近1,表明两个变量之间高度关联,越接近0,表明关联度越低。二、有控制变量的情况下交叉分析在已知两个变量关系的情况下,假如控制变量的分析。在Crosstabs对话框中,选择要进行分析的统计量后,选择控制变量进入layer1by1进行详细分析即可。第二节:单一样本t检验

One-SampleTTest过程检验单个变量的均值是否与给定的常数这间存在差异。例如研究人员可能想知道一组学生的IQ平均分数与100分的差异。如果已知总体均数,进行样本数与总体均数之间的差异显著性检验属于单一样本的t检验。One-SampleTTest过程对每个检验变量给出的统计量有:均值、标准差和均值的标准误。该过程计算每个数据与总体均值之间差的平均值,用户可以指定给验的显著性水平。

已知某地区12岁男孩平均身高为142.3cm。1973年某市测量120名12岁男孩身高资料数据编号data-8-1。

步骤:

1、建立无效假设H0;假设某市12岁男孩身高与该地区12岁男孩身高平均值相等。

2、建立数据集仅有一个变量Height:12岁男孩身高。3、按Statistics→CompareMean→OneSampleTTest顺序展开OneSampleTTest单一样本t检验对话框。

4、在对话框中将唯一的变量Height从源变量栏内移至Test框内。在Test框中将该地区12岁男孩平均身高142.5输入到Test后面的矩形框中。5、单击Options按钮,打开选择项对话框,Confidence选择系统默认值95%,缺失值选择系统默认值Excludecasesanalysisbyanalysis项。单击Continue按钮,返回主对话框。

6、在对话框中单击OK按钮,输出结果。

7、结果分析:样本身高均值143.048,标准差5.821,标准误0.531。可以看出,样本均值143.048与地区身高平均值142.5比较,样本均值略高,差0.548。

t值1.032,双尾t检验的P值为0.304>0.05。说明没有通过检验,接受H0,即没有显著性差异。第三节:独立样本t检验进行独立样本的t检验要求被比较的两个样本彼此独立,即没有配对关系。要求两个样本来自正态总体。要求均值是对于检验有意义的描述统计量。两个样本方差相等与不等时使用的计算t值的公式不同。因此应该先对方差进行齐性检验。SPSS的输出,在给同方差齐与不齐两种计算结果的t值,和t值检验的显著性概率的同时,选择t检验输出中的哪个结果,得出最后结论。

独立样本t检验操作1、读取数据文件2、按Statistics→CompareMeans→IndependentSamplesTtest顺序,展开主对话框。3、源变量框中选择要进行检验的变量,将其送入Test矩形框中。4、选择分组变量,将其送入Grouping矩形框中。5、单击DefineGroups按钮,展开DefineGroups确定分组的对话框。独立样本t检验实例

现以银行男女雇员现工资为例,见data-8-2,检验男女雇员现工资是否有显著性差异。首先打开数据文件。要gender变量作为分类变量比较salary变量的均值。(1)读取数据文件data-8-2。按Statistics→CompareMeans→IndependentSamplesTtest顺序,展开Independent-SimpleTTest主对话框,按如下步骤操作,即可使用系统默认值进行检验。(2)选择salary作为检验变量,将其送入Test矩形框中。(3)选择gender变量作为分组变量,将其送入Grouping矩形框中。(4)单击DefineGroups按钮,展开DefineGroups确定分组的对话框。在Group1后面的矩形框中输入“f”为女雇员组;在Group2后面的矩形框中输入“m”,即男雇员作为第二组。(5)与选择系统默认值相应的命令语句(6)分析结果及解释。通过显著度分析是否接受H1。第四节:配对样本t检验概念

进行配对样本的t检验要求被比较的两个样本有配对关系,要求两个样本均来自正态总体,要求均值是对于检验有意义的描述统计量。均值的配对比较是比较常见的。配对样本t体验操作

1、建立数据文件

2、按Statistics→CompareMeans→Paired-SamplesTTest顺序,展开Pair-SampleTTest配对样本t检验的主对话框。

3、指定配对变量①在主对话框的源变量表中,选择一个变量,该变量名反向显示;出现在主对话框左下部的CurrentSelections当前所选择的变量栏中Variable1提示项后面。

②在源变量框中,再选择一个与先选择的变量成对的变量,该变量名反向显示并出现在CurrentSelections当前所选择的变量栏中Variable2提示项后面。③当在CurrentSelections栏中显示的是两个被选择的配对变量名时,鼠标单击向左的箭壮举按钮,将配对变量送入PairedVariables矩形框中。在该矩形框中配对变量名处于同一行,中间有“—”连接。

可以使用上述方法指定多个配对变量。以上操作是使用系统默认参数进行配对样本t检验的基本操作。单击OK按钮就可以提交运行了。

4、配对样本t检验的选择项配对样本t检验使用系统默认值就可以得到比较满意的结果。配对样本t检验实例

现以某药品对糖尿病病人降低血糖的治疗效果数据为例。60个糖尿病患者在施以某药品后,在一个月内前后2次测定降低的血糖量,以判断该药品对降低血糖是否有效(数据data-8-3)。这是一个自身配对样本的t检验问题。解决问题的步骤如下:首先建立无效假设H0:该药品对糖尿病血糖的降低无疗效。

1、建立或打开数据文件

2、按Statistics→CompareMeans→Paired-SamplesTTest顺序,展开Pair-SampleTTest配对样本t检验的主对话框。

3、指定配对变量配对变量为2次血糖降低量即t1和t2。在主对话框左面的变量表中,单击t1变量,出现在主对话框左下部的CurrentSelections当前所选择的变量栏中Variable1提示项后面。再用鼠标单击t2变量,该变量名反向显示并出现在CurrentSelections当前所选择的变量栏中Variable2提示项后面,鼠标单击向右的箭头按钮,将配对变量送入PairedVariables矩形框中。单击Continue按钮,确认并返回主对话框,提交运行。4、运行结果分析①样本分析:因为均值是t1—t2=0.2,且前一组的标准差偏大,所以表明第一次的成效稍大于第二组的平均成效。②推论总体的假设检验:

H0:两个总体的均值差与0没有差别;

H1:两个总体的均值差与0有显著差别。因为sig.=0.810,所以拒绝H1,接受H0。结论:表明样本中患者的两次降低血糖的效果相差不显著。第五节:单因素方差分析

单因素方差分析也称为一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义,并可以进行两两组间均值的比较,称为组间均值的多重比较,还可以对该因素的若干水平分组中哪些均值间不具有显著性差异进行分析。

要求自变量是定类变量,因变量是定居以上变量。

例如:用四种减肥方法考察减肥的效果,共19被试对象分为4组,每组用一种方法(方法1:吃减肥药,方法2:体育锻炼,方法3:节食,方法4:抽脂)。2个月之再后称重。比较四种方法的减肥效果有无不同。(data-8-4)

操作方法与步骤

(1)在数据窗中建立数据文件,定义两个变量,并输入数据,这两个变量如下:①a1变量,分别代表A、B、C、D四种减肥方法。②a2变量,数值型,取值为体重减少数。

(2)按Analyze—CompareMeans—One-WayANOVA顺序击菜单,展开One-WayANOVA主对话框。(3)根据分析要求指定方差分析的因变量和因素变量。①选定a2变量进入DependentList框中,定义体重减少数为因变量。②选定a1变量进入Factor框中,定义减肥方法为因素变量。(4)单因素方差分析的选择项

①进行对照比较的选择项指定各组均值的系数具体的操作步骤为:在Coefficients框中输入一个系数,单击Add按钮,Coefficients框中的系数进入下面的方框中。重复上述操作,依次输入各组均值的系数,在方形显示框中形成一列数值。因素变量有几个水平(分为几组),就输入几个系数,多出的无异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论