




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS统计软件使用指导1 SPSS简介SPSS是:Statistical Program for Social Sciences,即社会科学统计程序。1.1 SPSS的基本功能1SPSS的数据编辑功能利用SPSS的数据编辑器窗口,可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等一般性操作,还可以对数据文件中的数据进行顺序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。可以根据需要把将要分析的变量集中到一个集合中,打开时指定打开该集合,而不必打开整个数据文件。2表格的生成和编辑利用SPSS可以生成数十种风格的表格,利用编辑窗口或监视器可以编辑所要生成的表格。在SPSS的高级版本中,统计成果多被归纳为表格或图形的形式。3图形的生成和编辑利用SPSS可以生成数十种基本图形和交互式图形。其中基本图形包括条形图、线形图、面积图、圆饼图、高低图、帕雷托图、控制图、箱形图、误差条形图、散点图、直方图、ROC曲线图、P-P概率图、QQ图、序列图和时间序列图等。交互式图形比基本图形更漂亮,可有不同风格的2D、3D图形。交互式图形包括条形交互作用图、点形交互作用图、线形交互作用图、带形交互作用图、圆形交互作用图、箱形交互作用图、误差条形交互作用图、直方交互作用图和散点交互作用图等。4SPSS的统计功能(1) 摘要性分析 摘要性分析是对原始数据进行描述性分析,是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。SPSS统计软件通过调用摘要性分析,可完成均数、标准差、标准误差等指标的计算,对于计数和一些等级资料,可完成构成比率等指标的计算和检验。SPSS的摘要性分析包括以下几个过程:1) Frequencies(频数)过程 调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。2) Descriptives(描述)过程 调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存人数据库。3) Explore(探索)过程 调用此过程可对变量进行更为深入详尽的描述性统计分析,即探索性统计。它是在一般描述性统计指标的基础上,增加有关数据其他特征文字与图形描述,有助于思考对数据进行分析的方案。(2)平均水平的比较 在正态或近似正态分布的计量资料中,经常在使用前面介绍的摘要性分析后,还要进行组与组之间平均水平的比较,也就是要进行常用的t检验和单因素方差分析。在SPSS统计软件中实现这一功能可调用以下几个过程:1) Means(平均数)过程 与摘要性分析中的Descriptives(描述)过程相比,若仅仅计算单一组别的均数和标准差,Means(平均数)过程并无特别之处;但在指定条件分组计算均数和标准差时,如分性别同时分年龄计算各组的均数和标准差,则用Means(平均数)过程更显简单快捷。2) One-Samples T Test(单一样本T检验)过程 调用此过程可完成样本均值与总体均值的比较。3) Indendent-Samples T Test(双样本T检验)过程 调用此过程可完成两样本均数差别的显著性检验,即两组资料的t检验。4) Paired-Samples T Test(配对样本T检验)过程 调用此过程可完成配对资料的显著性检验,即配对t检验。用于同对或同一研究对象分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比较。5) One-Way-ANOVA(单因素方差分析)过程 调用本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。(3)方差分析 方差分析主要用于:1)均数差别的显著性检验。2)分离各有关因素并估计其对总变异的作用。3)分析因素间的交互作用;方差齐性检验。SPSS软件除上面介绍的One-Way-ANOVA(单因素方差分析)过程外,可调用以下过程:Simple Factorial(单一因素)过程、General Factorial(综合因素)过程、Multivariate(多变量)过程等实现方差分析的功能。(4)相关分析 相关分析是判定变量间相互依存关系的统计方法,借助于Statistics(统计)菜单的Correlate(相关)选项完成的。包括Bivariate(两个变量之间相关分析)过程、Partial(偏相关分析)过程、Distances(距离相关分析)过程。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来。(5)回归分析 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。用于说明这种依存变化的数学关系。SPSS软件通过Linear(线性回归)过程、Curve Estimation(曲线估计)过程、Binary Logistic(二值逻辑回归)过程、Probit(概率回归)过程、Nonlinear(非线性回归)过程等实现回归分析功能。(6)对数线性模型 对数线性模型是用于离散型数据或整理成列联表格式的统计资料的统计分析工具。SPSS软件通过General(一般对数线性分析)过程、Logit(分对数线性分析)、Model Selection(选择模型的对数线性分析)过程实现这一功能。(7)分类分析 分类分析方法主要是聚类分析与判别分析。通过Twostep Cluster(两步聚类)过程、KMeans Cluster(快速聚类)过程、Hierarchical Cluster(分层聚类)和Tree(树状分析)过程、Discriminant(判别分析)过程实现。(8)因子分析 多元分析处理的是多指标的问题,由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又会让人陷入混乱不清的状态。在实际工作中,由于指标间经常具备一定的相关性,所以希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。调用Data Reduction(数据缩减)菜单的Factor(因子分析)命令,可对多指标或多因素资料进行因子分析。(9)可靠性分析 可通过调用Reliability(信度)过程完成。(10)非参数检验 许多统计分析方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐。这些方法常用来估计或检验总体参数,但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统计。通过调用Chi-Square(卡方检验)过程、Binomial(二项分布检验)过程、Runs(游程检验)过程、1-Sample K-S过程(单样本K-S检验)、2 1ndependent Samples(两独立样本非参数检验)过程、k lndependent Samples(多独立样本非参数检验)过程、2 Related Samples(两配对样本非参数检验)过程、K Related Samples(多配对样本非参数检验)过程,可实现非参数检验功能。1.2 SPSS的数据处理1SPSS录入数据(1)将数据录入成SPSS的数据文件。SPSS也可以读入其他格式的数据文件。(2)对数据文件进行必要的编辑。(3)利用SPSS的统计功能对编辑好的数据文件进行统计处理。(4)调整SPSS输出的统计结果(包括报表、图形和文本等)。(5)将结果输出、存盘、打印等。例12-1 某高校一次运动会上大一到大三年级学生铁饼标枪成绩(如表12-1所示),现将数据文件进行统计处理。表12-1 某高校一次运动会上大一到大三年级学生铁饼标枪成绩编号姓名性别年级铁饼(米)标枪(米)1周虎男大一83402许建男大一74523王红男大一95504王费女大一63165张华女大一86256章华女大一71347叶飞男大二74508许结男大二96399王蓬男大二1004910果雨女大二551911王莉女大二752312杨微女大二642713孙平男大二113314刘放男大二103015张义男大三894016何龙女大三722417陈真女大三721718霍达女大三69202操作步骤打开SPSS的数据编辑器。通常我们先要定义变量的属性,然后再输入数据。在数据编辑窗口的左下端,有两个页标签:Date View(数据视图)、Variable View(变量视图)。我们可以通过鼠标单击方便地在两个窗口之间切换。在录入数据之前,应该对数据的统计处理有一个基本的框架:计算哪些变量、做何种统计、生成哪种统计图等。在本例中,只做一般性的描述性统计处理,即求各年级男女选手的成绩平均值、标准差、最大值、最小值等。首先单击Variable View(变量视图)页按钮,进入图中所示的变量属性窗口。可以像输入数据一样定义一些变量的属性,如变量名、变量的长度、变量标签、变量的缺失值等。对于某些变量属性还会弹出对象框,可以进行进一步的定义工作。然后按照表12-1的结构输入数据即可(如图12-4所示)。图12-4 某高校一次运动会上大一到大三年级学生铁饼标枪成绩2描述性统计SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法,可以对要分析数据的总体特征有比较准确的把握,从而可以选择其他更为深入的统计分析方法。本节内容主要包括频数分析、描述性分析、探索分析、基本统计报表制作。我们主要讲述了如何在SPSS中进行的频数分析、描述性分析和基本统计报表制作等操作。2.1频数分析1频数分析的基本原理频数分析(Frequencies)过程是描述性统计分析中最常用的方法之一,它不仅可以产生详细的频数分析表,还可以按要求给出平均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差、四分位数、十分位数、百分位数。频数分析中涉及到的有关描述性统计量的理论知识,在本书前几章中已经进行了详细的论述,现只对Kurtosis (峰度)和Skewness(偏度)作以解释。峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同,峰度大于0表示比正态分布高峰更加陡峭,为尖顶峰。峰度小于0表示比正态分布的高峰要平坦,为平顶峰。峰度的计算公式如下: (12-1)偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。具体的计算公式如下: (12-2)这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度X相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边:偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。2SPSS实现过程例12-2 某公司20名员工的收入中的“基本工资”变量为例,求“基本工资”的均值、中位数、众数、全距、方差、标准差、频数、峰度、偏度、最小值、最大值、平均标准误差(如表12-2所示)。表12-2 某公司20名员工的收入姓名性别基本工资奖金分红A男50001500800B男48001300500C男37001300500D男19801000400E男46901300500G男31501000800H男16801000500I男48001300500J男37601000400K男34781000400L女48001300500M女20801000800N女24401000500O女39801300500P女24881000400R女40421500500S女28801000500T女37401200600(1)单击Analyze(分析)菜单Descriptive Statistics(描述统计)项中的Frequencies(频数)命令(如图12-5、12-6、12-7所示)。图12-5图12-6图12-7(2)弹出Frequencies(频数)对话框。在对话框左侧的变量列表中选择“基本工资”,点击“”按钮使之添加到Variable(s)(变量)框中。(3)单击下方的Statistics(统计)按钮,弹出Frequencies(频数):Statistics(统计)对话框。选择要统计的项目,Mean(均值)、Median(中位数)、Mode(众数)、Sum(合计)、Stddeviation(标准差)、Variance(方差)、Range(全距)、Minimum(最小值)、Maximum(最大值)、StdError of Mean(平均标准误差) 、Skewness(偏度)、Kurtosis(峰度)。选中对话框下方的Display frequency tables(频数分布表)复选框,表示显示频数分布表。选好后单击Continue(继续)按钮返回Frequencies(频数)对话框,单击OK按钮,SPSS即开始计算(如图12-8所示)。图12-8(4)结果解读(如图12-9所示)图12-9从结果中可以看出,此公司20名职工的基本工资Mean(均值)3337.90元、StdError of Mean(平均标准误差) 262.42174、Median(中位数)358900元、Mode(众数)4800.00元、Stddeviation(标准差)1173.586元、Variance(方差)1377303元、Skewness(偏度)-0.116元、StdError of Skewness(偏度标准误差) 0.512元、Kurtosis(峰度)-1.369元、StdError of Kurtosis (峰度标准误差) 0.992元、Range(全距)3460元、Minimum(最小值) 1540元、Maximum(最大值) 5000元、Sum(合计)66758元。3求Quartiles (四分位数)、Deciles (十分位数) 和Percentiles (百分位数)(1)Quartiles (四分位数)基本原理 四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差记为Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。(2)Deciles (十分位数) 基本原理 十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为Dl,D2,D9,表示10的数据落在Dl下,20的数据落在D2下,90落在D9下。(3)Deciles (百分位数) 基本原理 百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,P99,表示1的数据落在P1下,2的数据落在P2下,99落在P99下。现利用SPSS求四分位数、十分位数和百分位数。以某公司20名员工的收入资料为例,求“基本工资”的四分位数、“奖金”的十分位数和“分红”的百分位数。(4)SPSS实现过程1)同求均值的操作步骤(1)。2)同求均值的操作步骤(2)。3)单击下方的Statistics(统计)按钮,弹出 Frequencies(频数): Statistics(统计)对话框,选择要统计的项目:Quartiles复选框:四分位数,输出25%,50%,75%的分位数值;Cut points for n equal groups复选框:十分位数。将数据按大小顺序排序后,平均分成n等份,输出相应数据。如果选择此项,要求在右侧的编辑框输入一个整数数字。若输入数字n=10,即平均分成10等份;Percentile(s) 复选框:是自定义百分位数。依次键入一系列按大小排列的整数,键入值通过左侧的Add(增加)、Change(更改)、Remove(移除)按钮进行编辑。也可以自定义百分位数,若键入35,可求出在35%状态下的分红值。(5)结果解读1)求“基本工资”的四分位数(如图12-10、12-11所示)图12-10图12-11从结果中可以看出,此公司员工基本工资的第一四分位差Q1=2170.00元,第二四分位差Q2=3589.00元,第三四分位差Q3=4528.00元,Q=1176.5元。2)求“奖金”的十分位数(如图12-12、12-13所示)图12-12图12-13从结果中可以看出,此公司员工奖金的DlD5=1000元,D6=1260元,D7、D8=1300元,D9=1480元。3)求“分红”的百分位数(如图12-14、12-15、12-16、12-17所示)图12-14图12-15从结果中可以看出,此公司员工分红的百分位数是P1P30=400元,P30P40=430元,P40P70=500元,P70P80=580元,P80P100=800元。若自定义百分位数是35,求出的在P35状态下的分红值为500元。图12-16图12-172.2描述性分析1描述性分析的基本原理描述性统计分析过程就是计算并列出一系列描述性统计量指标。这与前面讲的频数分析过程相同,但它可以将原始数据转换成标准化值,并以变量的形式存入数据库,供进一步分析。将原数据变量X转化成新的标准化值变量Z。我们称为Z分数。Z分数定义:从平均数为,标准差为的总体中抽出一个变量值X,Z分数表示的是此变量大于或小于平均数几个标准差。计算公式: 将原始数据直接转换为Z分数时,常会出现负数和带小数点的值,实际使用起来很不方便。因此,可以对Z分数进一步加以线性转换,使之成为正的数值。最典型的一种Z分数线性转换就是T分数。计算公式: 2SPSS的实现过程现利用SPSS以表12-2“基本工资”变量为例,求它的Z分数。步骤如下:(1)单击Analyze(分析)菜单Descriptive Statistics(描述统计)项中的Descriptives(描述)命令。(如图12-18所示)图12-18(2)弹出Descriptives(描述)对话框。在对话框左侧的变量列表中选择“基本工资”,单击“”按钮使之添加Variable(s)(变量)框中,同时选中对话框左下方的Save standardized values as variables(把标准化后的值保存为变量)项。(3)单击右下方的Options(选项)按钮,出现Descriptives(描述):Options(选项)对话框,在此选择Mean(均值)、Std deviation(标准差)、Variance(方差)、3项统计量。(如图12-19所示) 图12-19选好后单击Continue(继续)按钮返回Frequencies(频数)对话框,单击OK按钮,SPSS即开始计算。3结果解读在数据编辑窗口中。新变量“Z基本工资”表示“基本工资”Z分数。(如图12-20、12-21所示)图12-20图12-214Z分数转换为T分数由于Z分数有正有负,而且小数点位数较多,因此可以把它通过线性转换为T分数。在SPSS中的转换步骤:(1)在Transform(转换)菜单中选择Compute(计算)(如图12-22所示)图12-22(2)在弹出的Compute Variable(计算变量)对话框中,在Target Variable(目标变量)文本框中输入目标变量t,接着在Numeric Expression(数值表达)文本框中输入“10Z基本工资+50”。单击Type & Label(类型和标签)按钮,出现Compute Variable:Type and Label(类型和标签)对话框。在Type and Label(类型和标签)对话框中的Label(标签)框中输入“T分数”,作为变量t的中文注解(如图12-23所示)。 图12-23(3)单击Continue(继续) 按钮,返回。单击OK按钮,SPSS立即算出学生数学成绩Z分数的线性转换后的T分数(如图12-24所示)。图12-24结果数据编辑窗口中新产生变量“t”来储存这些员工基本工资的T分数。3均值比较和T检验3.1 Means(均值)过程1Means(均值)的基本原理SPSS中的Means(均值)过程是计算各种基本描述统计量的过程。与前一节中的计算某一样本总体均值相比较,Means(均值)过程其实就是对样本进行分组计算均值和标准差,如按照性别计算各组的均值和标准差。可以指定一个或多个变量作为分组变量。如果分组变量为多个,还应指定这些分组变量之间的层次关系。层次关系可以是同层次的或多层次的。同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按第一分组变量分组,然后对各个分组下的个案按照第二组分组变量进行分组。2SPSS实现过程例12-6 以例12-2中的数据为例,比较不同性别员工的基本工资的平均值和方差。(1)在Analyze(分析)菜单Compare Means(均值比较)项中选择Means(平均值)命令(如图12-42所示)。图12-42(2)弹出Means(均值)对话框。在对话框左侧的变量列表中选择“基本工资”,单击“”按钮使之进入Dependent List(因变量列)框中,选择“性别”,单击“”按钮使之添加到Independent List(自变量列)框中。Indenpent List(自变量列)框中可以有多个变量,表示分组的多个层次,可以通过单击“Next”按钮来实现。(3)单击右下角的Options(选项)按钮,弹出Means Options(平均值选项):对话框,可以选择要统计的项目。在Cell Statistics(单元格统计量)项中,可选Mean(平均数)、Number of Cases(观察单位数)、Standard Deviation(标准差)、Variance(方差)。在Statistics for First Layer(第一层统计量)项中,如果选中Anova table and eta(方差分析表和eta)项,是对第一层次的分组计算方差分析(即单因素方差分析,通过方差分析的结果,可以看出第一层次的分组是否在观察值上有均值显著差异)。如果选中Test of linearity(线性检验)即进行第一层次的线性检验(如图12-43所示)。图12-43(4)选好后单击Continue(继续)按钮返回Means(均值)对话框,单击OK按钮,SPSS即开始计算得到结果2结果解读Means(均值)过程的结果输出比较简单,在结果输出窗口中包含两个输出表(如图12-44所示)。图12-44(1)处理样本数统计,如图所示。其中Included(包含)栏表示参加分析计算的样本数,从表中可知全部样本共有20个参加分析,占到全部样本的100,即分析计算中没有因数据缺测或其他原因等导致Excluded(样本剔除)。(2)变量分组统计结果,如图所示。可以看出,该单位职员男性11人,平均工资为350709,标准差为129385;女性9人,平均工资为313111,标准差为104454。结果表明该单位不同性别的工资有很大差异,男性比女性工资明显要高。3.2单一样本t检验1单一样本T检验基本原理SPSS单一样本t检验是用于解决样本均值与总体均值的比较这类问题,统计的前提是样本总体服从正态分布。也就是说单一样本本身无法比较,进行的是样本均值与已知总体均值间的比较。2SPSS实现步骤:例12-7 某地区10年前进行人口普查时,16岁女孩平均身高为159m。现在抽查测量了该地区40个16岁女孩的身高如表12-3所示。通过本例得出该地区现在女孩的身高与10年前相比是否有显著差异。表12-3 某地区女孩的身高测量结果编号身高(M)编号身高(M)编号身高(M)编号身高(M)11551115621153311652165121622217032163317413155231523315341621416924161341575165151652516335156617216167261683617371631716427169371698168181572815338164915519152291633916010152201573017040169(1)在Anflyze(分析)菜单Compare Means(均值比较)项中选择one-sample T test(单一样本T检验)命令(如图12-45所示)。图12-45(2)选择菜单后,出现One-Sample T Test(单一样本T检验)对话框。将10年前人口普查时,16岁女孩平均身高的159m填入Test Value(检验值)框,将要检验的变量“身高”从左边框中添加到Test Variable(变量检验)框中。(3)单击Options(选项)按钮,出现One-Sample T Test(单一样本T检验):Options(选项)对话框。该对话框用来指定输出内容和设置默认值的。1) Confidence Interval(信赖区间):表示差值置信区间,默认为95。2) Missing Values(缺失值)框中,Exclude cases analysis by analysis(排除分析中有缺失值的观测量)表示当分析计算涉及到含有缺失值的变量时,去掉在该变量上是缺失值的个案;Exclude cases listwise(排除因变量或自变量有缺失值的观测量)表示,去除所有含缺失值的个案后再进行分析(如图12-46所示)。图12-46(4)单击Continue(继续)按钮,返回到One-Sample T Test(单一样本T检验)对话框,单击OK按钮,SPSS即完成所需要的计算(如图12-47所示)。图12-473结果解读One-SamplesTTest(单一样本T检验)过程的输出比较简单,在结果输出窗口中包含描述性统计表和T检验表两个输出表。(1)输出结果第一个表,基本描述性统计量表,从表中可知,参与分析的样品数为40,平均身高16215m,标准差006554,均值误差001036。 (2)输出结果第二个表,单一样本T检验表,从表中可知,自由度df=39,根据公式计算的t值等于3040,对应的临界置信水平为004,95的置信区间为(00105,00525)。计算的t值对应的临界置信水平远远小于设置的005,因此拒绝原假设Ho,表明该地区现在16岁女孩的平均身高与10年前相比,存在显著差异。3.3双样本t检验 1双样本t检验基本原理 SPSS中的双样本t检验是用于进行两个独立样本均值的比较,所谓独立样本是指两个样本之间没有任何关联,两个独立样本各自接受相同的测量。假设两样本的样品个数分别为n1、n2,检验两样本均值是否相等的检验。2SPSS实现过程例12-8 某项化工试验,要考虑温度对产品断裂力的影响。在与两种不同温度下,分别做8次试验,结果(如表12-4所示)。表12-4 单位:千克力70 0C20518819820921519521021280 0C182208205193195206207196由经验知道,断裂力服从正态分布,并且在两种温度下,断裂力有相同的方差。问在各两种温度下,产品的断裂力是否相同。(1)在Anflyze(分析)菜单Compare Means(均值比较)项中选择Independent-Samples T Test(独立样本T检验)命令(如图12-48所示)。图12-48在弹出的Independent-Samples T Test(独立样本T检验)对话框中从左侧的变量列表中选择“断裂力”,并添加到Test Variable(s) (检验变量)框中;选择“类型”,添加到Grouping Variable(组变量)框中。(2)单击Defree Groups(定义组)按钮,弹出Define Groups(定义组)对话框,在该对话框中指定标识变量的区分方法。选择Use specified values(使用指定数值)选项,表示根据标识变量的取值进行区分。在Groupl(组1)中输入1,在Group2(组2)中输入2(如图12-49所示)。图12-49(3)单击Continue(继续)按钮,返回Independent-Samples T Test(独立样本T检验)对话框,单击OK按钮即完成分析。3结果解读Independent-Samples T Test(独立样本T检验)的输出比较简单,在结果输出窗口中包含描述性统计表和T检验表两个输出结果表(如图12-50所示)。图12-501描述性统计表。给出了一些基本描述性统计量。由输出结果可以看出,两个温度8个化工产品的断裂力平均值分别为204和199,标准差分别为9.411和9.103,均值误差分别为3.327和3.218。2T检验表。显示了双样本T检验结果。本例中F=0.013,F的相伴概率为0.911,大于显著性水平0.05,接受方差相等的假设,可以认为两个化工产品的断裂力方差无显著差异。然后看方差相等时T检验的结果,也就是第一行Equal variances assumed(方差相等)的T检验结果。T统计量的相伴概率为0.298大于显著性水平0.05,接受T检验的零假设,也就是说,两个温度16个化工产品的断裂力平均值不存在显著差异。另外,从两个样本的均值差的95置信区间看,区间跨0,这也说明两个温度化工产品的断裂力平均值无显著差异。4方差分析1方差分析的基本原理方差分析是将K个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值。通过计算这些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等。所以方差分析实质上用于两个及两个以上样本均数差别的显著性检验。由于受不同因素的影响,研究所得的数据会不同。造成结果差异的原因可分成两类:一类是人为很难控制的影响因素或不可控的影响因素,称为随机变量;另类是研究中人为施加的可控因素对结果的影响,称为控制变量。根据控制变量的个数,可以将方差分析分成单因素方差分析和多因素方差分析。单因素方差分析的控制变量只有一个,多因素方差分析的控制变量有多个。2SPSS实现过程:例12-9 为了考察化工生产中温度对某种化工产品的收率(%)的影响。现选择了五种不同的温度。在同一温度下各做四次试验,问反应温度对产品收率有无显著影响?试验结果(如表12-5所示)。表12-5 产品收率试验结果表 试验号温度1 2 3 4平均收率12345550 580 574 571544 568 524 560540 541 543 540564 570 566 570561 570 561 54056885490541056755580(1)在Analyze(分析)菜单Compare Mgeans(均值比较)中选择One-Way ANOVA(一维方差分析)(如图12-51所示)。图12-51(2)在弹出的One-Way ANOVA(一维方差分析)对话框中,从左侧的变量列表中选择“产品收率”,使之添加到Dependent List(因变量列)框中,选择“温度序号”,使之添加到 Factor(因子)框中。(3)对组间平方和进行线性分解并检验。单击Contrasts(对比)按钮,打开One-Way ANOVA:Contrasts(一维方差分析:对比)对话框。本例忽略此项设置。1) Polynomial(多项)复选框:是否对组间平方和进行分解,并进行结果检验。2) Degree(度)下拉框:与Polynomial(多项)复选钮,配合使用,可选择从线性趋势一直到最高五次方曲线来进行检验。3) Coefficients(系数)编辑框:定义精确两两比较的选项。这里按照分组变量升序给每组一个系数值,注意最终所有系数值相加应为0。如果不为0仍可检验,只不过结果是错的(如图12-52所示)。图12-524) 单击Continue(继续)按钮,返回One-Way ANOVA (一维方差分析)对话框。(4)选择进行各组间两两比较时。单击PostHoc(两两比较)按钮,弹出One-Way ANOVA:Post Hoc Muitiple Comparisons(一维方差分析:多重对比)对话框。1) Equar Variances Assumed(假定方差相等)复选框组:当各组方差齐时可用的两两比较方法,共有14种,其中最常用的为LSD 和 S-N-K 法。本例选择LSD法进行两两比较。2) Equar Variances Not Assumed(假定方差不相等)复选框组:一组当各组方差不齐时可用的两两比较方法,共有4种,其中以Dunnettss C法较常用。3) Significance Level(显著性水平)编辑框:定义两两比较时的显著性水平,默认为0.05(如图12-53所示)。图12-534) 单击Continue(继续)按钮,返回One-WayANOVA(一维方差分析)对话框。(5)定义相关统计选项以及缺失值处理方法。单击Options(选项)按钮,弹出One-Way ANOVA:Options (一维方差分析:选项)对话框。1) Statistics(统计)复选框组:选择一些附加的统计分析项目。本例选择 Descriptive (描述)和Homogeneity of variance test (方差齐性检验)。2) Memls plot(平均数制图)复选框:用各组均数制图,以直观地了解它们的差异。本例选择此项。3) Missing Values(缺失值)单选框组:定义分析中对缺失值的处理方法。Excludes cases analysis by analysis(排除分析中有缺失值的观测量):表示具体分析中用到的变量有缺失值才去除该记录。Excludescases listwise(排除因变量或自变量有缺失值的观测量):表示只要相关变量有缺失值,则在所有分析中均将该记录去除。默认为前者(如图12-54所示)。图12-544) 单击Continue(继续)按钮,返回One-Way ANOVA (一维方差分析)对话框。(6)所有设置确认无误后,单击OK按钮,执行单因素方差分析,得到输出结果。3结果解读本例输出包括5个部分,它们分别是描述性统计表、方差齐次性检验、方差分析表、多重比较表和各组均值折线图。我们重点解读描述性统计表、方差分析表和各组均值折线图(如图12-55所示)。图12-55(1)输出结果文件中的第一个表格:描述性统计量表。从表中可知,输出的统计量包括各组样本均值、标准差、标准误、均值95置信区间、最小值和最大值,如各组参与分析的样本数都为4,总样本数为20。(2)输出结果文件中的第二个表格:方差分析表。从表中可知,总离差平方和为44.386,组间离差平方和为22.768,组内离差平方和为21.618,组间离差平方和中能被线性解释的部分为0.036,方差检验F=3.95,对应的相伴概率(Sig)为0.022,小于显著性水平0.05,因此认5组之中至少有一个组与另外一组差异显著。(3)输出结果图,各组均值折线图,可以看出温度2和温度3的均值相对较小。5相关分析5.1相关分析的原理及应用1相关分析的基本原理一般来说现象之间的相互关系可以分为两种,一种是函数关系,另一种是相关关系。函数关系是指变量之间存在的相互依存的关系,它们之间的关系值是确定的。相关关系是两个现象数值变化不完全确定的依存关系。两变量间的相关分析就是研究两变量间线性相关程度并用适当的统计指标表示出来的一种常用统计方法。按相关的程度分,有完全相关、不完全相关和不相关;按相关的性质分,有正相关和负相关。测定变量之间线性相关程度和相关方向的统计指标是相关系数,同时要对相关系数的显著性检验。2SPSS实现过程例12-10 为研究某种化肥对农作物产量的影响,选取了10块条件基本相同的地块进行试验得到施肥量与农作物的亩产量,试求农作物亩产量对施肥量的回归直线方程。数据(如表12-6所示)。表12-6地块编号12345678910施肥量245881011131415亩产量253294298360348366410401443437(1) 把“亩产量”设为因变量y,“施肥量”设为自变量x。在Analyze(分析)菜单中选择Correlate(相关分析)中的Bivariate(两个变量相关分析)命令。弹出Bivariate Correlations(两个变量相关)对话框(如图12-56所示)。图12-56(2) 选择进行相关分析的变量。现欲分析亩产量与施肥量的相关关系,故在Bivariate Correlations(两个变量相关)对话框左侧的变量列表中选“亩产量”和“施肥量”,使之进入Variables(变量)框。1) 设定相关系数的类型。Correlation Coefficient(相关系数)复选框组包含了3个复选框,对应3种相关系数的类型。 Pearson(皮尔逊)复选框:此项为默认设置。本例中的亩产量与施肥量两个变量为等距变量,其数据可进行加减运算,因此采用该设置,计算相关系数; Kendallstua-b(肯德尔)复选框:等级相关系数,是一个用反映分类变量一致性的指标,只能在两个变量均属于有序分类时使用; Spearman(斯皮尔曼)复选框:是最常用的无参数相关分析。2)确定双尾检验还是单尾检验。在Test of Significance(显著性检验)框中,选择单选钮Tow-tailed(双侧)表示选择双尾检验,选择单选钮One-tailed(单侧)表示选择单尾检验。默认设置将对相关显著性进行双尾检验,本例采用默认设置。3)是否突出显示相关是否显著。选择复选框Flag significant correlations(标识显著相关),在输出结果中将用“*”号标记有统计学意义的相关系数,P0.05的系数值旁会标记一个星号,PO.01的则标记两个星号。默认设置选中该项,本例采用默认设置。(3)指定输出内容和缺失值处理方法。单击Bivariate Correlations(两个变量相关)对话框中的Options(选项)按钮,弹出Bivariate Correlations Options(两个变量相关选项)对话框。1) Statistics(统计)复选框组:选择要输出的统计量。 Means and standard deviations(平均值和标准差);Cross-product deviations and covariances(产品交叉离差和协方差)复选框:输出各对变量的离均差平方和以及协方差阵。2) Missing Values(缺失值)单选框组:指定对缺失值的处理方法。本例采用默认设置。Excludes casespairwise(排除因变量和自变量均有缺失值观测量)单选钮:在分析过程中遇到缺失值时将缺失值排除在数据分析之外;Excludescaseslistwise
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 考研无水印资料群(3篇)
- 安全培训防烫伤考试题和及答案解析
- 2025年公务员考试公共基础知识试题库与答案
- 保姆岗位招聘笔试题与参考答案(某大型国企)2025年
- 2025年农学专业综合知识考试试卷及答案
- 2025年高校辅导员职业素质考试试卷及答案
- 2025年海洋能发电与海水淡化联合系统在海洋高科技产业中的应用前景报告
- 2025年海洋能发电项目政策法规环境分析报告
- 2025年海洋能发电设备市场前景分析与海岛生态保护路径报告
- 2025年溧水护士考试试题及答案
- T-SZEIA 001-2024 温室气体产品碳足迹量化方法与要求 变电站电气设备
- 2025年湖南省安全员-B证考试题库及答案
- 北师大版六年级下册数学全册同步分层作业设计含答案解析
- 简易钢结构雨棚施工承包合同范本
- 苏州市前期物业管理委托合同范本
- 2022年冀教版七年级上册数学第一次月考试卷
- 《气管支架临床应用》课件
- 导数的应用-函数的零点问题(5题型分类)-2025年高考数学一轮复习(解析版)
- 8·12天津滨海新区爆炸事故调查报告分析及反思
- 2024新指南:中国阿尔茨海默病早期预防指南解读课件
- 江苏省南京市联合体2024-2025学年八年级上学期期中考试语文试题含答案
评论
0/150
提交评论