SPSS统计分析- 第4章平均数差异检验_第1页
SPSS统计分析- 第4章平均数差异检验_第2页
SPSS统计分析- 第4章平均数差异检验_第3页
SPSS统计分析- 第4章平均数差异检验_第4页
SPSS统计分析- 第4章平均数差异检验_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、LOGO第第4章章 平均数差异检验平均数差异检验. 重点班的学生和一般学生的平均智商是否有差异呢?要解重点班的学生和一般学生的平均智商是否有差异呢?要解决这个问题就可以运用本章将要介绍的平均数差异检验的决这个问题就可以运用本章将要介绍的平均数差异检验的方法。方法。.4.1 4.1 假设检验原理假设检验原理 假设检验(假设检验(hypothesis testinghypothesis testing)是推论统计中的重要内)是推论统计中的重要内容,是指先提出一个假设,一般是对总体参数或总体分布容,是指先提出一个假设,一般是对总体参数或总体分布形态的假设,然后通过检验样本统计量的差异来推断总体形态的

2、假设,然后通过检验样本统计量的差异来推断总体参数之间是不是存在差异。因为在现实调查研究中,往往参数之间是不是存在差异。因为在现实调查研究中,往往由于各种限制而无法得到总体的参数。由于各种限制而无法得到总体的参数。 例如要调查汉族和蒙古族例如要调查汉族和蒙古族7 7岁儿童的运算能力是否存在差岁儿童的运算能力是否存在差异,不可能对所有的汉族和蒙古族异,不可能对所有的汉族和蒙古族7 7岁儿童进行测试,只岁儿童进行测试,只能通过合理的抽样,然后对样本进行调查。这样得到的参能通过合理的抽样,然后对样本进行调查。这样得到的参数就是样本参数,通过对样本的参数进行检验从而推测汉数就是样本参数,通过对样本的参数

3、进行检验从而推测汉族族7 7岁儿童总体和蒙古族岁儿童总体和蒙古族7 7岁儿童总体在运算能力上是否有岁儿童总体在运算能力上是否有差异。差异。.4.1.1 4.1.1 假设与假设检验假设与假设检验 在统计学中,假设一般用来指对总体参数所做的假定性说在统计学中,假设一般用来指对总体参数所做的假定性说明。明。 在统计学上有两种假设,一种称为虚无假设(在统计学上有两种假设,一种称为虚无假设(null null hypothesishypothesis),或叫做零假设,记为),或叫做零假设,记为H H0 0;一种称为备择假;一种称为备择假设(设(alternative hypothesisalternat

4、ive hypothesis),或叫做对立假设,记为),或叫做对立假设,记为H H1 1。H H1 1是研究者提出的研究假设。是研究者提出的研究假设。. 在统计学上,只能对虚无假设在统计学上,只能对虚无假设H H0 0进行直接的检验。假设检进行直接的检验。假设检验的任务就是先假设验的任务就是先假设H H0 0是真的,然后以此为前提,如果有是真的,然后以此为前提,如果有不合理的现象出现则说明假设是错误的,即不合理的现象出现则说明假设是错误的,即H H0 0为真这一假为真这一假设是不成立的,要被拒绝。如果设是不成立的,要被拒绝。如果H H0 0为假,就要拒绝为假,就要拒绝H H0 0并接并接受受H

5、 H1 1,则研究者的假设成立;如果,则研究者的假设成立;如果H H0 0 为真,就要接受为真,就要接受H H0 0并并拒绝拒绝H H1 1,则研究者的假设不能成立。这就是统计学上的,则研究者的假设不能成立。这就是统计学上的“反证法反证法”。H H1 1称为备择假设就是指其是预备当称为备择假设就是指其是预备当H H0 0被拒绝时被拒绝时以供选择的。虚无假设和备择假设互相排斥并且只有一个以供选择的。虚无假设和备择假设互相排斥并且只有一个正确,因此正确,因此H H1 1又称为对立假设。又称为对立假设。.4.1.2 4.1.2 假设检验中的小概率事件假设检验中的小概率事件 小概率事件就是指一个发生概

6、率接近零的事件,也就是一小概率事件就是指一个发生概率接近零的事件,也就是一般情况下不会发生的事件。般情况下不会发生的事件。.4.1.3 4.1.3 假设检验的两类错误假设检验的两类错误 虽然小概率事件发生的可能性很小,但仍有发生的可能。虽然小概率事件发生的可能性很小,但仍有发生的可能。 若设定临界概率为若设定临界概率为0.050.05,从某一平均数为,从某一平均数为0 0的总体中抽的总体中抽取任一样本,样本平均数为。当没有落入总体分布两端取任一样本,样本平均数为。当没有落入总体分布两端5%5%概率的范围内,如图阴影部分所示。概率的范围内,如图阴影部分所示。. 然而,即使概率再小(如然而,即使概

7、率再小(如=0.01=0.01)、临界区域的面积再小,任)、临界区域的面积再小,任意抽取的仍有意抽取的仍有1%1%的概率落入临界区域,即这种小概率事件的发的概率落入临界区域,即这种小概率事件的发生仍有生仍有1%1%的可能性是合理的。这时的可能性是合理的。这时H H0 0是真的,然而依据假设检是真的,然而依据假设检验的统计逻辑却要拒绝验的统计逻辑却要拒绝H H0 0,这样就犯错误了。统计学中将这类,这样就犯错误了。统计学中将这类不该拒绝不该拒绝H H0 0却拒绝了却拒绝了H H0 0的错误称为的错误称为型错误(型错误(typeerrortypeerror), ,因因为常用为常用表示概率,所以又常

8、称为表示概率,所以又常称为型错误。这种错误往往导型错误。这种错误往往导致虚假的科学发现。致虚假的科学发现。 如图所示,是如图所示,是H H0 0为真时和为真时和H H1 1为真时的分布,两个分布是有重合的为真时的分布,两个分布是有重合的。 在这个阴影部分中既有可能是在这个阴影部分中既有可能是H H0 0为真也有可能为真也有可能H H1 1为真。但是我们为真。但是我们拒绝了拒绝了H H1 1为真的可能性,这就可能又犯错误了。统计学中将这为真的可能性,这就可能又犯错误了。统计学中将这类不该拒绝类不该拒绝H H1 1却拒绝了却拒绝了H H1 1的错误称为的错误称为型错误(型错误(type error

9、type error), ,这类错误的概率用这类错误的概率用表示,所以又称表示,所以又称型错误,这类错误往型错误,这类错误往往导致科学发现被埋没。往导致科学发现被埋没。.4.1.4 4.1.4 单侧检验和双侧检验单侧检验和双侧检验 根据是否强调检验的方向性,将检验分为单侧检验和双侧根据是否强调检验的方向性,将检验分为单侧检验和双侧检验。双侧检验只关心两个总体参数之间是否有差异,而检验。双侧检验只关心两个总体参数之间是否有差异,而不关心谁大谁小。不关心谁大谁小。.4.1.5 4.1.5 假设检验的步骤假设检验的步骤 假设检验一般包括以下五个步骤:假设检验一般包括以下五个步骤: (1 1)根据研究

10、问题的要求提出假设,包括虚无假设)根据研究问题的要求提出假设,包括虚无假设H H0 0和和备择假设备择假设H H1 1。 (2 2)选择合适的检验统计量。)选择合适的检验统计量。 (3 3)根据需要选择显著性水平)根据需要选择显著性水平。 (4 4)计算出检验统计量。)计算出检验统计量。 (5 5)根据检验统计量做出统计决策。)根据检验统计量做出统计决策。.4.2 4.2 均值比较均值比较 介绍了一定的假设检验的统计学知识,下面将具体讲解在介绍了一定的假设检验的统计学知识,下面将具体讲解在SPSS18.0SPSS18.0中如何利用假设检验的思想对平均数的差异进行中如何利用假设检验的思想对平均数

11、的差异进行检验。在检验。在SPSS18.0SPSS18.0中,是由中,是由“分析分析”|“|“比较均值比较均值”下的下的子菜单完成各种情况下的平均数差异检验的。先从最基本子菜单完成各种情况下的平均数差异检验的。先从最基本的的“均值过程均值过程”进行介绍。进行介绍。.4.2.1 4.2.1 均值比较的主要功能均值比较的主要功能 均值过程和前面的描述统计过程一样,可以对指定变量的均值过程和前面的描述统计过程一样,可以对指定变量的描述性统计变量进行呈现。描述性统计变量进行呈现。.4.2.2 4.2.2 均值比较的适用条件均值比较的适用条件 均值过程主要功能是统计变量的描述和不同组之间粗略的均值过程主

12、要功能是统计变量的描述和不同组之间粗略的比较,因此对数据没有什么要求。需要注意的是用来形成比较,因此对数据没有什么要求。需要注意的是用来形成分组的变量应该是能明确表明某种特征的变量。另外均值分组的变量应该是能明确表明某种特征的变量。另外均值过程中有一个对数据进行线性检验的功能,由过程中有一个对数据进行线性检验的功能,由“选项选项”对对话框中的话框中的“线性相关检验线性相关检验”功能实现,这要求在第一层的功能实现,这要求在第一层的控制变量要不少三个水平。控制变量要不少三个水平。.4.2.3 4.2.3 均值比较的操作过程均值比较的操作过程 在在SPSSSPSS中均值比较的操作过程如下:中均值比较

13、的操作过程如下: (1 1)打开或建立数据文件。)打开或建立数据文件。 (2 2)选择)选择“分析分析”|“|“比较均值比较均值”|“|“均值均值”命令,打开命令,打开“均值均值”主对话框,如图所示。主对话框,如图所示。. (3 3)选择因变量:对话框左面是源变量框,其中罗列了数据)选择因变量:对话框左面是源变量框,其中罗列了数据文件中已命名的变量,从中选择作为因变量的变量,单击上文件中已命名的变量,从中选择作为因变量的变量,单击上方的箭头按钮,该变量进入方的箭头按钮,该变量进入“因变量列表因变量列表”框。因变量可以框。因变量可以根据需要选择一个或多个变量。根据需要选择一个或多个变量。 (4

14、4)选择自变量:在源变量框中选择作为自变量的变量,即)选择自变量:在源变量框中选择作为自变量的变量,即分组变量。单击下面的箭头按钮,该变量进入分组变量。单击下面的箭头按钮,该变量进入“自变量列表自变量列表”框。首先选择的自变量默认为第一层控制变量,若单击框。首先选择的自变量默认为第一层控制变量,若单击“下一张下一张”按钮,可以再选择其他变量作为第二层控制变量。按钮,可以再选择其他变量作为第二层控制变量。 (5 5)选择描述性统计量:单击)选择描述性统计量:单击“选项选项”按钮,出现按钮,出现“选项选项”对话框,如图所示。对话框,如图所示。. (6 6)选择进行单因素方差分析或线性相关性检验:在

15、)选择进行单因素方差分析或线性相关性检验:在“选项选项”对话框的下方有两个复选按钮,分别是对话框的下方有两个复选按钮,分别是Anova Anova 表表 和和 etaeta、线性相关检验、线性相关检验, ,前者对第一层的自变量进行单因前者对第一层的自变量进行单因素方差分析和计算变量相关程度的素方差分析和计算变量相关程度的etaeta值;后者在第一层值;后者在第一层自变量有三个以上水平时对其进行线性相关性检验。自变量有三个以上水平时对其进行线性相关性检验。 (7 7)设置完成后,单击)设置完成后,单击“继续继续”按钮返回均值主对话框按钮返回均值主对话框,单击,单击 “确定确定”按钮,执行操作,输

16、出结果。按钮,执行操作,输出结果。.4.2.4 4.2.4 实例分析:某普通高校本科生自尊平均水平实例分析:某普通高校本科生自尊平均水平 在某普通高校随机抽取在某普通高校随机抽取152152名本科生,运用缺憾感量表对名本科生,运用缺憾感量表对其自尊水平进行测量,收集测验数据。部分数据如下所示其自尊水平进行测量,收集测验数据。部分数据如下所示:.1 1描述不同性别学生自尊的平均水平描述不同性别学生自尊的平均水平解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊水平;自变量是被试的性别和专业。要描述不同性别学生的水平;自变量是被试的性别和专

17、业。要描述不同性别学生的自尊平均水平,可以直接由均值比较的操作实现。自尊平均水平,可以直接由均值比较的操作实现。 操作过程操作过程(1)(1)创建新的数据文件:变量包括被试的性别、专业和自尊。创建新的数据文件:变量包括被试的性别、专业和自尊。(2)(2)打开主对话框并完成变量选择:选择打开主对话框并完成变量选择:选择“分析分析”| |“比较均值比较均值”| |“均值均值”命令,打开命令,打开“均值均值”对话框。将因变量对话框。将因变量“自尊自尊”选入选入“因变量列表因变量列表”框中,将分组变量框中,将分组变量“性别性别”选入选入“自自变量列表变量列表”框中,如图所示:框中,如图所示:.(3)(

18、3)选择描述性统计量:单击选择描述性统计量:单击“选项选项”按钮,打开按钮,打开“选项选项”对对话框。因为系统已将均值作为默认的描述统计量,因此可以不话框。因为系统已将均值作为默认的描述统计量,因此可以不做其他选择。单击做其他选择。单击“继续继续”按钮,返回按钮,返回“均值均值”主对话框。主对话框。(4)(4)单击单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。. 结果分析结果分析(1)(1)案例处理摘要表:案例处理摘要表: 结果首先呈现的是案例处理摘要表。该表格呈现了在均值结果首先呈现的是案例处理摘要表。该表格呈现了在均值比较中参与统计分析的案例和排除的案例的个数和所占的

19、百比较中参与统计分析的案例和排除的案例的个数和所占的百分比。如下表所示,有分比。如下表所示,有152152个数据个案参与统计处理,占总个数据个案参与统计处理,占总个案数的个案数的100%100%,剔除的个案数为,剔除的个案数为0 0。.(2)(2)均值比较结果报表:均值比较结果报表: 均值比较结果报表呈现了不同分组的描述性统计量变量,均值比较结果报表呈现了不同分组的描述性统计量变量,便于直观比较。如下表所示,分别呈现了女生和男生自尊的平便于直观比较。如下表所示,分别呈现了女生和男生自尊的平均水平,女生共有均水平,女生共有8585人参与检验,平均自尊得分是人参与检验,平均自尊得分是158.651

20、58.65,标,标准差为准差为27.23027.230;男生共有;男生共有6767人参与检验,平均自尊得分是人参与检验,平均自尊得分是173.00173.00,标准差为,标准差为28.41028.410;所有参与比较的被试的总数为;所有参与比较的被试的总数为152152,自尊平均值是,自尊平均值是164.97164.97,标准差为,标准差为28.57228.572。.2 2描述不同性别和不同专业的学生的自尊平均水平描述不同性别和不同专业的学生的自尊平均水平解:在该案例中,如果要描述不同性别和不同专业学生的平均解:在该案例中,如果要描述不同性别和不同专业学生的平均自尊水平,需要有两层分组,分别以

21、自尊水平,需要有两层分组,分别以“性别性别”和和“专业专业”为为分组变量,可以通过均值比较中添加分组层次的功能来实现分组变量,可以通过均值比较中添加分组层次的功能来实现。 操作过程操作过程(1)(1)打开数据文件。打开数据文件。(2)(2)打开主对话框并完成变量选择:选择打开主对话框并完成变量选择:选择“分析分析”| |“比较均值比较均值”| |“均值均值”命令,打开命令,打开“均值均值”主对话框。将因变量主对话框。将因变量“自自尊尊”选入选入“因变量列表因变量列表”框中,将分组变量框中,将分组变量“性别性别”选入选入“自变量列表自变量列表”框中。单击框中。单击“下一张下一张”按钮,选择按钮,

22、选择“专业专业”进进入入“自变量列表自变量列表”框中作为第二层分组变量,如图所示:框中作为第二层分组变量,如图所示:.(3)(3)选择描述性统计量:选择描述性统计量:单击选择描述性统计量:选择描述性统计量:单击“选项选项”按按钮,打开钮,打开“选项选项”对话框。因为系统已将均值作为默认的描述对话框。因为系统已将均值作为默认的描述统计量,因此可以不做其他选择。单击统计量,因此可以不做其他选择。单击“继续继续”按钮,返回按钮,返回“均值均值”主对话框。主对话框。(4)(4)单击单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。. 结果分析结果分析 结果除了呈现案例处理摘要表,还呈

23、现了均值结果报表,结果除了呈现案例处理摘要表,还呈现了均值结果报表,如下表所示。从该统计报表中不仅可以分别看出女生和男生如下表所示。从该统计报表中不仅可以分别看出女生和男生的平均自尊得分,还可以进一步看到不同专业的女生和男生的平均自尊得分,还可以进一步看到不同专业的女生和男生的平均自尊得分,以及不同专业学生总体的平均自尊得分。的平均自尊得分,以及不同专业学生总体的平均自尊得分。例如哲学专业女生共有例如哲学专业女生共有2626人,平均自尊得分为人,平均自尊得分为151.46151.46,标准,标准差为差为20.12020.120;心理学专业的学生共有;心理学专业的学生共有111111人,平均自尊

24、得分人,平均自尊得分为为167.06167.06,标准差为,标准差为29.60129.601。.4.3 4.3 单一样本单一样本T T检验检验 4.24.2节所介绍的均值过程可以呈现分组变量的平均值等描节所介绍的均值过程可以呈现分组变量的平均值等描述统计量,将不同的组进行一个直观的比较。在以下的三述统计量,将不同的组进行一个直观的比较。在以下的三节中将介绍的检验方法有单样本节中将介绍的检验方法有单样本T T检验、独立样本检验、独立样本T T检验、检验、配对样本配对样本T T检验,根据数据的特征,选择运用合适的检验检验,根据数据的特征,选择运用合适的检验方法。方法。.4.3.1 4.3.1 单一

25、样本单一样本T T检验的主要功能检验的主要功能 单一样本单一样本t t检验是比较某一样本的平均数与某一确定总体检验是比较某一样本的平均数与某一确定总体均值是否有统计学意义上的差异。用样本的平均数来估计均值是否有统计学意义上的差异。用样本的平均数来估计样本所代表的未知总体的平均数,通过检验样本平均数与样本所代表的未知总体的平均数,通过检验样本平均数与确定总体平均数值是否存在差异来推论未知总体是否和确确定总体平均数值是否存在差异来推论未知总体是否和确定总体一致。定总体一致。.4.3.2 4.3.2 单一样本单一样本T T检验的适用条件检验的适用条件 当确定均值的总体的条件不同时,如总体是否为正态分

26、布当确定均值的总体的条件不同时,如总体是否为正态分布以及总体方差是否已知,所适用的单一样本平均数差异检以及总体方差是否已知,所适用的单一样本平均数差异检验的方法是不同的。验的方法是不同的。.4.3.3 4.3.3 单一样本单一样本T T检验的操作过程检验的操作过程 在在SPSSSPSS中进行单一样本中进行单一样本t t检验的操作过程如下:检验的操作过程如下: (1 1)打开或建立数据文件。)打开或建立数据文件。 (2 2)打开主对话框:选择)打开主对话框:选择“分析分析”|“|“比较均值比较均值”|“|“单单样本样本T T检验检验”命令,打开命令,打开“单样本单样本T T检验检验”主对话框,如

27、图主对话框,如图所示。所示。. (3 3)选择变量:在左边的源变量列表框中选中要进行单一样)选择变量:在左边的源变量列表框中选中要进行单一样本本t t检验的变量名,单击中间的箭头按钮,使选中的变量进入检验的变量名,单击中间的箭头按钮,使选中的变量进入右边的右边的“检验变量检验变量”列表框中。列表框中。 (4 4)输入检验值:在)输入检验值:在“检验变量检验变量”列表框下方的列表框下方的“检验值检验值”文本框中填入要进行检验的确定的均值。文本框中填入要进行检验的确定的均值。. (5 5)设置置信度、选择缺失值处理方法:单击)设置置信度、选择缺失值处理方法:单击“选项选项”按钮按钮,打开,打开“选

28、项选项”对话框,如图所示。对话框,如图所示。 (6 6)设置完成后,单击)设置完成后,单击“继续继续”按钮返回单样本按钮返回单样本t t检验主对检验主对话框,单击话框,单击 “确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。.4.3.4 4.3.4 实例分析:全国各地区城市园林绿地面积实例分析:全国各地区城市园林绿地面积 20082008年的全国调查显示中国各地区平均城市园林绿地面积年的全国调查显示中国各地区平均城市园林绿地面积约为约为5630056300公顷。假设公顷。假设20102010又进行一次全国各地区城市园又进行一次全国各地区城市园林绿地面积的调查,试检验林绿地面积的调

29、查,试检验20102010年各地区城市园林绿地面年各地区城市园林绿地面积与积与20082008年全国平均城市园林绿地面积是否有差异。年全国平均城市园林绿地面积是否有差异。解:在本案例中,要检验解:在本案例中,要检验20102010年各地区城市园林绿地面积与年各地区城市园林绿地面积与20082008年全国平均城市园林绿地面积(已知值:年全国平均城市园林绿地面积(已知值:5630056300公顷公顷)是否有差异,即某一样本数据与某一确定均值进行比较)是否有差异,即某一样本数据与某一确定均值进行比较。虽然不知道总体分布是否是正态,但样本较大(。虽然不知道总体分布是否是正态,但样本较大(N=30N=3

30、0),狂热以运用单样本,狂热以运用单样本T T检验。检验。.1 1操作过程操作过程(1)(1)建立数据文件建立数据文件: :将调查获得数据输入数据文件中,如下表所将调查获得数据输入数据文件中,如下表所示,单位(公顷)。示,单位(公顷)。.(2)(2)打开主对话框:选择打开主对话框:选择“分析分析”|“|“比较均值比较均值”|“|“单样本单样本T T检验检验”命令,打开命令,打开“单样本单样本T T检验检验”主对话框。主对话框。(3)(3)选择变量:将变量列表框中选择变量:将变量列表框中“绿化面积绿化面积”变量移入右边的变量移入右边的“检验变量检验变量”列表框中。列表框中。(4)(4)输入检验值

31、:在输入检验值:在“检验变量检验变量”列表框下方的列表框下方的“检验值检验值”文文本框中填入检验均值本框中填入检验均值5630056300,如图所示:,如图所示:(5)(5)单击单击 “确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。.2 2结果分析结果分析(1)(1)描述性统计量表:该表格呈现了单个样本的描述性统计量描述性统计量表:该表格呈现了单个样本的描述性统计量的值,包括参与统计的单个样本的个案数(的值,包括参与统计的单个样本的个案数(N N)、均值、标准)、均值、标准差和均值的标准误。如下表所示,共调查了中国差和均值的标准误。如下表所示,共调查了中国3030个地区,平个地

32、区,平均城市园林绿地面积为均城市园林绿地面积为58030.6358030.63公顷,标准差为公顷,标准差为69705.95769705.957,标准误为标准误为12726.50812726.508。.(2)(2)单样本单样本T T检验结果报表:该样本呈现了单样本检验结果报表:该样本呈现了单样本T T检验的结果检验的结果,包括,包括T T值、自由度(值、自由度(dfdf)、检验的概率()、检验的概率( Sig. Sig.)、均值差)、均值差值,以及差分的值,以及差分的95%95%置信区间。如下表所示,本案例置信区间。如下表所示,本案例T T检验的检验的T T值为值为0.1360.136,自由度,

33、自由度df=29df=29,双侧,双侧T T检验的概率检验的概率Sig.(Sig.(双侧双侧)=0.893.)=0.893.由于显著性水平为由于显著性水平为0.050.05,而,而0.8930.050.8930.05,因此接受,因此接受虚无假设,即虚无假设,即20102010年调查所得各地区平均城市园林绿地面积,年调查所得各地区平均城市园林绿地面积,与与20082008年调查所得的全国平均城市园林绿地面积年调查所得的全国平均城市园林绿地面积5630056300公顷无公顷无显著差异。显著差异。.T T检验对应的置信区间的公式为:检验对应的置信区间的公式为: 则则20102010年全国平均城市园林

34、绿地面积年全国平均城市园林绿地面积95%95%的置信区间的置信区间= =均值(均值(58030.6358030.63)1.961.96标准误(标准误(12726.50812726.508),),即即33086.6743233086.6743282974.5856882974.58568,这个置信区间与给定均值之差为,这个置信区间与给定均值之差为33086.67432-5630033086.67432-5630082974.58568-5630082974.58568-56300,即,即-23213.32568-23213.3256826674.5856826674.58568。这和下限和上限中

35、的数据相对应,有些。这和下限和上限中的数据相对应,有些微的误差。微的误差。.4.4 4.4 两独立样本两独立样本t t检验检验 4.3节已经介绍了单样本节已经介绍了单样本T检验一般用来检验单样本均值检验一般用来检验单样本均值与确定的总体均值是否存在显著差异,即检验某一样本是与确定的总体均值是否存在显著差异,即检验某一样本是否来自已知总体。那么如何检验两个样本的均值是否有显否来自已知总体。那么如何检验两个样本的均值是否有显著性差异呢?对于两个样本均值的差异检验,推断统计的著性差异呢?对于两个样本均值的差异检验,推断统计的逻辑是由两个样本的平均数差异来推断它们所代表的两个逻辑是由两个样本的平均数差

36、异来推断它们所代表的两个总体的平均数之间是否存在显著差异。两个样本平均数差总体的平均数之间是否存在显著差异。两个样本平均数差异检验所要考虑的检验条件要比单样本异检验所要考虑的检验条件要比单样本T检验复杂,不但检验复杂,不但要考虑两个样本所代表的总体是否正态分布,总体方差是要考虑两个样本所代表的总体是否正态分布,总体方差是否已知,还要考虑两个总体的方差是否齐性,两个样本是否已知,还要考虑两个总体的方差是否齐性,两个样本是独立样本还是相关样本,两个样本的容量是否相同等问题独立样本还是相关样本,两个样本的容量是否相同等问题。当数据的条件不同时,所适用的检验方法也是不同的。当数据的条件不同时,所适用的

37、检验方法也是不同的。 本节主要介绍在本节主要介绍在SPSS 18.0中如何进行独立样本中如何进行独立样本T检验检验的操作。的操作。.4.4.1 4.4.1 两独立样本两独立样本t t检验的主要功能检验的主要功能 在两个样本平均数差异检验中,根据两个样本是否相关,在两个样本平均数差异检验中,根据两个样本是否相关,分为独立样本和配对样本。独立样本是指两个样本的数据分为独立样本和配对样本。独立样本是指两个样本的数据之间没有关联性,即两个样本中的任一数据的获取不会受之间没有关联性,即两个样本中的任一数据的获取不会受到两个样本中其他任何数据的影响,是独立的。两独立样到两个样本中其他任何数据的影响,是独立

38、的。两独立样本本t t检验就是用来检验两个独立样本的均值之间是否显著检验就是用来检验两个独立样本的均值之间是否显著差异,即检验两样本所代表的总体的均值是否相同。差异,即检验两样本所代表的总体的均值是否相同。.4.4.2 4.4.2 两独立样本两独立样本t t检验的适用条件检验的适用条件 进行两独立样本平均数差异检验时要先检验两个样本所代进行两独立样本平均数差异检验时要先检验两个样本所代表的总体方差是否已知,以及方差是否齐性。当两个总体表的总体方差是否已知,以及方差是否齐性。当两个总体的方差未知时,需要用样本的方差来作为总体方差的无偏的方差未知时,需要用样本的方差来作为总体方差的无偏估计量,需要

39、用估计量,需要用t t检验。当两个总体的方差未知且不齐性检验。当两个总体的方差未知且不齐性时,需要运用时,需要运用Cochran-Cox-testCochran-Cox-test来进行检验。具体统计学来进行检验。具体统计学知识在此不做赘述。知识在此不做赘述。.4.4.3 4.4.3 两独立样本两独立样本t t检验的操作过程检验的操作过程 在在SPSSSPSS中进行两独立样本中进行两独立样本t t检验的操作过程如下:检验的操作过程如下: (1 1)打开或创建)打开或创建SPSSSPSS数据文件。数据文件。 (2 2)打开主对话框:选择)打开主对话框:选择“分析分析”|“|“比较均值比较均值”|“

40、|“独独立样本立样本T T检验检验”命令,打开命令,打开“独立样本独立样本T T检验检验”主对话框。主对话框。如图所示。如图所示。. (3 3)选择变量:从左边的源变量框中选中需要检验的一个或)选择变量:从左边的源变量框中选中需要检验的一个或多个变量,单击中间上面一个箭头按钮,使检验变量进入多个变量,单击中间上面一个箭头按钮,使检验变量进入“检验变量检验变量”列表框中。从左边的源变量框中选中分组变量,列表框中。从左边的源变量框中选中分组变量,单击下面一个箭头按钮,使之进入单击下面一个箭头按钮,使之进入“分组变量分组变量”列表框中。列表框中。 (4 4)定义分组变量:单击)定义分组变量:单击“定

41、义组定义组”按钮,打开按钮,打开“定义组定义组”对话框,有两个复选框,对应两种定义分组变量的情况,如对话框,有两个复选框,对应两种定义分组变量的情况,如图所示。图所示。. 使用指定值使用指定值单选按钮:这是默认的定义方法,当分组变量单选按钮:这是默认的定义方法,当分组变量有两个水平时,一般选用这种方法,如性别:男、女。在组有两个水平时,一般选用这种方法,如性别:男、女。在组1和组和组2后面的文本框中填入分组变量的值。若在数据中分别用后面的文本框中填入分组变量的值。若在数据中分别用1代表女、用代表女、用2代表男,则在代表男,则在组组1文本框中填文本框中填1,在,在组组2文本框中填文本框中填2。

42、割点割点单选按钮:当分组变量有单选按钮:当分组变量有3个及以上水平时,一般选个及以上水平时,一般选用该定义方法。在用该定义方法。在割点割点文本框中输入一个数值,系统将全文本框中输入一个数值,系统将全部数据分为分组变量数值小于割点值和大于等于割点值两组部数据分为分组变量数值小于割点值和大于等于割点值两组,再对这两组进行两独立样本,再对这两组进行两独立样本T检验。若分组变量有检验。若分组变量有3个水平个水平,在,在割点割点文本框中输入文本框中输入2,则将分组变量的数值等于,则将分组变量的数值等于1的分的分为一组,将分组变量的数值等于为一组,将分组变量的数值等于2和和3的分为一组。的分为一组。. (

43、5 5)设置置信度、选择缺失值处理方法:定义好分组变量后)设置置信度、选择缺失值处理方法:定义好分组变量后,单击,单击“继续继续”按钮,返回按钮,返回“独立样本独立样本T T检验检验”主对话框。单主对话框。单击击“选项选项”按钮,进入按钮,进入“选项选项”对话框。其中,对话框。其中,“置信区间置信区间百分比百分比”文本框是用来设定设定检验的置信度的,默认的为文本框是用来设定设定检验的置信度的,默认的为95%95%,“缺失值缺失值”复选框是用来选择用哪种方式处理包含有缺复选框是用来选择用哪种方式处理包含有缺失值的变量的。失值的变量的。 (6 6)设置完成后,单击)设置完成后,单击“继续继续”按钮

44、返回独立样本按钮返回独立样本t t检验主检验主对话框,单击对话框,单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。.4.4.4 4.4.4 实例分析:某大学超市会员卡消费情况实例分析:某大学超市会员卡消费情况 假设某大学超市要调查该校学生一年在该超市用超市会员假设某大学超市要调查该校学生一年在该超市用超市会员卡消费情况,随机抽取卡消费情况,随机抽取255255名学生的消费情况,试检验该名学生的消费情况,试检验该大学学生一年在该超市使用超市会员卡的消费金额是否存大学学生一年在该超市使用超市会员卡的消费金额是否存在性别差异。在性别差异。解:在该案例中,需要将男生消费情况与女生消

45、费情况进行解:在该案例中,需要将男生消费情况与女生消费情况进行比较,检验差异是否显著。男生的消费数据和女生的消费比较,检验差异是否显著。男生的消费数据和女生的消费数据是两个相互独立的样本,且样本容量较大,可以认为数据是两个相互独立的样本,且样本容量较大,可以认为两总体分布近似正态,因此选用两独立样本两总体分布近似正态,因此选用两独立样本T检验来检验检验来检验二者是否存在显著差异。在创建的文件中需要两个变量,二者是否存在显著差异。在创建的文件中需要两个变量,一个是自变量,即本案例中的一个是自变量,即本案例中的性别性别;另一个是因变量,;另一个是因变量,即本案例中的即本案例中的消费金额消费金额。.

46、1 1操作过程操作过程(1)创建数据文件:将调查获得数据输入数据文件中,部分)创建数据文件:将调查获得数据输入数据文件中,部分数据如下所示,单位(元)。数据如下所示,单位(元)。 注:注:性别性别一栏中一栏中1代表女生,代表女生,2代表男生。代表男生。.(2)打开主对话框:选择)打开主对话框:选择分析分析|比较均值比较均值|独立样本独立样本T检验检验命令,打开命令,打开独立样本独立样本T检验检验主对话框。主对话框。(3)选择变量:从左边的变量列表框中选择)选择变量:从左边的变量列表框中选择“消费消费”作为检验作为检验变量,单击上方箭头按钮变量,单击上方箭头按钮 ,将其移入,将其移入“检验变量检

47、验变量”列表框中。列表框中。从变量列表框中选择从变量列表框中选择“性别性别”作为分组变量,单击下方箭头按作为分组变量,单击下方箭头按钮钮 ,将其移入,将其移入“分组变量分组变量”列表框中,如下图所示。列表框中,如下图所示。.(4)定义分组变量:单击)定义分组变量:单击“定义组定义组”按钮,弹出按钮,弹出“定义组定义组”对对话框,在默认的话框,在默认的“使用指定值使用指定值”单选按钮下,在单选按钮下,在“组组1”文本框文本框中填中填1(代表女生),在(代表女生),在“组组2”文本框中填文本框中填2(代表男生),(代表男生),如下图所示。如下图所示。(5)设置完成后,单击)设置完成后,单击继续继续

48、按钮返回按钮返回独立样本独立样本T检验检验主主对话框,单击对话框,单击确定确定按钮,执行操作,输出结果。按钮,执行操作,输出结果。.2 2、结果分析、结果分析(1)描述性统计量表:该表格分别呈现了分组变量的简单描)描述性统计量表:该表格分别呈现了分组变量的简单描述性统计量,包括参与检验数据的个案数(述性统计量,包括参与检验数据的个案数(N)、均值、标准)、均值、标准差和均值的标准误。如下表所示,是对分析变量差和均值的标准误。如下表所示,是对分析变量性别性别的简的简单描述统计。从表中可以看出随机抽取的女生样本容量为单描述统计。从表中可以看出随机抽取的女生样本容量为1 3 1 , 平 均 消 费

49、金 额 是, 平 均 消 费 金 额 是 1 8 1 7 . 2 2 1 4 , 标 准 差 是, 标 准 差 是338.69831,标准误是,标准误是29.59221。读者同样也可以看出。读者同样也可以看出男生样本相关描述性统计量。男生样本相关描述性统计量。.(2)独立样本)独立样本T检验结果报表:该表呈现的是对两独立样本检验结果报表:该表呈现的是对两独立样本进行进行T检验的结果,包括方差齐性检验的检验的结果,包括方差齐性检验的F值和概率,值和概率,T检验的检验的t值、自由度(值、自由度(df)和检验的概率,均值的差值,标准误差值)和检验的概率,均值的差值,标准误差值和差分的和差分的95%置

50、信区间。如下表所示,是对男生组和女生组置信区间。如下表所示,是对男生组和女生组的消费金额进行独立样本的消费金额进行独立样本T检验的结果。检验的结果。.方差齐性检验:前面已介绍了两独立样本方差齐性检验:前面已介绍了两独立样本T检验要对两样本代表的总体进检验要对两样本代表的总体进行方差齐性检验,在方差齐性和方差不齐性两种情况下所运用的检验方法行方差齐性检验,在方差齐性和方差不齐性两种情况下所运用的检验方法是不同的。在是不同的。在SPSS独立样本独立样本T检验输出的统计报表中,会分别呈现在方检验输出的统计报表中,会分别呈现在方差无显著性差异和方差有显著性差异下的检验值。如表差无显著性差异和方差有显著

51、性差异下的检验值。如表4-10所示,所示,假设假设方差相等方差相等所对应的一行数据是在方差无显著性差异条件下的各统计量的所对应的一行数据是在方差无显著性差异条件下的各统计量的值,值,假设方差不相等假设方差不相等所对应的下面一行数据是在方差有显著性差异条件所对应的下面一行数据是在方差有显著性差异条件下的各统计量的值。表格中下的各统计量的值。表格中方差方程的方差方程的Levene检验检验下呈现的是检验方下呈现的是检验方差齐性的差齐性的F值(值(0.105)和显著性概率)和显著性概率p(0.747)。因为)。因为P0.05,接,接受受F检验的虚无假设检验的虚无假设H0,即两总体的方差无显著性差异。所

52、以以下皆参照,即两总体的方差无显著性差异。所以以下皆参照假设方差相等假设方差相等所对应的一行数据。所对应的一行数据。两独立样本两独立样本T检验的值为检验的值为t=0.086,自由度,自由度df=253,双侧检验显著性概,双侧检验显著性概率率P=0.9310.05,因此接受两独立样本,因此接受两独立样本T检验的虚无假设,即两个样检验的虚无假设,即两个样本所代表的总体的平均数相同,男生和女生在该学校超市使用会员卡消费本所代表的总体的平均数相同,男生和女生在该学校超市使用会员卡消费的金额没有显著性差异。的金额没有显著性差异。均值差值均值差值=3.72944为两个组的平均数之差,说明样本中女生的消费金

53、为两个组的平均数之差,说明样本中女生的消费金额比男生高额比男生高3.72944元,但这种差异是不显著的。标准误差值元,但这种差异是不显著的。标准误差值=43.19812。其中差值的。其中差值的95%置信区间的置信区间的上限上限和和下限下限中的数据的中的数据的意义,可以参阅意义,可以参阅4.3.4节的实例分析。节的实例分析。.4.5 4.5 两配对样本两配对样本t t检验检验 两样本平均数差异检验,根据两个样本数据之间是够有关两样本平均数差异检验,根据两个样本数据之间是够有关联性,分为独立样本和配对样本。独立样本是指两个样本联性,分为独立样本和配对样本。独立样本是指两个样本的数据之间没有关联性,

54、而配对样本,也称相关样本,是的数据之间没有关联性,而配对样本,也称相关样本,是指两个样本的数据之间存在一一对应的关系。两个样本中指两个样本的数据之间存在一一对应的关系。两个样本中的一对数据是有某种关联性的。例如在配对组实验中或在的一对数据是有某种关联性的。例如在配对组实验中或在对同一样本前测后测实验中获得的数据。本节将对配对样对同一样本前测后测实验中获得的数据。本节将对配对样本本t t检验的一些统计原理和在检验的一些统计原理和在SPSS18.0SPSS18.0中的操作进行介绍。中的操作进行介绍。.4.5.1 4.5.1 两配对样本两配对样本t t检验的主要功能检验的主要功能 两配对样本两配对样

55、本t t检验是对两个配对样本的平均数之间进行差检验是对两个配对样本的平均数之间进行差异检验。配对样本一般来自配对组或是同对一个样本的两异检验。配对样本一般来自配对组或是同对一个样本的两次施测,而配对组是可以认为是两个同质的组,因此来自次施测,而配对组是可以认为是两个同质的组,因此来自配对组的两个数据也是有关联的。配对组的两个数据也是有关联的。.4.5.2 4.5.2 两配对样本两配对样本t t检验的适用条件检验的适用条件 对两配对样本进行平均数差异检验,需要考虑数据的各种对两配对样本进行平均数差异检验,需要考虑数据的各种条件,如两总体是否正态分布,两总体方差是否已知以及条件,如两总体是否正态分

56、布,两总体方差是否已知以及相关系数是否已知,从而选择合适的检验的方法。与两独相关系数是否已知,从而选择合适的检验的方法。与两独立样本差异检验不同,两配对样本差异检验不用事先进行立样本差异检验不同,两配对样本差异检验不用事先进行方差齐性检验,因为配对样本的数据是成对数据,可以认方差齐性检验,因为配对样本的数据是成对数据,可以认为方差一致。为方差一致。 .4.5.3 4.5.3 两配对样本两配对样本t t检验的操作过程检验的操作过程 在在SPSSSPSS中进行两配对样本中进行两配对样本t t检验的操作过程如下:检验的操作过程如下:(1 1)打开或创建)打开或创建SPSSSPSS数据文件。数据文件。

57、(2 2)打开主对话框:选择)打开主对话框:选择“分析分析”| “| “比较均值比较均值”| “| “配配对样本对样本T T检验检验”命令,打开命令,打开“配对样本配对样本T T检验检验”主对话框,主对话框,如图所示。如图所示。.(3 3)选择变量:对话框左边是源变量框,右边是)选择变量:对话框左边是源变量框,右边是“成对变量成对变量”列表框,该列表框中,列表框,该列表框中,“对对”下显示的是配对组的序号,下显示的是配对组的序号,Variable 1Variable 1和和Variable 2Variable 2下将分别显示选中的配对的两个变下将分别显示选中的配对的两个变量名。在左边的源变量框

58、中单击选中参与配对的一个变量名量名。在左边的源变量框中单击选中参与配对的一个变量名,单击中间的箭头按钮,使变量进入,单击中间的箭头按钮,使变量进入“成对变量成对变量”列表框中列表框中。该变量名将出现在。该变量名将出现在“成对变量成对变量”列表框中的第一组配对组列表框中的第一组配对组的的Variable 1Variable 1下。再从左边的源变量框中选中另一个参与配下。再从左边的源变量框中选中另一个参与配对的变量名,单击箭头按钮,该变量名将出现在对的变量名,单击箭头按钮,该变量名将出现在“成对变量成对变量”列表框中的第一组配对组的列表框中的第一组配对组的Variable 2Variable 2下

59、。下。 当第一组变量配对完成后,当第一组变量配对完成后,成对变量成对变量列表框中的列表框中的对对下自动下自动跳出第二组的序号。可以根据需要依照上述方法指定多组配跳出第二组的序号。可以根据需要依照上述方法指定多组配对变量。对变量。.(4 4)设置置信度、选择缺失值处理方法:单击)设置置信度、选择缺失值处理方法:单击“选项选项”按钮,弹按钮,弹出出“选项选项”对话框。如图所示。对话框。如图所示。(5 5)执行操作:设置完成后,单击)执行操作:设置完成后,单击“继续继续”按钮返回独立样本按钮返回独立样本t t检验主对话框,单击检验主对话框,单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。.4.5.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论