SPSS中T检验的应用_第1页
SPSS中T检验的应用_第2页
SPSS中T检验的应用_第3页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本文指在简述SPSS 中的T 检验,主要说明了T 检验的原理和应用,及使用范围。和SPSS 中的基本操作。T 检验是检验样本的均值和给定的均值是否存在显著性差异。T 检验、两独立样本T 检验和两配对样本T 检验。T 检验分为3 类:单样本关键词:T 检验、 SPSS、显著性水平、统计量、概率P-值、自由度、线性相关、置信区间、零假设。目录一、单样本 T 检验31.单样本 T 检验的目的32.单样本 T 检验的基本步骤33.单样本 T 检验的应用举例4三、两独立样本T 检验51.两独立样本 T 检验的目的52两独立样本 T 检验的基本步骤53.两独立样本 T 检验的应用举例7三、两配对样本T 检

2、验91.两配对样本 T 检验的目的92.两配对样本 T 检验的基本步骤93.两配对样本 T 检验的应用举例10四、参考文献13一、单样本T 检验1.单样本 T 检验的目的。单样本 t 检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与制定的检验值之间存在显著性差异。它是对总体均值的假设检验。2.单样本 T 检验的基本步骤。 .提出原假设。单样本 T 检验的原假设H 0 为:总体均值与检验值之间不存在显著差异,表述为H 0 :0 。为总体均值,0 为检验值。 .选择检验统计量。当总体分布为正态分布 N ( , 2 ) 时,样本均值的抽样分布仍为正态分布,该正态分布的均值为,方差为2 /

3、 n ,即2XN( , )n式中,为总体均值,当原假设成立时,0 ;2 为总体方差; n 为样本数。总体分布近似服从正态分布时。通常总体方差是未知的,此时可以用样本方差S2 替代,得到的检验统计量为t 统计量,数学定义为:Xt2Sn式中, t 统计量服从n-1 自由度为 t 分布。单样本t 检验的检验统计量即为t 统计量。当认为原假设成立时用0代入。计算检验统计量观测值和概率P-值该步目的是甲酸检验统计量的观测值和相应的概率P-值。SPSS 将自动将样本均值、0 、样本方差、 样本数代入式中, 计算出 t 统计量的观测值和对应的概率P-值。给定显著性水平,并作出决策。如果概率 P-值小于显著性

4、水平,则应拒绝原假设,认为总体均值与检验值之间存在显著差异;反之,如果概率P-值大于显著性水平,则不应拒绝原假设,认为总体均值与检验值之间无显著差异。33.单样本 T 检验的应用举例案例:利用住房状况问卷调查数据,推断家庭人均住房面积的平均值是否为20 平方米。数据名字为“住房状况调查.sav”推断家庭人均住房面积的平均值是否为20 平方米。由于该问题设计的是单个总体,且要进行总体均值比较,同时家庭人均住房面积的总体可近似认为服从正态分布,因此,可采用单样本 T 检验来进行分析。SPSS 单样本 T 检验的基本操作步骤是:选择菜单:【 Analyze 】 【 Compare Means】 【

5、One-Samples T Test】出现如图所示的窗口。图 1选择待检验的变量到【 Test Variables】,在【 Test Value】框中输入检验值。按 Option 按钮定义其他选项,出现图2 所示的窗口。Option 选项用来指定缺失值的处理方法。另外,还可以输出默认95%的置信区间。图 2至此, SPSS 将自动计算 t 同嘉陵和对应的概率P-值。分析结果如表3 和表 4 所示。4人均住房面积的基本描述统计结果One-Sample StatisticsStd.Std. ErrorNMeanDeviationMean人均面积299322.006012.70106.23216表

6、3人均住房面积单样本T 检验结果One-Sample TestTest Value = 095% Confidence Interval of theSig.MeanDifferencetdf(2-tailed)DifferenceLowerUpper人均面积94.7882992.00022.0059621.550822.4612表 4由表 3 可知,2993 个家庭的人均住房面积的平均值为22 平方米,标准差为12.7 平方米,均值标准误差为(S)为 0.23.表 4 中,第二列是t 统计量的观测值为8.64;第三列是自由n度为 2992;第四列是 t 统计量观测值的双尾概率P-值;第五列是

7、样本均值与检验值的差,即t 统计量的分子部分;第六列和第七列是总体均值与原假设值差的95%的置信区间,为(1.55,2.46),由此计算出总体均值的95%的置信区间为 (21.55,22.46 )平方米。该问题应采用双尾检验,因此比较和 p 。如果给定为 0.05,由于 p 小于,因此应拒绝原假设,认为家庭人均住房面积的平均值与20 平方米由显著差异。95%的置信区间告诉我们有95%的把握认为家庭人均诸方面均值在21.5522.46 平方米之间。三、两独立样本T 检验1.两独立样本 T 检验的目的两独立样本 T 检验的目的是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。2两独

8、立样本 T 检验的基本步骤。提出零假设5两独立样本T 检验的原假设H 0 为:两总体均值无显著差异。表述为:H0:1201 ,2 分别为第一个和第二个总体的均值。选择检验统计量对两总体均值差的推断是建立在来自两个总体样本均值差的基础之上的,也就是希望利用两组样本均值的差去估计量总体均值的差。因此,应关注两样本均值的抽样分布。当两总体分布分别为N (1 , 12 ) 和 N ( 2 ,22 ) 时,两样本均值差的抽样分布仍为正态分布,该正态分布的均值为12 ,方差为122 。在不同的情况下,122 有不同的计算方式。第一种情况:当两总体方差未知且相等,即12 时,采用合并的方差作为两个总体方差的

9、估计,数学定义为2( n11)S12(n2 1)S22Spn1n2 2式中, S12 , S22 分别为第一组和第二组样本的方差;n1, n2 分别为第一组和第二组样本的样本数。此时两样本均值差的抽样分布的方差212 为2Sp2Sp212n1n2第二种情况:当两总体方差未知且不相等,即12 时,分别采用各自的方差,此时两样本均值差的抽样分布的方差122 为:2S2S212n2n1于是,两总体均值差检验的检验统计量为t 统计量,数学定义为:tX1 X2 (12 )212在第一种情况下,t 统计量服从 n1n2 2 个自由度的 t 分布;在第二种情况下,服从修正自由度的t 分布,修正的自由度定义为

10、6( S12S22) 2n1n2f(S22)( S12 )2n1n2n1n2计算检验统计量观测值和概率P-值。该步的目的是计算F 统计量和 t 统计量的观测值以及相应的概率P-值。 SPSS 将自动依据单因素方差分析的方法计算F 统计量和概率P-值,并自动将两组样本的均值、样本数、抽样分布方差等代入式中,计算出 t 统计量的观测值和对应的概率P-值。给定显著性水平,并作出决策。第一步,利用F 检验判断两总体的方差是否相等,并据此决定抽样分布方差和自语度的计算方法和计算结果。如果F 检验统计量的概率P-值小于显著想水平,则应拒绝原假设,认为两总体方差没有显著差异,应选择式和式计算出的结果:反之,

11、若果概率P-值大于显著性水平则不应拒绝原假设, 认为两总体方差无显著差异。第二步,体用t 检验判断两总体均值是否存在显著差异。如果t 检验统计量的概率P-值小于显著性水平,则应拒绝原假设,认为两总体均值有显著性差异;反之,如果概率P-值大于显著性水平,则不应拒绝原假设, 认为两总体均值无显著差异。3.两独立样本 T 检验的应用举例原假设是:本市户口和外地户口的家庭收入人均值无显著性差异,即H0:120选择菜单【Analyze 】 【 Compare Means】 【 Indendent-Samples T Test】于是出现如图所示的窗口。7图 3选择检验变量到【Test Variables(

12、 s)】框中。选择总体标识变量到【Grouping Variables 】框中。按DefineGroups 按钮定义两总体的标识值,显示如图4 所示的窗口。其中【UseSpecified Values】表示分别输入对应两个不同总体的标志值; 【 Cut Point 】框中应输入一个数字,大于等于该值的对应另一个总体。图 4两独立样本 t 检验的 Option 选项含义与单样本t 检验的相同。分析结果如图5 所示本市户口和外地户口家庭人均住房面积的基本描述统计Group Statistics户口状Std.Std. Error况NMeanDeviationMean人均面本市户282521.7251

13、2.17539.22907积口8外地户16826.71618.967481.46337口5图 5由图5 可以看出,本市户口和外地户口的家庭人均住房面积的样本平均值有一定的差8距。通过检验应推断这种差异是抽样误差造成的还是系统性的。本市户口和外地户口家庭人均住房面积两独立样本t 检验结果图 6图 6 是本市户口和外地户口家庭人均住房面积的均值检验结果。分析结论应通过两步完成。第一步,两总体方差是否相等的F 检验。这里,该检验的F 统计量的观测值为65.469,对应的概率P-值为 0.00.如果显著性水平为 0.05,由于概率P-值小于 0.05,可以认为两总体的方差有显著差异。 第二步, 两总体

14、均值的检验。 在第一步中, 由于两总体方差有显著差,因此应看第二行 T 检验的结果。其中 T 统计量的观测值为 -3.369,对应的双尾开率 P-值为0.001.如果显著性水平为 0.05,由于概率 P-值小于 0.05,因此认为两总体的均值有显著差异,即本市户口和外地户口的家庭人均住房面积的平均值存在显著差异。图 6 中的第七列和第八列分别为T 统计量的分子和分母;第九列和第十列为两总体差的95%置信区间的上限和下限。三两配对样本T 检验1.两配对样本 T 检验的目的两配对样本 T 检验的目的是利用来自两个不同总体的配对样本,推断两个总体的均值是否存在显著差异。配对样本通常有两个特征:第一,

15、两组样本的样本数相同 ; 第二,两组样本观测值的先后顺序是一一对应的,不能随意更改。2.两配对样本 T 检验的基本步骤。提出原假设两配对样本T 检验的原假设H 0 为:两总体均值无显著差异,表述为 H 0 :120 。1 ,2 分别为第一个和第二个总体的均值。选择统计量。两配对样本T 检验采用T 统计量。其思路是:首先,对两组样本分别计算出每对观测值的差值得到差值样本;然后,体用差值样本, 通过对其均值是否显著为0 的检验来推断两总体均值的差是否显著为0.如果差值样本的均值与0 有显著差异,则可以认为两总体的均值有显著差异; 反之,如果差值系列的均值与0 无显著差异。 则可以认为两总体均值不存

16、在显著差异。计算检验统计量观测值和概率P-值SPSS将计算两组样本的差值,并将相应数据代入式,计算出T 统计量的观测值和对应的概率 P-值。9给定显著水平,并作出决策。给定显著水平,与检验统计量的概率P-值作比较。如果概率P-值小于显著水平,则应拒绝原假设,认为差值样本的总体均值与0 有显著不同, 两总体的均值有显著差异;反之,如果概率P-值大于显著水平,则不应拒绝原假设,认为差值样本的总体均值与0 无显著不同,两总体的均值不存在显著差异。3.两配对样本 T 检验的应用举例。案例:为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35 名肥胖志愿者进行了减肥跟踪调研。首先将其喝减肥茶以前

17、的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥作用。SPSS两配对样本T 检验的基本操作步骤如下:选择菜单:【 Analyze 】 【 Compare Means】 【 Paired-Samples T Test】于是出现如图 7 所示的窗口图 7选择一对或若干对检测变量到【Paired Variables】框中。两配对样本 T 检验的 Option 选项含义和单样本T 检验的相同。至此, SPSS 将自动计算 T 统计量和对应的概率P-值。分析结果如图8、图9和图 10所示。喝茶前和喝茶后体重的基本描述统计量Pa

18、ired Samples StatisticsMeaStd.Std. ErrornNDeviationMeanPair喝茶前体重89.2355.33767.90223157110Paired Samples StatisticsMeaStd.Std. ErrornNDeviationMeanPair喝茶前体重89.2355.33767.902231571喝茶后体重70.0355.66457.95749286图 8图 8 表明,喝茶前和喝茶后样本的平均值有较大差异。喝茶后的平均体重低于喝茶前的平均体重。喝茶前和喝茶后体重的简单相关系数及检验Paired Samples CorrelationsC

19、orrelatioNnSig.Pair喝茶前体重 & 喝后35-.052.7681体重图 9图 9 中,第三列是喝茶前和喝茶后两组样本的简单相关系数,第四列是相关系数检验的概率 P-值。它表明在显著性水平为 0.05时,肥胖志愿者服用减肥茶前后的体重并没有明显的线性变化,喝茶前和喝茶后体重的线性相关程度较弱。11喝茶前和喝茶后体重的两配对样本T 检验结果图 10图 10 中,第二列是喝茶前与喝茶后体重的平均差异,相差了19.2 公斤;第三列是差值样本的标准差;第四列是差值样本分布的标准差;第五列、第六列是差值95%的置信区间的上限和下限;第七列是T 检验统计量的观测值;第八列是R 检验

20、统计量观测值对应的双尾概率 P-值,接近于0.如果显著性水平为 0.05,由于概率P-值小于显著性水平,应拒绝原假设, 即认为总体上体重差的平均值与0 有显著不同, 意味着喝茶前与喝茶后的体重平均值存在显著差异,可以认为该减肥茶具有显著的减肥效果。统计学意义(p 值)结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p 值为结果可信程度的一个递减指标,p 值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p 值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们

21、重复类似实验,会发现约20 个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或 95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05 的 p 值通常被认为是可接受错误的边界水平。如何判定结果具有真实的显著性在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说, 认为结果无效而被拒绝接受的水平的选择具有武断性。实践中, 最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一

22、致的支持性证据的数量,依赖于以往该研究领域的惯例。通常, 许多的科学领域中产生p 值的结果 0.05 被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果0.05p>0.01 被认为是具有统计学意义,而0.01 p0.001 被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。12所有的检验统计都是正态分布的吗并不完全如此, 但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t 检验、 f 检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。 当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论