均值比较与检验_第1页
均值比较与检验_第2页
均值比较与检验_第3页
均值比较与检验_第4页
均值比较与检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于均值比较与检验12主要内容5.1统计推断与假设检验5.2Means过程5.3单样本T检验5.4两独立样本T检验5.5两配对样本T检验第2页,共53页,2024年2月25日,星期天35.1统计推断与假设检验1、参数检验利用样本数据对总体特征的推断通常有两种情况:(1)当总体分布已知(如总体为正态分布)的情况下,对总体包含的参数进行推断的问题称为参数检验;(2)当总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断,通常采用的统计推断方法是非参数检验方法。第3页,共53页,2024年2月25日,星期天45.1统计推断与假设检验1、参数检验①均值比较(Means),用于计算指定变量的综合描述统计量;②单样本T检验(One-SampleTTest),检验单个变量的均值与假设检验值之间是否存在差异;③独立样本T检验(IndependentSampleTTest),用于检验两组来自独立总体的样本,其独立总体的均值或中心位置是否一样;④配对样本T检验(Paired-SampleTTest),用于检验两个相关的样本是否来自具有相同均值的总体。CompareMeans子菜单第4页,共53页,2024年2月25日,星期天55.1统计推断与假设检验2、假设检验的几个概念(1)统计假设原假设:在很多情况下,我们给出一个统计假设仅仅是为了拒绝它。例如,如果我们要判断给定的一枚硬币是否均匀,则我们假设硬币是均匀的(即p=0.5,其中p是正面出现的概率)类似地,如果我们要判断一种方法是否优于其他的方法,则我们假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为备择假设:任何不同于零假设的假设都称为备择假设。例如,如果零假设是,则备择假设是。备择假设记为。

第5页,共53页,2024年2月25日,星期天65.1统计推断与假设检验2、假设检验的几个概念(2)假设检验的两类错误第一类错误:在假设检验中拒绝了本来是正确的零假设,称为“弃真”错误。第二类错误:在假设检验中没有拒绝本来是错误的零假设,称为“取伪”错误。第6页,共53页,2024年2月25日,星期天75.1统计推断与假设检验2、假设检验的几个概念(3)显著性水平在作假设检验时,我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。在实际问题中,显著性水平可以有多种选择,但最为普通的是0.05或0.01。例如,如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说,我们大约有95%的把握作出正确的决策。此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应接受的假设这类错误的概率是0.05。第7页,共53页,2024年2月25日,星期天85.1统计推断与假设检验2、假设检验的几个概念(4)概率p值

p值是当零假设正确时,观测到的样本信息出现的概率。如果这个概率很小,以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。p值越小,拒绝零假设的理由就越充分。但怎样的p值才算“小”呢?通常是与预先设定的显著性水平值比较,若值为0.05,p值小于0.05则认为该概率值足够小,应拒绝零假设。第8页,共53页,2024年2月25日,星期天95.1统计推断与假设检验3、假设检验的基本步骤第1步给出检验问题的原假设;根据检验问题的要求,将需要检验的最终结果作为零假设。例如,需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样,都为75,由此可做出零假设,第2步选择检验统计量;在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的已知分布,例如均值检验中最常用的t分布和F分布等。第9页,共53页,2024年2月25日,星期天105.1统计推断与假设检验3、假设检验的基本步骤第3步计算检验统计量的观测值及其发生的概率值;

在给定零假设前提下,计算统计量的观测值和相应概率p值。概率p值就是在零假设成立时检验统计量的观测值发生的概率,该概率值间接地给出了样本值在零假设成立的前提下的概率,对此可以依据一定的标准来判断其发生的概率是否为小概率。第4步在给定显著性水平条件下,做出统计推断结果。这里的显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05。当检验统计量的概率p值小于显著性水平时,则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,也就是说犯错误的概率小到我们能容忍的范围,这时可以拒绝零假设;反之,如果检验统计量的概率p值大于显著性水平,如果拒绝零假设,犯弃真错误的概率大于预先给定的容忍水平,这时不应该拒绝零假设。第10页,共53页,2024年2月25日,星期天11主要内容5.1统计推断与假设检验5.2Means过程5.3单样本T检验5.4两独立样本T检验5.5两配对样本T检验第11页,共53页,2024年2月25日,星期天125.2Means过程1、Means过程的主要功能

Means过程即均值过程,其主要功能是分组计算,比较指定变量的描述性统计量包括均值、标准差、总和、观测量数、方差等一系列单变量描述性统计量,还可以给出方差分析表和线性检验结果。均值过程中系统默认的描述统计量可按分组给出指定变量的均值、标准差、观测量数等,对话框中的选项可以给出其他更加丰富的描述统计量。第12页,共53页,2024年2月25日,星期天135.2Means过程2、Means过程的操作界面

选择待分析的变量。在该选项组中定义分组变量,主要包括以下几项:IndependentList文本框:选择分组变量。可定义多层分组变量,每层分组变量中也可以有多个变量;Previous按钮:选择前一层的分组变量;Next按钮:选择下一层的分组变量。单击该按钮,弹出如图5-2所示的options子对话框。图5-1第13页,共53页,2024年2月25日,星期天145.2Means过程2、Means过程的操作界面

图5-2Option按钮Statistics文本框:在该文本框中列出可以选择的描述性统计量,这些统计量的具体含义同描述性统计分析中的统计量含义一样。CellStatistics文本框:列出要输出的统计量。默认输出Mean(均值)、NumberofCases(观测量数)和StandardDeviation(标准差);StatisticsforFirstLayer选项组:该选项组定义是否进行分组第一层变量的方差分析(Anovatableandeta)和线性检验(Testforlinearity)。第14页,共53页,2024年2月25日,星期天155.2Means过程3、实例分析【例5-1】表5.1是各地区分性别受教育程度的人口数量,利用均值过程比较受教育程度是否受性别的影响。

第15页,共53页,2024年2月25日,星期天165.2Means过程3、实例分析第1步数据组织;

根据表5.1生成SPSS数据文件,建3个变量:“sex”、“edu”、“num”,数据文件的部分数据如图5-3所示。图5-3第16页,共53页,2024年2月25日,星期天175.2Means过程3、实例分析第2步打开主对话框;选择Analyze→CompareMeans→Means,打开同图5-1一样的均值过程主对话框。第3步确定要进行均值比较的变量;在图5-1的对话框中,从左边的候选变量列表框中选择“人口数量(num)”变量,移入DependentList文本框中,表示对该变量进行均值比较分析。第4步确定分组变量;分组变量可以有几层,选择“性别(sex)”变量作为第一层分组变量,将其移入IndependentList文本框中。第17页,共53页,2024年2月25日,星期天185.2Means过程3、实例分析第5步确定输出的统计量;单击图5-1上的Options…按钮,弹出如图5-2所示的子对话框,选择Anovatableandeta复选框,进行方差分析,单击Continue按钮,返回主对话框。第18页,共53页,2024年2月25日,星期天195.2Means过程3、实例分析结果分析第19页,共53页,2024年2月25日,星期天205.2Means过程3、实例分析结果分析表5.4是性别的单因素方差分析,在下一章会详细介绍方差分析,此处不再详细讲述。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差异。第20页,共53页,2024年2月25日,星期天215.2Means过程3、实例分析结果分析表5.5是人口数量与性别的相关性度量表。此时的Eta和EtaSquared取值都很小,说明性别和受教育的人口数量的相关性很差,这也和单因素方差分析表的结论是一致的。第21页,共53页,2024年2月25日,星期天22主要内容5.1统计推断与假设检验5.2Means过程5.3单样本T检验5.4两独立样本T检验5.5两配对样本T检验第22页,共53页,2024年2月25日,星期天235.3单样本T检验1、单样本T检验目的和步骤(1)单样本T检验的目的单样本T检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异。它是对总体均值的假设检验。例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。第23页,共53页,2024年2月25日,星期天245.3单样本T检验1、单样本T检验目的和步骤(2)单样本T检验的步骤第1步提出零假设;单样本T检验需要检验总体均值与指定的检验值是否存在显著差异。为此,给出检验均值为,零假设为:,其中,为总体均值。例如,假设储户一次平均存(取)款金额与2000元无显著性差异,零假设则为:。第24页,共53页,2024年2月25日,星期天255.3单样本T检验1、单样本T检验目的和步骤(2)单样本T检验的步骤第2步选择检验统计量;单样本T检验的前提是总体服从正态分布,其中为总体均值,为总体方差。如果样本容量为n,样本均值为,则仍服从正态分布,即:。在零假设成立的条件下,均值检验使用t统计量,构造的t统计量为:,其中,用代入,t统计量服从自由度为n-1的t分布,S为样本标准差。SPSS的操作结果中还显示均值标准误差(Std.ErrorMean),计算公式为:,即统计量的分母部分。第25页,共53页,2024年2月25日,星期天265.3单样本T检验1、单样本T检验目的和步骤(2)单样本T检验的步骤第3步计算检验统计量的观测值及其发生的概率;在给定零假设的前提下,SPSS将检验值代入t统计量,得到检验统计量观测值以及根据t分布的分布函数计算出概率p值。第4步给定显著性水平,做出统计推断。给出显著性水平,与检验统计量的概率p值作比较。当检验统计量的概率p值小于显著性水平时,则拒绝零假设,认为总体均值与要检验的之间存在差异;反之,如果检验统计量的概率p值大于显著性水平,则接受零假设,认为总体均值与检验值之间无显著性差异。第26页,共53页,2024年2月25日,星期天275.3单样本T检验2、单样本T检验的操作界面从候选变量框中选择要进行T检验的变量移入此框中,可同时选择多个变量,此时,SPSS就将分别产生多个变量的T检验分析结果。在此框中输入检验值,即检验与什么值有无显著性差异。单击该按钮弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法

图5-3第27页,共53页,2024年2月25日,星期天285.3单样本T检验3、实例分析【例5-2】某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为:495,502,508,496,505,499,503,498,505,500。假设数据呈正态分布,请检验生产线的工作情况。第1步数据组织;首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可。第28页,共53页,2024年2月25日,星期天295.3单样本T检验3、实例分析第2步打开主对话框;选择Analyze→CompareMeans→One-SampleTTest,打开同图5-3一样的单样本T检验主对话框。第3步确定要进行T检验的变量;在图5-3所示的对话框中,选择“Weight”变量作为检验变量,移入“TestVariable(s)”框中。第4步输入要检验的值;在图5-4的对话框中的“Testvalue”中输入要检验的值,本例应输入500。第29页,共53页,2024年2月25日,星期天305.3单样本T检验3、实例分析结果分析第30页,共53页,2024年2月25日,星期天315.3单样本T检验3、实例分析结果分析

表5.7是单样本T检验结果表,第一行的TestValue为检验参数值500,即用于比较的总体均值,下面从左至右依次为检验统计量(t)、自由度(df)、双尾检测概率P值(Sig.(2-tailed))、样本均值与和检验值的差(MeanDifference)、均值差的95%置信区间(95%ConfidenceIntervaloftheDifference)。当置信水平为95%时,显著性水平为0.05,从表5.7中可以看出,双尾检测概率P值为0.432,大于0.05,故零假设成立,也就是说抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。第31页,共53页,2024年2月25日,星期天32主要内容5.1统计推断与假设检验5.2Means过程5.3单样本T检验5.4两独立样本T检验5.5两配对样本T检验第32页,共53页,2024年2月25日,星期天335.4两独立样本T检验1、两独立样本T检验目的和主要步骤(1)两独立样本T检验的目的单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著差异。例如,为比较两种牧草对奶牛的饲养效果,随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量,根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。第33页,共53页,2024年2月25日,星期天345.4两独立样本T检验1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第1步提出零假设;两独立样本T检验需要检验两个总体的均值是否存在显著性差异。因此,零假设为:,即假设两样本均值相等,备择假设为:,即假设两样本均值不等。第34页,共53页,2024年2月25日,星期天355.4两独立样本T检验1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第2步选择检验统计量;

两独立样本T检验的前提是两个独立的总体分别服从和。在零假设成立的条件下,独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1)当样本方差相等时,t统计量定义为:其中和分别为两样本容量,和分别为两样本标准差。该统计量服从自由度为的t分布。第35页,共53页,2024年2月25日,星期天365.4两独立样本T检验1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第2步选择检验统计量;

2)当样本方差不等时,t统计量定义为:可见,两独立样本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前,首先应对两总体方差是否相等进行检验,也称之为方差齐性检验。第36页,共53页,2024年2月25日,星期天375.4两独立样本T检验1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第3步计算检验统计量的观测值及其发生的概率;

在给定零假设的前提下,SPSS将检验值0代入t统计量的部分,得到检验统计量观测值以及根据t分布的分布函数计算出概率p值。第4步给定显著性水平,做出统计推断。给出显著性水平,与检验统计量的概率p值作比较。当检验统计量的概率p值小于显著性水平时,则拒绝零假设,认为两个总体均值之间存在差异;反之,如果检验统计量的概率p值大于显著性水平,则接受零假设,认为两个总体均值之间无显著性差异。第37页,共53页,2024年2月25日,星期天385.4两独立样本T检验2、两独立样本T检验的操作界面从候选变量框中选择要进行T检验的变量移入此框中,图5-4选择分组变量,在选择变量进入GroupingVariable框后,DefineGroups…按钮将被激活,单击该按钮定义分组信息单击该按钮弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法

第38页,共53页,2024年2月25日,星期天395.4两独立样本T检验3、实例分析【例5-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。

第39页,共53页,2024年2月25日,星期天405.4两独立样本T检验3、实例分析第1步数据组织;根据表5.8,SPSS数据文件中建立两个变量,分别为“品种”、“产量”,变量“品种”的变量值标签为:a-品种A,b-品种B,录入数据即可。第2步打开主对话框;选择Analyze→CompareMeans→Independent-Samples,打开同图5-4一样的两独立样本T检验主对话框。第40页,共53页,2024年2月25日,星期天415.4两独立样本T检验3、实例分析第3步确定要进行T检验的变量;在图5-4所示的对话框中,选择“产量”变量作为检验变量,移入“TestVariable(s)”框中。第4步确定分组变量;选择变量“品种”作为分组变量,将其移入图5-4中的“Groupingvariable”文本框中,并定义分组的变量值:Group1—a,Group2—b。第41页,共53页,2024年2月25日,星期天425.4两独立样本T检验3、实例分析结果分析第42页,共53页,2024年2月25日,星期天435.4两独立样本T检验3、实例分析结果分析

在方差相等的情况下,两独立样本T检验的结果应该看表5.10中的“Equalvariancesassumed”一行,第5列为相应的双尾检测概率(Sig.(2-tailed))为0.332,在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。第43页,共53页,2024年2月25日,星期天44主要内容5.1统计推断与假设检验5.2Means过程5.3单样本T检验5.4两独立样本T检验5.5两配对样本T检验第44页,共53页,2024年2月25日,星期天455.5两配对样本T检验1、两配对样本T检验目的和主要步骤(1)两配对样本T检验目的两配对样本T检验的目的是检验两个相关样本是否来自相同均值的正态总体,即推断两个总体的均值是否存在显著差异。

配对的概念是指两个样本的各样本值之间存在着对应关系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本的容量相同。配对样本T检验与独立样本T检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在“前”“后”两种状态下某属性的两种状态,也可以是对某事物两个不同侧面或方面的描述。其差别在于抽样不是相互独立的,而是互相关联的。第45页,共53页,2024年2月25日,星期天465.5两配对样本T检验1、两配对样本T检验目的和主要步骤(2)两配对样本T检验主要步骤第1步提出零假设;配对样本T检验需要检验两个总体均值是否存在显著性差异,其零假设为,其中,和分别为第一个总体和第二个总体的均值。第2步选择检验统计量;在配对样本T检验中,设、分别为配对样本。其样本差值,此时检验统计量为:其中为的均值,S为的标准差,n为样本数,当时,t统计量服从自由度为n-1的t分布。第46页,共53页,2024年2月25日,星期天475.5两配对样本T检验1、两配对样本T检验目的和主要步骤(2)两配对样本T检验主要步骤第3步计算检验统计量的观测值及其发生的概率;

该步骤的目的是计算t统计量的观测值以及相应的概率p值。SPSS将计算两组样本的差值,并将相应数据代入上式的t检验统计量计算公式中,计算出t统计量的观测值和对应的概率p值。第4步给出显著性水平,并做出统计推断结果。给出显著性水平,与检验统计量的概率p值作比较。如果概率p值小于显著性水平,则应拒绝零假设,认为差值的总体均值与0有显著不同,两总体的均值有显著差异;反之,如果概率p值大于显著性水平,则不应拒绝零假设,认为差值的总体均值与0无显著不同,两总体的均值不存在显著差异。第47页,共53页,2024年2月25日,星期天485.5两配对样本T检验2、两配对样本T检验的操作界面图5-5该列表框中的变量作为分析变量,总是成对地出现,可以有多对被分析的变量。

单击该按钮弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法

第48页,共53页,2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论