版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS
中进行非参数检验由【Analyze(分析)】菜单中的【NonparametricTests(非参数检验)】菜单项导出。其中包括以下命令。●Chi-square
test:卡方检验。●Binomialtest:二项分布检验。●Runstest:游程检验。●1-SimpleK-Stest:单样本K-S检验。●2IndependentSampletest:两个独立样本非参数检验。●KIndependentSamplestest:多个独立样本非参数检验。●2RelatedSampletest:两个相关样本非参数检验。●KRelatedSampletest:多个相关样本非参数检验。现在是1页\一共有109页\编辑于星期四6.1非参数检验概述6.1.1非参数检验的提出非参数检验是不依赖总体分布的统计推断方法。它是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数假设检验方法少得多,也容易满足,适用于计量信息较弱的资料且计算方法也简便易行,所以在实际中有广泛的应用。
现在是2页\一共有109页\编辑于星期四6.1.2非参数检验的特点和参数方法相比,非参数检验方法的优势如下:
(1)稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。
(2)对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。
(3)适用于小样本、无分布样本、数据污染样本、混杂样本等。现在是3页\一共有109页\编辑于星期四表6-1参数检验和非参数检验的效率比较应用参数检验非参数检验对正态总体的非参数检验的效率评价配对样本数据两个独立样本多个独立样本相关随机性t检验或者z检验t检验或者z检验方差分析(F检验)线性相关无可用的参数检验符号检验Wilcoxon检验Wilcoxon检验K-W检验秩相关检验游程检验0.630.950.950.950.91没有可比较的基础现在是4页\一共有109页\编辑于星期四6.2SPSS 在卡方检验中的应用1.使用目的卡方检验(Chi-SquarTest)也称为卡方拟合优度检验,是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。
2.基本原理进行卡方检验时,首先提出零假设:样本X来自的总体分布服从期望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它描述了观察值和理论值之间的偏离程度。
3.软件使用方法
SPSS会自动计算出χ2统计量及对应的相伴概率P值。现在是5页\一共有109页\编辑于星期四6.2.2卡方检验的SPSS操作详解Step01:打开主菜单
选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Chi-Square(卡方)】命令,弹出【Chi-SquareTest(卡方检验)】对话框。现在是6页\一共有109页\编辑于星期四Step02:选择检验变量在【Chi-SquareTest(卡方检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,表示需要进行进行卡方检验的变量。Step03:确定检验范围在【ExpectedRange(期望全距)】选项组中可以确定检验值的范围,对应有两个单选项。Step04:选择期望值在【ExpectedValues(期望值)】选项组中可以指定期望值,对应有两个单选项。
现在是7页\一共有109页\编辑于星期四Step05:选择计算精确概率单击【Exact】按钮,弹出【ExactTests(精确检验)】对话框,该对话框用于选择计算概率P值的方法。现在是8页\一共有109页\编辑于星期四Step06:其他选项选择单击【Options】按钮,弹出【Options(选项)】对话框,该对话框用于指定输出内容和关于缺失值的处理方法.
Step07单击【OK】按钮,结束操作,SPSS软件自动输出结果。现在是9页\一共有109页\编辑于星期四6.2.3实例图文分析:人员结构的调动1.实例内容某公司经营多年,形成了一套成熟的企业文化和管理体系,例如根据多年的运营经验,经理层、监察员、办事员三种职务类别人员比例大约在15:5:80为宜,这样运行效率最高。目前公司进行人事调整,公司人员结构发生变动,有员工担心是否人事调整已经导致职务类型比例的失调。请利用数据文件6-1.sav来解决该问题。三种职务的期望构成比为15%、5%和80%。而目前样本中观察到的三种职务的人数比为84:27:363,构成比分别是17.7%、5.7%和76.6%,和理论值有差异。那么这种差异是由随机误差造成的,还是真的构成比和以前有所变化?该问题就可以用χ2检验来实现。相应的假设检验如下。H0:目前三个职业的总体构成比仍然是15%、5%和80%。H1:目前三个职业的总体构成比不再是15%、5%和80%。现在是10页\一共有109页\编辑于星期四2.实例操作Step01:打开对话框打开数据文件6-1.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Chi-Square(卡方)】命令,弹出【Chi-SquareTest(卡方检验)】对话框。其中,“jobcat”变量表示职业类型,“1”表示办事员,“2”表示监察员,“3”表示经理。Step02:选择检验变量在左侧的候选变量列表框中选择“jobcat”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。现在是11页\一共有109页\编辑于星期四Step03:选择期望值在【ExpectedValues(期望值)】选项组中点选【Values】单选钮,以指定期望概率值。接着在Values的文本框中分别输入0.8、0.05和0.15这三个数值,并且单击【Add】按钮加以确定。Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是12页\一共有109页\编辑于星期四3实例结果及分析
SPSS的结果报告中列出了期望频数和实际频数。显然残差值越小,说明实际频数与期望频数越接近。
ObservedNExpectedNResidualClerical363379.2-16.2Custodial2723.73.3Manager8471.112.9Total474(1)频数表现在是13页\一共有109页\编辑于星期四(2)卡方检验表具体包括统计量(Chi-Square)、自由度(df)和近似概率P值(Asymp.Sig.)。可见,统计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍然是15%、5%和80%,人数的调动只是随机误差造成的,公司人员结构没有显著性改变。
EmploymentCategoryChi-Square3.492adf2Asymp.Sig..174现在是14页\一共有109页\编辑于星期四6.3SPSS 在二项分布检验中的应用6.3.1二项分布检验的基本原理1.方法概述事件要服从二项分布,则应该具备下列基本的条件。(1)各观察单位只能具有相互对立的一种结果。(2)已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π。(3)n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。现在是15页\一共有109页\编辑于星期四2.软件使用方法
SPSS二项分布检验过程是推断总体的分布是否等于指定的某个二项分布。其假设检验过程如下。
H0:样本来自的总体与某个指定的二项分布无显著性差异。
H1:样本来自的总体与某个指定的二项分布有显著性差异。
SPSS会自动计算出二项分布检验相应的检验统计量及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为总体与某个指定的二项分布有显著性差异;相反的,如果概率P值大于显著性水平,则接受零假设。需要注意的是,二项分布检验过程要求变量必须是数值型的二元变量(只取两个可能值的变量)。假如变量是字符型的,可以使用重编码功能将其转化为数值型变量;假如变量不是二元变量,需要设置断点将数据分为两个部分,将大于断点值的归为一组,其余归为另一组。现在是16页\一共有109页\编辑于星期四6.3.2二项分布检验的SPSS操作详解
Step01:打开主菜单
选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Binomial(二项式)】命令,弹出【BinomialTest(二项式检验)】对话框。现在是17页\一共有109页\编辑于星期四Step02:选择检验变量在【BinomialTest(二项式检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,表示需要进行进行二项分布检验的变量。Step03:定义二元变量在【DefineDichotomy(定义二分法)】选项组中可以定义二元变量。
Step04:指定检验概率值在【TestProportion(检验比例)】选项组中可以指定二项分布的检验概率值。系统默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。如果所要检验的二项分布不是同概率分布,参数框中要键入第一组变量所对应的检验概率值。现在是18页\一共有109页\编辑于星期四Step05:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择
【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。
现在是19页\一共有109页\编辑于星期四6.3.3实例图文分析:灯泡是否合格1.实例内容某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求,其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候,该厂的这种产品合格品率为95%,为检验产品质量,今从新生产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数据资料,试根据这些样品数据检验该批产品的合格率是否等于95%。1070107395895897596910799649689479629701054987967969967100199499310841012985994964952951987963957现在是20页\一共有109页\编辑于星期四2.实例操作Step01:打开对话框打开数据文件6-2.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Binomial(二项式)】命令,弹出【BinomialTest(二项式检验)】对话框。
现在是21页\一共有109页\编辑于星期四Step02:选择检验变量在左侧的候选变量列表框中选择“time”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。现在是22页\一共有109页\编辑于星期四Step03:定义二元变量在【DefineDichotomy(定义二分法)】选项组中点选【Cutpoint(割点)】,以指定断点。接着在其文本框中输入“960”,表示以它作为分界点将原始样本分为两组。Step04:指定检验概率值在【TestProportion(检验比例)】文本框中输入指定概率值“0.05”。现在是23页\一共有109页\编辑于星期四Step05:描述性统计量输出单击【Options】按钮,弹出【Options(选项)】对话框。在【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。再单击【Continue】按钮,返回【BinomialTest(二项式检验)】对话框。现在是24页\一共有109页\编辑于星期四Step06:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是25页\一共有109页\编辑于星期四3.实例结果及分析(1)基本统计量
SPSS首先输出了样本的描述性统计量表。这里共选择了30个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13小时,标准差等于40.968小时,灯泡寿命最小值等于947小时,寿命最大值等于1084小时。同时其25%、50%和75%分位点等于962.75、969.50和996.75小时。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th灯泡寿命30989.1340.9689471084962.75969.50995.75现在是26页\一共有109页\编辑于星期四(2)二项分布检验表
首先根据断点“960”将原始数据划分为两部分:“Group1”和“Group2”,它们各自的样本容量等于6和24,所占总体的比例为20%和80%。由于这里要检验合格率是否等于95%,也就是要检验“Group1”组所占比例是否等于0.05。但根据单尾概率P值(0.003)小于显著性水平(0.05),可以判断这批样本的合格率不等于95%,即这批产品没有合格。CategoryNObservedProp.TestProp.Asymp.Sig.(1-tailed)灯泡寿命Group1<=96060.200.050.003Group2>96024.80Total301.00现在是27页\一共有109页\编辑于星期四6.4SPSS 在游程检验中的应用6.4.1游程检验的基本原理1.方法概述游程检验是一种利用游程数所作的单样本随机性的检验方法,它可以用来判断观察值的顺序是否为随机。许多统计模型的假设中都要求观察值都是独立的,也就是说,收集到的数据样本的顺序是不相关的。如果样本顺序影响到统计结果,那么样本就可能不是随机的,这将使研究者不能得出关于抽样总体的准确结论。因此,研究者可以使用游程检验来检验数据的随机性。现在是28页\一共有109页\编辑于星期四2.基本原理游程检验可用来检验任何序列的随机性,而不管这个序列是怎样产生的;此外还可用来判断两个总体的分布是否相同,从而检验出它们的位置中心有无显著差异。3.软件使用方法
SPSS中利用游程数构造Z统计量,利用Z统计量的分布来检验序列是否具有随机性。软件将自动计算出Z统计量的取值及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为变量不具有随机性;相反的,如果概率P值大于显著性水平,则认为变量出现是随机的。现在是29页\一共有109页\编辑于星期四6.4.2游程检验的SPSS操作详解Step01:打开对话框选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Runs(游程)】命令,弹出【RunsTest(游程检验)】对话框。现在是30页\一共有109页\编辑于星期四Step02:选择检验变量在【RunsTest(游程检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,表示需要进行游程检验的变量。
Step03:确定断点在【Cutpoint(割点)】选项组中指定计算游程数的分界值。小于分界值的观察值归为一组,其余的归为另一组,然后计算游程数。
现在是31页\一共有109页\编辑于星期四Step04:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中的相应按钮相同的。Step05:其他选项选择
【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。现在是32页\一共有109页\编辑于星期四6.4.3实例图文分析:企业盈亏预测1.实例内容已知某企业在过去20年的盈亏情况为“000011
11111000111111”。其中“0”表示亏损,“1”表示盈利。现根据财务统计预测今年该企业盈利,请问这个结果对企业明年的经营状况有无影响?2.实例操作根据过去20年的经营情况看到该企业的盈亏情况经常逐年发生变化。已知今年企业盈利,要判断明年企业的盈亏状态,其实就是要分析今年企业的盈利是否会对明年它的盈亏带来一定的影响。也就是说,要判断不同年份之间的盈亏情况有无影响性,即盈亏情况是否是随机的。这样就可以通过游程检验来分析历史数据。如果历史数据是随机的,说明今年的盈利不会对明年企业的生产产生影响;反之,表明今年的盈利会对明年生产有影响。所以采用SPSS具体操作步骤如下。现在是33页\一共有109页\编辑于星期四Step01:打开对话框打开数据文件6-3.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【RunsTest(游程检验)】命令,弹出【RunsTest(游程检验)】对话框。其中“x”变量表示企业盈亏状态,“0”表示亏损,“1”表示盈利。
现在是34页\一共有109页\编辑于星期四Step02:选择检验变量在候选变量列表框中选择“x”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。Step03:确定断点在【Cutpoint(割点)】选项组中取消勾选【Median(中位数)】复选框,勾选【Mean(均值)】复选框。
现在是35页\一共有109页\编辑于星期四Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是36页\一共有109页\编辑于星期四3.实例结果及分析首先“TestValue=0.65”表示游程检验以0.65作为断点将原始数据分为两组。在过去20年中,企业亏损的年份数共有7年,而在剩下的13年里该企业都是盈利的。整个历史数据的游程数等于4。接着计算游程检验的Z统计量等于-2.843,相伴概率P值0.004显然小于显著性水平0.05。所以,认为企业盈亏历史数据并不是随机的,其中有一定的规律性。因此,今年企业的盈利会对明年企业的经营状况产生显著影响。盈亏TestValuea.65Cases<TestValue7Cases>=TestValue13TotalCases20NumberofRuns4Z-2.843Asymp.Sig.(2-tailed).004现在是37页\一共有109页\编辑于星期四6.4.4实例进阶分析:工业和商业企业的负债水平1.实例内容在我国的工业和商业企业中随机抽取22家企业进行资产负债率行业差异分析,其1999年底的资产负债率(%)如下,请问两个行业的负债水平是否有显著性差异?工业企业647655825982707561647383商业企业77808065939184918486现在是38页\一共有109页\编辑于星期四2.实例操作要检验工业和商业企业的负债水平是否有差异,可以将两组数据混合起来,同时用“1”表示数据来自工业企业,“2”表示数据来自商业企业。接着将这些序列按照升序或降序重新排列。这样可以得到由1和2构成的数列,如1221122。如果两个行业的负债水平没有差异,它们的资产负债率按大小应该是随机混合排列的,则构成的这组数列应该是随机的;否则说明工业和商业企业的负债水平有一定的规律性,即两个行业有一定的差异性。
现在是39页\一共有109页\编辑于星期四SPSS具体操作步骤
Step01:打开数据文件6-4.sav,其中“fzl”变量表示企业的资产负债率;“indicate”变量表示企业类型,“1”表示工业企业,“2”表示商业企业。Step02:选择菜单栏中的【Data(数据)】→【SortCases(排序个案)】命令,弹出【SortCases(排序个案)】对话框。在候选变量列表框中选择变量“fzl”,添加至【Sortby(排序依据)】列表框中。这步的目的就是要按照企业负债率的高低对“indicate”变量重新排序。现在是40页\一共有109页\编辑于星期四Step03:接着利用游程检验分析“indicate”变量的随机性。选择菜单栏中的【Analyze(分析)】→【Nonparametric
Tests(非参数检验)】→【LegacyDialogs(旧对话框)】→【RunsTest(游程检验)】命令,弹出【RunsTest(游程检验)】对话框。在候选变量列表框中选择“indicate”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。Step04:在【Cutpoint(割点)】选项组中取消勾选系统默认的【Median(中位数)】复选框,勾选【Mean(均值)】复选框。Step05:单击【RunsTest(游程检验)】对话框中的【OK】按钮,完成操作。现在是41页\一共有109页\编辑于星期四3.实例结果及分析根据第二步操作,数据文件6-5.sav的“indicate”变量进行了重新排列,形成了序列:1111121111222111222222
这个序列是按照资产负债率的高低将企业类型“indicate”进行重新排列得到的。下面表6-9是这组序列的游程检验结果。游程检验的Z统计量值等于-2.384,概率P值0.017小于显著性水平0.05,说明这组数据不是随机序列,数据的排序呈现一定的规律性。因此,工业企业和商业企业的负债水平有显著性差异。现在是42页\一共有109页\编辑于星期四indicateTestValuea1.45Cases<TestValue12Cases>=TestValue10TotalCases22NumberofRuns6Z-2.384Asymp.Sig.(2-tailed).017现在是43页\一共有109页\编辑于星期四6.5SPSS在单样本K-S检验中的应用6.5.1单样本K-S检验的基本原理1.方法概述
K-S检验是以两位前苏联数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的,是一种拟和优度的非参数检验方法。单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,一般来说它是比卡方检验更精确的非参数检验法。现在是44页\一共有109页\编辑于星期四2.基本原理
K-S检验的理论分布可以为正态分布、均匀分布、指数分布和泊松分布等。其零假设是:样本来自的总体与指定的理论分布无显著差异。它的基本思想是:根据样本数据和用户的指定构造出理论分布,查分布表得到相应的理论累计概率分布函数F0(x);利用样本数据计算各样本数据点的累计概率,得到经验累计概率分布函数S0(x);计算S0(x)和F0(x)在相同变量值点x上的差D(x),得到差值序列D。单样本K-S检验主要对差值D序列进行研究。3.软件使用方法
SPSS将自动计算K-S检验中的Z统计量,依据K-S分布表(小样本)或正态分布表(大样本)给出相应的相伴概率P值。如果P值小于或等于用户指定的显著性水平α,则拒绝原假设H0;反之,不能拒绝H0,可以认为样本来自的总体与指定的分布无显著差异。现在是45页\一共有109页\编辑于星期四6.5.2单样本K-S检验的SPSS操作详解Step01:打开对话框选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【1-samplesK-S(1样本K-S(1))】命令,弹出【One-SampleK-STest(单样本K-S检验)】对话框,这是K-S检验的主操作窗口。现在是46页\一共有109页\编辑于星期四Step02:选择检验变量在【One-SampleKolmogorov-SmirnovTest(单样本K-S检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,表示需要进行K-S检验的变量。Step03:选择待检验理论分布在【TestDistribution(检验分布)】选项组中,用户需要选择待检验的理论分布。系统提供了四种统计中常见的分布。
现在是47页\一共有109页\编辑于星期四Step04:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中相关按钮是相同的。Step05:其他选项选择
【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。现在是48页\一共有109页\编辑于星期四6.5.3实例分析:商品销售收益的分布1.实例内容零售商希望了解某商品销售收益(Revenue)的大致分布情况。依据其他销售商已有的资料,他认为其销售收益可能服从正态分布。为了检验其假设,考虑是否与其他零售商一样,销售收益服从正态分布,收集到相关的销售收益数据,请使用SPSS软件分析样本数据是否服从正态分布。现在是49页\一共有109页\编辑于星期四2.实例操作本案例的目的就是要检验文件6-5.sav中的“revenue”变量是否服从正态部分,因此可以采用非参数K-S检验来判断。首先,通过描述性统计功能绘制了“revenue”变量的直方图及其拟合的正态曲线,具体见图6-19。从图形特征看到,“revenue”变量的分布非常接近正态分布,但需要采用K-S检验来诊断。现在是50页\一共有109页\编辑于星期四Step01:打开对话框打开数据文件6-4.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【1-samplesK-S(1样本K-S(1))】命令,弹出如下图所示的对话框。
现在是51页\一共有109页\编辑于星期四Step02:选择检验变量在候选变量列表框中选择“revenue”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。提示:可以在【TestDistribution(检验分布)】选项组中选择检验分布类型;系统默认为正态分布。
现在是52页\一共有109页\编辑于星期四Step03:确定断点单击【Options】按钮,在弹出的对话框的【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。单击【Continue】按钮返回主对话框。
现在是53页\一共有109页\编辑于星期四Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是54页\一共有109页\编辑于星期四3.实例结果及分析(1)描述性统计量输出
SPSS首先给出了“revenue”变量的基本统计量。样本总数N等于1488,收益均值等于$2,516.58,收益标准差等于$994.586,收益最小值和最大值分别是$13和$6,213,收益25%、50%和75%的分位数是$1,830.96、$2,490.68和$3,183.54。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75thRevenue1488$2,516.58$994.586$13$6,213$1,830.96$2,490.68$3,183.54现在是55页\一共有109页\编辑于星期四(2)K-S检验结果表给出了原假设:销售收益服从均值为2516.58、标准差为994.586的正态分布。给出了K-S检验关键结果:实际分布和检验分布之间的正向最大频数差为0.019,负向最大频数差为-0.010,因此用于计算统计量的绝对值最大频数差为0.019。随后的K-S统计量Z值等于0.75,相应的概率P值为0.627,大于显著性水平0.05。所以接受零假设,认为该厂商的销售收益服从正态分布。RevenueN1488NormalParametersaMean$2,516.58Std.Deviation$994.586MostExtremeDifferencesAbsolute0.019Positive0.019Negative-0.010Kolmogorov-SmirnovZ0.750Asymp.Sig.(2-tailed)0.627现在是56页\一共有109页\编辑于星期四P-P图除了采用上述非参数K-S检验来判断单样本的分布外,还可以利用P-P图和Q-Q图直观判别样本的分布。选择菜单栏中的【Analyze(分析)】→【DescriptiveStatistics(描述统计)】→【P-PPlots(P-P图)】命令,即可生成P-P图。现在是57页\一共有109页\编辑于星期四6.6SPSS在两独立样本非参数检验中的应用6.6.1两独立样本非参数检验的方法原理1.方法概述两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过分析样本数据,推断样本来自的两个独立总体的分布是否存在显著差异。这种检验方法一般通过独立总体的均值或中位数是否存在显著差异来推断。关于样本之间是否独立,主要看在一个总体中抽取样本对在另一个总体中抽取样本有无影响。如果没有影响,则可以认为这两个总体是独立的。2.基本原理
SPSS提供了四种相关的非参数检验方法:曼-惠特尼U检验、K-S检验、极端反应检验、游程检验。现在是58页\一共有109页\编辑于星期四6.6.2两独立样本非参数检
验的SPSS操作详解Step01:打开主菜单选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【2IndependentSamples(2个独立样本)】命令,弹出【Two-Independent-SamplesTests(两个独立样本检验)】对话框。现在是59页\一共有109页\编辑于星期四Step02:选择检验变量在【Two-Independent-SamplesTests(两个独立样本检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,这里表示需要进行两独立样本检验的变量。Step03:选择分组变量在【Two-Independent-SamplesTests(两个独立样本检验)】对话框左侧的候选变量中选择分组变量,将其添加至【GroupingVariable(s)(分组变量)】文本框中,目的是要区分检验变量的不同组别。单击【GroupingVariables】按钮,在弹出的对话框的【Group1(组1)】和【Group2(组2)】文本框中分别输入整数值,这两个值确定的分组将选择的检验变量的观测值分为两组或者分成两个样本,并将检验变量的其他数值排除在检验分析之外。设置完成后,单击【Continue】按钮,返回主对话框。现在是60页\一共有109页\编辑于星期四Step04:选择检验方法在【TestType(检验类型)】选项组中,用户需要选择两独立样本检验的方法。系统提供了四种常用方法:
Mann-WhitneyU(曼-惠特尼U检验)、Kolmogorov-SmirnovZ(K-S检验)、MosesExtremeReactions(极端反应检验)和Wald-WolfwitzRuns(游程检验)。
现在是61页\一共有109页\编辑于星期四Step05:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择
【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。现在是62页\一共有109页\编辑于星期四6.6.3实例图文分析:日本和
美国公司的市盈率1.
实例内容一个公司的市盈率是指这家公司股票的当前价格除以最近12个月的每股收益。下表列出了10家日本公司和12家美国公司的市盈率,这两个国家公司的市盈率之间是否存在显著差异?日本美国公司市盈率公司市盈率SumitomoCorp.KindenHeiwaNCPJapanSuzukiMotorFujiBankSumitomoChemicalSeibuRailwayShiseidoTodoGas153211812531213646663368GannetMotorolaSchlumbergerOracleSystemsGapWinn-DixieIngersoll-RandAmericanElectricPowerHerculesTimesMirrorWellPointHealthNorthernStatesPower192424432214211421381514现在是63页\一共有109页\编辑于星期四2.实例操作本案例的目的就是要检验日本和美国公司的市盈率是否有显著差异。由于这里样本量较少,难以确定这两个总体的分布,因此可以引入非参数的检验方法。由于讨论的两个样本相互独立,故引入两独立样本非参数检验方法。于是建立如下假设检验。
H0
:日本公司和美国公司的市盈率没有显著差异。
H1
:日本公司和美国公司的市盈率存在显著差异。主要是比较日本和美国公司的平均市盈率是否相同,所以采用曼-惠特尼U检验方法。
现在是64页\一共有109页\编辑于星期四Step01:打开对话框打开数据文件6-6.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【Legacy
Dialogs(旧对话框)】→【2IndependentSamples(2个独立样本)】命令,弹出如下图所示的对话框。
现在是65页\一共有109页\编辑于星期四Step02:选择检验变量在左侧的候选变量列表框中选择“PE”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。Step03:选择分组变量选择分组变量x,将其添加至【GroupingVariable(s)(分组变量)】文本框中。现在是66页\一共有109页\编辑于星期四Step04:确定分组标号单击【GroupingVariables】按钮,弹出相应对话框,在【Group1(组1)】文本框中输入“1”,在【Group2(组2)】文本框中输入“2”,分别表示分组的标号。输入完成后,单击【Continue】按钮返回主对话框。
现在是67页\一共有109页\编辑于星期四Step05:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是68页\一共有109页\编辑于星期四3.实例结果及分析(1)描述性统计量
NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th市盈率2275.5000141.6019714.00666.0018.750024.000065.0000国家221.5455.509651.002.001.00002.00002.0000现在是69页\一共有109页\编辑于星期四3.实例结果及分析(2)曼-惠特尼U检验的秩统计表
国家NMeanRankSumofRanks市盈率日本1015.70157.00美国128.0096.00Total22现在是70页\一共有109页\编辑于星期四3.实例结果及分析(3)曼-惠特尼U检验结果表
市盈率Mann-WhitneyU18.000WilcoxonW96.000Z-2.776Asymp.Sig.(2-tailed)0.005ExactSig.[2*(1-tailedSig.)]0.004a现在是71页\一共有109页\编辑于星期四6.7SPSS在多独立样本
非参数检验中的应用6.7.1多独立样本非参数检验的基本原理1.方法概述多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的分布是否存在显著差异。这里样本间的独立是指在一个总体中抽取样本对在其他总体中抽取样本无影响。2.基本原理
SPSS提供的多独立样本非参数检验的方法主要包括:Kruskal-WallisH检验、中位数检验(Median检验、Joneckheere-Terpstra检验。现在是72页\一共有109页\编辑于星期四6.7.2多独立样本非参数检验
的SPSS操作详解Step01:打开对话框选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【KIndependentSamples(K个独立样本)】命令,弹出【TestsforSeveralIndependentSamples(多个独立样本检验)】对话框,这是多独立样本非参数检验的主操作窗口。现在是73页\一共有109页\编辑于星期四6.7.2多独立样本非参数检验
的SPSS操作详解Step02:选择检验变量在主对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,这里表示需要进行多独立样本检验的变量。现在是74页\一共有109页\编辑于星期四6.7.2多独立样本非参数检验
的SPSS操作详解Step03:选择分组变量在主对话框左侧的候选变量中选择分组变量,将其添加至【GroupingVariable(s)(分组变量)】文本框中,目的是要区分检验变量的不同组别。单击【GroupingVariables】按钮,弹出如下图所示的对话框。在【Minimum(最小值)】和【Maximum(最大值)】文本框中分别键入最小值和最大值,这两个值之间的整数值将检验变量的观测值分为若干个样本,并将其他数值排除在检验分析之外。设置完成后,单击【Continue】按钮,返回主对话框。现在是75页\一共有109页\编辑于星期四6.7.2多独立样本非参数检验
的SPSS操作详解Step04:选择检验方法在【TestType(检验类型)】选项组中,用户需要选择多独立样本检验的方法。系统提供了三种常用方法:Kruskal-WallisH(克鲁斯凯-沃里斯H检验)、Median(中位数检验)和Joneckheere-Terpstra(J-T检验)。
Step05:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择
【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。现在是76页\一共有109页\编辑于星期四6.7.3实例分析:糖果中的卡路里1.实例内容畅销的糖果往往含有较高的卡路里。假设下表中的数据为三种不同糖果样本中的卡路里含量,检验这三种糖果中的卡路里含量的显著差异。糖果1糖果2糖果3230210240250230225205245253220200208202190180现在是77页\一共有109页\编辑于星期四2.实例操作本案例的目的就是要检验这三种糖果中的卡路里含量有没有显著性差异。由于这里样本量较少,难以确定总体的分布,因此可以引入非参数的检验方法。由于三种糖果的卡路里含量独立,故引入多独立样本非参数检验方法。于是建立如下假设检验。
H0
:三种糖果的卡路里含量没有显著差异。
H1
:三种糖果的卡路里含量存在显著差异。现在是78页\一共有109页\编辑于星期四2.实例操作Step01:打开数据文件6-7sav,其中“calories”变量表示糖果中卡路里的含量;“x”变量表示糖果类型,分别用1-3表示。选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【KIndependentSamples(K个独立样本)】命令,弹出如下图所示的对话框。提示:可以在【TestType(检验类型)】选项组中选择检验方法。现在是79页\一共有109页\编辑于星期四2.实例操作Step02:选择检验变量在左侧的候选变量列表框中选择“calories”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。Step03:选择分组变量选择分组变量x,将其添加至【GroupingVariable(s)(分组变量)】文本框中。
现在是80页\一共有109页\编辑于星期四2.实例操作Step04:确定分组标号。单击【GroupingVariables】按钮,弹出相应对话框,如图6-35所示。在【Minimum(最小值)】文本框中输入“1”,在【Maximum(最大值)】文本框中输入“3”,分别表示分组的最小标号和最大标号。输入完成后,单击【Continue】按钮返回。现在是81页\一共有109页\编辑于星期四2.实例操作Step05:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是82页\一共有109页\编辑于星期四3.实例结果及分析(1)描述性统计量
NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th卡路里15219.200022.23639180.00253.00202.0000220.0000240.0000糖果类型152.0000.845151.003.001.00002.00003.0000现在是83页\一共有109页\编辑于星期四3.实例结果及分析(2)秩统计表糖果类型NMeanRank卡路里1510.802510.00353.20Total15现在是84页\一共有109页\编辑于星期四3.实例结果及分析(3)非参数检验结果表
卡路里Chi-Square8.736df2Asymp.Sig.0.013现在是85页\一共有109页\编辑于星期四6.8SPSS在两配对样本
非参数检验中的应用
6.8.1两配对样本非参数检验的基本原理两配对样本的非参数检验是在对两组配对样本的总体分布不甚了解的情况下,推断样本来自的两个总体的分布等是否存在显著差异的方法。这种检验对两个总体服从的分布不做要求,但要求数据必须是成对出现的,而且顺序不能够随意调换。下面简要介绍常用的四种检验方法:符号检验、Wilcoxon符号秩检验、McNemar检验、MarginalHomogeneity检验。现在是86页\一共有109页\编辑于星期四6.8.2两配对样本非参数检验
的SPSS操作详解Step01:打开对话框选择菜单栏中的【Analyze(分析)】→【Nonparametric
Tests(非参数检验)】→【LegacyDialogs(旧对话框)】→【2RelatedSamples(2个相关样本)】命令,弹出【Two-Related-SamplesTests(两个关联样本检验)】对话框,这是两配对样本非参数检验的主操作窗口。现在是87页\一共有109页\编辑于星期四6.8.2两配对样本非参数检验
的SPSS操作详解Step02:选择检验变量在主对话框左侧的候选变量列表框中选择变量,将其添加至【TestPairs(检验对)】列表框中。需注意的是,由于是进行配对检验,所以检验变量要成对添加至【TestPairs(检验对)】列表框。Step03:选择检验方法在【TestType(检验类型)】选项组中,用户需要选择两配对样本检验的方法。系统提供了四种常用方法:Wilcoxon符号秩检验、符号检验、McNemar检验、MarginalHomogeneity检验。现在是88页\一共有109页\编辑于星期四6.8.2两配对样本非参数检验
的SPSS操作详解Step04:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法。
Step05:其他选项选择
【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。现在是89页\一共有109页\编辑于星期四6.8.3实例分析:音乐与入睡时间1.实例内容在关于放松(听音乐)对成年女性入睡所需时间影响的研究中,抽取了10名女性组成样本。下表给出了10个对象在有听音乐和不听音乐下入睡所需的时间(min)。就此数据你的结论是什么?研究对象12345678910不听音乐1512228107810149听音乐10119411587116现在是90页\一共有109页\编辑于星期四6.8.3实例分析:音乐与入睡时间2.实例操作案例要分析听音乐是否会影响成年人的入睡时间,于是选择了10名女性,对她们分别进行听音乐和不听音乐两种条件下的入睡时间检测。由于选择的样本是相同的,因此表中的两组样本是成对数据。由于这里样本量较少,难以确定总体的分布,因此可以引入非参数的检验方法。故引入两配对样本非参数检验方法。同时这里的数据是连续性数据,故采用Wilcoxon符号秩检验。于是建立如下假设检验。
H0
:听音乐和不听音乐两种条件下入睡时间没有显著差异。
H1
:听音乐和不听音乐两种条件下入睡时间存在显著差异。现在是91页\一共有109页\编辑于星期四SPSS具体操作步骤Step01:打开对话框打开数据文件6-8.sav。选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【2RelatedSamples(2个相关样本)】命令,弹出【Two-Related-SamplesTests(两个关联样本检验)】对话框。现在是92页\一共有109页\编辑于星期四Step02:在左侧的候选变量列表框中同时选择“x”变量和“y”变量作为成对检验变量,将其同时添加至【Test
Pairs(检验对)】列表框中提示:可以在【TestType(检验类型)】选项组中选择检验方法。现在是93页\一共有109页\编辑于星期四Step03:单击【Options】按钮,在弹出的对话框的【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。再单击【Continue】按钮,返回主对话框。现在是94页\一共有109页\编辑于星期四Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。现在是95页\一共有109页\编辑于星期四3.实例结果及分析(1)描述统计量表NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th无放松1011.504.5287228.0010.0014.25有放松108.202.6164115.758.5011.00现在是96页\一共有109页\编辑于星期四3.实例结果及分析(2)秩统计表NMeanRankSumofRanks有放松-无放松NegativeRanks8a5.4443.50PositiveRanks1b1.501.50Ties1cTotal10现在是97页\一共有109页\编辑于星期四3.实例结果及分析(3)非参数检验结果表
有放松
-无放松Z-2.499aAsymp.Sig.(2-tailed)0.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 岩土考研面试题目及答案
- 2026年上海市浦东新区高三二模历史试卷(含答案)
- 金工ETF点评:宽基ETF周净流出571.69亿元;环保、公用事业拥挤变幅较大
- 雨课堂学堂在线学堂云《神经解剖学(山东)》单元测试考核答案
- 网络化维修信息平台
- 矩阵分解高效算法
- 2025-2030中国氢能源行业深度发展研究与“十四五”企业投资战略规划报告
- 2025-2030全球与中国钨合金行业发展现状及趋势预测分析研究报告
- 部编版(六三制)二年级拼音巩固与提升指南(吃透易错点拼读更熟练)
- 2026中国GPRS调制解调器行业现状动态及前景规划分析报告
- 房产公司前期部管理制度
- 中医内科学课件-9肺痿
- 2025-2030中国冰刀行业市场发展趋势与前景展望战略研究报告
- 2022年中华护理学会输液连接装置安全管理专家共识解读
- 农村分家协议书范文
- DLT 722-2014 变压器油中溶解气体分析和判断导则
- 岩溶地区建筑地基基础技术规范DBJ-T 15-136-2018
- QSY 1078-2010 管道下向焊接工艺规程
- 个人保险合同解除申请书
- 中学实验室安全教育课件
- 国内外SRB技术的研究现状及进展
评论
0/150
提交评论