MBA统计学非参数检验_第1页
MBA统计学非参数检验_第2页
MBA统计学非参数检验_第3页
MBA统计学非参数检验_第4页
MBA统计学非参数检验_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学,从数据到结论,第十六章 非参数检验,16.1 关于非参数的一些常识,经典统计的多数检验都假定了总体的背景分布。 但在总体未知时,如果假定的总体和真实总体不符,那么就不适宜用通常的检验 这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。,无需假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行的检验都称为非参数检验(nonparametric testing)。,16.1 关于非参数的一些常识,这些非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。 在总体分布形式已知时,非参数检验不如传统方法效

2、率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。,这里介绍一些非参数检验。 关于非参数方法的确切定义并不很明确。我们就其最广泛的意义来理解。 在计算中,诸如列联表分析中的许多问题都有精确方法,Monte Carlo抽样方法和用于大样本的渐近方法等选择。精确方法比较费时间,后两种要粗糙一些,但要快些。,秩(rank),非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。例

3、如我们有下面数据,这下面一行(记为Ri)就是上面一行数据Xi的秩。,秩(rank),利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。,16.2 单样本检验16.2.1单样本中位数(a-分位数)符号检验,我们知道某点为中位数(a-分位数)意味着一个数小于该点的概率应该为0.5(a). 因此,一个观测值小于该点(或与该点之差的符号为负号)的概率为0.5(a)。 这就是符号检验名称的来源,并与二项分布有关。,例:数据gs.txt,例16.1 质量监督部门对商店里面出售的某厂家的西洋参片进行了

4、抽查。对于25包写明为净重100g的西洋参片的称重结果为(单位:克):,99.05100.25102.5699.15104.89101.8696.3796.7999.37 96.9093.9492.97108.2896.8693.9498.2798.36 100.8192.99103.7290.6698.2497.8799.21101.79,数据gs.txt,样本中位数为m=98.36。因此,人们怀疑厂家包装的西洋参片份量不足。由于对于这些重量的总体分布不清楚,决定对其进行符号检验。需要检验的是:,数据gs.txt,按照零假设,每个观测值(每包西洋参的净重)大于中位数m0=100g的机会和小于

5、100g的概率都是0.5。这服从二项分布Bin(25,0.5)。 重于100g的只有8包。这样的二项分布变量小于或等于8的概率为0.05388。这就是p-值。 因此, 对于水平a=0.05, 根据这个符号检验,没有充分的证据拒绝零假设。,数据gs.txt,SPSS输出的结果在下面表格中。从该表格可以看出精确的双边检验的p-值=0.108(精确地为0.1078);也就是说,我们的单尾检验的p-值为其一半。,数据gs.txt,另一种输出来自于SPSS的另一种选项:,SPSS软件使用,这里有两种选项方式: 1.以数据gs.sav为例。直接使用SPSS选项AnalyzeNonparametric Te

6、stsBinomial,再把变量gsweight选入Test Variable List,然后在下面Define Dichotomy的Cut point输入100(克),在下面Test Proportion输入p0=0.50(零假设大于100小时的比例);还可以点击Exact来选择精确检验,渐近检验和Monte Carlo方法等,然后OK即可得到前面显示的结果。,SPSS软件使用,2. 数据gs.sav有一列(变量名为m),这是重复零假设的100g使得m的长度和gsweight一样。然后利用选项AnalyzeNonparametric TestsRelated Samples,再把变量gswe

7、ight和m同时选入Test Pair(s) List之中,再在下面选Sign及在Exact中选Exact;然后回到主对话框,OK即可。得出前面的第二个输出。,16.2 单样本检验16.2.2单样本位置参数的Wilcoxon符号秩检验,符号检验只用了差的符号,但没有利用差值的大小。 Wilcoxon 符号秩检验(Wilcoxon signed-rank test) 把差的绝对值的秩分别按照不同的符号相加作为其检验统计量。 它利用了更多的信息。,16.2 单样本检验16.2.2单样本位置参数的Wilcoxon符号秩检验,Wilcoxon符号秩检验需要一点总体分布的性质;它要求假定样本点来自连续对

8、称总体分布;而符号检验不需要知道任何总体分布的性质。 在对称分布中,总体中位数和总体均值是相等的;因此,对于总体中位数的检验,等价于对于总体均值的检验。,假定x1,x2, xn为来自连续对称总体。如果零检验为中位数(均值)m = m0。 把满足xi-m00的|xi-m0|的秩求和,并用W+表示。如果m0的确是中位数,那么,W-和W-应大体差不多。 如果W-或者W+过大或过小,则应该怀疑中位数m = m0的零假设。 令W=min(W-,W+),则当W太小时,应该拒绝零假设。这个W就是Wilcoxon符号秩检验统计量。,例:数据gs.txt,例16.1 质量监督部门对商店里面出售的某厂家的西洋参片

9、进行了抽查。对于25包写明为净重100g的西洋参片的称重结果为(单位:克):,99.05100.25102.5699.15104.89101.8696.3796.7999.37 96.9093.9492.97108.2896.8693.9498.2798.36 100.8192.99103.7290.6698.2497.8799.21101.79,例16.1:数据gs.txt(继续),利用SPSS,很容易得到该数据的Wilcoxon符号秩检验结果 (Wilcoxon符号秩检验精确(单尾)的p-值为0.047 ):,软件使用说明,利用例16.1数据(gs.txt或gs.sav)。该数据有一列(变

10、量名为m),这是重复零假设的100g使得m的长度和gsweight一样。然后利用选项AnalyzeNonparametric TestsRelated Samples,再把变量gsweight和m同时选入Test Pair(s) List之中,再在下面选Wilcoxon及在Exact中选Exact;再回到主对话框,OK即可。,16.2.3 单样本Kolmogorov-Smirnov检验,单样本的Kolmogorov-Smirnov检验(K-S检验)是用来检验一个数据的观测累积分布是否是已知的理论分布。 这些作为零假设的理论分布在SPSS的选项中有正态分布,Poisson分布,均匀分布和指数分布

11、。在SPSS软件中对于是否是正态分布或均匀分布的检验统计量为,数据ksdata.sav的K-S检验,我们检验它是否是正态分布、均匀分布和指数分布。输出结果分别显示在下面三个表中:,单边检验的p-值等于0.074/2=0.037(渐近检验)和0.069/2=0.0345(精确检验)。如果按照显著性水平为0.05的标准,可以拒绝产生数据的总体为正态分布的零假设。,p-值等于0.000(渐近检验)和0.000(精确检验)。如果按照显著性水平为0.05的标准,可以拒绝产生数据的总体为均匀分布的零假设。,p-值等于0.664/2=0.332(渐近检验)和0.662/2=0.331(精确检验)。如果按照显

12、著性水平为0.05的标准,不能拒绝产生数据的总体为指数分布的零假设。,警告,经常有人在Kolmogorov-Smirnov检验中,当检验不能拒绝总体分布为某分布时,来“接受”或“证明”该样本来自该分布。这是错误的。 比如我们有由1、2、3、4、5五个数目组成的数据,我们分别检验该数据是否是正态分布、均匀分布、Poisson分布或指数分布。结果归纳为下表(读者可以自己练习去算),Kolmogorov-Smirnov单样本分布检验 零假设的分布(渐近双边检验的)p-值 正态分布1.000 均匀分布0.988 Poisson分布1.000 指数分布0.806,根据此表,没有足够证据来拒绝任何一个零假

13、设。难道我们可以随意“接受”该总体为其中任一个分布吗?,SPSS软件使用说明,使用我们的ksdata.sav数据。 选项为AnalyzeNonparametric Tests1 Sample K-S。 然后把变量(这里是x)选入Variable List。再在下面Test Distribution选中零假设的分布(Normal、Poisson、Uniform和Exponential)作为零假设。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。,16.2

14、.4 关于随机性的游程检验(run test),游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由0和1组成的一个这种变量的样本(数据run1.sav): 0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0 其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。 这个数据中有4个0组成的游程和3个1组成的游程。一共是R=7个游程。其中0的个数为m=15,而1的个数为n=10。,关于随机性的游程检验(run test),出现0和1的的这样一个过程可以看成是参数为某未知p的Bernoulli试验。但在给定了m和

15、n之后,在0和1的出现是随机的零假设之下,R的条件分布就和这个参数无关了。根据初等概率论,R的分布可以写成(令N=m+n),关于随机性的游程检验(run test),于是就可以算出在零假设下有关R的概率,以及进行有关的检验了。利用上面公式可进行精确检验;也可以利用大样本的渐近分布和利用Monte Carlo方法进行检验。利用上面数据的结果是,关于随机性的游程检验(run test),当然,游程检验并不仅仅用于只取两个值的变量,它还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于0和1的个数)是否随机的问题。看下面例子。 例 (run2.sav): 从某装瓶机出来的30盒化妆品的重量

16、如下(单位克) 71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9 为了看该装瓶机是否工作正常,首先需要验证是否大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。,关于随机性的游程检验(run test),如果把小于中位数的记为0,否则记为1,上面数据变成下面的01序列 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1

17、0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 这就归为上面的问题。当然这里进行这种变换只是为了易于理解。实际计算时,用不着这种变换,计算机会自动处理这个问题的。 直接利用这个数据,通过SPSS,得到下面游程检验结果的输出。,SPSS软件使用说明,用run2.sav数据。 选项为AnalyzeNonparametric TestsRuns。 然后把变量(这里是length)选入Variable List。再在下面Cut Point选中位数(Median)。当然,也可以选其他值,如均值(Mean),众数(Mode)或任何你愿意的数目(放在Custom)。注意在对前面的由0和1组成的序

18、列(run1.sav进行随机性检验时,要选均值(为什么?)。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。,16.3 两独立样本检验16.3.1 比较两总体中位数的非参数检验: Wilcoxon (Mann-Whitney)秩和检验,为检验两总体的中位数是否相等,常用Wilcoxon (或称Mann-Whitney)秩和检验,其原理很简单 假定两个个样本分别有m个和n个观测值。把两个样本混合后把这m+n个观测值升幂排序, 记下每个观测值在混合排序下面

19、的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。这两个值可以互相推算,称为Wilcoxon统计量。,该统计量的分布和两个总体分布无关。由此分布可以得到p-值。 直观上看,如果WX与WY之中有一个显著地大,则可以选择拒绝零假设。 该检验需要的唯一假定就是两个总体的分布有类似的形状(不一定对称)。,例子,下面数据(GDP.txt)是地区1的十个城市和地区2的15个城市的人均GDP(元)。现在要想以此作为两个样本来检验两个地区的人均GDP的中位数m1和m2是否一样,即双尾检验H0: m1=m2对Ha: m1m2。由于地区2的人均GDP的中位数大于地区

20、1的中位数,因此也可以做单尾检验H0: m1=m2对Ha: m1m2。 地区1:3223452638362781598232164710562823034618 地区2:539139834076594147484600632545345526569970085403667855375257,SPSS的输出,该结果头两行显示了Mann-Whitney和Wilcoxon统计量的值。另外和我们需要结果的相关部分为:对于双尾检验H0: m1=m2对Ha: m1m2,p-值为0.016(见“Exact Sig. (2-tailed)”);而对于单尾检验H0: m1=m2对Ha: m1m2(见“Exact

21、 Sig. (1-tailed)”),p-值为0.008。这两个结果是精确计算的。通常在样本量大的时候利用近似方法得到渐近分布的p-值(见“Asymp. Sig. (2-tailed)”),它只给了双尾检验的近似p-值0.017,和精确值差别不大。注意单尾检验的p-值是双尾检验的p-值的一半。这个例子的结果表明,可以拒绝原假设,即有理由认为地区2的人均GDP的中位数要高一些。,SPSS软件使用说明,使用GDP.sav数据。 选项为AnalyzeNonparametric Tests2 Independent Samples。 把变量(gdp)选入Test Variable List;再把用1和

22、2分类的变量area输入进Grouping Variable,在Define Groups输入1和2。 在Test Type选中MannWhitney。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.3.2 两样本分布的Kolmogorov-Smirnov检验,假定有分别来自两个独立总体的两个样本。要想检验它们背后的总体分布相同的零假设,可以进行两独立样本的Kolmogorov-Smirnov检验。原理完全和单样本情况一样。只不过把检验统计量中零

23、假设的分布换成另一个样本的经验分布即可。 假定两个样本的样本量分别为n1和n2,用S1 (X)和S2 (X)分别表示两个样本的累积经验分布函数。再记DjS1 (Xj)-S2 (Xj)。近似正态分布的检验统计量为,计算结果,twonp.txt:两种破坏性试验的持续时间。根据这个数据,n1=30,n2=25。由SPSS输出,得到,SPSS软件使用说明,使用twonp.sav数据。 选项为AnalyzeNonparametric Tests2 Independent Samples。 把变量(duration)选入Test Variable List;再把用1和2分类的变量type输入到Groupi

24、ng Variable,在Define Groups输入1和2。 在Test Type选中Kolmogorov-Smirnov Z。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.3.3 两样本Wald-Wolfowitz游程检验,Wald-Wolfowitz游程检验(Wald-Wolfowitz runs test)和Kolmogorov-Smirnov检验都是看两样本代表的总体分布是否类似。但是方法不一样。 Wald-Wolfowitz游程检

25、验把两个样本混合之后,按照大小次序排列,同样本的观测值在一起的为一个游程。 和单样本的游程问题类似。可以由游程个数R看出两个样本在排序中是否随机出现。,软件使用:数据和前面一样,只在Test Type选Wald-Wolfowitz runs。,由twonp.sav数据,可以得到下面SPSS关于Wald-Wolfowitz游程检验的输出:,16.4 关于多个独立样本的检验16.4.1 Kruskal-Wallis关于多个样本的秩和检验,检验目的是看多总体位置参数是否一样。 方法和Wilcoxon-Mann-Whitney检验的思想类似。 假定有k个总体。先把从这个k个总体来的样本混合起来排序,记

26、各个总体观测值的秩之和为Ri,i=1,k。显然如果这些Ri很不相同,就可以认为它们位置参数相同的零假设不妥(备选假设为各个位置参数不全相等)。,Kruskal-Wallis关于多个样本的秩和检验,注意这里所说的位置参数是在下面意义上的qi;由于它在分布函数Fi(x)中可以和变元x相加成为F(x+qi)的样子,所以称qi为位置参数。 形式上,假定这些样本有连续分布F1,Fk,零假设为H0:F1=Fk,备选假设为Ha:Fi(x)=F(x+qi),i=1,k,这里F为某连续分布函数,而且这些参数qi并不相等。Kruskal-Wallis检验统计量为(R上面一杠表示平均),Kruskal-Wallis

27、关于多个样本的秩和检验,公式中ni为第i个样本量,而N为各个样本量之和(总样本量)。 如果观测值中有大小一样的数值,这个公式会有稍微的变化。 这个统计量在位置参数相同的零假设下有渐近的自由度为k-1的c2分布。Kruskal-Wallis检验仅仅要求各个总体变量有相似形状的连续分布。,数据house.txt:三个区域房价的数据,为了调查三个地区的房价是否类似,在每个地区抽样,得到三个样本量分别为20、30、25的房价样本。利用SPSS软件,很容易得到下面的检验结果:,SPSS软件使用说明,使用house.sav数据。 选项为AnalyzeNonparametric TestsK Indepen

28、dent Samples。 把变量(这里是price)选入Test Variable List;再把数据中用1、2、3来分类的变量group输入Grouping Variable,在Define Groups输入1、2、3。 在下面Test Type选中Kruskal-Wallis H。 点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.4.2 Jonckheere-Terpstra多样本的秩检验,这个检验处理的问题和Kruskal-Wallis检验类

29、似,零假设都是各个总体的位置参数相同,但这里的备选假设为各个总体的位置参数按升幂排列(如为降幂排列,可把总体编号颠倒顺序即为升幂排列)。 这里所说的位置参数和前面的Kruskal-Wallis检验中的位置参数意义一样。 Jonckheere-Terpstra检验先在每两个样本所有观测值对之间比较,计算第i个样本观测值中小于第j个样本观测值的对子数:,数据house.sav:三个区域房价的数据,很容易得到SPSS的Jonckheere -Terpstra检验结果输出:,SPSS软件使用说明,使用house.sav数据。 选项为AnalyzeNonparametric TestsK Indepen

30、dent Samples。 把变量(这里是price)选入Test Variable List;再把数据中用1、2、3来分类的变量group输入Grouping Variable,在Define Groups输入1、2、3。 在下面Test Type选中Jonckheere-Terpstra。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.4.3 Brown-Mood中位数检验,在有数个独立样本的情况,希望知道它们的中位数是否相等。零假设是这些样

31、本所代表的总体的中位数相等。备选假设是这些中位数不全相等。 假定有k个总体,ni为第i个样本量;把所有样本量之和记为N。,16.4.3 Brown-Mood中位数检验,先把从这个k个总体来的样本混合起来排序,找出它们的中位数。 再计算每个总体中小于该中位数的观测值个数O1i,i=1,k,和每个总体中大于该中位数的观测值个数O2i,i=1,k。这样就形成了一个由元素Oij组成的2k表。其列总和为ni,i=1,k;而两个行总和为各样本小于总中位数的观测值总和:R1O11+O12+ O1k及各样本大于总中位数的观测值总和R2O21+O22+ O2k。 这显然是一个列联表,可以用Pearson c2统

32、计量,即,house.txt数据,这里,SPSS软件使用说明,使用house.sav数据。 选项为AnalyzeNonparametric TestsK Independent Samples。 把变量(这里是price)选入Test Variable List;再把数据中用1、2、3来分类的变量group输入Grouping Variable,在Define Groups输入1、2、3。 在下面Test Type选中Median。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic

33、 only)。最后OK即可,16.5 多个相关样本的检验 16.5.1 Friedman秩和检验,前面讨论了两因子试验设计数据的方差分析,那里所用的F检验需要假定总体的分布为正态分布。 有一种非参数方差分析方法,称为Friedman (两因子)秩和检验,或Friedman方差分析。它适用于两个因子的各种水平的组合都仅有一个观测值的情况。,Friedman秩和检验,假定第一个因子有k个水平(称为处理,treatment),第二个因子有b个水平(称为区组);因此一共有kbkb个观测值。 这里之所以称一个因子为处理,是因为这是我们想要看该因子各水平是否对试验结果有显著的不同(它的各个水平的观测值也就

34、是本小节的多个相关样本)。而另一个因子称为区组,不同的区组也可能对结果有影响。下面是一个例子。,数据fert.txt,这里有三种肥料作为第一个因子(肥料因子)的三个水平;而四种土壤为第二个因子(土壤因子)的四个水平。感兴趣于是否这三种肥料对于某作物的产量有区别。称肥料因子为处理,而土壤因子为区组。数据在下表中(表中数字为相应组合的产量,单位公斤)。,Friedman秩和检验,Friedman秩和检验是关于位置的,和Kruskal-Wallis检验类似,形式上,假定这些样本有连续分布F1,Fk,零假设为H0:F1=Fk,备选假设为Ha:Fi(x)=F(x+qi),i=1,k,这里F为某连续分布函

35、数,而且这些参数qi并不相等。 虽然这和以前的Kruskal-Wallis检验一样,但是由于区组的影响, 要首先在每一个区组中计算各个处理的秩;再把每一个处理在各区组中的秩相加.如果Rij表示在j个区组中第i个处理的秩。则秩按照处理而求得的和为,Friedman秩和检验,这样做的目的是在每个区组内比较处理。例如, 同个年龄段中比较药品的疗效比不分年龄来比较疗效要合理;在同一个部位比较不同的材料要比混合起来比较要合理等等。这里要引进的Friedman统计量定义为,Friedman秩和检验,第一个式子表明,如果各个处理很不一样,和的平方就会很大,结果就显著。第二个公式是为了计算方便而导出的。它有近

36、似的(有k-1个自由度的)c2分布。,fert.txt数据,SPSS软件使用说明,使用fert.sav数据。 选项为AnalyzeNonparametric TestsK Related Samples。 然后把变量(这里是a、b、c)选入Test Variable List。 在下面Test Type选中Friedman。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.5.2 Kendall协同系数检验,实践中常需要按照某些特别的性质来多次对一

37、些个体进行评估或排序;比如几个(m个)评估机构对一些(n个)学校进行排序。人们想要知道,这些机构的不同结果是否一致。如果很不一致,则该评估多少有些随机,意义不大。 换句话说,这里想要检验的零假设是:这些对于不同学校的排序是不相关的或者是随机的;而备选假设为:这些对不同学校的排序是正相关的或者是多少一致的。,Kendall协同系数检验,一个机构对诸个体(学校)的秩(次序)的和为1+2+n=n(n+1)/2;所有m个机构对所有个体评估的总秩为mn(n+1)/2;这样对每个个体的平均秩为m(n+1)/2。如果记每一个个体的m个秩(次序)的和为Ri(i=1,n), 如果评估是随机的,这些Ri与平均秩的

38、差别不会很大,反之差别会很大,也就是说下面的个体的总秩与平均秩的偏差的平方和S很大。S定义为,Kendall协同系数检验,这个和Kendall协同系数(Kendalls Coefficient of Concordance)是成比例的,Kendall协同系数W(Kendalls W)定义为,数据school.txt,下面是4个独立的环境研究单位对15个学校排序的结果每一行为一个评估机构对这些学校的排序。看上去不那么一致(也有完全一致的):,数据school.sav,SPSS的Kendall协同系数检验的输出,SPSS软件使用说明,使用school.sav数据。 选项为AnalyzeNonpar

39、ametric TestsK Related Samples。 然后把变量(这里是s1、s2、s15 )选入Test Variable List。 在下面Test Type选中Kendalls W 。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.5.3 关于两值响应的Cochran检验,前面讨论了两因子方差分析问题的Friedman秩和检验。 但是当观测值只取诸如0或1两个可能值时,由于有太多同样的数目(只有0和1),排序的意义就很成问题了。

40、这里要引进的Cochran检验就是用来解决这个问题的一个非参数检验。这里的零假设也是各个处理是相同的。先看一个例子,16.5.3 关于两值响应的Cochran检验,关于瓶装饮用水的调查(数据在water.txt)。20名顾客对4种瓶装饮用水进行了认可(记为1)和不认可(记为0)的表态。 我们感兴趣的是这几种瓶装水在顾客眼中是否有区别。这里零假设是这些瓶装水(作为处理)在(作为区组的)顾客眼中没有区别。,数据water.txt,下表是数据,每一行为20个顾客对某一饮料的20个观点(0或1)。最后一列1为认可总数Ni而最后一行为每个顾客给出的4个观点中认可数的总和Li。最后一行的最后的元素为总认可

41、数N。,显然,如果Ni和这些Ni的均值的差距很大,那么这些处理就很不一样了。Cochran检验就是基于这个思想的。用Ni 表示第i个处理所得到的“1”的个数,而Lj为第j个区组(例子中的顾客)所给的“1”的个数,“1”的总数记为N。,关于两值响应的Cochran检验,Cochran检验统计量(Cochrans Q)为(假定有k个处理和b个区组),当k固定时,Q在b很大时有近似的自由度为k-1的c2分布。,数据water.sav,Cochran检验的SPSS输出:,SPSS软件使用说明,使用water.sav数据。 选项为AnalyzeNonparametric TestsK Related Samples。 然后把变量(这里是c1、c2、c3、c4 )选入Test Variable List。 在下面Test Type选中Cochrans Q。 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可,16.5.4 成对样本的中位数检验,我们介绍了在正态分布总体的假定下,关于成对样本均值的t检验。 我们还提到,当总体参数未知时,应该使用非参数方法。 这里

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论