方差分析对应的非参检验_第1页
方差分析对应的非参检验_第2页
方差分析对应的非参检验_第3页
方差分析对应的非参检验_第4页
方差分析对应的非参检验_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差分析对应的非参检验方差分析对应的非参检验 Kruskal Wallis 检验(对应单因素) Friedman检验(对应双因素) Kruskal Wallis 检验 l这个检验的目的是看多个总体的位置参数是这个检验的目的是看多个总体的位置参数是 否一样。否一样。 l方法和方法和Wilcoxon-Mann-Whitney检验的思想检验的思想 类似。类似。 l假定有假定有k个总体。个总体。 l先把从这个先把从这个k个总体来的样本混合起来排序,个总体来的样本混合起来排序, 记各个总体观测值的秩之和为记各个总体观测值的秩之和为Ri,i=1,k。 l显然如果这些显然如果这些Ri很不相同,就可以认为它们

2、很不相同,就可以认为它们 位置参数相同的零假设不妥(备选假设为各位置参数相同的零假设不妥(备选假设为各 个位置参数不全相等)。个位置参数不全相等)。 Kruskal Wallis 检验检验 l注意这里所说的位置参数是在下面意义上的注意这里所说的位置参数是在下面意义上的q qi; 由于它在分布函数由于它在分布函数Fi(x)中可以和变元中可以和变元x相加成相加成 为为F(x+q qi)的样子,所以称的样子,所以称q qi为位置参数,即为位置参数,即 Fi(x)=F(x+q qi) l形式上,假定这些总体有连续分布形式上,假定这些总体有连续分布F1,Fk, 零假设为零假设为H0:F1=Fk, 备选假

3、设为备选假设为Ha:F(x+q qi),i=1,k,这些参数这些参数q qi并并 不相等不相等 Kruskal Wallis 检验检验 lKruskal-Wallis检验统计量为检验统计量为 公式中公式中n ni i为第为第i i个样本量,而个样本量,而N N为各个样本量之和(总为各个样本量之和(总 样本量)。样本量)。 如果观测值中有大小一样的数值,这个公式会有稍如果观测值中有大小一样的数值,这个公式会有稍 微的变化。微的变化。 这个统计量在位置参数相同的零假设下有渐近的自这个统计量在位置参数相同的零假设下有渐近的自 由度为由度为k-1k-1的的c c2 2分布。分布。 Kruskal-Wa

4、llisKruskal-Wallis检验仅仅要求各个总体变量有相似检验仅仅要求各个总体变量有相似 形状的连续分布。形状的连续分布。 2 1 12 3(1) (1) k i i i R HN N Nn Kruskal Wallis 检验案例检验案例house l为了调查三个地区的房价是否类似,在每个地区抽样,得为了调查三个地区的房价是否类似,在每个地区抽样,得 到三个样本量分别为到三个样本量分别为2020、3030、2525的房价样本。利用的房价样本。利用SPSSSPSS软软 件容易得到下面的检验结果:件容易得到下面的检验结果: Test Statisticsb,c 10.365 2 .006

5、.005a .003 .007 Chi-Square df Asymp. Sig. Sig. Lower Bound Upper Bound 99% Confidence Interval Monte Carlo Sig. PRICE Based on 10000 sampled tables with starting seed 2000000. a. Kruskal Wallis Testb. Grouping Variable: GROUPc. Kruskal Wallis 检验检验SPSS实现实现 l使用使用house.sav数据。数据。 l选项为选项为AnalyzeNonparame

6、tric TestsK Independent Samples。 l把变量(这里是把变量(这里是price)选入)选入Test Variable List; 再把数据中用再把数据中用1、2、3来分类的变量来分类的变量group输入输入 Grouping Variable,在,在Define Groups输入输入1、2、 3。 l在下面在下面Test Type选中选中Kruskal-Wallis H。 l点点Exact时打开的对话框中可以选择精确方法时打开的对话框中可以选择精确方法 (Exact),),Monte Carlo抽样方法(抽样方法(Monte Carlo) 或用于大样本的渐近方法(或

7、用于大样本的渐近方法(Asymptotic only)。)。 l最后最后OK即可即可 Jonckheere-TerpstraJonckheere-Terpstra检验检验 l这个检验处理的问题和这个检验处理的问题和Kruskal-WallisKruskal-Wallis检检 验类似,零假设都是各个总体的位置参数验类似,零假设都是各个总体的位置参数 相同,但这里的相同,但这里的备选假设为各个总体的位备选假设为各个总体的位 置参数按升幂排列置参数按升幂排列(如为降幂排列,可把(如为降幂排列,可把 总体编号颠倒顺序即为升幂排列)。总体编号颠倒顺序即为升幂排列)。 l注意这里所说的位置参数和前面的注意

8、这里所说的位置参数和前面的 Kruskal-WallisKruskal-Wallis检验中的位置参数意义一检验中的位置参数意义一 样。样。 Jonckheere-TerpstraJonckheere-Terpstra检验检验 lJonckheere-TerpstraJonckheere-Terpstra检验先在每两个样本检验先在每两个样本 所有观测值对之间比较,计算第所有观测值对之间比较,计算第i i个样本观个样本观 测值中小于第测值中小于第j j个样本观测值的对子数:个样本观测值的对子数: #(,1,.,1,.,) ijikjlil UXXkn ln ij ij JU Jonckheere-

9、TerpstraJonckheere-Terpstra检验检验househouse Jonckheere-Terpstra Test a 3 75 1229.500 925.000 102.299 2.977 .003 .003 .001 .000 Number of Levels in GROUP N Observed J-T Statistic Mean J-T Statistic Std. Deviation of J-T Statistic Std. J-T Statistic Asymp. Sig. (2-tailed) Exact Sig. (2-tailed) Exact Sig

10、. (1-tailed) Point Probability PRICE Grouping Variable: GROUPa. Jonckheere-TerpstraJonckheere-Terpstra检验检验SPSSSPSS l使用使用house.sav数据。数据。 l选项为选项为AnalyzeNonparametric TestsK Independent Samples。 l把变量(这里是把变量(这里是price)选入)选入Test Variable List; 再把数据中用再把数据中用1、2、3来分类的变量来分类的变量group输入输入 Grouping Variable,在,在De

11、fine Groups输入输入1、2、 3。 l在下面在下面Test Type选中选中Jonckheere-Terpstra。 l在点在点Exact时打开的对话框中可以选择精确时打开的对话框中可以选择精确方法方法 (Exact),),Monte Carlo抽样方法(抽样方法(Monte Carlo) 或用于大样本的渐近方法(或用于大样本的渐近方法(Asymptotic only)。)。 l最后最后OK即可即可 Friedman秩和检验秩和检验双因素双因素 l参数统计中讨论了两因子试验设计数据的参数统计中讨论了两因子试验设计数据的 方差分析,那里所用的方差分析,那里所用的F F检验需要假定总体检

12、验需要假定总体 的分布为正态分布。的分布为正态分布。 l有 一 种 非 参 数 方 差 分 析 方 法 , 称 为有 一 种 非 参 数 方 差 分 析 方 法 , 称 为 Friedman Friedman (两因子)秩和检验,或(两因子)秩和检验,或 FriedmanFriedman方差分析。方差分析。 它适用于两个因子的各种水平的组合都有一个观它适用于两个因子的各种水平的组合都有一个观 测值的情况。测值的情况。 Friedman秩和检验秩和检验 l假定第一个因子有假定第一个因子有k k个水平(称为处理,个水平(称为处理, treatmenttreatment),第二个因子有),第二个因子

13、有b b个水平(称个水平(称 为区组);因此一共有为区组);因此一共有k kb bkbkb个观测值。个观测值。 l这里之所以称一个因子为处理,是因为这这里之所以称一个因子为处理,是因为这 是我们想要看该因子各水平是否对试验结是我们想要看该因子各水平是否对试验结 果有显著的不同。果有显著的不同。 l而另一个因子称为区组,不同的区组也可而另一个因子称为区组,不同的区组也可 能对结果有影响。下面是一个例子。能对结果有影响。下面是一个例子。 Friedman秩和检验案例秩和检验案例fert l这里有三种肥料作为第一个因子(肥料因子)的三个水平;这里有三种肥料作为第一个因子(肥料因子)的三个水平; 而四

14、种土壤为第二个因子(土壤因子)的四个水平。感兴而四种土壤为第二个因子(土壤因子)的四个水平。感兴 趣于是否这三种肥料对于某作物的产量有区别。称肥料因趣于是否这三种肥料对于某作物的产量有区别。称肥料因 子为处理,而土壤因子为区组。(单位公斤)。子为处理,而土壤因子为区组。(单位公斤)。 肥料种类肥料种类 肥料肥料A肥料肥料B肥料肥料C 土土 壤壤 类类 型型 土壤土壤1224668 土壤土壤2253648 土壤土壤3182120 土壤土壤4111319 Friedman秩和检验秩和检验 lFriedman秩和检验是关于位置的,和秩和检验是关于位置的,和Kruskal- Wallis检验类似,形式

15、上,假定这些样本有连检验类似,形式上,假定这些样本有连 续分布续分布F1,Fk,零假设为,零假设为H0:F1=Fk,备选,备选 假设为假设为Ha:Fi(x)=F(x+q qi),i=1,k,这里,这里F为为 某连续分布函数,而且这些参数某连续分布函数,而且这些参数q qi并不相等。并不相等。 l由于区组的影响由于区组的影响, 要首先在每一个区组中计算各要首先在每一个区组中计算各 个处理的秩;个处理的秩; l再把每一个处理在各区组中的秩相加再把每一个处理在各区组中的秩相加. l如果如果Rij表示在表示在j个区组中第个区组中第i个处理的秩。则秩按个处理的秩。则秩按 照处理而求得的和为照处理而求得的

16、和为 1 ,1,., b iij j RRik Friedman秩和检验秩和检验 l这样做的目的是在每个区组内比较处理。这样做的目的是在每个区组内比较处理。 例如例如, 同个年龄段中比较药品的疗效比不分年龄来比较同个年龄段中比较药品的疗效比不分年龄来比较 疗效要合理;疗效要合理; 在同一个部位比较不同的材料要比混合起来比较要合在同一个部位比较不同的材料要比混合起来比较要合 理等等。理等等。 l这里要引进的这里要引进的Friedman统计量定义为统计量定义为 l第一个式子表明,如果各个处理很不一样,和的第一个式子表明,如果各个处理很不一样,和的 平方就会很大,结果就显著。平方就会很大,结果就显著

17、。 l第二个公式是为了计算方便而导出的。它有近似第二个公式是为了计算方便而导出的。它有近似 的(有的(有k-1个自由度的)卡方分布。个自由度的)卡方分布。 2 2 11 12(1)12 3 (1) (1)2(1) kk ii ii b k QRRb k bk kbk k Friedman秩和检验案例秩和检验案例fert Ranks 1.00 2.25 2.75 A B C Mean Rank Test Statistics a 4 6.500 2 .039 .042 .037 N Chi-Square df Asymp. Sig. Exact Sig. Point Probability Friedman Testa. Friedman秩和检验秩和检验SPSS实现实现 l使用使用fert.sav数据。数据。 l选项为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论