Kruskal-Wallis检验与Friedman检验.ppt_第1页
Kruskal-Wallis检验与Friedman检验.ppt_第2页
Kruskal-Wallis检验与Friedman检验.ppt_第3页
Kruskal-Wallis检验与Friedman检验.ppt_第4页
Kruskal-Wallis检验与Friedman检验.ppt_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七讲Kruskal-Wallis检验与Friedman检验,数据:由K个样本容量可能不同的随机样本组成。记第i个样本容量为 的随机样本为 ,则数据可以排成许多列。 样本1 样本2 样本k,K个样本的比较,假设条件: 1.N个随机样本 ,是相互独立的。 2.对每个固定的 个随机变量 是来自连续分布函数 的随机样本。 3.分布函数 有如下关系: 对 ,是对第j个群体带有未知中位数 和未知疗效 的连续函数。 我们感兴趣的是在疗效 是否有差异。 零假设是它们之间没有差异。,Kruskal-Wallis检验 步骤: 记N为观察的总数 ,把N个观察值从小到大进行排列并赋予它们秩,令 表示赋给 的秩, 为

2、赋给第i个样本的秩的平均,即: 如果有几个观察值相互相等,则可能会有不同的方式赋秩,在这里我们给每个有结的观测赋平均秩。,检验统计量: 这里: 如果没有结,则 可简化为 ,从而检验统计量简化为 如果 大于它零分布的 分位数,则以水平 拒绝零假设。,大样本逼近,在零假设下: 因此, 近似于自由度为1的 随机变量的分布。如果 相互独立,则和,的分布可以用自由度为 的 分布来逼近。但是, ,故 之间是不独立的。Kruskal(1952)证明了如果用 乘以 的第i项,则结果为 是渐进于自由度为 的 分布。 从而如果 大于自由度为 的 分布的 分位数,则以水平 拒绝零假设。P-值近似为自由度为 的 分布

3、随机变量超过 观测值的概率。,例7.1:为了比较属同一类的4种不同食谱的营养效果,将25只老鼠随机地分为4组,每组分别是8只,4只,7只和6只,各采用食谱甲,乙,丙,丁喂养。假设其他条件均保持相同,12周后测得体重增加量如表所示。对于 ,检验各食谱的营养效果是否有显著差异。 12周后25只老鼠的体重增加量,kruskal.test(formula, data, subset, na.action, .) formula: a formula of the form lhs rhs where lhs gives the data values and rhs the corresponding

4、 groups. data: an optional matrix or data frame (or similar: see model.frame) containing the variables in the formula formula. By default the variables are taken from environment(formula). subset: an optional vector specifying a subset of observations to be used. na.action:a function which indicates

5、 what should happen when the data contain NAs. Defaults to get Option(na.action)further arguments to be passed to or from methods.,food-data.frame( x=c(164,190,203,205,206,214,228,257, 185,197,201,231, 187,212,215,220,248,265,281, 202,204,207,227,230,276), g=factor(rep(1:4,c(8,4,7,6) ) kruskal.test(

6、xg,data=food) Kruskal-Wallis rank sum test data: x by g Kruskal-Wallis chi-squared = 4.213, df = 3, p-value = 0.2394,例7.2:把3个减肥计划的每一个分配给了12名志愿者,志愿者被分配到哪个计划是随机的,总共有36位志愿者,假设他们是来自可能要试用一种减肥计划人群中的随机样本,检验零假设:在3种计划下减肥量的概率分布没有差别,备择假设是:在3种计划下减肥量的概率分布有差别。每个人减掉的磅数结果如下。,class-data.frame( x=c(2,12,5,4,26,8,17,4

7、,25,6,21,6, 17,15,3,19,5,14,5,6,19,4,9,7, 29,3,25,28,11,7,5,25,32,24,36,20), g=factor(rep(1:3,c(12,12,12) ) kruskal.test(xg,data=class) Kruskal-Wallis rank sum test data: x by g Kruskal-Wallis chi-squared = 6.138, df = 2, p-value = 0.04647,双向设计,数据: 数据由 个观察值组成,其中 是来自第i个区 组第j种处理的中的观察数 。,假设: 1.N个随机变量 是

8、相互独立的。 2.对固定的i和j, 个随机变量 是来自具有连续分布函数 的随机样本。 3.分布函数 具有如下关系: 这里: 是带有未知中位数 的一个连续函数, 是由第i个区组贡献的未知可加性效应, 是由第j种处理贡献的未知可加性处理效应。 我们感兴趣的是在疗效 是否有差异。 零假设是它们之间没有差异。,Friedman检验,步骤: 在这里 ,首先我们对n个区组中的每一个分别对k 个观察值从小到大进行排序。 表示在第i个区组观察值 联合秩中 的秩,令:,Friedman检验统计量S: 如果S大于第一类错误的概率等于 的值,则拒绝零假设,否则就接受。 大样本近似:当零假设成立时,随着n趋于无穷大,

9、统计量S渐进的服从自由度k-1的 分布,所以当S大于 时,则拒绝零假设,否则就接受。,例7.3: 24只小老鼠按不同窝别分为8个区组,再把每个区组中的观察单位随机分配到3种不同的饲料组,喂养一段时间后,测得小老鼠肝中铁含量,结果如下表所示。试分析不同饲料的小老鼠肝中的铁含量是否不同。 不同饲料组小老鼠肝中铁含量,friedman.test(formula, data, subset, na.action, .) formula: a formula of the form a b | c, where a, b and c give the data values and correspond

10、ing groups and blocks, respectively. data: an optional matrix or data frame (or similar: see model.frame) containing the variables in the formula formula. By default the variables are taken from environment(formula). subset: an optional vector specifying a subset of observations to be used. na.action:a function which indicates what should happen when the data contain NAs. Defaults to getOption(na.action).further arguments to be passed to or from methods.,X-matrix( c(1.00,1.01,1.13,1.14,1.70,2.01,2.23,2.63, 0.96,1.23,1.54,1.96,2.94,3.68,5.59,6.96, 2.07,3.72,4.50

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论