第统计1105班,孙铭远 翻译.docx_第1页
第统计1105班,孙铭远 翻译.docx_第2页
第统计1105班,孙铭远 翻译.docx_第3页
第统计1105班,孙铭远 翻译.docx_第4页
第统计1105班,孙铭远 翻译.docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三讲Wilcoxon 秩和检验13.1简介 在上一讲的置换检验中,我们阐述了随机抽样条件下,比较一个独立样本中两组均值1,2的方法,这种情况下,我们检验的假设是这种形式原假设H0: 1 2 = 0 备择假设:Ha: 1 2 0 Ha: 1 2 0 Ha: 1 2 0 我们真正需要用置换检验去检验的假设仅是(1)样本是随机选取且独立的(2)数据以区间形式度量(因此均值以及均值差的意义重大)Wilcoxon 秩和检验是另一种广泛使用的非参数统计方法,用来比较两组属于Wilcoxon(即符号秩检验的创始人)型的独立总体。为什么我们要介绍这种检验呢?这主要是因为秩和检验与上文的假设不同,基本上来说,Wilcoxon秩和检验仅需要将观测值的秩作为检验统计量,这也就意味着,只有样本的顺序参与分析。基于此,Wilcoxon秩和检验可以检验任何按顺序排列的数据(它同样可以用来检验区间数据,但这样做很可能会丢失样本)13.2次序数据次序数据既是仅按大小顺序排列的数据,但是我们难以确认数据差异的大小,我们曾在抽样调查中见过很多这样的例子,如“利开特”型量表,请看下面的例子例:请选出下列最符合你个人情况的数字非参数统计是即切片面包以来最伟大的事物非常反对 反对 一般 同意 非常同意1 2 3 4 5这个问题的答案均为顺序的,当你从左向右观察这个量表时,你只能看到同意程度增加的幅度,然而,“非常同意”和“同意”之间的差值我们不得而知。这种距离,或者说变量之间的区间是模糊且非常主观的。这个量表的数字仅仅是为了方便而设置的,我们要清楚的认识到它们是任意取值的。你同样可以任意的用2,5,13,15,29作为你的量表数字,而不是传统的1,2,3,4,5。因此,例如这样基于区间尺度的统计量也同样是任意的。当然,这并不妨碍研究者们使用作为统计量,但你应当意识到这种方式的不足之处。Wilcoxon秩和检验的目的既是仅基于数据的次序探究两个独立样本的问题,下面给出使用条件1.数据是次序的2数据是区间的,但是存在强烈的异常值导致不可靠我将由下一个例子引出这个检验的推导步骤。13.3检验的推导假定:Wilcoxon秩和检验包含以下假定1. 样本独立且随机2. 数据至少是顺序的原假设H0:总体变量在1,2组中处在同一位置备择假设Ha:总体变量在1中位置与2不同(双边检验)Ha:总体变量在1中比2大(右侧检验)Ha:总体变量在1中比2小(左侧检验)这些假设,比我们曾接触到的符号秩检验(第8讲)、 Wilcoxon符号秩检验(第9讲)的假设更广泛,这主要是因为采用次序作为度量尺度,若我们采用更为严格的假设,如连续数据或同分布,假设就会变成总体中位数的比较(正如第8讲,第9讲)。然后,主要的区别在于样本是独立的,而此时符号检验,符号秩检验是无法使用的。构造统计量:事实上,有很多极佳且有效的统计量可用来检验以上假设,它们都基于组合后样本的秩进行检验。其中一种广泛使用的统计量为W统计量,即W=首个样本的秩和这是一个简单计算W统计量的例子,假设你在比较两种治疗手段的研究中得到以下两组数据首先,无论样本观测值来自己哪一个样本,将它们同意排序,使用平均秩处理打结秩,这是处理后的数据,括号内的是他们的联合秩。对于这个数据,我们的检验统计量是W=3+7+8+1=19(注意我们舍弃了实际的数据,但保留了他们在混合样本中的相关位置)W的含义是什么呢?若原假设H0成立,两个样本中的变量应当相等,因此我们应当能在两个样本中均发现大秩和小秩。若原假设H0不成立,一个样本的变量应当小于另一个样本的变量。所以,若第一个治疗手段产生更小的反应,第一个样本的变量也就小,相应的其秩和W值更小。所以,若第一个治疗手段产生更大的反应,第一个样本的变量也就大,相应的其秩和W值更大。零分布和P值早前的统计著作中对零分布和P值有无穷无尽的赘述,然后我们可以通过置换检验轻松地估计零分布,现在,我将给出整个13讲的核心Wilcoxon 秩和检验就是使用W作为检验统计量的置换检验从定义上来讲,任何假设下的P值是样本观测值与原假设一致(或相反)的可能性大小。我们需要通过使用R软件的计算,认识到备择假设的含义及其成立时W的含义,最后与给定的值进行比较。运行程序:这是使用置换检验(随机排列)进行Wilcoxon秩和检验的逻辑步骤,假定样本1中存在m个观测值,样本2中存在n个观测值。1, 将m+n个观测值放入同一群组中2, 将所有观测值按从小到大的顺序进行排列,将最小的值记为1,2其次,以此类推。对于打结观测值取平均数3, 计算样本的W统计量 即W=第一个样本的秩和4, 随机打乱混合样本的秩,将前m个样本放入样本15, 计算置换后的W值6, 将4,5两步重复多次(如1000或10000次),对于右侧检验,P值表示W比实际观测值大或相等的可能性(同样我们也可以针对左侧检验或双边检验得到一个近似的P值)13.4使用R软件进行W秩和检验我们可以通过修改置换检验程序来运行秩和检验,也可以使用R中的自带功能,我们将分别介绍这两种方法并讨论其使用条件。例:饮食习惯比较 这是第十一讲的数据运行95%置信水平下的Wilcoxon秩和检验,研究A习惯下的生长速度是否比B快解:完整的假设为原假设H0:A、B两种饮食习惯对实际增长速度无影响备择假设Ha:A习惯下的实际增长速度比B高以下给出R中置换检验的程序,要求掌握代码的输入A - c(156,183,120,113,138,145,142)B - c(109,107,119,162,121,123,76,111,130,115)R - 9999 ranksall - rank(c(A,B) k - 1:length(ranksall) reps - numeric(R) ts - sum(ranksall1:length(A) ts for (i in 1:R) m - sample(k, size=length(A), replace=FALSE)a1 - ranksallmrepsi - sum(a1) pvalue = ts) pvalue 通过运行程序,计算可得观测值的W统计量为84,同一数据每次算得的P值可能会稍微出现差异,因为每一次置换得到的样本都会不同,经计算,P值为0.0203,所以我们拒绝H0,因此我们有足够的理由认定在A饮食条件下,增长速度更快。注意这里的P值(0.0203)与之前12讲中置换检验均值的P值(0.0148)不同,这并不是因为置换得到的样本不同,而是因为我们使用了一个完全不同的检验统计量和假设。R中wilcox.exact()的使用方法我们可以通过加载exactRankTests拓展包运行wilcox.exact()功能进行秩和检验。现在我用wilcox.exact()重新处理饮食习惯数据,假设同上,即 A B library(exactRankTests) wilcox.exact(A, B, paired=FALSE, alternative=greater)Exact Wilcoxon rank sum testdata: A and BW = 56, p-value = 0.02154alternative hypothesis: true mu is greater than 0注意paired=FALSE选项的使用,这说明是用wilcox.exact()运行Wilcoxon秩和检验而不是第9章的Wilcoxon秩和检验。同样需要主要的还有R计算检验统计量的差异,它先机选我们之前定义的Wilcoxon统计量,然后减掉(将新值记为W统计量),但这对P值不造成影响(仍然感到疑惑吗)W统计量的值为56,右侧检验的P值为了0.02154(将其与置换检验得到的值作比较)既然P0.05,我们有充分的理由相信,A饮食习惯下的生长速度比B高。13.5讨论以下是在使用Wilcoxon秩和检验需要注意的几点1, 有效检验统计量的形式,如前文所提,有效检验统计量的形式多样,即a. W为第一个样本的秩和(同我们在置换检验中使用的统计量一样) b.首个样本中的“调整”秩和,例如,运行R中wilcox.exact()程序将W-作为检验统计量。 c.第2个样本中的秩和 d.两个样本的均值差 e.令Xi表示第1个样本中任意值,Yj表示第2个样本中任意值,对其进行所有可能的排列记为(Xi,Yj),将XiYj时,(Xi,Yj)组合的个数记为U统计量以上统计量的效果都是等价的,它们均用来处理次序数据的秩,需要注意的是,每一种形式的统计量,需在简单假设和复合假设的情况下,才能正确的计算P值。2, 通用名,另外两名统计学家(Mann 和Whitney)在研究相同的检验问题中,发明了和Wilcoxon秩和检验等价的解决方法,而且几乎在同一时间完成著作,(Mann 和Whitney检验统计量的版本在e部分中已给出),因此,这个结论有时也被称为Mann-Whitney-Wilcoxon检验,我猜大师们也珍重名声。3,联接数据。联接存在与否不影响置换检验,使用R中功能时,exactRankTests扩展包中的wilcox.exact() 程序同样不受联接影响(注意R中自带的wilcox.test()并不能正确处理联接数据,练习中请不要使用这个功能!)4,双边检验。R中wilcox.exact()操作下,使用alternative=”two.sided” 选项可以很容易进行双边检验,然而,如果你使用的W检验程序和置换检验,很难正确计算P值。因此,研究双边假设中,需要使用一个不同形式的检验统计量,使其更符合检验的要求。练习一个学者将一个班31个学生分为两组,用传统方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论