




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二十七课 符号检验和Wilcoxon符号秩检验在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定的概率分布,这个分布带有一组自由的参数。参数检验被认为是依赖于分布假定的。通常情况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实,因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似,这是由于大样本理论所保证的。但有些资料不一定满足上述要求,或不能测量具体数值,其观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的方法,而只能用非参数统计方法(non-parametric statistical analysis)来处理。这种方法对数据来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。一、 单样本的符号检验符号检验(sign test)是一种最简单的非参数检验方法。它是根据正、负号的个数来假设检验。首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表示,如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体数字,也可用符号检验,例如用正号表示颜色从深变浅,用负号表示颜色从浅变深。用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则,然后计数正号的个数及负号的个数,由于在具体比较配对资料时,可能存在配对资料的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样本大小也随之减少,故修正样本大小。当样本较小时,应使用二项分布确切概率计算法,当样本较大时,常利用二项分布的正态近似。1. 小样本时的二项分布概率计算当时,或的检验值由精确计算尺度二项分布的卷积获得。在比较配对资料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正号,反之为负号,那么对于原假设:试验前后无变化来说,正号的个数和负号的个数可能性应当相等,即正号出现的概率=0.5,于是与均服从二项分布,对于太大的相应太小的,或者太大的相应太小的,都将拒绝接受原假设;对于原假设:试验后比试验前有增加来说,正号的个数大于负号的个数的可能性应该大,即正号出现的概率,对于太小的相应太大的,将拒绝接受原假设;对于原假设:试验后比试验前减小来说,正号的个数小于等于负号的个数的可能性应该大,即正号出现的概率,对于太大的相应太小的,将拒绝接受原假设。例27.1有一种提高学生某种素质的训练,有人说它是无效的,有人说它是有效的,那么真实情况究竟应该是怎样的呢?随机地选取15名学生作为试验样本,在训练开始前做了一次测验,每个学生的素质按优、良、中、及、差打分,经过三个月训练后,再做一次测试对每个学生打分。数据见表27.1所示。我们将素质提高用正号表示,反之用负号表示,没有变化用0表示。显著性水平取0.1。表27.1 训练前后的素质比较学生编号训练之前训练之后差异符号1中优2及良3良中4差中5良良06中优7差及8良优9中差10差中11中优12及良13中及14中优15差中从表27.1中15名学生训练前后的差异分析可得出:有14名学生有差异,其中=11,=3。1名学生无差异(学生编号为5),应该从分析中去掉,所以=151=14。假设检验为: 即训练之后学生素质没有提高。 即训练之后学生素质有提高。由于试验的结果只有两种可能,正号或负号,对每一个学生试验出现正号的假定概率为=0.5,负号为1=0.5,这样整个试验的概率是相同的,并且每一个试验是相互独立的。因此在=14次独立的试验中,正号出现的次数服从二项分布,见表27.2所示。表27.2 二项分布的概率和累计概率n=14,p=0.5正号出现的次数正号出现的概率累计概率00.00010.000110.00090.000920.00560.006530.02220.028740.06110.089850.12220.212060.18330.395370.20950.604780.18330.788090.12220.9102100.06110.9713110.02220.9935120.00560.9991130.00090.9999140.00011.0000从表27.2的累计概率列中我们看到,正号出现的次数大于10的概率为10.9713=0.0287,或者换一种方法计算为=0.0001+0.0009+0.0056+0.0222=0.0287,二者的微小差异是因为小数点后舍入问题造成的。而试验的结果:正号出现的次数为11,大于10,出现的概率不会超过0.0287,我们开始设定的显著性水平为0.1,由于0.02870.1,所以我们拒绝原假设,接受备选假设。如果我们的原假设为=0.5,既训练前后学生素质相等,那么就是双侧检验,应该加上正号出现的次数小于4的概率0.0287,即20.0287=0.0574时,应该修正为0.5;当时,应该修正为0.5。值加或减的0.5是连续性修正因子,目的是为了能将连续分布应用到近似的离散型分布。二、 配对资料的Wilcoxon符号秩检验当两组配对资料近似服从正态分布,它们差值的检验可以使用配对t检验法。如果配对资料的正态分布的假设不能成立,就可以使用Frank Wilcoxon(1945)符号秩检验,它是一种非参数检验方法,对配对资料的差值采用符号秩方法来检验。它的基本要求是差值数据设置为最小的序列等级和两组配对资料是相关的(配成对)。在两组配对资料的差异有具体数值的情况下,符号检验只利用大于0和小于0的信息,即正号和负号的信息,而对差异大小所包含的信息却未加利用,但Wilcoxon符号秩检验方法既考虑了正、负号,又利用了差值大小,故效率较符号检验法高。例27.2某制造商想要比较两种不同的生产方法所花费的生产时间是否有差异。随机地选取了11个工人,每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,每一个工人开始选用的生产方法是随机的,即可以先使用生产方法1再使用生产方法2,也可以先用生产方法2再使用生产方法1。这样,在样本中的每一个工人都提供了一个配对观察。数据见表27.3所示。任务完成时间的正差值表示生产方法1需要更多的时间,负差值表示生产方法2需要更多的时间。表27.3 两种不同生产方法完成任务的时间(分钟)工人编号n生产方法M差值D绝对差值秩次R符号秩次RM1M2D=M1M2|D|110.29.50.70.78829.69.80.20.22239.28.80.40.43.53.5410.610.10.50.55.55.559.910.30.40.43.53.5610.29.30.90.91010710.610.50.10.111810.010.000911.210.60.60.6771010.710.20.50.55.55.51110.69.80.80.899符号秩次总和=5.5,=49.55.549.5为了比较两种方法的任务完成时间是否有显著差异,假设检验为:任务完成时间的两个总体是相同的。任务完成时间的两个总体是不相同的。使用Wilcoxon符号秩检验方法的主要步骤见表27.3中每列的计算方法和过程,先求出每对数据的差值D,按差值绝对值|D|由小到大排列并给秩R,从秩1开始到秩10,注意工人编号为8的配对数据,由于差值为0,在排秩中丢弃,样本数目修正为=111=10。在给秩值时,遇到相等|D|,也称为结值(tied),使用平均秩,如工人编号3和5具有相同的绝对差值0.4,所以平分秩3和秩4,各为秩3.5。一旦绝对差值的秩值R给出后,然后将R分成正和负差值的两个部分秩值和,最后求符号秩和,如=2+3.5=5.5。对于样本数目有个,与的最小可能值为0,而最大可能值为(1+2+n)=n(n+1)/2。显然,应当有+= n(n+1)/2,如本例5.5+49.5=55=10(10+1)/2。那么符号秩的平均值为n(n+1)/4。构造Wilcoxon符号秩统计量为(27.3)显然如果原假设为真,与应该有相同的值,等于n(n+1)/4,因此太大的S值或太小的S值都是我们拒绝的依据。在实际工作中便于计算常取W=min(,),W服从所谓的Wilcoxon符号秩分布,对于本例=10,49.510(10+1)/4=22,W= min(49.5,5.5)=5.5,查表可得在显著水平0.05,=10的双侧检验的临界值为8,即W值的拒绝区域为0到8,接受区域为8到27.5。由于5.520,当原假设为真时,统计量=接近于0,统计量的方差为(27.4)建立检验统计量(27.5)近似于标准正态分布。因为+= n(n+1)/2,所以=2n(n+1)/2,我们可以将(27.5)式中的改写为的形式(27.5)我们以本例的数据来计算一下,=2.24,p=20.01246=0.0249。标准正态分布使用显著水平0.05时,拒绝区域为z1.96,因为2.241.96,所以拒绝原假设。三、 实例分析例27.1的SAS程序如下:data study.training ;input before after;d= after-before;cards;3 52 44 31 34 43 51 24 53 1 1 3 3 5 2 4 3 2 3 5 1 3;proc univariate data=study.training;var d;run;程序说明:建立输入数据集training,首先要对定性资料进行量化。本例把学生成绩按5分计量,设定优=5分,良=4分,中=3分,及格=2分,差=1分。把提高学生某种素质的训练前成绩和训练后成绩分别存放在变量before和after中,变量d等于配对的训练后成绩减去训练前成绩。注意只能调用univariate过程,而不能调用means过程来进行符号检验。分析变量为单样本数据集training中的d变量。输出的主要结果见表27.4所示。表27.4 用univariate过程进行符号检验的输出结果Univariate ProcedureVariable=D Moments Quantiles(Def=5) N 15 Sum Wgts 15 100% Max 2 99% 2 Mean 1.066667 Sum 16 75% Q3 2 95% 2 Std Dev 1.387015 Variance 1.92381 50% Med 2 90% 2 Skewness -1.24756 Kurtosis 0.181317 25% Q1 0 10% -1 USS 44 CSS 26.93333 0% Min -2 5% -2 CV 130.0326 Std Mean 0.358126 1% -2 T:Mean=0 2.978471 Pr|T| 0.0100 Range 4 Num = 0 14 Num 0 11 Q3-Q1 2 M(Sign) 4 Pr=|M| 0.0574 Mode 2 Sgn Rank 38 Pr=|S| 0.0154 Extremes Lowest Obs Highest Obs -2( 9) 2( 10) -1( 13) 2( 11) -1( 3) 2( 12) 0( 5) 2( 14) 1( 8) 2( 15)结果说明:符号检验统计量M(Sign)=4,它是取正符号和负符号两者之间的小者作为检验统计量,Pr=|M|计算的概率是二项分布的两尾概率之和,因此它是双侧检验,检验正符号和负符号是否相同,结果为0.0574。在显著水平设定为0.1时,由于0.05740.05,改变为不能拒绝原假设。但是,如果我们用考虑差值d大小的信息的Wilcoxon符号秩检验,即Sgn Rank,由于0.0154|T| 0.0194 Range 1.3 Num = 0 10 Num 0 8 Q3-Q1 0.7 M(Sign) 3 Pr=|M| 0.1094 Mode 0.5 Sgn Rank 22 Pr=|S| 0.0234W:Normal 0.942951 Pr0.05,因此不能拒绝差值d具有正态性。因为制造商拒绝相信差值d具有正态性,所以我们采用Wilc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二手车买卖双方车辆交易信用评估及监管协议
- 私人房产抵押贷款合同协议:房产抵押及还款保障条款
- 股权回购合同中股权回购方案设计与实施步骤
- 琴行专业教师聘任与音乐教育质量保证合同
- 离婚协议子女轮流抚养权及财产分割合同范本
- 2025年药店管理试题及答案
- 2025年国家公务员考试行测(副省级)行政职业能力测验试卷与参考答案
- 2025年社会责任咨询师考试试卷及答案
- 2025年肌动学模考试题与参考答案解析
- 2025年pcr上岗证历年考试题及答案
- 马克思主义科学技术方法论
- 08K507-1 管道与设备绝热-保温(有水印)
- GB/T 5237.1-2017铝合金建筑型材第1部分:基材
- GB/T 18948-2017内燃机冷却系统用橡胶软管和纯胶管规范
- 2020年户口本模板
- 全套课件-食品营养学-王莉
- htri手册HTRIExchanger使用手册
- 四年级数学上册试题 一课一练2.3《平移与平行》习题1-北师大版(含答案)
- 小学英语外研版5A Unit2 They sell many different things Module 2部优课件
- 9.10.11有机、酸碱一般排-盛剑
- 完整版:美制螺纹尺寸对照表(牙数、牙高、螺距、小径、中径外径、钻孔)
评论
0/150
提交评论