秩转换的非参数检验孙振球_第1页
秩转换的非参数检验孙振球_第2页
秩转换的非参数检验孙振球_第3页
秩转换的非参数检验孙振球_第4页
秩转换的非参数检验孙振球_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章,秩转换的非参数检验,(nonparametrictest),非参检验,参数检验无法使用的情况下:资料分布不满足参数检验条件;不满足方差齐性;数据不能精确测量,如“50mg”;结局变量为有序分类的资料。,2,非参检验,经典统计的多数检验都假定了总体的背景分布。但也有些没有假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行检验。这都称为非参数检验在资料能够进行参数检验或者能够通过转换符合参数检验的条件下,首选参数检验,因为非参仅仅考虑参数的位置分布,而忽略了详细的信息,检验效能降低。,3,2008年8月,方法小节,非参数检验,非参数检验的方法选择多样:独立两样本所来自总体比较:Wilconxonranksumtest/WilconxonMann-WhitneyUKolmogorov-SmimovZ:检验样本是否来自同一总体Mosesextremereactions:当样本中同时含有正值和负值时选用的方法。Wald-Wolfowitzruns:检验两个样本所在总体的任一点分布情况是否相同,5,1.成组设计两样本的比较!,配对/相关两样本所来自的总体的比较:Wilcoxon:Wilcoxon符号秩和检验,为相关样本差值的秩和检验,系统默认值;Sign:符号检验,利用正负号检验,效率低McNemar:常用的配对卡方检验,只用于两分类资料,检验两组间分类有差异的频数,不考虑相同分类的频数;MarginalHomogeneity:与McNemar类似,只分析有差异的情况!,6,非参数检验,2.配对设计两样本的比较!,多个样本所来自的总体均数的比较:Kruskal-WallisH:最为常用的多个样本所来自的总体比较的秩和检验Median/中位数:检验效能最低Jonckheere-Terpstra:用于双向有序变量资料分析时,检验效能高于Kruskal-WallisH检验,7,非参数检验,3.成组设计多个样本的比较!,多组配伍/相关样本所来自总体均数的检验:Friedman:M检验,k个相关样本最常用的检验;KendallsW检验:Kendall协和系数检验,表示k个指标间相互关联的程度;CochransQ检验:适用于二分类变量,是两相关样本McNemar在多个样本情况下的推广。,8,非参数检验,4.配伍设计多个样本的比较!,非参检验资料的几种类型,一、成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)二、配对设计差值的符号秩和检验(Wilcoxon配对法)三、成组设计多个样本比较的秩和检验(Kruskal-Wallis法)四、随机区组设计资料的秩和检验(Friedman法),9,数据格式:1个分组变量“group”,1个反应变量“x”。步骤:AnalyzeNonparametricTests2IndependentSamplesTestVariableList:xGroupingVariable:groupTestType:Mann-WhitneyU,一、两独立样本比较的秩和检验(原始数据),10,例1:两独立样本比较的秩和检验,某实验室观察某种抗癌新药治疗小鼠移植性肿瘤的疗效,两组各10只小鼠,以生存日数作为观察指标,结果如下,试检验两组小鼠生存日数有无差别?试验组:242627303234364060天以上对照组:4679101012131616,11,12,资料的读数中,“60”不是确定值,因而只能采用非参数检验的方法进行处理!,13,资料的读数中,如果“60”是确定值,该资料能够采用参数检验的方法进行处理吗!,14,15,发现“确定”按钮没有激活的情况,需要考虑是否存在未完成的选项!,16,检验步骤计算Wilcoxon统计量W和Mann-Whitney统计量U分别求出两个样本的秩的和,Wx和Wy。若mn,统计量W=Wy;若m=n,统计量为第一个变量值所在样本组的W值Mann-Whitney统计量定义为小样本情况下,统计量服从Mann-Whitney分布,大样本情况下,近似服从正态分布,检验统计量为根据P值作出决策,两个独立样本Mann-Whitney检验,(k为W对应样本组的样本数据个数),Mann-Whitney检验,18,数据格式:1个分组变量“group”,1个反应变量“x”,1个频数变量“freq”。步骤:DataWeightCasesWeightcasesby:freqAnalyzeNonparametricTests2IndependentSamplesTestVariableList:xGroupingVariable:groupTestType:Mann-WhitneyU,一、两独立样本比较的秩和检验(频数资料),19,例2、两独立样本比较的秩和检验,为研究甲乙两种药物对某一疾病的治疗效果,观察采用不同药物治疗后的208名患者,结果如下,问,甲乙两种药物对这一疾病的治疗效果有无差异?,20,21,22,二、配对设计差值的符号秩和检验,数据格式:2个反应变量,分别为“X1”和“X2”。步骤:AnalyzeNonparametricTests2RelatedSamplesTestPair(s)List:X1X2TestType:Wilcoxon,23,例3:配对设计差值的符号秩和检验,尿铅的传统测定方法比较繁琐,现有人希望用新方法代替原有方法,10份样本分别采用两种方法进行测定,结果如下,试分析两种方法的测定结果有无差别?,24,25,26,27,28,与配对t检验相比,有什么异同?,29,数据格式:1个分组变量“group”,1个反应变量“x”。步骤:AnalyzeNonparametricTestsKIndependentSamplesTestVariableList:xGroupingVariable:groupTestType:KruskalWallisH,三、多个独立样本比较的秩和检验(原始数据),30,例3、多个独立样本比较的秩和检验,测得某中学教室中6个采样点不同时间空气中的CO2含量,结果如下,问不同时间空气中的CO2含量有无差别?(本例未将同一采样点作为一个区组设置,实际工作中要考虑有无设置区组的必要),31,32,33,34,35,数据格式:1个分组变量“group”,1个反应变量“x”,1个频数变量“frequncy”。步骤:DataWeightCasesWeightcasesby:freqAnalyzeNonparametricTestsKIndependentSamplesTestVariableList:xGroupingVariable:groupTestType:KruskalWallisH,三、多个独立样本比较的秩和检验(频数表),36,例4、多个独立样本比较的秩和检验,三种病人肺切除术的针麻效果,见下表,问,此三种病人肺切除术的针麻效果有无差异?,37,38,卡方检验统计量不能够体现出结局为等级资料的等级差异对结果的影响,所以不能在此类资料的分析中采用!,39,Kruskal-Wallis检验,40,中值检验,41,数据格式:反应变量分别为“X1”,“X2”,“X3”,“X4”步骤:AnalyzeNonparametricTestsKRelatedSamplesTestVariables:X1X2X3X4TestType:Friedman,四、随机区组设计资料的秩和检验,42,例5、随机区组设计资料的秩和检验,受试者5人,每人穿4种防护服,测得脉搏数结果见下表,问,5个受试者穿4种防护服测得脉搏数有无差别?,43,44,注意此资料的录入格式与随机区组设计的方差分析有什么区别?变量个数?录入的形式?,项目编号不是分析所必须的,但是一个区组的或者说有关联的样本要在一行上录入。,Friedman检验,KendallW检验,45,双向有序列联表的检验,1.虽然分组变量和研究变量均为有序,但是研究者仅仅对分组产生的研究结果感兴趣,则可以按单向有序的资料进行分析;2.如果想要明确两变量之间的相关关系,则需要采用Spearman相关分析;3.可以采用Jonckheere-Terptra检验,该检验对双向有序资料的检验效率较其它方法高;4.如果是多中心临床试验的结果,那么不同中心结果可能会不一致,要考虑混杂因素的影响,可进行Cochran-Mantel-Haenszel分析。,46,47,医疗形式与患者对医疗服务的满意度之间的关系,48,Jonckheere-Terpstra过程的操作提示,图7-6选择Jonckheere-Terpstra检验图7-7选择精确概率检验,49,例3、二位放射科医生对一批矽肺胸片独自做出矽肺分级诊断,见下表,问他们的诊断结果是否一致,诊断水平有无差异?,注意区别以下适合配对卡方分析的情况,50,2008年8月,方法小节,总结2:非参数检验,1、成组设计两样本比较的秩和检验2IndependentSamplesMann-WhitneyU2、配对设计差值的符号秩和检验2RelatedSamplesTestType:Wilcoxon3、成组设计多个样本比较的秩和检验KIndependentSamplesTestType:KruskalWallisH4、随机区组设计资料的秩和检验KRelatedSamplesTestType:Friedman,在利用SPSS进行非参数检验的时候,如何根据条件进行方法的选择?,52,参数检验parametrictest(1)总体分布类型已知,如率服从二项分布、样本均数服从正态分布;(2)由样本参数推断未知总体参数。这时,基于一定的参数分布对总体参数的假设检验称为参数检验。如t检验:F检验:,非参数检验(nonparametrictest)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-freetest),它直接对总体分布的位置作假设检验。,参数统计:通常要求样本来自正态总体,或方差齐等,在此基础上用样本统计量对总体参数进行推断或作假设检验的统计分析方法。,非参数统计:有许多资料不符合参数统计的要求,分布未知,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,而是对总体的分布或分布位置进行检验,称为非参数检验。,参数检验与非参数检验比较,将数值变量值从小到大,或等级变量值从弱到强转换成秩次。例111只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60秩次364928157101110.510.5例27名肺炎病人的治疗结果:危险程度治愈治愈死亡无效治愈有效治愈秩次12763542.52.5762.552.5,秩转换ranktransformation,秩相同取平均秩!,秩相同取平均秩!,已知总体分布类型,对未知参数进行统计推断,依赖于特定分布类型,比较的是参数,参数检验(parametrictest),非参数检验(nonparametrictest),对总体的分布类型不作严格要求,不受分布类型的影响,比较的是总体分布位置,优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等),缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同,以下情况首选非参数检验:,1.不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;3.一端或二端是不确定数值(如0.002、65等)的资料(必选);4.单向有序列联表资料;5.各种资料的初步分析。,在资料符合参数检验的条件下,请一定采用参数检验的方法。非参数检验中所利用的信息量有限,在同等条件下的检验效能低于参数检验。,非参数检验,第一节配对样本比较的Wilcoxon符号秩和检验第二节两个独立样本比较的Wilcoxon秩和检验第三节完全随机设计多个样本比较的Kruskal-WallisH检验第四节随机区组设计多个样本比较的FriedmanM检验,第一节,配对样本比较的Wilcoxon符号秩检验(Wilcoxonsigned-ranktest)常用于以下两种情况:,1配对样本差值的中位数与0的比较2单个样本中位数和总体中位数比较,常见的配对设计类型,1.同一研究对象处理前后的比较;2.同一研究对象分别接受不同的处理;3.不同研究对象,根据研究因素以外的会影响研究结果的重要因素配成对子,分别接受不同的处理,比较不同处理的效果。,例8-112份血清原方法(检测时间20分钟)新方法(检测时间10分钟)测谷-丙转氨酶问两法所得结果有无差别?,1配对样本差值的中位数和0比较,表8-112份血清两法测血清谷-丙转氨酶(nmolS-1/L)的比较,配对秩和检验编秩规则:算出各对值的代数差;根据差值的绝对值大小编秩,从小到大;将秩次按差值正负冠以正负号,计算正、负秩和(T+,T-);用不为“0”的对子数作为n(5)取绝对值小的秩和作为统计量T,表8-112份血清两法测血清谷-丙转氨酶(nmolS-1/L)的比较,*下面资料中新法测定的结果中有未能确定的值,所以必须采用非参数检验的方法。,编秩的方法为按照绝对值的大小从小到大编。,1.建立检验假设,确定检验水平,2.求检验统计量T值,省略所有差值为0的对子数,余下的有效对子数记录为n,见表8-1第(4)栏,本例n=11;,检验步骤,按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等【称为相同秩(ties)】则取平均秩,(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩),一般取较小者为T,本例取T=11.5。,3.确定P值,作出推断结论,(1)当n50时,查T界值表(附表9,p716)判断原则:T在范围之外,P(T范围越小,P越大)n=11,=0.10:13-53=0.05:10-56,所查到的界值是在H0成立的情况下,根据预先设定的和相应的样本量,可以接受的T值范围。,(2)若当n50,超出附表9范围,可用正态近似法作Z检验。,重复秩次的个数,如果H0成立,即两总体无差异,在理论上的样本的正负秩和相等,即T值应为总秩和(T总=n(n+1)/2)的一半,即T=n(n+1)/4。若T值在界值范围内,不拒绝H0,当T值在界值上或界值范围外,H0成立的概率很小,拒绝H0,认为两总体分布不同,配对资料符号秩和检验的基本思想,例8-2已知某地正常人尿氟含量的中位数为45.30。(总体中位数)12名工人尿氟含量见表8-2第(1)栏(样本)。问该厂工人的尿氟含量是否高于当地正常人?,2单个样本中位数和总体中位数比较,如果资料符合进行参数检验的条件,则应该采用样本均数与总体均数比较的t检验。,表8-212名工人的尿氟含量与45.30()比较,本例由于存在数值不明的资料,所以采用非参数检验。,据表8-2第(3)、(4)栏,取T=1.5。,第二节,两个独立样本比较的Wilcoxon秩和检验Wilcoxonranksumtest,表8-5肺癌病人和矽肺0期工人的RD值(cm)比较,例8-3,1原始数据的两样本比较,在不符合参数检验条件时,计量资料两独立样本的比较不能采用两独立样本均数t检验,需考虑非参数检验,表8-5肺癌病人和矽肺0期工人的RD值(cm)比较,例8-3,检验步骤,求检验统计量T值:,(同一组可直接写秩号),确定P值,作出推断结论:,在H0成立的情况下,含量为n1样本的秩和T1应在n1(N+1)/2的左右变化。,两独立样本比较的秩和检验采用Z检验的原理,适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法,此外两个等级资料比较也采用本方法。基本思想:如果H0成立,在两样本来自分布相同的总体,两样本的平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差较小。含量为n1样本的秩和T1应在n1(N+1)/2的左右变化。若T值偏离此值太远,H0发生的可能性就很小。若偏离出给定的值所确定的范围时,即P,拒绝H0,表8-6吸烟工人和不吸烟工人的HbCO(%)含量比较,2两样本频数表和等级资料的比较,表8-6吸烟工人和不吸烟工人的HbCO(%)含量比较,先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏;本例T=1917;,计算Z值,3Mann-WhitneyU检验两独立样本比较还常用Mann-WhitneyU检验原理:把第一个样本的n1(小于等于n2)个变量值的每一个值,与第二个样本的每个变量值X逐个进行比较,每次比较均记录比较的结果:小于X记1,与X相等记0.5,大于X记0。比较结果之和即为U值。例如:表8-5资料,表8-5肺癌病人和矽肺0期工人的RD值(cm)比较,代入P129公式(8-3)计算Z值,小于X记1,与X相等记0.5,大于X记0,两独立样本资料进行比较时,在资料不符合参数检验的条件下,除上述方法外,还可以采用中位数检验,mediantest。中位数检验的检验效能在非参数检验中相对较低,结论比较保守。,对于同一份资料,用Mann-WhitneyU和Wilcoxon方法计算得到的Z值是相等的,所下的统计结论也是等价的。,第三节,完全随机设计多个样本比较的Kruskal-WallisH检验,一、多个独立样本(计量)比较的Kruskal-WallisH检验,H0:多个总体分布位置相同;H1:多个总体分布位置不全相同。,基本思想:如果各总体分布相同,则各组混合编秩的平均秩次应该相差不大,如果满足参数条件,这类资料一般作完全随机设计ANOVA,例8-5,样本数据存在相同秩的情况,例8-6比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?,2.多个有序(等级)数据样本的比较例8-7,二、多个独立样本作两两比较的Nemenyi法检验当经过多个独立样本比较的kruskal-WallisH检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用Nemenyi法检验(Nemenyitest)。,第四节,随机区组设计多个样本比较的FriedmanM检验,例8-98名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?,一、FriedmanM检验方法,二、两两比较的q检验,当经过多个相关样本比较的FriedmanM检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。,.,对四组大白鼠用不同剂量的某种激素后,测量耻骨间隙宽度的增加量(),结果如下表,请问各组的增加量有无差异?A组0.150.30.40.5B组1.21.351.41.51.92.3C组0.51.21.422.22.2D组1.51.52.52.5,请用比较下表资料中新旧防护服的防护效果。,1.资料及资料收集背景:拿到资料时,首先查看资料提供者的研究设计,资料分析计划和分析目的;2.统计描述:对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论