第八章秩和检验.ppt_第1页
第八章秩和检验.ppt_第2页
第八章秩和检验.ppt_第3页
第八章秩和检验.ppt_第4页
第八章秩和检验.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章秩转换的非参数检验,第二军医大学卫生统计学教研室孟虹,第八章内容,从数据的设计分类:*第一节、配对样本资料的Wilcoxon符号秩检验*第二节、两个独立样本比较的Wilcoxon秩和检验*为重点第三节、完全随机设计多个样本比较的Kruskal-WallisH检验第四节、随机区组设计多个样本的FriedmanM检验,非参数检验的概念,参数检验:假定比较数据服从某分布,通过参数的估计量()对比较总体的参数()作检验,统计上称为参数法检验(parametrictest)。如t、u检验、方差分析。非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法。称为非参数检验(nonparametrictest).,非参数统计检验秩和检验,适用范围广,特别适用于组间比较:1.数据分布为偏态分布或不满足参数检验方法(组间方差不齐)的计量资料.2.有的数据为无确切值,只是某值或值的计量资料。3.当比较的数据只能用严重程度、优劣等级的半定量(等级)资料组间的比较。,秩和检验用于定量资料,计量资料中,变量值(x):极度偏态资料,或个别数值偏离过大各组离散度相差悬殊资料中含有不确定值,大于5年、0.1兼有等级和定量性质的资料,例:两种食物对大鼠心肌坏死面积(格子数),M1=0.6,M2=0,医学研究中的等级资料,疗效(x):痊愈、显效、有效、无效、恶化化验结果(x):+体格发育(x):下等、中下、中等、中上、上等心功能分级(x):I、II、III营养水平(x):差、一般、好,例1两组独立计量数据小样本的比较,观察值(x)A组7,14,22,36,40,63,98,108,n=8B组5,6,10,17,18,23,29,49,n=8A组48.5037.88B组19.6514.46,问两组均数差别有无统计意义?常用t检验,用t检验,要求数据满足正态和方差齐性条件(计量资料).,两组数据箱式图的比较,组别,方差齐性检验:=0.10F=37.882/14.462=6.86,P=0.015,两组方差不齐.在不满足t检验前提,如两均数比较用t检验,=0.05,结果:t=2.014t0.05,14=2.1,P=0.065,p0.05容易增大误差概率!(取伪),秩和检验的方法-秩转换,秩和检验的基本计算步骤:1.将数据(x)按大小转化为秩次(i),用秩次的大小反映变量值的大小。2.对各组”秩次”求和,称为秩和(T=i)。3.对各组秩和(T)做检验的方法称为秩和检验。,例:秩转换的基本方法,将两组比较原始数据(X)混合按大小编秩,如x相同取平均秩,分别对各组的秩求和(T).甲组(x)35102022秩和秩号(i)13578T1=24乙组(x)49152535秩号(i)246910T2=31,总秩和,T=10(10+1)/2=55,例:两组比较的等级数据编秩,A组:、+、+、+、+秩(i):124.54.54.58.5秩和:TA25(组间相同,求平均秩)B组:+、+、+、+、+、+秩(i):4.58.58.58.51112秩和:TB53(组内相同,不影响求秩和),总秩和:TA+TB=12(12+1)/2=78,秩次:在一定程度上反映了原始数据大小(等级)的信息。秩和:反映了一组数据在分布上的范围位置。平均秩次:反映一组数据平均水平A组平均秩次=23.5/6=3.92B组平均秩次=54.5/6=9.08,A组(x)3,5,7,91114(i)123458.5T=23.5B组(x)121314162022(i)678.5101112T=54.5,第一节、配对样本比较的符号秩检验(Wilcoxonsignedranktest),何时选用配对资料的秩和检验1.配对设计等级资料的比较2.两组配对计量数据,变量差值(d)不为正态分布,秩和检验效率高于参数的配对t检验。,讲义例8-1配对设计计量数据表8-112份血清用两法测转氨酶结果比较,用配对t检验的条件:差值(d)为计量数据,并且服从正态.,对表8-1数据进行正态性检验:概率图(probality-probalityplot,P-Pplot),SPSS统计软件,数据点不为直线,并未分布在线上,提示本资料不为正态.,配对设计资料的秩和检验步骤(Wilcoxconsigned-ranktest),方法:1.将配对数据的差值(d)按绝对值大小转换为秩,如差值为0舍去。2.求差值的正、负秩和,记为(T+)、(T-)。3.用任意一个正或负秩和(T)做检验。4.检验方法有:1)查表法:(对子数n50)*2)正态近似法,n50时用公式(8-1),例:表8-112份血清用两法测转氨酶结果比较,(T+),(T-),例表8-1配对资料秩和检验步骤,1.建立检验假设:H0:Md=0,(T+)=(T-),即两种方法测定结果值相同H1:Md0,或(T+)(T-)=0.052.编秩,求正、负秩次的秩和(T)3.任取(T)查表确定秩和(T)的概率(p)(本例n=1150),用(T+)或T-与T0.05,n界值范围做比较.确定p值方法:T在T0.05,n界值范围内,P0.05等于或在T0.05界值范围外,P0.05本例:查表824页(n=11)界值T0.05=1056(双侧)本例T-=11.5或T+=54.5在T0.05范围内,P0.05结论:按=0.05水准,不拒绝H0,尚还不能认为两法测定值差别有统计意义。,附表9,n=11的双侧T界值与概率(p),T界值5101333535661P值0.010.050.100.100.050.01例8-1T-=11.5,T+=54.50.05P0.10如H0假设成立,理论秩和T+=T-=33,理论总秩和=11(11+1)/2=66,抽样n=4,差值(d)秩可能为0,1,2,3,4,秩和(T)秩的组成f概率(p=f/16)0010.06251110.06252210.0625331+220.125441+320.12551+42+320.12561+2+32+420.12571+2+43+420.12581+3+410.062592+3+410.0625101+2+3+410.0625,16,符号秩和检验的基本思想,如H0成立,则理论上差值(d)的正、负秩和应相等,或样本的T+与T均接近理论上秩和(T)。T=N(N+1)/2/2。如果样本秩和与理论秩和相差太大,超出了事先规定的检验水准界值,则认为H0成立可能性小,拒绝H0。,资料8-1WilcoxonSignedRanksTest,用参数法配对t=1.602,P=0.137,第二节、两组独立样本比较的秩和检验,常用方法:W检验(Wilcoxonranksumtest)常见的数据形式:计量数据的两组比较例数较少(原始数据形式)等级数据的两组比例数较多(频数表形式),表8-5肺癌病人与矽肺0期工人RD值比较,总T=253,表8-5资料t检验计算结果,两独立样本秩和检验计算步骤,1.两组变量值混合编秩求出各组秩和.有相同x值在不同组,求平均秩.2.对n较小组求秩和(T)做统计检验3.检验方法:1)查表法:较小组例数n10查表确定统计量(T)的概率2)正态近似法:计算u值,公式8-2(较小组例数n10),例:表8-3资料秩和检验,1.建立检验假设:H0:两组RD值的总体分布位置相同H1:肺癌病人RD值高于矽肺0期工人=0.05(单侧)2.确定检验的统计量(T)当n1n2时,取例数较小组的秩和为T.本例:较小组n1=10,T1=141.5当n1=n2,任取一个组的秩和为T。,3.本例n1=10,查附表10确定T概率(825页)用T与T0.05,n比较,如T在T0.05界值范围内,p0.05,不拒绝H0查表n=10单侧T0.05,10=89141本例T=141.5p0.05结论:在=0.05水准,p0.05,拒绝H0,两组变量值分布差别有统计意义,肺癌组平均秩次(141.5/10=14.15)高于矽肺0期组平均秩次(111.5/12=9.29)。,,两组秩和检验界值范围和概率,例数n1=10,n2-n1=2的界值单侧概率界值:假设成立T1理论秩和=115767984891151411461511540.050.0250.010.005,本例T=141.5p0.05,两组秩和检验的基本思想,如H0:“两总体观察值的分布相同”假定成立,则n1样本的秩和(T1)应接近n1理论的秩和n1(N+1)/2。同理,n2样本的秩和(T2)与应n2(N+1)/2相差不大。如相差悬殊,即P0.05,表示H0假定成立的概率较小,便拒绝H0假定。,例:两组变量值分布相等,n1=n2,甲组(x1)2458秩和秩次1.53.55.57.518乙组(x2)2458秩次1.53.55.57.518总秩和=N(N+1)/2=8(8+1)/2=36各组理论秩和=各组平均秩次=(N+1)/2=4.5,例:两组变量值例数不相等,甲组(x)2455秩和秩次1.53.56617乙组(x)245秩次1.53.5611假设两组分布相等甲组理论秩和=4(7+1)/2=16乙组理论秩和=3(7+1)/2=12,肺癌组矽肺组总秩和样本秩和141.5111.5253理论秩和115138差值26.5-26.5抽样误差?如果H0成立,则理论秩和与样本秩和之差应不大。,表8-5肺癌病人与矽肺0期工人RD值比较,表8-7N=7,n=2的取秩组合和秩和(T),取秩1,21,31,41,51,61,72,32,42,52,62,7T34567856789取秩3,43,53,63,74,54,64,75,65,76,7T7891091011111213表8-8N=7,n=2的T概率分布T345678910111213P0.040.040.0950.0950.1420.1420.1420.0950.0950.040.04,0.10,0.05,(二)u检验法正态近似法(例数超出附表10范围),采用公式8-2计算u值,确定p值。,公式8-2,U1.96,p0.05,T为n小的组秩和Tj为相同秩的个数,频数表资料和等级数据的两组比较,表8-6,表8-6,计算步骤,1.建立检验假设:H0:两组观察值的总体分布位置相同H1:两组观察值的总体分布位置不同=0.052.混合编秩,求各组秩和3.确定检验的统计量(T)方法同前:本例T=1917(例数较小组),例:表8-6频数表资料,吸烟组不吸烟组总秩和例数3940样本秩和191712433160理论秩和156016003160差值357-357平均秩次49.1531.07H0:两组变量值的分布相同结论:在=0.05水准,p0.01,拒绝H0,两组变量值分布差别有统计意义,吸烟组工人的HbCO(%)高于(平均秩次为49.15)对照组(31.07).,例:表8-6频数表资料,式中t为各等级的合计数,u=3.70232.58,校正系数,第三节、多组资料的秩和检验(Kruskal-WallisH检验),1.多个独立样本资料的比较1)编秩方法同两组资料(不配对)相同.(混合编秩)2)计算检验公式为H(公式8-4),1)查表法(总例数N15时)2)N15时,用H值与卡方界值做比较.3.如p值有统计意义,做组间的两两比较(见讲义).,2.确定H统计量的p值,表8-9三个独立样本的比较,变量值为百分率,不符合正态要求。,检验步骤,1.建立检验假设:H0:三组药物死亡率总体分布位置相同H1:三组药物死亡率总体分布位置不同=0.052.混合编秩,求各组秩和(R)3.计算H=9.744.确定p值,本例N=15,查表附11,,结论:p0.01,认为三组药物灭螺的效果不同,二、多个独立样本两两比较,表8-10资料三组间平均秩和的两两比较比较组2p值1与2组比较6.72p0.051与3组比较8.15p0.052与3组比较0.016p0.05,2.多个样本的等级资料比较,H0:四组嗜酸性细胞总体分布位置相同,N=6015,查表确定H值的概率,结论:四组疾病患者的嗜酸性细胞不同。,小结:秩和检验的优缺点,优点:不考虑资料分布,适用范围广,计算简单。常用于不满足参数检验的计量数据和等级数据的比较。缺点:对于满足参数检验的资料,秩和检验的效率低于参数检验(t,F检验)。注意:单向有序的等级资料比较用秩和检验的统计效率高于卡方检验。秩和检验给予数据”秩”的信息.,单向

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论