秩和检验.doc_第1页
秩和检验.doc_第2页
秩和检验.doc_第3页
秩和检验.doc_第4页
秩和检验.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.第十章 基于秩次的非参数检验【教学要求】掌握:非参数检验的基本概念及其适用的资料类型;参数检验与非参数检验的区别;掌握配对设计、单样本设计、完全随机化设计两独立样本及多独立样本秩和检验的应用条件、实施方法。熟悉:常用秩和检验方法的步骤、结果解释。了解:完全随机设计多个独立样本间的多重比较;通过电脑实验了解不同设计类型的秩和检验和相应t 检验的功效问题。【重点难点】(一)参数检验与非参数检验1、参数检验 以特定的总体分布(如正态分布)为前提,对未知的总体参数(如总体均数)作推断的假设检验方法统称为参数检验,也叫参数统计。2、非参数检验当样本所来自的总体分布不服从特定分布,或难以用某种函数式来表达,解决这类问题可用非参数检验方法。非参数检验不依赖总体分布的具体形式,不受总体参数的限制,它检验的是分布,而不是参数。(二)非参数检验的特点和适用范围 1、特点(1)对样本所来自的总体分布形式没有要求。(2)收集资料方便,可用“等级”或“符号”来记录观察结果。(3)多数非参数检验方法比较简便,易于理解和掌握。(4)缺点是损失信息量,适用于参数检验的资料用非参数检验会降低检验效能。2、适用范围(1)等级资料。(2)偏态分布资料。当观察资料呈明显偏态分布而又未作变量变换,或经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。(3)方差不齐,且不能通过变量变换达到齐性。(4)个体数据偏离过大,或一端或两端无界的资料。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数检验统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。(三)配对设计差值的符号秩和检验(Willcoxon 配对法)1、建立检验假设,确定检验水准H0:差值的总体中位数等于0 H1:差值的总体中位数不等于00.052、计算检验统计量T值(1) 求差值d(2)编秩:依差值的绝对值由小到大编秩。当差值为0,弃去不计,n随之减少;当差值绝对值相同,称为相持,取平均秩次。(3)求正、负秩和(4)确定统计量T :任取T或 T为统计量T。3、确定P值,作出推断结论(1)查表法:当n50时,查T界值表,得出P值。若检验统计量T值在上下界值范围内,其P值大于表上方对应的概率值;若T值在上下界值范围外,其P值小于表上方对应的概率值;若T值恰好等于上下界值,其P值等于(一般是近似等于)表上方对应的概率值。(2)正态近似法:若n50时,可用Z检验,按如下公式计算:当相同秩次(相持现象)出现较多时(如超过25),应改用校正公式:(四)一组样本资料的符号秩和检验Wilcoxon符号秩和检验的原理与配对设计资料类似,所不同的只是差值为各观察值与已知总体中位数之差,其他符号的意义同配对设计资料。(五)两组独立样本比较秩和检验(Willcoxon两样本比较法)1、建立检验假设,确定检验水准H0:两总体中位数相等H1:两总体中位数不等0.052、计算检验统计量T值(1)编秩:将两组数据由小到大统一编秩,遇相同数据取平均秩次。(2)求各组秩和:以样本例数较小者为n1,其秩和为T1。(3)确定统计量T值:若n1n2,则TT1;若n1n2,则TT1或TT2。3、确定P值,做出推断结论(1)查表法:(2)正态近似法:若n1或n2-n1较大时,可用Z检验,按如下公式计算:当相同秩次出现较多时(如超过25),应改用校正公式:,其中,为第j次相持时相同秩次的个数。(六)完全随机化设计多组独立样本的秩和检验1、建立检验假设,确定检验水准H0:多个总体中位数相等H1:多个总体中位数不相等或不全相等0.052、计算检验统计量H值(1)编秩: 将多组数据由小到大统一编秩,遇相同数据取平均秩次。(2)求各组秩和Ri (3)计算统计量H值 式中为各组秩和,为各组例数,。当相持较多时,由上式求得H值偏小,可按下式计算校正Hc值: 其中,为第j次相持时相同秩次的个数。3、确定P值,作出推断结论查H界值表(附表11): 当组数k3,且各组例数ni5时查H界值表可得P值。查界值表(附表8): 当组数或/和各组例数超出H界值表时,H近似地服从自由度的分布,可查界值表得到P值。(七)多个样本两两比较的秩和检验对完全随机设计多个样本比较用Kruskal-Wallis秩和检验,当推断结论为拒绝,接受时,只能得出各总体分布不同或不全相同的结论。若要对每两个总体分布做出有无不同的推断,需要作组间的两两比较。第五节 案例讨论案例10-1 某研究者欲研究熊去氧胆酸对脂肪肝的发生有无预防作用,将10只雄性大鼠随机分为两组,一组由正常饲料喂养,另一组采用正常饲养熊去氧胆酸喂养。经过一段时间后,测其肝脏脂类总量(g/%),数据见表10-8,问两组大鼠肝脏脂类总量有无差别?表10-8 两组大鼠肝脏脂类总量(g/%)正常饲养组8.908.968.988.978.95正常饲养熊去氧胆酸组8.918.858.828.008.89某研究者对该资料做了两独立样本的t 检验:1.476, ,0.05,按=0.05水平,不拒绝,结论为饲料中添加熊去氧胆酸对大鼠脂肪肝无预防作用。而另一位研究者采用两独立样本秩和检验,由5,0,39,查界值表(两独立样本秩和检验用),得出0.010.02,按=0.05水平,拒绝,结论为饲料中添加熊去氧胆酸对大鼠脂肪肝有预防作用。对于上述两种分析结果,请讨论:(1)你认为哪位研究者的统计推断是正确的?为什么?(2)从这个案例中,你得出什么启示?案例10-2 将272名冠心病患者随机分为3组,分别采用甲、乙、丙3种不同方法治疗,结果见表10-9,问3种方法的疗效有无差别? 表10-9 3种不同方法治疗冠心病患者的疗效比较疗效等级甲疗法乙疗法丙疗法合计加重162066102无效251371109改善8151841显效421420合计5350169272研究者对于上述资料做了列联表检验:,v6,0.05,在的检验水准上,拒绝,可认为3种方法的疗效有差别。请讨论:(1) 该资料的分析方法是否合适?为什么?(2) 应该如何分析该资料?【案例讨论参考答案】案例10-1 某研究者欲通过研究两组大鼠肝脏脂类总量有无不同,判断熊去氧胆酸对脂肪肝的发生有无预防作用。(1)后一位研究者采用两独立样本秩和检验进行分析是正确的。该资料属于计量资料,设计类型为完全随机化设计两组比较。若该资料服从正态分布、方差齐性条件,采用两独立样本比较的t检验;若不满足条件,采用两独立样本秩和检验。本例资料服从正态分布,但方差不齐,所以采用两独立样本秩和检验是正确的。(2)通过这个案例,对于资料不经分析,盲目套用参数检验是不正确的,应用参数检验一定要满足参数检验的条件。不满足参数检验条件,盲目套用参数检验反而会降低检验效能,甚至可能导致错误结论。案例10-2 比较3种不同疗法治疗冠心病患者的疗效,该资料为等级资料,设计类型为完全随机化设计三样本比较,属于单向有序资料。本案例研究目的是比较3种不同疗法治疗冠心病患者的疗效有无差别,此时研究者采用检验进行统计分析是不合适的。 (1)原因如下:指标为等级资料,比较三组的实验效应有无差别,宜用多组有序变量资料的秩和检验;若采用列联表检验进行分析,其比较的就不再是实验效应,而是三组间疗效的这四种结果的分布有无差别,即比较的是三组构成比总体上有无不同。故根据本例研究目的,不能采用列联表检验。(2)对于该资料的统计学分析,应该采用多组有序变量资料的秩和检验。假设检验步骤如下:1、建立检验假设,确定检验水准H0:三种方法疗效的总体中位数相同H1:三种方法疗效的总体中位数不相同或不全相同0.05 表10-1 3种不同疗法治疗冠心病患者的疗效比较疗效等级甲疗法乙疗法丙疗法合计秩次范围平均秩次加重162066102110251.5无效251371109103211157.0改善8151841212252232.0显效421420253272262.5合计5350169272查界值表,= k-1=2,得P0.05,按=0.05水平,拒绝H0,接受H1,可认为三种方法疗效有差别。思考与练习1.什么叫做非参数检验?2.秩和检验有哪些优缺点?3.两组或多组有序分类资料的比较,为什么宜用秩和检验而不用检验?4.两独立样本比较的Willcoxon秩和检验,当n110或n2-n110时用Z检验,这时检验是属于参数检验还是非参数检验,为什么?5.已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下:2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18 3.87 5.67问该厂工人的尿氟含量是否高于当地正常人?6.某市卫生防疫站用减压蒸馏法和醋酸丁酯萃取法分离10种海产品中的无机砷和有机砷,然后测得10种海产品的有机砷含量见表10-11。试问,就总体而言,两种分离方法的测定结果有无不同?表10-11 海产品中有机砷测定结果(mg/kg)样品号减压蒸馏法醋酸丁酯萃取法差值秩次125.8023.802.009.5268.8069.91-1.11-8321.4523.45-2.00-9.549.208.920.285515.2214.710.51761.521.68-0.16-2711.7511.240.51684.934.680.25391.821.560.264100.310.290.0217.配对比较两种药物治疗10例足癣的结果见表10-12,试问,就总体而言,何种药物疗效较好?表10-12 两种药物治疗足癣效果病例号12345678910中草药软膏治愈有效治愈治愈有效治愈治愈治愈有效治愈癣敌软膏有效无效有效治愈有效有效无效有效无效治愈8.甲地8眼井和乙地10眼井的水质中氟化物含量(mg/L)测定结果见表10-13,试问,就总体而言,两地井水氟化物含量有无差别?表10-13 甲地8沿井和乙地10眼井的水质中氟化物含量(mg/L)测定结果甲地00.0010.0020.0020.0080.0080.0090.01乙地0.0020.0020.0040.0060.0260.050.090.130.140.259.某研究者欲比较A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%)(表10-14),试判断三组吞噬率的差别是否具有统计学意义?表10-14 不同菌种对小鼠巨噬细胞的吞噬率()A菌组B菌组对照组45.064.070.051.062.089.046.044.056.066.071.051.068.091.031.036.056.066.074.054.068.093.056.036.057.066.074.054.070.048.024.060.366.076.059.070.043.018.063.067.073.061.071.024.036.064.070.093.061.070.018.044.064.070.095.061.087.036.036.010.某研究者欲比较吸烟工人与非吸烟工人的碳氧血红蛋白HbCO(%)含量,测得39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量值,其结果见表10-15。试问,就总体而言,吸烟工人的碳氧血红蛋白HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量? 表10-15 吸烟工人和不吸烟工人的HbCO(%)含量比较HbCO(%)含量吸烟工人不吸烟工人合计很低123偏低82331中等161127偏高10414很高404合计39(n1)40(n2)79【思考与练习参考答案】1、非参数检验对总体分布不作严格限定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作检验。2、秩和检验为非参数检验,其主要的优点:适用范围广:等级资料。偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。各组离散程度相差悬殊,即方差明显不齐,且不能通过变量变换达到齐性。个体数据偏离过大,或资料为单侧或双侧没有上限或下限值。分布类型不明。初步分析。有些医学资料由于统计工作量大,可采用非参数检验统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。(2)方法简便、易于理解和掌握。主要缺点:损失信息量,适用于参数检验条件的资料用非参数检验,检验效能降低。3、见案例10-2的讨论。4、属于非参数检验。因为这时的Z检验是比较例数较小组秩和与其总体均数n1(N+1)/2的差别。5、该资料为计量资料,设计类型为单样本设计;由于尿氟资料通常不服从正态分布,故采用一组样本资料的符号秩和检验。假设检验基本步骤如下:差值的总体中位数等于零:差值的总体中位数不等于零表10-2 某地某厂12名工人与该地正常人尿氟含量(mmol/L)比较工人编号123456789101112样本2.152.102.202.122.422.522.622.723.003.183.875.67差值0-0.050.05-0.030.270.370.470.570.851.031.723.52秩次-2.52.5+=62.5 T=3.5n=11,T=3.5,查T界值表(附表9,配对比较的符号秩和检验用),得P0.005,按 =0.05检验水准,拒绝,接受。可认为该厂工人的尿氟含量高于当地正常人。6、该资料为计量资料,设计类型为配对设计;由于海产品中有机砷资料通常不服从正态分布,故采用配对设计资料的符号秩和检验。假设检验基本步骤如下:差值的总体中位数等于零:差值的总体中位数不等于零表10-3 海产品中有机砷测定结果(mg/kg)样品号减压蒸馏法醋酸丁酯萃取法差值秩次125.8023.802.009.5268.8069.91-1.11-8321.4523.45-2.00-9.549.208.920.285515.2214.710.51761.521.68-0.16-2711.7511.240.51684.934.680.25391.821.560.264100.310.290.021T+=35.5 T=19.5 n=10,T=19.5,查T界值表(附表9,配对比较的符号秩和检验用),得P0.10,按 =0.05检验水准,不拒绝,可认为两种分离方法对于测定结果没有不同影响。7、该资料为等级资料,设计类型为配对设计;采用配对设计资料的符号秩和检验。假设检验基本步骤如下:差值的总体中位数等于零:差值的总体中位数不等于零令“治愈”=3,“有效”=2,“无效”=1表10-4 两种药物治疗足癣效果病例号12345678910中草药软膏治愈有效治愈治愈有效治愈治愈治愈有效治愈癣敌软膏有效无效有效治愈有效有效无效有效无效治愈差值1110012110秩次1234756T+=28 T=0 n=7,T=0,查配对设计用T界值表,得P = 0.020.05,按 =0.05检验水准,拒绝,接受。可认为两种药物治疗足癣疗效不同,中草药软膏疗效更好。8、该资料为计量资料,设计类型为完全随机化设计两样本比较;由于水中氟化物含量(mg/L)不服从正态分布,不满足t检验条件,故采用两组连续型变量资料的秩和检验。假设检验基本步骤如下:两个总体中位数相同:两个总体中位数不同表10-5 甲地8沿井和乙地10眼井的水质中氟化物含量(mg/L)测定结果甲地秩次乙地秩次0.000 10.002 4.50.001 20.002 4.50.002 4.50.004 70.002 4.50.006 80.008 9.50.026 130.008 9.50.050 140.009 110.090 150.010 120.130 160.140 170.250 18n1 = 8T1 = 54n2 = 10T2 = 117以n1 = 8,n2 -n1 = 2,T=54,查T界值表(附表10,两样本比较的秩和检验用),0.10P 0.05,按=0.05检验水准,不拒绝,尚不能认为两地井水氟化物含量有差别。9、该资料为比值资料,设计类型为完全随机化设计三样本比较;采用三组连续型变量资料的秩和检验。假设检验基本步骤如下:H0:三个总体的中位数相同:三个总体的中位数不同或不全相同=0.05表10-6 不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组B菌组C菌组吞噬率秩次吞噬率秩次吞噬率秩次45.01451.01746.01556.02251.01831.0556.02254.01956.02257.02454.02048.01660.32659.02543.01163.03161.02724.0364.03261.02818.0164.03361.02936.0864.03462.03044.01266.03568.04036.0866.03668.04136.0866.03770.044.524.0466.03870.044.518.0267.03971.048.536.0870.044.570.044.544.01370.044.587.05436.0870.044.589.05571.048.591.05674.05193.057.574.05276.05373.05093.057.595.059Ri927.5698.5144ni241916=32.95,=0.998,=33.02,查界值表,,得出。按检验水准,拒绝。可以认为不同菌种对小鼠巨噬细胞的吞噬率有差别。两两比较1=38.6458,2=36.7632,3=9,N=59,表10-7 三组样本秩和的两两比较对比组P(1)(2)(3)(4)(5)A菌组与B菌组1.88265.2740.3570.5A菌组与C菌组29.64585.5445.3470.001B菌组与C菌组27.76325.8274.7650.001A、B菌与C菌的吞噬率不同,还不能认为A菌和B菌的吞噬率不同。10、该资料为等级资料,设计类型为完全随机化设计两样本比较;采用完全随机化设计两样本资料的符号秩和检验。假设检验基本步骤如下:两个总体中位数相同:两个总体中位数不同表10-8 吸烟工人和不吸烟工人的HbCO(%)含量比较含量吸烟工人不吸烟工人合计秩次范围平均秩次秩和吸烟工人不吸烟工人(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)很低12313224偏低8233143419152437中等161127356148768528偏高10414627568.5685274很高404767977.53100合计39(n1)40(n2)791917(T1)1243(T2)=0.8940,=20.5823,查t界值表(v=),得P0.001,按检验水准,拒绝。可认为吸烟工人与不吸烟工人碳氧血红蛋白含量总体分布不同。【补充练习题】一、 选择题(一)A1型:每一道下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。1以下检验方法除 外,其余均属非参数方法。At检验 BH检验 CM检验 D检验 E符号秩和检验2两小样本定量资料比较的假设检验,首先应考虑 。A用t检验 B用秩和检验 Ct检验与秩和检验均可D资料符合t检验还是秩和检验的条件 E检验3在作等级资料的比较时,宜用 。At检验 B检验 C秩和检验 DF检验 E方差分析4在作两样本均数比较时,已知n1、n2均小于30,总体方差不齐且呈极度偏峰的资料宜用 。At检验 Bt检验 CZ检验 D秩和检验 Et/检验与秩和检验均可5三组比较的秩和检验,样本例数均为5,确定P值应查 。A界值表 BH界值表 CT界值表 DM界值表 E以上均不可6对成组设计两样本比较的秩和检验,描述不正确的是 。A将两组数据统一由小到大编秩B遇有相同数据,若在同一组,按顺序编秩C遇有相同数据,若不在同一组,按顺序编秩D遇有相同数据,若不在同一组,取其平均秩次E将两组数据混合编秩7 ,应该用非参数统计方法。A正态分布资料n不相等时两样本均数的比较B正态分布资料两样本方差都比较大时两样本均数的比较C两组等级资料比较D两组百分比资料的平均数比较E两组对数正态分布资料的平均数比较8在统计检验中是否选用非参数统计方法, 。A要根据研究目的和数据特征作决定B可在算出几个统计量和得出初步结论后进行选择C要看哪个统计结论符合专业理论D要看哪个P值更小 E只看研究目的9请指出下列五个秩和检验的结果哪个是错误的 。A配对计量资料n=12,T+=7,T=71,查得T0.05=1365,P0.05B配对计量资料n=8,T+=12,T=24,查得T0.05=333,P0.05C两组计量资料n1=12, n2=10,T1=173,T2=80,查得T0.05=84146,P0.05D两组计量资料n1=10, n2=10,T1=55,T2=155,查得T0.05=78132,P0.05E两组计量资料n1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论