研究生-统计学讲义-第8讲-非参数检验与Ridit分析.ppt_第1页
研究生-统计学讲义-第8讲-非参数检验与Ridit分析.ppt_第2页
研究生-统计学讲义-第8讲-非参数检验与Ridit分析.ppt_第3页
研究生-统计学讲义-第8讲-非参数检验与Ridit分析.ppt_第4页
研究生-统计学讲义-第8讲-非参数检验与Ridit分析.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第11章 非参数检验、Ridit分析,第一节 非参数统计的意义,前面介绍的统计分析方法,通常都要求样本来自的总体分布类型已知(如样本来自正态分布的总体),在这种假设基础上,对总体参数(如总体均数)进行估计或检验,称为参数统计(parametric statistics)。若不知道样本来自的总体分布类型或已知总体分布与检验所要求的条件不符,此时可用非参数统计(nonparametric statistics)进行假设检验。非参数检验是一种与总体分布无关的统计检验方法,它不比较参数,而是比较分布的位置。常采用“符号”(sign)或“等级”(rank)来代替数据本身进行分析。例如,秩和检验(rank

2、 sum test)、中位数检验(median test)等。,非参数统计的优点是不受总体分布类型的限制,应用范围广,对数据的要求不象参数检验那样严格,不论定量变量和分类变量均可用非参数检验。非参数检验的不足之处是:对符合用参数统计的资料,用非参数检验(如两样本均数比较,符合检验条件时,用秩和检验),一般犯第二类错误的概率比参数检验大,若要使相同,非参数检验要比参数检验需要更多的样本例数。故适合参数统计条件的资料,一般先选参数检验,若参数检验的应用条件得不到满足,才用非参数检验。,用SPSS11.5进行非参数检验,由主菜单Analysis下拉菜单中的Nonparametric tests菜单导

3、出,其中列出了8 种非参数分析方法:,1.Chi-square test(2检验):用2检验作同一样本中两个或多个构成比的比较,操作过程如例8.14,检验变量的几个取值所占百分比和期望的比例有无统计学差异。注意:该检验和一般用的2 检验不一样,一般的2检验用Analyze 中 Descriptive Statistics下拉菜单的Crosstable完成,而不是这里。具体见P143E8.15。,2.Binomial Test(二项分布检验):用于检验所给的变量是否符合二项分布,变量可以是两分类的,也可以是连续性变量,按给出的分界点检验。,3.Runs Test(游程检验):用于检验某变量值的变

4、化是否随机,是否是围绕着某个数值(如均数、中位数、众数或自定义数值)随机波动。操作过程如P154例9.8、,4. 1-Sample K-S Test(即One-Sample Kolmogorov-Smirnov Test单个样本的柯尔莫哥诺夫-斯米尔诺夫检验):用于分析变量是否符合某种分布,可检验Normal(正态分布)、Uniform(均匀分布)、Poisson(Poission分布)和Exponential(指数分布)。操作过程如例3.1(血糖)中所做的探索性分析。,5. 2 Independent-Samples Tests(两个独立样本检验):完全随机设计的两样本均数比较的非参数检验,

5、操作过程如例11.3。 6. K Independent Samples(多个独立样本检验):完全随机设计的多个样本均数比较的非参数检验,操作过程如例11.5,7、2 Related-Samples Tests(两相关样本检验):配对设计两样本均数的非参数检验。操作过程如例11.1、例9.1。,8、 K Related Samples Test(多个相关样本检验):配伍设计多个样本均数的非参数检验,操作如例11.7,第二节 配对设计资料的秩和检验(Wilcoxon法),所谓秩(rank), 又称等级, 实际上就是按数值大小顺序作1, 2, 3, , 等级的一种编码. 秩和检验常用于有序分类变量

6、或不符合用参数检验的资料. 两个或多个有序分类变量(等级资料)的比较, 如临床疗效分为治愈, 显效,好转, 无效; 尿糖分为, , , , ;针麻效果分为,级等.,可以列成2k 表或RC表,用RC表的 2 检验比较差异,但2 检验能说明各等级构成或各对比率是否相同,但不能说明对比各组疗效的优劣或针麻效果好坏等。而秩和检验与Ridit分析则可以起作用。,配对设计资料的符号秩和检验(Wilcoxon法)不仅可用于配对比较,亦可用于样本中位数与总体中位数比较,基本思想是:若H0成立,则配对数值的差值应服从均数T : 标准差T :,T =n(n+1)/4,,的对称分布,将配对的差值按绝对值大小编秩并标

7、上原来差值的符号后,带正号、带负号的秩和在理论上是均匀的, 即使有些差别,也只是随机因素造成的差别,应在一定范围内。,如果正、负秩和相差悬殊,统计量 T 特别小或特别大,则 H0 为真的可能性很小,从T 界值表(附表12)也可看出,当 n 确定以后,T 界值的下限愈小,上限愈大时,P 值愈小。因而可按小概率原理,拒绝H0;反之,不能拒绝H0 。随着 n增大,T 分布逐渐逼近:,均数:T=n(n1)/4,,方差为:,的正态分布。可用 u 检验。,Wilcoxon法配对符号秩和检验对子数 n 必须大于5。因n5时,可以排出差值编秩的所有组成共有32种情况。当各配对的差值符号相同时,秩和绝对值较小者

8、为0,较大者为15的5个自然数之和15,即T0或T15;其它情况下0T15;可知n5时,T的取值范围是015,,而P(T0)P(T15)1/320.03125,双侧概率为0.0312520.06250,已大于0.05。所以当n5时,用符号秩和检验不能得出双侧概率P0.05,故 n 必须大于5。,1配对设计资料比较的符号秩和检验,例9.1,.,(1) H0:配对差值总体中位数Md0;,H1:配对差值总体中位数Md 0 .0.05.,差值 -20 36 -5 -2 2 0 -10 -48,rank -8 10 - 3 -1.5 1.5 -5 -11,由于n11(因为有0),T+11.5、T-54.

9、5,则统计量T11.5. 查统计用表12,11.5在(10,56)内,双侧P0.05,以0.05水准不拒绝H0,差值总体中位数与0的差异有无统计意义,尚不能认为两法检测谷-丙转氨酶的结果不同。,a.在n25时,可查统计用表11,用T值与T界值进行比较若T值在上、下界范围内,则 P 值大于相应概率;若T值为上、下界值或范围外,则 P 值小于相应概率,在n 25时,可用连续的u检验作不连续T分布的近似,即:,在相同差值太多时(不包括差值为0),由于求得的u值偏小,要进行校正,即,ti为第i个相同秩次的个数,SPSS11.5,建立数据文件P147E1.sav , Analyze, Nonparame

10、tric Tests,2 Related Samples,解法2:软件计算,表中显示:按y-x的正秩输出,检验统计量Z=-1.913,双侧大约概率P=0.056,故以=0.05水准不拒绝H0,接受H1。,二、单样本资料的秩和检验 样本中位数与总体中位数比较的目的是推断样本是否来自某已知中位数的总体。检验方法步骤和配对比较的符号秩和检验一样,唯一不同的是用每一个样本观测值与已知总体中位数相减来计算“差值”。,【例9.2】已知某地正常人尿氟含量的中位数为0.86mg/L,今在该地某厂随机抽取12名工人,测得尿氟含量(mg/L)为:0.84,0.86,0.88,0.94,0.97,1.01,1.05

11、,1.09,1.20,1.28,1.35,1.83。推断该厂工人的尿氟含量是否高于当地正常人。因据经验尿氟含量不满足正态性,本例小样本资料,虽经正态性检验不拒绝H0,还是按不满足正态性处理,采用Wilcoxon符号秩和检验。,H0:该厂工人的尿氟含量与当地正常人相同,中位数Md0.86;H1:该厂工人的尿氟含量高于当地正常人, Md0.86。0.05。 分别求12个观测值与总体中位数0.86之差(标明正负号),有一个差值为0,不编秩,依差值的绝对值从小到大编秩11个,标上原差值的正负号,统计正、负秩和分别为1.5、64.5,取T1.5。用n11查配对秩和检验T界值表(附表11),T1.5在单侧

12、T0.005/2(12)561的范围外,P0.005,按0.05水准,拒绝H0,接受H1,可认为该厂工人的尿氟含量高于当地正常人。,第三节 完全随机设计两样本比较的秩和检验,完全随机设计两样本比较秩和检验是用两样本观察值的秩来推断两样本分别代表的总体分布位置是否不同。本节介绍Wilcoxon两样本比较法。,1计量资料的两样本比较 例9.3 为了考察中药葛根对心脏的影响,使用3g/100mL和5g/100mL葛根的剂量,测定大鼠用药后一分钟心肌收缩的抑制率(1用药后心肌的收缩量/用药前心肌的收缩量)100,试检验这两种葛根剂量对心肌收缩作用是否相同?,3g/100ml组 94.45 54.69

13、1.24 81.80 85.19 86.92 91.32,5g/100ml组 90.71 98.25 79.92 90.68 68.64 91.90,-1.24 54.69 68.64 79.92 81.80 85.19 86.92 90.68 1 2 3 4 5 6 7 8,90.71 91.32 91.90 94.45 98.25 9 10 11 12 13,n1=6 , T=3+4+8+9+11+13=48,成组资料比较时,H0:两总体分布相同在H0成立时,容量分别为n1、n2的两个样本来自同一总体定量资料编秩时, 同组相同数据取顺序秩次, 不同组相同数据取平均秩次. 分类资料编秩时,

14、同一等级取平均秩次. 规定n1n2 , 记Nn1n2 , 容量为n1样本的秩和T与平均秩和n1(N1)/2理论上应相差不大 . 当n1、n2增大时 , T 的分布逐渐逼近: =N1(N1)/2 =n1n2(N1)/12 的正态分布,这种方法,称为成组秩和检验(Wilcoxon法) 在n1、n2较小时,可查统计用表12,用T值与T界值进行比较若T值在上、下界范围内,则P值大于相应概率;若T值为上、下界值或范围外,则P值小于相应概率,在n1、n2较大时,可用连续的u检验作不连续T分布的近似,即,Nn1n2,在两样本相同秩次的个数太多时,由于求得的u值偏小,要进行校正,即,Nn1n2,ti 为第 i

15、 个相同秩个数,解法1: 这是定量资料但不要求正态分布,H0:两总体分布相同,H1:两总体分布不同.,3g组 1.24 54.69 81.8 85.19 86.92,5g组 68.64 79.92 90.68,3g组 91.32 94.45 n2=7,Rank 1 2 3 4 5 6 7 8,5g组 90.71 91.90 98.25 n1=6,Rank 9 10 11 12 13 T=48,查统计用表11成组T界值,单侧P0.05,只能以0.05水准接受H0,两总体分布相同,不能认为两种剂量的效果不同,解法2: 用SPSS11.5统计软件,H0:两总体分布相同;,H1:两总体分布不相同,0.

16、05。,Test Statisticsb 表中给出了Mann-Whitney U统计量为15、Wilcoxon W统计量为43, 两法的检验统计量Z= -0.857, 双侧近似P值=0.391, 确切概率=0.445。故双侧检验接受H0两总体分布相同,不能认为葛根两种剂量的效果不同。,解法3 :用DPS 数据处理系统,输入两组数据试验统计非参数检验两样本检验结果,各个处理数据的秩 3g 组 12.0 2.01.0 5.0 6.0 7.010.0 5g 组 13.0 4.08.0 3.0 11.0 9.0,Wilcoxon检验 n1=7 n2=6 秩和T=48.00 Txy=15 两组间差异显著

17、检验的精确p=0.4452214 正态近似 统计量U=0.7857 p=0.4320351,2分类资料的两样本比较 例 用蠲哮汤治疗热哮型支气管哮喘67例,对照组30例以牡荆油胶丸治疗,两组在年龄、病情等到方面具有可比性,两组的疗效见表11-3,试作比较。 H0:两组总疗效相同; H1 :两组疗效不相同;0.05。,表11-3 某药对两种病情支气管炎疗效的秩和检验计算表,Test Statisticsb表给出Mann-Whitney U统计量=531.500、Wilcoxon W统计量=2809.5,两法的检验统计量Z= -3.844,双侧近似P值=0.000,故可拒绝H0,接受H1,认为两组

18、的总疗效不相同,可认为蠲哮汤治疗哮型支气管哮喘的总疗效优于牡荆油胶丸。,第四节 完全随机设计多样本比较的秩和检验(H检验),完全随机分组资料比较, H0为各总体分布相同. H0成立时, 容量分别为ni (1ik) 的k个样本来自同一总体. 定量资料编秩时, 同组相同数据取顺序秩次, 不同组相同数据取平均秩次. 分类资料编秩时, 同一等级取平均秩次. 记N=ni ,Ti为容量为ni样本的秩和 当 ni 增大时, Ti构成的 H 统计量近似于自由度为k1的卡方分布,即,x2,dfk1,这种方法称完全随机分组秩和检验(KruskalWallis法), 在ni 较小时, 可查统计用表13, 用H值与H

19、界值进行比较 在ni 较大时,可用 H 统计量近似作 x2 检验,并在相同秩次太多时校正,即,例为比较不同批号药盒检验结果是否一致,将三个批号各四个药盒一一测定了某一标本。结果如表11-4,试问不同批号测定结果有无差别?,H0:不同批号测定值总体分布位置同;H1:不同批号的测定值总体分布位置不同或不全相同.0.05。,1号 1.80 1.92 2.00 2.01 2.11 n1=5,2号 2.11 2.21 2.25 2.57 n2=4,3号 2.75 3.10 3.27 3.27 n3=4,rank 1 2 3 4 5.5 T1=15.5,rank 5.5 7 8 9 T2=29.5,ran

20、k 10 11 12.5 12.5 T3=46,n1+n2+n3=N=13,H =10.449,P 值0.005;故拒绝H0,接受H1,可认为不同批号的测定值总体的分布位置不同或不全相同,输出结果:由Kruskal-Wallis H中的Test Statistica,b得2=10.449,近似P值=0.005;由Median Test中的Test Statisticb得2=8.976, P=0.011,故单侧检验均拒绝H0,接受H1,可认为不同批号的测定值总体的分布位置不同或不全相同,例9.4 用祖传及一般针炙疗法治疗哮喘病人46例及28例判断祖传针灸疗法的疗效是否高于一般针炙疗法,分类资料,

21、单向有序且样本容量较小,不宜Ridit分析,H0:两总体分布相同,H1:两总体分布不同,计算各等级合计数,秩次范围,平均秩次,秩和。如疗效为“无效”者合计8例,平均秩次为(18)/24.5,一般疗法组的秩和为4.5522.5,确定T850.5,t18、t229、t321、t416,2.3305,由uCu0.05/2,双侧P0.05,以0.05水准的双侧检验拒绝H0,两总体的分布不同,由T1T2,可以认为祖传针灸疗法的疗效高于一般针炙疗法,第四节 完全随机分组秩和检验(K-W法), 完全随机分组秩和检验,H0:各总体分布相同,ni增大时,Ti构成H统计量近似df=k1卡方分布,定量资料同组相同数

22、据取顺序秩,不同组相同数据取平均秩。分类资料同一等级取平均秩,ni较小时查统计用表13,用H值与H界值进行比较,ni较大时用H统计量近似x2检验,相同秩多时校正, 在各总体分布不全相同结论下多重比较,H0:第i、j个总体分布相同,dfNk,在无相同数据时,在有相同数据时,例9.5 用三种药物杀灭钉螺,每批用200只活钉螺,计算死亡率,问三种药物杀灭钉螺的效果有无差异,解 这是百分率资料,不符合正态分布 完全随机分组秩和检验, H0:三个总体分布相同,N15,样本数据混合编秩,求出秩和,计算H值,由组数k3且例数ni5,查附表13,单侧H0.01(5,5,5)7.989.7400,单侧P0.01

23、,以0.01水准单侧检验拒绝H0,三个总体分布不全相同,可以认为三种药物的杀灭钉螺的效果不同, 多重比较,H0:第1、2个总体分布相同。 无相同数据,,2.两两比较的Nemenyi法检验(Nemenyi test) 在各总体分布位置不全相同,需进一步推断是哪两两总体位置分布不同时,可用Nemenyi法检验。当各样本例数较大时,第i个和第j个样本比较检验统计量计算公式为:,dfk-1,例9.5进一步作多重比较。如A药与B药比较: H0:A药与B药杀钉螺死亡率的总体分布位置相同,H1:两总体分布位置不同。0.05 本例因无相同数据,C =1。,3.645, dfk-12,用df2查2界值表(附表2

24、),得单侧0.1P0.25,按0.05水准拒绝H0,接受H1,可以认为A药杀死钉螺的效果高于B药。类似得到9.68,P0.01,可以认为A药杀死钉螺的效果高于C药。1.81,P0.05,B药和C药比较,尚需增大样本含量才能了解是否总体分布位置不同。,二、等级资料多样本比较的秩和检验,【例9.6】某医院以蛞蝓胶囊为主综合治疗(简称蛞蝓综合法)中晚期肺癌,并与中西医结合治疗及联合化疗作比较观察,其近期疗效分部分缓解,稳定,扩展三级,资料见表9-5,比较三组的疗效。,H0:三组疗效相同;H1:三组疗效不全相同;=0.05。,表9-5 三种方法治疗中晚期肺癌近期疗效秩和检验计算表,等级资料(单向有序R

25、C表),用Kruskal-wallis H检验。取0.05 H0:三种方法疗效的总体分布位置相同,H1:三种方法疗效的总体分布位置不全相同。,编秩,求秩和,见表9-5第栏。按(式9.4)、(式9.5):,3.4309,(ti3ti)(35235)+(41241)+(16216)=115800 Hc 3.4309/1115800/(92392) = 4.0303 以自由度dfk-12查2界值表(附表4),20.1(2)=4.61,故P0.10,按=0.05水准不能拒绝H0,不能认为三种方法的疗效不同。,第五节 配伍组设计多个样本比较的秩和检验,1配伍设计多个样本比较的秩和检验 这里介绍Fried

26、man M检验。,【例9.7】某医师按中医辨证,把肺癌病人分成五类,研究辨证分型的疗效,由于疗效又受病期的影响,所以又按病期分为、三个配伍组(b3),资料见表9-6。分析不同辨证分型肺癌病人的一年生存率是否不同。,第六节 游程检验,第七节 Ridit分析 一、意义,Ridit分析(Ridit analysis)亦称参照单位分析,系I.D.J.Bross于20世纪五十年代中期所提出,Ridit一词为relative to an identified distribution的缩写Rid与unit的词尾it组成,意为“与特定分布相对应的单位”。适用于两个或多个有序分类变量以及如抗体滴度等具有无确切

27、数字(如1:320)的半定量变量比较,它不光能说明各等级构成或各对比率是否相同,又能说明对比各组的优劣。其独到之处在于将有序分类资料或等级分配的数据,经过特定的变换转化为定量数据(连续型变量值),从而可按正态分布的理论来作统计推断。由于存在一种似近算法,不需作平方和的运算就能估计标准误,所以应用简便。,例9.9 某医院用中草药制剂甲治疗慢性支气管炎病人3420例,疗效很好。今又制成一种中草药新的制剂乙,与甲制剂相比,不知乙制剂疗效如何?为此,又进行了105例临床试验,结果如表11-7。检验步骤如下:,1 .参照单位 R 的定义,设有等级资料:,等级i 1 2 k 合计 频数 m1 m2 mk

28、n 频率 f1 f 2 f k Ri R1 R2 Rk,其中, n=m1+m2+mk,Ri 称为第 i 等级的参照单位或Ridit值,.,把按等级分布的计数资料变换为一组计量资料.由数理统计可以得知: R服从0,1上的均匀分布,由均匀分布的理论知:,标准误,当 n 充分大时, 近似服从,近似服从标准正态分布 N(0,1),的1的置信区间为:,若0.05,则,的95%的置信区间为:,可以证明,参照组(或标准组),0.5,因此参照组 95% 的置信区间为:,2、应用条件 : 适用于单向有序资料,3、方法 1)取例数多的一组作为参照组(标准组) 2)一般取合并组为参照组(平均Ridit分析),4、判

29、断,二、样本与总体比较的Ridit分析 设对比组的 R 的总体均数为 设 H0: 若对比组 的置信区间不包含0.5 , 则以显著水平拒绝H0 , 认为 与平均疗效 0.5 的差异有统计意义, 若等级从“差好”, 值越大,表示效果越“好”;同时,注意到 是在0,1上取的值, 所以在作对比分析时可把它理解为对比组中的个体效果更好的概率。例如,若 =0.8,则该组中的个体比标准组中的个体获得较好效果的可能性为80,即平均100例中约有80例获得较好效果。,返回到例9.9 ,(1) 选定标准组:,(2) H0: 乙制剂治疗慢性支气管炎效果与甲制剂相同,即对比组总体 0.5;,H1: 乙制剂治疗慢性支气

30、管炎效果与甲制剂不相同,即对比组总体 0.5。0.05,等级 无效 好转 显效 痊愈 合计,频数 776 1926 685 33 3420,频率 0.2269 0.5631 0.2002 0.0096,R 值 0.1135 0.5085 0.8902 0.9952,(3) 计算标准组各等级的R值。,可见R值计算无误。,(4) 计算对比组的 值:,(5) 计算对比组总体 值的可信区间。,u/ =0.62392.58 / =0.55120.6966,(6) 推断结论:如果对比组总体值的可信区间不包括0.5,可认为对比组与标准组差别有统计学意义;反之,如果对比组总体值的可信区间包括0.5,则不能认为

31、对比组与标准组有差别。,本例样本与总体比较的Ridit分析,对比组总体值的99可信区间不包括0.5,故在0.01的水准上拒绝H0,接受H1 (P0.01)。从表11-23中可以看出,疗效越好,R值越大,本例对比组值大于标准组,可认为乙制剂治疗慢性支气管炎优于标准组(甲制剂)。,虚线为标准组值, 供比较用。小圆圈为对比组的值, 小圆圈上下的两条短横线表示可信区间。可信区间与横线相交, 表示对比组与标准组差别无统计学意义;可信区间不与横线相交, 则表示对比组与标准组差别有统计学意义。,例9.10 观察针刺与药物治疗内分泌性突眼症的临床疗效, 资料见表11-9, 试比较两疗法的疗效有无差别?,等级 痊愈 显效 好转 无效 合计,针刺 19 32 8 13 72,合计 22 38 12 42 114,药疗 3 6 4 29 42,频率 0.1929 0.3333 0.1052 0.3684,R 值 0.0965 0.3596 0.5789 0.8158,(5) 推断两R值差别有无统计意义: 方法1:可信区间重叠法. 先分别各对比组求出总体 值的(1)可信区间,若可信区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论