课件:医学统计学精品教学(汕头大学)第十章-非参数检验.ppt_第1页
课件:医学统计学精品教学(汕头大学)第十章-非参数检验.ppt_第2页
课件:医学统计学精品教学(汕头大学)第十章-非参数检验.ppt_第3页
课件:医学统计学精品教学(汕头大学)第十章-非参数检验.ppt_第4页
课件:医学统计学精品教学(汕头大学)第十章-非参数检验.ppt_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/4/14,1,第十章 非参数秩和检验,吴 库 生 汕头大学医学院预防医学教研室,2019/4/14,秩和检验,2,参数统计与非参数统计,1、参数统计(parametric statistics) 样本所来自的总体分布具有某个已知的函数形式(如正态分布),而其中有的参数是未知的,统计分析的目的是对这些未知的参数进行估计或检验。,2019/4/14,秩和检验,3,但实际上有些医学研究资料并不符合上述条件,即使用变量变换的方法也难以达到应用参数方法的要求。 这就需要一种不依赖于总体分布的具体形式的统计方法来解决此类问题。 由于这类方法不受总体参数的影响,故称非参数检验法。它检验的是分布,而非参数。,2019/4/14,秩和检验,4,2、非参数统计( non-parametric statistics ) 不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断,而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。由于这类方法不受总体参数的限制,故称非参数统计法。有时也称为任意分布检验(distribution-free statistics)。,2019/4/14,秩和检验,5,3、非参数统计的优点, 适用范围广,不论样本所代表的总体分布形式如何,甚至是未知的,都可适用; 资料可用“等级”、“符号”表示,收集方便; 多数非参数检验方法简便,易于理解和掌握。,2019/4/14,秩和检验,6,4、非参数统计的缺点, 对符合用参数检验的资料,如用非参数统计,会丢失信息,导致检验效率下降,犯第II类错误的可能性比参数检验大,即值; 非参数检验的有些问题的计算仍显繁冗。,2019/4/14,秩和检验,7,何时使用非参数检验?,等级资料(半定量资料) 当指标只能用严重程度(轻、中、重),优劣等级(好、中、差),治疗转归(治愈、好转、无效)等形式表达时,原始资料并非定量的,这些数据比“定量”粗,而比一般的“定性”细,是相继的若干阶梯。但毗邻的阶梯之间并非等距离,亦不能度量。 偏态分布资料,2019/4/14,秩和检验,8,何时使用非参数检验?,个别数据偏离过大资料 这里指的是随机的偏离而不属于“过失误差”所致。还有一种情况就是数据的某一端无确定数值,如“50mg”等等,只给一个上限或下限,而没有具体数值。 各组离散程度相差悬殊(方差不齐)的资料 如经变量变换达到方差齐性,则可用参数检验;否则的话就要用非参数法处理。,2019/4/14,秩和检验,9,何时使用非参数检验?,分布形态不明的资料 小样本,但又不趋向于正态分布;不稳定,例数少,分布不明确的资料。,符合参数检验条件首选参数检验 不符合条件非参数检验,2019/4/14,秩和检验,10,秩和检验,秩次(rank):就是将观察值按顺序由小到大排列(排名次),并用序号(如1, 2, 3 )代替变量值本身,秩次即通常意义上的序号。 秩和:即秩次的和。 秩转换:将数值变量转换成秩次,再计算检验统计量的过程。 秩和检验:就是通过秩次的排列求秩和进行假设检验的方法。,2019/4/14,秩和检验,11,Contents,第一节 配对资料的符号秩和检验(Wilcoxon配对法) 第二节 两独立样本比较的秩和检验(Wilcoxon两样本法) 第三节 完全随机设计多个样本比较的秩和检验(Kruskal-allis检验),2019/4/14,秩和检验,12,第一节 两配对样本差值的符号秩和检验(Wilcoxon signed rank test),符号秩和检验由Wilcoxon于1945年提出,作为配对t检验的替代方法。检验配对资料的差值是否来自中位数为0的总体。 在数据满足配对t检验的要求时,符号秩和检验的功效是配对t检验效能的95%左右。,2019/4/14,秩和检验,13,符号秩和检验的基本思想:,在H0成立的条件下(两配对处理效应相同 ),两配对样本的差数的正负是随机的,则正差数的秩和与负差数的秩和应该相差不会太大,即总体中位数为0;反之,若两秩和相差太悬殊,则认为H0成立的可能性受到怀疑,从而拒绝H0,接受H1。,2019/4/14,秩和检验,14,例1:分别用氰化高铁法与光电比色法测得10个血样的血红蛋白含量,问两法测得结果有无差别?,2019/4/14,医学统计学-秩和检验,15,表1 两种方法测定血清血红蛋白含量 血样号 氰化高铁法 光电比色法 1 15.0 12.5 2 12.8 12.9 3 13.5 13.0 4 11.3 12.8 5 12.3 15.4 6 12.1 12.9 7 13.7 13.0 8 12.9 14.1 9 12.9 12.1 10 13.0 12.9,配对差值经检验不符合正态分布,不满足t检验条件,2019/4/14,秩和检验,16,符号秩和检验的基本步骤:,建立检验假设,确定检验水准 H0 :Md=0(两处理效应相同) H1 :Md0(两处理效应不相同) =0.05,2019/4/14,秩和检验,17,2. 求两组数据的差数d,对差数的绝对值编秩号, 差数为0的数据忽略不计,对子数减1; 余下的n-i个差数按绝对值由小到大排秩号,但排好后的秩号要保持原差数的正负号; 差数绝对值相等时,则取其平均秩次。,2019/4/14,医学统计学-秩和检验,18,表1 两种方法测定血清血红蛋白含量 血样号 氰化高 光电比 差值 负秩 正秩 铁法 色法 (1) (2) (3) (4)=(2)-(3) (5) (6) 1 15.0 12.5 2.5 9 2 12.8 12.9 -0.1 -1.5 3 13.5 13.0 0.5 3 4 11.3 12.8 -1.5 -8 5 12.3 15.4 -3.1 -10 6 12.1 12.9 -0.8 -5.5 7 13.7 13.0 0.7 4 8 12.9 14.1 -1.2 -7 9 12.9 12.1 0.8 5.5 10 13.0 12.9 0.1 1.5 T-= -32 T+=23 验算:|T+ |+| T-| =n(n+1)/2=55,统计量T,对差 数的 绝对 值编 秩,2019/4/14,秩和检验,19,3. 分别求正、负差数的秩和,以绝对值较小者为T 验算:T+T-=n(n+1)/2 4. 确定P值和作出推断结论 小样本时(n50, n为d0的对子数),通过查p226附表8(T界值表)得到P值,原则是:若统计量T处于某T界值范围之内,其P值大于或等于相应概率;反之,则小于相应概率。当T值恰好等于附表中的界值时,其确切概率常小于相应的概率水平。,2019/4/14,秩和检验,20,本例中:,T=23 对子数n=10,查p226附表8得 2310 45 故 P0.10 下结论:在=0.05水准上不拒绝H0 ,故不能认为两法测得血红蛋白含量有差别。,2019/4/14,秩和检验,21, 大样本时( 对子数n50)通过公式进行u转化,采用正态近似检验: (式10-1) 式中0.5是连续性校正数,因为T值是不连续的,而u分布是连续的。,秩和标准差,平均秩和,2019/4/14,秩和检验,22,当存在同一秩较多时,按(式10-1)计算的u值要比实际的u值小,应采用(公式10-2)对u加以校正: 其中,tj是相同秩号的个数。,校正系数,2019/4/14,秩和检验,23,符号秩和检验的SPSS实现 SPSS(Statistical Package for Social Science,社会科学统计软件包)一直是国际上最流行且最具权威性的统计分析软件之一。SPSS最显著的特点是菜单和对话框操作方式,无需编程,且图形功能强大,易于掌握和操作。,2019/4/14,秩和检验,24,2019/4/14,秩和检验,25,符号秩和检验的SPSS实现,1 定义变量,2019/4/14,秩和检验,26,符号秩和检验的SPSS实现,2 输入数据,2019/4/14,秩和检验,27,2019/4/14,秩和检验,28,符号秩和检验的SPSS实现,2019/4/14,秩和检验,29,符号秩和检验的SPSS实现,2019/4/14,秩和检验,30,Wilcoxon Signed Ranks Test,结果,2019/4/14,医学统计学-秩和检验,31,第二节 两独立样本秩和检验(Wilcoxon两样本比较法),观测值X A 7 14 22 36 40 48 63 98 41.0029.81 B 3 5 6 10 17 18 20 39 14.7511.73 方差齐性检验: P0.05 两样本方差不齐,不能应用t检验,2019/4/14,医学统计学-秩和检验,32,采用Wilcoxon两独立样本秩和检验,基本思想:假定原假设H0成立(样本来自两个相同总体),合并两样本,将观察值由小到大排列,编写秩次。在H0成立的条件下,T值应接近平均秩和n0(1+N)/2,其中N=n1+n2, n0=min(n1, n2)。 如果T值严重偏离平均秩和,则提示H0可能是不正确的。 (1+2+3+ +16)/2=68 n0(1+N)/2=8*(1+16)=68,2019/4/14,医学统计学-秩和检验,33,采用Wilcoxon秩和检验,一、建立检验假设,确定检验水准 H0 :样本来自两个相同总体 (样本的每个观察值来自两总体的概率均为0.5) H1 :样本来自两个不同总体 (样本的每个观察值来自两总体的概率不等) =0.05,2019/4/14,秩和检验,34,二、编秩 将两组数据由小到大统一编秩,如遇相同原始数据,若在同一组,仍按数据出现顺序编秩;若在不同组,则取其平均秩次。本例编秩结果见表2,2019/4/14,医学统计学-秩和检验,35,表2 两种疗法的退热时间 新疗法 旧疗法 退热时间 秩号 退热时间 秩号 25 1 36 5 30 2 40 9 32 3 44 11 35 4 48 13.5 37 6 50 15 39 7.5 56 16 39 7.5 59 17 42 10 60 18 46 12 64 19 48 13.5 195 20 240 21 n1=10 T1=66.5 n2=11 T2=164.5,两样本混 合后统一 编秩求得秩号,分别求秩和,2019/4/14,医学统计学-秩和检验,36,三、分组求秩和并确定检验统计量 当样本例数不等时,取较小例数组的秩和为统计量T;如n1=n2,则取任一组秩和为统计量T。本例中: n1=10 n2=11 T=min(T1,T2)=T1=66.5,2019/4/14,医学统计学-秩和检验,37,四、查p227附表9( n1,n2均较小 )确定检验界值的区间,得到P值并做出推断结论 原则:找到n1和n2-n1对应的四行界值,如果T位于检验界值区间内,P,不拒绝H0;如果T值恰好等于界值,P;如果T位于检验界值区间外,P,拒绝H0 ,接受H1 。,2019/4/14,医学统计学-秩和检验,38,在本例中,T=66.5,取=0.05,根据附表9双侧检验界值0.01区间为(73,147),T位于区间外,所以P0.01。 P0.01,因此在=0.05的水准上,拒绝H0 ,接受H1,认为新疗法与旧疗法的退热时间不同。,2019/4/14,医学统计学-秩和检验,39,大样本情况下统计量的计算: 当样本例数较大,超出附表9的范围时,可以对T值进行变换,记为u (式10-3) 可利用u 检验法对假设做出检验。,平均秩和,2019/4/14,医学统计学-秩和检验,40,在相同秩次较多时需要按(式10-4)计算校正的检验统计量 (式10-4) 式中 tj为第j个相同秩次的个数,在无相同秩次时,C=1,即为10-3式。,2019/4/14,秩和检验,41,Wilcoxon秩和检验的基本步骤总结:,建立检验假设,确定检验水准; 混合编秩,分组求秩和,计算检验统计量T值; 查附表9,得检验界值区间,确定P值; 作出结论。,2019/4/14,医学统计学-秩和检验,42,混合编秩的注意事项:,如果有相同的数值,出现相同秩次(ties)时可按以下方法处理: 相同数据在同一组,仍按顺序编秩; 相同数据在不同组,取其平均秩次。 样本较小时,如果相同秩次较多,检验结果会存在偏性,应提高测量精度,避免出现较多的同秩。 大样本时,要对公式(10-3)进行适当校正,以减少相同秩次带来的偏秩。,2019/4/14,医学统计学-秩和检验,43,P173 例11-3 两独立样本秩和检验SPSS实现,1 定义变量,定义组别,2019/4/14,医学统计学-秩和检验,44,两独立样本秩和检验SPSS实现,2 数据输入,2019/4/14,医学统计学-秩和检验,45,两独立样本秩和检验SPSS实现,2019/4/14,医学统计学-秩和检验,46,两独立样本秩和检验SPSS实现,检验变量,分组变量,2019/4/14,医学统计学-秩和检验,47,定义分组,2019/4/14,医学统计学-秩和检验,48,结果,2019/4/14,医学统计学-秩和检验,49,二 两样本等级资料的比较,例3 就表3中(1),(2),(3)列的资料,比较巴非林与阿司匹林两种药物解热镇痛的疗效有无差别。,2019/4/14,医学统计学-秩和检验,50,表3 巴非林与阿司匹林疗效比较 疗效 频数 巴非林 阿司匹林 (1) (2) (3) 痊愈 45 12 显效 27 17 有效 22 17 无效 6 4 合计 100 50 单向有序列联表资料,用 检验比较疗效将损失信息,应采用秩和检验。,单向有序变量,2019/4/14,医学统计学-秩和检验,51,建立检验假设,确定检验水准 H0 :两组疗效相同 H1 :两组疗效不相同 =0.05,2019/4/14,医学统计学-秩和检验,52,混合编秩,求各组秩和 表3 巴非林与阿司匹林疗效比较计算表 疗效 频数 合计 累计 秩次 平均 秩次和 巴非林 阿司匹林 频数 范围 秩次 巴非林 阿司匹林 (1) (2) (3) (4) (5) (6) (7) (8)=(2)(7) (9)=(3)(7) 痊愈 45 12 57 57 1-57 29 1305 348 显效 27 17 44 101 58-101 79.5 2146.5 1351.5 有效 22 17 39 140 102-140 121 2662 2057 无效 6 4 10 150 141-150 145.5 873 582 合计 100 50 150 6986.5 4338.5(T) T1 T2,有序变量,疗效合并,混合编秩,求 和,1+57/2,2019/4/14,医学统计学-秩和检验,53,计算检验统计量,确定P值 由于本例样本量较大,且存在同秩,故采用校正后的统计量uc 先计算检验统计量T: n1=100n2=50 T=例数较少组对应的秩和=T2=4338.5(T),2019/4/14,医学统计学-秩和检验,54,根据公式(10-3)计算u 根据C 根据t界值表,P0.001,2019/4/14,医学统计学-秩和检验,55,根据P值,下结论 按=0.05的检验水准,拒绝H0 ,接受H1 ,故可以认为两种药物的疗效不同。 注意: Wilcoxon秩和检验与一般文献中使用的Mann-Whitney的U检验是独立提出的,但是两者的检验结果完全等价,前者用T统计量,后者用U统计量,可任意选取。,2019/4/14,医学统计学-秩和检验,56,Wilcoxon两样本比较法基本思想,假定原假设H0成立,合并两样本,将观察值由小到大排列,编写秩次。在H0成立的条件下,T值应接近平均秩和n0(1+N)/2,其中N=n1+n2, n0=min(n1, n2)。 如果T值严重偏离平均秩和,则提示H0可能是不正确的。,2019/4/14,医学统计学-秩和检验,57,两样本等级资料秩和检验的SPSS实现,定义变量,2019/4/14,医学统计学-秩和检验,58,2 输入数据,2019/4/14,医学统计学-秩和检验,59,3 频数加权,1,2,3,2019/4/14,医学统计学-秩和检验,60,4 开始分析,2019/4/14,医学统计学-秩和检验,61,检验变量,分组变量,定义分组,2019/4/14,医学统计学-秩和检验,62,结果,2019/4/14,秩和检验,63,第三节 完全随机设计多组差别的秩和检验(Kruskal- Wallis检验),Kruskal-Wallis检验的基本思想: 如果各组均来自同一总体,则各组的平均秩和近似相等。,2019/4/14,秩和检验,64,Kruskal- Wallis检验的基本步骤: 建立检验假设,确定检验水准; 混合编秩,分组求秩和Ri,i=1,2,k, k是处理的个数; 计算检验统计量H; 确定P值,作出推断结论。,2019/4/14,秩和检验,65,例3 试检验表4中三组人的血浆总皮质醇含量有无差别?,2019/4/14,医学统计学-秩和检验,66,表3 三组人血浆总皮质醇测定值(g/L) 正常人 单纯性肥胖 皮质醇增多症 测定值 秩次 测定值 秩次 测定值 秩次 0.11 1 0.17 2 2.79 20 0.52 4 0.33 3 2.81 21 0.61 6 0.55 5 2.92 22 0.69 8 0.66 7 3.59 23 0.77 9 0.86 10.5 3.86 25 0.86 10.5 1.13 14 4.08 26 1.02 12 1.38 16 4.30 27 1.08 13 1.63 17 4.30 28 1.27 15 2.04 19 5.96 29 1.92 18 3.75 24 6.62 30 秩和 96.5 117.5 251 例数 10 10 10,2019/4/14,秩和检验,67,建立检验假设,确定检验水准 H0 : 三组人的血浆总皮质醇含量总体分布相同 H1 :三组人的血浆总皮质醇含量总体分布不全相同 =0.05,2019/4/14,秩和检验,68,混合编秩,分组求秩和Ri,i=1,2,k, k是处理的个数。将各组数据混合,由小到大编秩。遇有原始数据相同时,若在同一组,则按顺序编秩;若分属不同组,取其平均秩次。再将各组秩号分别相加,求出各组的秩和Ri。,2019/4/14,医学统计学-秩和检验,69,表3 三组人血浆总皮质醇测定值(g/L) 正常人 单纯性肥胖 皮质醇增多症 测定值 秩次 测定值 秩次 测定值 秩次 0.11 1 0.17 2 2.79 20 0.52 4 0.33 3 2.81 21 0.61 6 0.55 5 2.92 22 0.69 8 0.66 7 3.59 23 0.77 9 0.86 10.5 3.86 25 0.86 10.5 1.13 14 4.08 26 1.02 12 1.38 16 4.30 27 1.08 13 1.63 17 4.30 28 1.27 15 2.04 19 5.96 29 1.92 18 3.75 24 6.62 30 秩和Ri 96.5 117.5 251 例数ni 10 10 10,统一编秩,分组求秩和,2019/4/14,秩和检验,70,计算检验统计量H 检验统计量H按式(10-5)计算: (式10-5) 式中, Ri为各组的秩和, ni为各组样本的含量,N为总的样本量。,2019/4/14,秩和检验,71,当各组相同秩次较多时,计算所得H值偏小,要对H进行校正 Hc=H/C 本例同秩不多,按(式10-5 )计算H值:,2019/4/14,秩和检验,72,确定P值,作出推断结论 小样本情况:当处理数k3,且各组样本含量ni 5时,可查附表10(H界值表)确定P值。如果HH,则P; 大样本情况:若k 3或ni 5时,理论上,H近似服从自由度为k1的 分布,可查附表7( 界值表)得出P值,最后按P值作出推断结论。,2019/4/14,秩和检验,73,本例处理数k=3,各组样本含量均为10,超出了附表10(H界值表)的范围。因此,查附表7( 界值表)确定P值。 按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论