医学统计学精品教学 第十章-非参数检验_第1页
医学统计学精品教学 第十章-非参数检验_第2页
医学统计学精品教学 第十章-非参数检验_第3页
医学统计学精品教学 第十章-非参数检验_第4页
医学统计学精品教学 第十章-非参数检验_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021-7-251 第十章第十章 非参数秩和检验非参数秩和检验 吴吴 库库 生生 汕头大学医学院预防医学教研室 2021-7-252 参数统计与非参数统计 1、参数统计(参数统计(parametric statistics) 样本所来自的总体分布具有某个已知样本所来自的总体分布具有某个已知 的函数形式(如正态分布),而其中的函数形式(如正态分布),而其中有有 的的参数参数是未知的,统计分析的目的是对是未知的,统计分析的目的是对 这些未知的参数进行估计或检验。这些未知的参数进行估计或检验。 2021-7-253 但实际上有些医学研究资料并但实际上有些医学研究资料并不符合上述不符合上述 条件条件

2、,即使用变量变换的方法也难以达,即使用变量变换的方法也难以达 到应用参数方法的要求。到应用参数方法的要求。 这就需要一种这就需要一种不依赖于总体分布不依赖于总体分布的具体形的具体形 式的统计方法来解决此类问题。式的统计方法来解决此类问题。 由于这类方法不受总体参数的影响,故称由于这类方法不受总体参数的影响,故称 非参数检验法。非参数检验法。它检验的是它检验的是分布分布,而非,而非 参数。参数。 2021-7-254 2、非参数统计(、非参数统计( non-parametric statistics ) 不考虑研究对象总体分布的具体形式,也不考虑研究对象总体分布的具体形式,也 不对总体参数进行统

3、计推断,而是通过检验不对总体参数进行统计推断,而是通过检验 样本所代表的样本所代表的总体分布形式是否一致总体分布形式是否一致来得出来得出 统计结论。由于这类方法不受总体参数的限统计结论。由于这类方法不受总体参数的限 制,故称非参数统计法。有时也称为任意分制,故称非参数统计法。有时也称为任意分 布检验布检验(distribution-free statistics)(distribution-free statistics)。 2021-7-255 3、非参数统计的优点非参数统计的优点 适用范围广,不论样本所代表的总体分适用范围广,不论样本所代表的总体分 布形式如何,甚至是未知的,都可适用;布形

4、式如何,甚至是未知的,都可适用; 资料可用资料可用“等级等级”、“符号符号”表示,收表示,收 集方便;集方便; 多数非参数检验方法简便,易于理解和多数非参数检验方法简便,易于理解和 掌握。掌握。 2021-7-256 4、非参数统计的缺点非参数统计的缺点 对符合用参数检验的资料,如用非参数对符合用参数检验的资料,如用非参数 统计,会丢失信息,导致检验效率下降,统计,会丢失信息,导致检验效率下降, 犯第犯第IIII类错误的可能性比参数检验大类错误的可能性比参数检验大, ,即即 值值; 非参数检验的有些问题的计算仍显繁冗。非参数检验的有些问题的计算仍显繁冗。 2021-7-257 何时使用非参数检

5、验何时使用非参数检验? 等级资料(半定量资料)等级资料(半定量资料) 当指标只能用严重程度当指标只能用严重程度( (轻、中、重轻、中、重) ),优,优 劣等级(好、中、差),治疗转归(治愈、好转、劣等级(好、中、差),治疗转归(治愈、好转、 无效)等形式表达时,原始资料并非定量的,这无效)等形式表达时,原始资料并非定量的,这 些数据比些数据比“定量定量”粗,而比一般的粗,而比一般的“定性定性”细,细, 是相继的若干阶梯。但毗邻的阶梯之间并非等距是相继的若干阶梯。但毗邻的阶梯之间并非等距 离,亦不能度量。离,亦不能度量。 偏态分布资料偏态分布资料 2021-7-258 何时使用非参数检验何时使用

6、非参数检验? 个别数据偏离过大资料个别数据偏离过大资料 这里指的是随机的偏离而不属于这里指的是随机的偏离而不属于“过失误差过失误差” 所致。还有一种情况就是数据的某一端无确定数所致。还有一种情况就是数据的某一端无确定数 值,如值,如“”“”,“,“50mg”等等,只给一个上限或等等,只给一个上限或 下限,而没有具体数值。下限,而没有具体数值。 各组离散程度相差悬殊各组离散程度相差悬殊( (方差不齐方差不齐) )的资料的资料 如经变量变换达到方差齐性,则可用参数如经变量变换达到方差齐性,则可用参数 检验;否则的话就要用非参数法处理。检验;否则的话就要用非参数法处理。 2021-7-259 何时使

7、用非参数检验何时使用非参数检验? 分布形态不明的资料分布形态不明的资料 小样本,但又不趋向于正态分布;小样本,但又不趋向于正态分布; 不稳定,例数少,分布不明确的资料。不稳定,例数少,分布不明确的资料。 符合参数检验条件 首选参数检验 不符合条件 非参数检验 2021-7-2510 秩和检验秩和检验 秩次秩次(rankrank):就是将观察值按顺序由小):就是将观察值按顺序由小 到大排列到大排列( (排名次排名次) ),并用序号(如,并用序号(如1, 2, 1, 2, 3 3 )代替变量值本身,秩次即通常意)代替变量值本身,秩次即通常意 义上的序号。义上的序号。 秩和:秩和:即秩次的和。即秩次

8、的和。 秩转换秩转换:将数值变量转换成秩次,再计算:将数值变量转换成秩次,再计算 检验统计量的过程。检验统计量的过程。 秩和检验秩和检验:就是通过秩次的排列求秩和进:就是通过秩次的排列求秩和进 行假设检验的方法。行假设检验的方法。 2021-7-2511 Contents 第一节第一节 配对资料的符号秩和检验(配对资料的符号秩和检验(WilcoxonWilcoxon配对法)配对法) 第二节第二节 两独立样本比较的秩和检验(两独立样本比较的秩和检验(WilcoxonWilcoxon两样本两样本 法)法) 第三节第三节 完全随机设计多个样本比较的秩和检验完全随机设计多个样本比较的秩和检验 (Kru

9、skal-Kruskal-allisallis检验)检验) 2021-7-2512 第一节第一节 两配对样本差值的符号秩和检验两配对样本差值的符号秩和检验 (Wilcoxon signed rank test) 符号秩和检验由符号秩和检验由WilcoxonWilcoxon于于19451945年提年提 出,作为配对出,作为配对t t检验的替代方法。检验配检验的替代方法。检验配 对资料的差值是否来自对资料的差值是否来自中位数中位数为为0 0的总体。的总体。 在数据满足配对在数据满足配对t t检验的要求时,符检验的要求时,符 号秩和检验的功效是配对号秩和检验的功效是配对t t检验效能的检验效能的 9

10、5%95%左右。左右。 2021-7-2513 符号秩和检验的符号秩和检验的基本思想基本思想: 在在H H0 0成立的条件下(两配对处理效应相成立的条件下(两配对处理效应相 同同 ),两配对样本的差数的正负是随),两配对样本的差数的正负是随 机的,则正差数的秩和与负差数的秩和机的,则正差数的秩和与负差数的秩和 应该相差不会太大,应该相差不会太大,即总体中位数为即总体中位数为0 0; 反之,若两秩和相差太悬殊,则认为反之,若两秩和相差太悬殊,则认为H H0 0 成立的可能性受到怀疑,从而拒绝成立的可能性受到怀疑,从而拒绝H H0 0, , 接受接受H H1 1。 。 2021-7-2514 例例

11、1 1:分别用氰化高铁法与光电比色法测:分别用氰化高铁法与光电比色法测 得得1010个血样的血红蛋白含量,问两法测个血样的血红蛋白含量,问两法测 得结果有无差别?得结果有无差别? 配对差值经检验不符合正态分布,不满足t检验条件 2021-7-2516 符号秩和检验的基本步骤: 建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0 :Md=0Md=0(两处理效应相同)(两处理效应相同) H H1 1 : :Md0Md0(两处理效应不相(两处理效应不相 同)同) 2021-7-2517 2. 求两组数据的差数求两组数据的差数d d,对差数的绝对,对差数的绝对 值编秩号值编秩号 差数为

12、差数为0 0的数据忽略不计,对子数减的数据忽略不计,对子数减1 1; 余下的余下的n-in-i个差数个差数按绝对值按绝对值由小到大排由小到大排 秩号,但排好后的秩号秩号,但排好后的秩号要保持原差数的正负要保持原差数的正负 号号; 差数绝对值相等时,则取其平均秩次。差数绝对值相等时,则取其平均秩次。 对差对差 数的数的 绝对绝对 值编值编 秩秩 2021-7-2519 3. 分别求正、负差数的秩和,以绝对值较分别求正、负差数的秩和,以绝对值较 小者为小者为T T 验算:验算:T T+ +T+T- -=n(n+1)/2=n(n+1)/2 4. 4. 确定确定P P值和作出推断结论值和作出推断结论

13、小样本时(小样本时(n50, n50, n n为为d0d0的对子的对子 数数), ,通过查通过查p226p226附表附表8(T8(T界值表界值表) )得到得到P P 值,值,原则原则是:若统计量是:若统计量T T处于某处于某T T界值范界值范 围之内,其围之内,其P P值大于或等于相应概率;反值大于或等于相应概率;反 之,则小于相应概率。当之,则小于相应概率。当T T值恰好等于附值恰好等于附 表中的界值时,其确切概率常小于相应表中的界值时,其确切概率常小于相应 的概率水平。的概率水平。 2021-7-2520 本例中:本例中: T=23 对子数对子数n=10,查,查p226附表附表8得得 23

14、10 45 10 45 故故 下结论:在下结论:在水准上不拒绝水准上不拒绝H H0 0 ,故不能认,故不能认 为两法测得血红蛋白含量有差别。为两法测得血红蛋白含量有差别。 2021-7-2521 大样本时(大样本时( 对子数对子数n50)通过公式进)通过公式进 行行u u转化,采用正态近似检验:转化,采用正态近似检验: (式(式10-110-1) 式中是连续性校正数式中是连续性校正数, ,因为因为T T值是不连值是不连 续的续的, ,而而u u分布是连续的。分布是连续的。 24/ ) 12)(1( 5 . 0|4/ ) 1(| nnn nnT u 2021-7-2522 当存在同一秩较多时,按

15、(式当存在同一秩较多时,按(式10-110-1)计算)计算 的的u u值要比实际的值要比实际的u u值小,应采用(公式值小,应采用(公式 10-210-2)对)对u u加以校正加以校正: : 其中,其中,t tj j是相同秩号的个数。是相同秩号的个数。 48 )( 24 ) 12)(1( 5 . 0|4/ ) 1(| 3 jj tt nnn nnT u 2021-7-2523 符号秩和检验的SPSS实现 SPSS(Statistical Package for Social Science,社会科学统计软件包) 一直是国际上最流行且最具权威性的统 计分析软件之一。SPSS最显著的特点是 菜单和

16、对话框操作方式,无需编程,且 图形功能强大,易于掌握和操作。 2021-7-2524 2021-7-2525 符号秩和检验的SPSS实现 2021-7-2526 符号秩和检验的SPSS实现 2021-7-2527 2021-7-2528 符号秩和检验的SPSS实现 2021-7-2529 符号秩和检验的SPSS实现 2021-7-2530 R Ra an nk ks s 5a4.6023.00 5b6.4032.00 0c 10 Negative Ranks Positive Ranks Ties Total 光电比色法 - 氰化高铁法 NMean RankSum of Ranks 光电比色法

17、 氰化高铁法 b. 光电比色法 = 氰化高铁法 c. Test StatisticsTest Statistics b b -.459a .646 Z Asymp. Sig. (2-tailed) 光电比色法 - 氰化高铁法 Based on negative ranks. a. Wilcoxon Signed Ranks Test b. X 99. 4 2863. 6 5929.137 9481.864 )( )( )7,7( ,05. 0 2 2 2 1 FF S S F 小 大 2021-7-2534 二、编秩二、编秩 将两组数据由小到大统一编秩,如遇将两组数据由小到大统一编秩,如遇 相

18、同相同原始数据原始数据,若,若在同一组在同一组,仍按数据,仍按数据 出现顺序编秩;若出现顺序编秩;若在不同组在不同组,则取其平,则取其平 均秩次。本例编秩结果见表均秩次。本例编秩结果见表2 2 ) 1( 12 1 5 . 0|2/ ) 1(| 21 0 Nnn NnT u Cuuc/ )/()(1 33 NNttC jj 2021-7-2541 Wilcoxon秩和检验的基本步骤总结:秩和检验的基本步骤总结: l建立检验假设,确定检验水准建立检验假设,确定检验水准; l混合编秩,分组求秩和,计算检验统计混合编秩,分组求秩和,计算检验统计 量量T T值;值; l查附表查附表9 9,得检验界值区间

19、,确定,得检验界值区间,确定P P值;值; 1.1.作出结论。作出结论。 Test Statisticsb 11.500 66.500 -3.065 .002 .001 a Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) Exact Sig. 2*(1-tailed Sig.) 退热时间 Not corrected for ties.a. Grouping Variable: 疗法b. Ranks 106.6566.50 1114.95164.50 21 疗 法 新 疗 法 旧 疗 法 Total 退 热 时 间 NMean RankSum

20、 of Ranks 2 Cucu/ 1534. 3 ) 1( 12 1 5 . 0|2/) 1(| 21 0 Nnn NnT u 9021. 0 150150 )1010(.)5757( 1 )/()(1 3 33 33 NNtt jj 3201. 39021. 0/1534. 3cu R Ra an nk ks s 10069.876986.50 5086.774338.50 150 分组 巴非林 阿司匹林 Total 疗效 NMean RankSum of Ranks Test StatisticsTest Statistics a a 1936.500 6986.500 -2.365 .

21、018 Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) 疗效 Grouping Variable: 分组 a. 2021-7-2563 第三节第三节 完全随机设计多组差别的完全随机设计多组差别的 秩和检验(秩和检验(Kruskal- Wallis检验检验) Kruskal-WallisKruskal-Wallis检验的基本思想:检验的基本思想: 如果各组均来自同一总体,则各组如果各组均来自同一总体,则各组 的平均秩和近似相等。的平均秩和近似相等。 2021-7-2564 Kruskal- Wallis检验的基本步骤:检验的基本步骤: 建立检

22、验假设,确定检验水准;建立检验假设,确定检验水准; 混合编秩,分组求秩和混合编秩,分组求秩和Ri,i=1,2,k, k 是处理的个数;是处理的个数; 计算检验统计量计算检验统计量H; 1.确定确定P值,作出推断结论。值,作出推断结论。 2021-7-2565 例例3 试检验表试检验表4中三组人的血浆总皮质醇含中三组人的血浆总皮质醇含 量有无差别?量有无差别? 2021-7-2567 建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0 : 三组人的血浆总皮质醇含量三组人的血浆总皮质醇含量 总体分布相同总体分布相同 H H1 1 :三组人的血浆总皮质醇含量总 :三组人的血浆总皮质醇

23、含量总 体分布不全相同体分布不全相同 2021-7-2568 l混合编秩,分组求秩和混合编秩,分组求秩和R Ri i,i=1,2,k, i=1,2,k, k k是处理的个数。将各组数据混合,由是处理的个数。将各组数据混合,由 小到大编秩。遇有原始数据小到大编秩。遇有原始数据相同相同时,时,若若 在同一组,则按顺序编秩;若分属不同在同一组,则按顺序编秩;若分属不同 组,取其平均秩次。组,取其平均秩次。再将各组秩号分别再将各组秩号分别 相加,求出各组的秩和相加,求出各组的秩和R Ri i。 2021-7-2570 l计算检验统计量计算检验统计量H l 检验统计量检验统计量H按式(按式(10-5)计算:)计算: l l (式(式10-5) l式中,式中, Ri为各组的秩和,为各组的秩和, ni为各组样本的含量,为各组样本的含量, N为总的样本量。为总的样本量。 ) 1(3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论