秩转换的非参数检验医学统计_第1页
秩转换的非参数检验医学统计_第2页
秩转换的非参数检验医学统计_第3页
秩转换的非参数检验医学统计_第4页
秩转换的非参数检验医学统计_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

秩转换的非参数检验 第二军医大学卫生统计学教研室 孟 虹 第八章内容 从数据的设计分类: *第一节、配对样本资料的 Wilcoxon符号秩检验 *第二节、两个独立样本比较的 Wilcoxon秩和检 验 *为重点 第三节、完全随机设计多个样本比较的 Kruskal- Wallis H检验 第四节、随机区组设计多个样本的 Friedman M 检验 非参数检验的概念 n 参数检验 : 假定比较数据服从 某分布 ,通过 参数的估计量 ( )对比较总体的参数 () 作 检验 ,统计上称为参数法检验 (parametric test)。如 t、 u检验、方差分析。 n 非参数检验 :是指在统计检验中不需要假定总 体分布形式和用参数估计量 ,直接对比较数据的 分布进行统计检验的方法。称为非参数检验 (nonparametric test). 非参数统计检验 秩和检验 适用范围广,特别适用于 组间 比较: 1.数据分布为偏态分布或不满足参数检验方 法 (组间方差不齐 )的 计量资料 . 2.有的数据为无确切值 ,只是某值或值的 计量资料 。 3.当比较的数据只能用严重程度、优劣等级 的 半定量 (等级)资料组间的比较。 秩和检验用于定量资料 n 计量资料中 ,变量值 (x): 极度偏态资料,或个别数值偏离过 大 各组离散度相差悬殊 资料中含有不确定值 , 大于 5年 、 0.1 兼有等级和定量性质的资料 例 :两种食物对大鼠心肌坏死面积 (格子数 ) 甲 组 (n1=29) 乙 组 (n2=28) 0 1 0 0 0 1.6 0 0.2 0 2.2 0 0.2 0 2.6 0 0.2 0 3.3 0 0.3 0 4.3 0 0.4 0 5.1 0 0.4 0 5.4 0 0.9 0 5.5 0 0.9 0 6.1 0 1.3 0 6.2 0 1.7 0.3 9.7 0 2.8 0.4 13.8 0 7.4 0.4 36.0 0 13.0 0.6 0 M1=0.6 M2=0 医学研究中的等级资料 疗 效 (x):痊愈、显效、有效、无效、恶化 化验结果 (x): + + 体格发育 (x) :下等、中下、中等、中上、上等 心功能分级 (x): I、 II、 III 营养水平 (x) :差、一般、好 例 1两组独立计量数据小样本的比较 观察值( x) A组 7, 14, 22, 36, 40, 63, 98 , 108 , n=8 B组 5, 6, 10, 17, 18, 23, 29, 49, n=8 A组 48.5037.88 B组 19.6514.46 问两组均数差 别有无统计意 义 ?常用 t检验 用 t检验 ,要求数据满足正态和方差齐性条件 ( 计量资料 ). 两组数据箱式图的比较 组别 方差齐性检验: =0.10 F=37.882/14.462=6.86, P=0.015,两组 方差不齐 . 在不满足 t检验前提 ,如两均数比较用 t检验, =0.05, 结果: t=2.014 t0.05,14=2.1 , P=0.065, p 0.05 容易增大 误差概率 !(取伪 ) 秩和检验的方法 -秩转换 秩和检验的基本计算步骤: 1.将数据( x)按大小转化为秩次( i) ,用秩 次的大小反映变量值的大小。 2.对各组 ”秩次 ”求和,称为秩和 (T =i)。 3.对各组秩和 (T)做检验的方法称为秩和检 验。 例 : 秩转换的基本方法 将两组比较原始数据( X) 混合 按大小编秩 ,如 x 相同取平均秩 , 分别对各组的秩求和( T) . 甲组( x) 3 5 10 20 22 秩和 秩号 ( i) 1 3 5 7 8 T1=24 乙组( x) 4 9 15 25 35 秩号( i) 2 4 6 9 10 T2=31 总秩和 T=10(10+1)/2=55 例 : 两组比较的等级数据编秩 A组 : 、 、 +、 +、 +、 + 秩 (i) : 1 2 4.5 4.5 4.5 8.5 秩和 : TA 25 (组间相同 ,求平均秩 ) B组 : +、 +、 +、 +、 +、 + 秩 (i) : 4.5 8.5 8.5 8.5 11 12 秩和 : TB 53 (组内相同 ,不影响求秩和 ) 总秩和 : TA+TB=12(12+1)/2=78 秩次:在一定程度上反映了原始数据大小 (等级 )的 信息。 秩和:反映了一组数据在分布上的范围位置。 平均秩次:反映一组数据平均水平 A组平均秩次 =23.5/6=3.92 B组平均秩次 =54.5/6=9.08 A组 (x) 3, 5, 7, 9 11 14 (i) 1 2 3 4 5 8.5 T=23.5 B组 (x) 12 13 14 16 20 22 (i) 6 7 8.5 10 11 12 T=54.5 第一节、配对样本比较的符号秩检验 ( Wilcoxon signed rank test) 何时选用配对资料的秩和检验 1.配对设计 等级资料 的比较 2.两组配对 计量数据 , 变量差值 (d) 不为正态分布 ,秩和检验效率 高 于参数 的配对 t检验。 讲义例 8-1配对设计计量数据 表 8-1 12份血清用两法测转氨酶结果比较 编 号 原法 新法 差 值 ( d) 1 60 80 20 2 142 152 10 3 195 243 48 4 80 82 2 5 242 240 -2 6 220 220 0 7 190 205 15 8 25 38 13 9 212 243 31 10 38 44 6 11 236 200 -36 12 95 100 5 用配对 t检验的条件 : 差值 (d)为计量数据 , 并且服从正态 . 对表 8-1数据进行正态性检验 : 概率图 (probality-probality plot,P-P plot) SPSS统计软件 数据点不为直线 ,并未分布在线 上 ,提示本资料 不为正态 . 配对设计资料的秩和检验步骤 ( Wilcoxcon signed-rank test) 方法: 1.将配对数据的 差值( d) 按绝对值大小转换 为秩 ,如差值为 0舍去。 2.求差值的正、负秩和 ,记为 (T+) 、 (T-) 。 3.用 任意 一个正或负秩和( T)做检验。 4.检验方法有 : 1)查表法 : (对子数 n50)* 2)正态近似法, n 50时用公式 (8-1) 例 :表 8-1 12份血清用两法测转氨酶结果比较 编 号 原法 新法 差 值 ( d) 正秩 负 秩 1 60 80 20 8 2 142 152 10 5 3 195 243 48 11 4 80 82 2 1.5 5 242 240 -2 1.5 6 220 220 0 7 190 205 15 7 8 25 38 13 6 9 212 243 31 9 10 38 44 6 4 11 236 200 -36 10 12 95 100 5 3 合 计 54.5 11.5 (T+) (T-) 例表 8-1配对资料秩和检验步骤 1.建立检验假设: H0: Md=0, (T +) =(T-),即两种方法测定结 果值相同 H1: Md0,或 (T +) (T-) =0.05 2.编秩,求正、负秩次的秩和 (T) 3.任取 (T) 查表 确定秩和 (T)的概率( p) (本例 n=11 50) 用 (T+) 或 T- 与 T0.05,n界值范围做比较 . 确定 p值方法: T 在 T0.05,n界值范围内, P 0.05 等于或在 T0.05界值范围外, P0.05 本例:查表 824页 ( n=11)界值 T0.05=10 56(双侧 ) 本例 T-=11.5或 T+=54.5在 T0.05范围内, P 0.05 结论:按 =0.05水准,不拒绝 H0, 尚 还不能认 为两法测定值差别有统计意义。 附表 9 , n=11的双侧 T界值与概率( p) T界值 5 10 13 33 53 56 61 P值 0.01 0.05 0.10 0.10 0.05 0.01 例 8-1 T-=11.5 , T+=54.5 0.05 P 0.10 如 H0假设成立,理论秩和 T+=T-=33, 理论总秩和 =11( 11+1) /2=66 抽样 n=4,差值( d)秩可能为 0,1 , 2 , 3, 4 秩和 (T) 秩的组成 f 概率 (p=f/16) 0 0 1 0.0625 1 1 1 0.0625 2 2 1 0.0625 3 3 1+2 2 0.125 4 4 1+3 2 0.125 5 1+4 2+3 2 0.125 6 1+2+3 2+4 2 0.125 7 1+2+4 3+4 2 0.125 8 1+3+4 1 0.0625 9 2+3+4 1 0.0625 10 1+2+3+4 1 0.0625 16 符号秩和检验的基本思想 如 H0成立,则理论上差值 (d)的正、负秩 和应相等,或样本的 T+ 与 T 均接近 理论上秩 和 (T)。 T= N(N+1)/2/2。 如果样本秩和与理论秩和相差太大,超出 了事先规定的检验水准界值, 则认为 H0成立 可能性小,拒绝 H0 。 资料 8-1Wilcoxon Signed Ranks Test 用参数法 配对 t=1.602, P=0.137 第二节、两组独立样本比较的 秩和检验 常用方法: W检验( Wilcoxon rank sum test ) 常见的数据形式: 计量数据的两组比较 例数较少(原始数据形式) 等级数据的两组比 例数较多(频数表形式) 表 8-5肺癌病人与矽肺 0期工人 RD值比较 肺癌病人 矽 肺 0期 观 察 值 秩号 观 察 值 秩号 2.78 1 3.23 2.53 .23 2.5 3.5 4 4.20 7 4.01 54.87 14 4.15 6 5.12 17 4.28 86.21 18 4.34 9 7.18 19 4.47 108.05 20 4.64 11 8.56 21 4.75 129.6 22 4.82 13 4.95 155.10 16 n=10 混合 编 秩 T1=141.5 n=12 T2=111.5 总 T=253 表 8-5资料 t检验计算结果 两独立样本秩和检验计算步骤 1. 两组变量值 混合编秩 求出各组秩和 . 有相同 x值 在不同组 ,求平均秩 . 2.对 n较小组 求秩和( T)做统计检验 3.检验方法: 1)查表法 :较小组例数 n10查表确定统计量 ( T)的概率 2)正态近似法 : 计算 u值, 公式 8-2 (较小组例数 n 10) 例:表 8-3资料秩和检验 1.建立检验假设: H0:两组 RD值的 总体分布位置 相同 H1:肺癌病人 RD值高于矽肺 0期工人 =0.05(单侧) 2.确定检验的统计量( T) 当 n1n2时,取例数较小组的秩和为 T. 本例:较小组 n1=10, T1=141.5 当 n1=n2,任取一个组的秩和为 T。 3.本例 n1=10,查附表 10确定 T概率( 825页) 用 T与 T0.05,n比较,如 T在 T0.05界值范围内, p 0.05,不拒绝 H0 查表 n=10 单侧 T0.05,10=89 141 本例 T=141.5 p 0.05 结论:在 =0.05水准, p 0.05, 拒绝 H0, 两 组 变量值分布差别有统计意义,肺癌组平均秩次 ( 141.5/10=14.15)高于矽肺 0期组平均秩次 ( 111.5/12=9.29)。 , 两组秩和检验界值范围和概率 例数 n1=10, n2-n1=2的界值 单侧概率 界值: 假设成立 T1理论秩和 =115 76 79 84 89 115 141 146 151 154 0.05 0.025 0.01 0.005 本例 T=141.5 p 0.05 两组秩和检验的基本思想 如 H0: “两总体观察值的分布相同 ”假定成立 , 则 n1样本的秩和( T1) 应接近 n1理论的秩和 n1( N+1) /2。 同理, n2样本的秩和 (T2)与应 n2( N+1) /2相差不大。 如相差悬殊,即 P 0.05 , 表示 H0假定成 立的概率较小,便拒绝 H0假定。 例:两组变量值分布相等 ,n1=n2 甲组( x1) 2 4 5 8 秩和 秩次 1.5 3.5 5.5 7.5 18 乙组( x2) 2 4 5 8 秩次 1.5 3.5 5.5 7.5 18 总秩和 =N( N+1) /2=8( 8+1) /2=36 各组理论秩和 = 各组平均秩次 =( N+1) /2=4.5 例:两组变量值例数不相等 甲组( x) 2 4 5 5 秩和 秩次 1.5 3.5 6 6 17 乙组( x) 2 4 5 秩次 1.5 3.5 6 11 假设两组分布相等 甲组理论秩和 =4( 7+1) /2=16 乙组理论秩和 =3( 7+1) /2=12 肺癌组 矽肺组 总秩和 样本秩和 141.5 111.5 253 理论秩和 115 138 差值 26.5 -26.5 抽样误差? 如果 H0成立,则理论秩和与样本秩和之差应不 大。 表表 8-5肺癌病人与矽肺肺癌病人与矽肺 0期工人期工人 RD值比较值比较 表 8-7 N=7, n=2的取秩组合和秩和( T) 取秩 1,2 1,3 1,4 1,5 1,6 1,7 2,3 2,4 2,5 2,6 2,7 T 3 4 5 6 7 8 5 6 7 8 9 取秩 3,4 3,5 3,6 3,7 4,5 4,6 4,7 5,6 5,7 6,7 T 7 8 9 10 9 10 11 11 12 13 表 8-8 N=7, n=2的 T概率分布 T 3 4 5 6 7 8 9 10 11 12 13 P 0.04 0.04 0.095 0.095 0.142 0.142 0.142 0.095 0.095 0.04 0.04 0.10 0.05 (二) u检验法 正态近似法( 例数超出 附表 10范围) 采用公式 8-2计算 u值,确定 p值。 公式 8-2 U1.96, p0.05 T为 n小的组秩和 Tj为相同秩的个 数 频数表资料和等级数据的两组比较 表 8-6表 8-6 计算步骤 1.建立检验假设: H0:两组观察值的 总体分布位置 相同 H1:两组观察值的总体分布位置不同 =0.05 2.混合编秩,求各组秩和 3.确定检验的统计量( T) 方法同前:本例 T=1917( 例数较小组 ) 例 : 表 8-6频数表资料 吸烟组 不吸烟组 总秩和 例数 39 40 样本秩和 1917 1243 3160 理论秩和 1560 1600 3160 差值 357 -357 平均秩次 49.15 31.07 H0:两组变量值的分布相同 结论 :在 =0.05水准, p 0.01,拒绝 H0,两组变 量值分布差别有统计意义,吸烟组工人的 HbCO(%)高于 (平均秩次为 49.15) 对照组( 31.07) . 例 : 表 8-6频数表资料 式中 t为各等级的合计数 u=3.7023 2.58 校正系数 第三节、多组资料的秩和检验 (Kruskal-Wallis H检验 ) 1.多个独立样本资料的比较 1)编秩方法同两组资料(不配对)相 同 .(混合编秩 ) 2)计算检验公式为 H(公式 8-4) 1)查表法 (总例数 N15时 ) 2) N 15时 , 用 H值与卡方界值做比较 . 3.如 p 值有统计意义,做组间的两两比 较(见讲义) . 2.确定 H统计量的 p 值 表 8-9 三个独立样本的比较 变量值为百分率,不符合正态要求。 检验步骤 1.建立检验假设: H0:三组药物死亡率总体分布位置相同 H1:三组药物死亡率总体分布位置不同 =0.05 2.混合编秩,求各组秩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论