第八章 秩转换非参数检验 (1)_第1页
第八章 秩转换非参数检验 (1)_第2页
第八章 秩转换非参数检验 (1)_第3页
第八章 秩转换非参数检验 (1)_第4页
第八章 秩转换非参数检验 (1)_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章秩转换的非参数检验秩转换的非参数检验参数检验参数检验n参数检验方法:参数检验方法:t 检验,方差分析;检验,方差分析;n总体分布假定:各组样本所来自的总体为总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式)正态分布(已知的分布形式),各组样本所各组样本所来自的总体方差齐性。来自的总体方差齐性。非参数检验非参数检验n定义:不依赖于总体的分布类型,对样本定义:不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推所来自总体的分布不作严格假定的统计推断方法,称为非参数检验(断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。)

2、。直接对总体分布做假设检验。 又称为任意分布检验(又称为任意分布检验(distribution-free test)。)。2, 非参数检验是一类统计学方法的总称,非参数检验是一类统计学方法的总称,基于秩转换(基于秩转换(rank transformation)的)的非参数检验只是其中的一种。非参数检验只是其中的一种。秩转换的非参数检验秩转换的非参数检验n秩次(秩次(rank):某种测量值按照从小到大):某种测量值按照从小到大的顺序排序后,每一测量值所对应的序号。的顺序排序后,每一测量值所对应的序号。n秩转换:将某一变量值从小到大排序后,秩转换:将某一变量值从小到大排序后,获得每一变量值的秩次,

3、并用此秩次代替获得每一变量值的秩次,并用此秩次代替原有变量值的过程。原有变量值的过程。秩转换的非参数检验秩转换的非参数检验非参数检验的应用场合非参数检验的应用场合n计量资料计量资料:不满足参数检验的条件,且无适当的变量变不满足参数检验的条件,且无适当的变量变换方法解决此问题时;换方法解决此问题时;分布类型无法获知的小样本计量资料;分布类型无法获知的小样本计量资料;一端或两端存在不确定数值(如一端或两端存在不确定数值(如1000IU)的计量资料;的计量资料;n等级资料等级资料:比较各组间等级强度的差别。比较各组间等级强度的差别。非参数检验的优点与不足非参数检验的优点与不足n优点:优点: 1. 适

4、用范围广泛;适用范围广泛; 2. 多数方法计算简便;多数方法计算简便; 3. 易于理解和掌握;易于理解和掌握; 4. 无法精确测量的资料及等级资料可以采用;无法精确测量的资料及等级资料可以采用;n不足:不足: 1. 参数检验适用的资料,非参数方法会降低检验参数检验适用的资料,非参数方法会降低检验 效能;效能; 2. 某些方法的计算过程仍然复杂。某些方法的计算过程仍然复杂。第一节第一节 配对样本比较的配对样本比较的Wilcoxon符号秩检验符号秩检验Wilcoxon符号秩检验简介符号秩检验简介符号秩检验由符号秩检验由Wilcoxon于于1945年提出;年提出;应用:应用:n配对样本差值的中位数与

5、配对样本差值的中位数与0比较;比较;n单个样本中位数与总体中位数(给定值)单个样本中位数与总体中位数(给定值)的比较。的比较。配对样本差值的中位数与配对样本差值的中位数与0 0比较比较 配对设计两组处理效应的比较一配对设计两组处理效应的比较一般采用配对般采用配对t t 检验,如果差数严重检验,如果差数严重偏离正态分布,可采用偏离正态分布,可采用Wilcoxon符符号秩检验。号秩检验。例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)16076162142152103195243484808225

6、242240-2622022007190205158253813919824345103844611236190-4612951005合计合计 例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)正秩正秩(5)负秩负秩(6)160761682142152105319524348114808221.55242240-21.56220220071902051578253813691982434591038446411236190-4610129510053合计合计54.511.5符号秩检验的基本思想符

7、号秩检验的基本思想n在在H0成立(两配对样本差值的总体中位数为成立(两配对样本差值的总体中位数为0)的条件下,两配对样本的差值的正负及其绝对值的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;的相对大小是随机的;n在此情况下,正秩和与负秩和之间应当相近,差在此情况下,正秩和与负秩和之间应当相近,差别不会太大;别不会太大;n如果正秩和与负秩和之间相差足够大,则可认为如果正秩和与负秩和之间相差足够大,则可认为H0成立的可能性很小,从而加以拒绝。成立的可能性很小,从而加以拒绝。 例例8-1分析结果分析结果取负秩和为取负秩和为T,则,则T=11.5,对子数,对子数11;查查T界值表得界值表

8、得0.05P0.1;结论:不拒绝结论:不拒绝H0,不能认为两种方法检测,不能认为两种方法检测ALT的结果有差别。的结果有差别。 当当 n 大于大于5050且有相同的秩号时,可用正且有相同的秩号时,可用正态近似法作态近似法作 u 检验检验例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)正秩正秩(5)负秩负秩(6)ti160761681214215210513195243481114808221.525242240-21.52622022007190205157182538136191982434

9、59110384464111236190-461011295100531合计合计54.511.5配对设计等级资料的符号秩检验配对设计等级资料的符号秩检验1. 把等级从弱到强转换成秩,如某指标的检测结果把等级从弱到强转换成秩,如某指标的检测结果为为-,+,+,+,可转化为相应的秩次,可转化为相应的秩次1,2,3,4;2. 求各对秩次的差值,省略所有差值为求各对秩次的差值,省略所有差值为0的对子数,的对子数,令余下的有效对子数为令余下的有效对子数为n;3. 按按n个差值编正秩与负秩,求正秩和与负秩和个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检注意:由于等级资料相

10、同秩多,此时小样本的检验结果会存在偏性,最好用大样本。验结果会存在偏性,最好用大样本。3. 单个样本中位数和指定的单个样本中位数和指定的总体中位数比较总体中位数比较例例8-2:12名工人尿氟含量与名工人尿氟含量与45.3比较比较尿氟含量尿氟含量(1)(1)- 45.3(2)正秩正秩(3)负秩负秩(4)44.21-1.091.545.30046.391.091.549.474.17351.055.75453.167.86553.267.96654.379.07757.1611.86867.3722.07971.0525.751087.3742.0711合计合计64.51.5假设检验过程假设检验过

11、程u与配对资料符号秩检验基本相同。与配对资料符号秩检验基本相同。u此处先计算每一测量值与给定的值的差数;此处先计算每一测量值与给定的值的差数;u然后对此差数进行秩转换,进行与配对资料符然后对此差数进行秩转换,进行与配对资料符号秩检验完全相同的操作过程。号秩检验完全相同的操作过程。u此例得此例得T=1.5,对子数,对子数11,查表得,查表得P0.005;u拒绝拒绝H0,认为该厂工人的尿氟含量高于当地正,认为该厂工人的尿氟含量高于当地正常人的水平。常人的水平。第二节第二节 两个独立样本比较的两个独立样本比较的 Wilcoxon秩和检验秩和检验Wilcoxon秩和检验秩和检验nWilcoxon秩和检

12、验(秩和检验(rank sum test)用于)用于推断计量资料或等级资料的两个独立样本推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别。所来自总体的分布位置是否有差别。n对分布的形状不加考虑,因此应注意分布对分布的形状不加考虑,因此应注意分布位置和分布(包括位置和形状)的区别。位置和分布(包括位置和形状)的区别。n分布形状相同或类似的两个总体分布位置分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较,可以简化地理解为两总体中位数的比较。比较。1. 1. 计量资料两样本比较计量资料两样本比较例例8-3 两类肺病患者两类肺病患者RD值比较值比较肺癌病人

13、肺癌病人矽肺矽肺0期工人期工人RD值值秩次秩次RD值值秩次秩次2.7813.232.53.232.53.5044.2074.0454.87144.1565.12174.2886.21184.3497.18194.47108.05204.64118.56214.75129.60224.82134.95155.1016n1=10T1=141.5n2=12T2=111.5(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:两组患者:两组患者RD值总体分布位置相同值总体分布位置相同H1:肺癌病人:肺癌病人RD值高于矽肺值高于矽肺0期工人期工人RD值值=0.05(2)混合编秩,求统计量)混

14、合编秩,求统计量Tu将两样本数据混合,从小到大排序;将两样本数据混合,从小到大排序;u对混合数据进行秩转换,获得每一观察值对应对混合数据进行秩转换,获得每一观察值对应的秩次;的秩次;u观察值相等者取平均秩次;观察值相等者取平均秩次;u分别计算两样本的秩和;分别计算两样本的秩和;u取样本量较小者为取样本量较小者为n1,其秩和作为统计量,其秩和作为统计量T;u两样本量相等者任取其中一个作为统计量两样本量相等者任取其中一个作为统计量T(通常取秩和较小者)。(通常取秩和较小者)。 若若H0成立,成立,T值应接近值应接近 ,若,若T值严重偏离值严重偏离 ,则提示,则提示H0可能是不正确的。小样本时,可能

15、是不正确的。小样本时,查查T界值表。界值表。N)/2N)/2(1(1n n0 02 21 12 21 12 21 1n nn n),),R R, ,min(Rmin(Rn nn n , ,T T较小例数组的秩和较小例数组的秩和)n ,nmin(nnnN21021N)/2N)/2(1(1n n0 0较小例数组的平均秩和为:较小例数组的平均秩和为:N)/2N)/2(1(1n n0 0(3)确定)确定P值,作出结论值,作出结论若若n110且且n2-n110,可通过查阅,可通过查阅T界值表界值表(附表(附表10)确定)确定P值;值;若两样本量不满足上述条件,则可采用正若两样本量不满足上述条件,则可采用

16、正态近似法作态近似法作u检验,按公式(检验,按公式(8-2)计算)计算u值。值。正态近似法正态近似法)NN)tt (jj33112121)1)(N(Nn nn n| |1)/21)/2(N(Nn nT T| |u u2 21 11 1例例8-3分析结果分析结果本例本例n1=10, n2-n1=2,T=T1=141.5,满足查,满足查T界值表的条件;界值表的条件;查表得查表得单侧单侧0.025P0.05;拒绝拒绝H0 ,认为肺癌病人的,认为肺癌病人的RD值高于矽肺值高于矽肺0期病人的期病人的RD值。值。3. 等级资料两样本比较等级资料两样本比较例例8-4 吸烟和不吸烟工人吸烟和不吸烟工人HbCO

17、含量比较含量比较含量含量吸烟吸烟不吸烟不吸烟合计合计秩范围秩范围平均秩平均秩秩和秩和(1)(2)(3)(4)(5)(6)吸烟吸烟(7)=(2)(6)不吸烟不吸烟(8)= (3)(6)很低很低12313224低低8233143419152437中中161127356148768528偏高偏高10414627568.5685274高高404767977.53100合计合计39(n1) 40(n2)791917(T1)1243(T2)(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:两组工人:两组工人HbCO含量总体分布位置相同含量总体分布位置相同H1:吸烟工人:吸烟工人HbCO含量

18、高于不吸烟工人含量高于不吸烟工人=0.05(2)混合编秩,求统计量)混合编秩,求统计量Tu确定各等级的合计人数;确定各等级的合计人数;u根据各等级的合计人数确定其秩次范围和平根据各等级的合计人数确定其秩次范围和平均秩;均秩;u分别计算两样本的秩和;分别计算两样本的秩和;u取样本量较小者为取样本量较小者为n1,其秩和(,其秩和(T1)作为统计)作为统计量量T;u根据公式(根据公式(8-2)计算)计算u值,执行值,执行u检验过程。检验过程。例例8-4分析结果分析结果本例本例n1=39, n2=40,T=T1=1917;计算得计算得u=3.7023,查表得单侧,查表得单侧P5或或g3时时,则,则H或

19、或Hc近似服从近似服从=g-1的的卡方分布,可通过卡方分布,可通过查阅卡方界值表确定查阅卡方界值表确定P值值。例例8-5分析结果分析结果本例本例n1=n2=n3=5,N=15,满足查,满足查H界值表的界值表的条件;条件;计算得计算得H=9.74,查表得双侧,查表得双侧P3,通过查卡方界值表(附表,通过查卡方界值表(附表8)确)确定定P值;值;例例8-7分析结果分析结果本例计算得本例计算得H=14.28,Hc =15.52,查卡方界,查卡方界值表得双侧值表得双侧P0.005;拒绝拒绝H0 ,认为四种疾病患者痰液内噬酸粒,认为四种疾病患者痰液内噬酸粒细胞有差别。细胞有差别。3. 多个独立样本两两比

20、较的多个独立样本两两比较的Nemenyi检验检验Nemenyi检验方法简介检验方法简介n类似于多组样本比较方差分析的情形,当类似于多组样本比较方差分析的情形,当经过多个独立样本比较的经过多个独立样本比较的Kruskal-Wallis H检验拒绝检验拒绝H0之后,可进一步进行组间两两之后,可进一步进行组间两两比较;比较;nNemenyi检验即为执行此类统计学比较的方检验即为执行此类统计学比较的方法之一。法之一。例例8-8 小白鼠接种三种伤寒菌的存活日小白鼠接种三种伤寒菌的存活日数数9D11CDSC1存活日数存活日数秩次秩次存活日数存活日数秩次秩次存活日数存活日数秩次秩次22510.534.522

21、510.5510.522615.5615.534.5615.5615.5Ri84169212ni10911Ri8.4018.7819.27三组样本所来自的总体分布位置比较三组样本所来自的总体分布位置比较n三组样本所来自的总体分布位置比较的操作过程三组样本所来自的总体分布位置比较的操作过程与例与例8-5完全相同;完全相同;n本例得本例得Hc=9.97,P0.01,拒绝,拒绝H0;n认为接种三种伤寒杆菌的存活日数有差别;认为接种三种伤寒杆菌的存活日数有差别;n为进一步观察不同伤寒杆菌之间的差别,可进一为进一步观察不同伤寒杆菌之间的差别,可进一步进行三组间的两两比较。步进行三组间的两两比较。任意两组

22、间分布位置的比较任意两组间分布位置的比较n计算各组的平均秩和,根据公式(计算各组的平均秩和,根据公式(8-6)计)计算任意两组之间比较的卡方值;算任意两组之间比较的卡方值;n自由度取组数减一,即自由度取组数减一,即=g-1;n查表确定相应的查表确定相应的P值,进行统计推断。值,进行统计推断。例例8-8分析结果分析结果n ,0.025P0.05n ,0.01P0.025n ,0.99P15或处理组数或处理组数g15时,则通过公式时,则通过公式(8-8)进行近似卡方检验,确定)进行近似卡方检验,确定P值。值。实际上当实际上当g4,或者,或者g=4且且n5,或者,或者g=3且且n9 ,即可采用近似卡

23、方检验方法。即可采用近似卡方检验方法。例例8-98-9分析结果分析结果本例计算得本例计算得M=199.5,查,查M界值表得双侧界值表得双侧P0.05;拒绝拒绝H0 ,认为四种频率声音刺激的反应率,认为四种频率声音刺激的反应率有差别。有差别。2. 多个相关样本两两比较的多个相关样本两两比较的q检验检验q检验方法简介检验方法简介n当经过多个相关样本比较的当经过多个相关样本比较的Friedman M检验拒绝检验拒绝H0之后,可进一步执行组间两之后,可进一步执行组间两两比较的操作;两比较的操作;nq检验可用以执行多个相关样本的两两比检验可用以执行多个相关样本的两两比较过程。较过程。q检验方法操作过程检验方法操作过程n操作过程类似于方差分析组间两两比较的操作过程类似于方差分析组间两两比较的SNK-q检验;检验;n任意两组间比较的任意两组间比较的q值通过公式(值通过公式(8-9)和公式)和公式(8-10)计算;)计算;n自由度自由度=(n-1)(g-1),样本跨度,样本跨度a是指是指g个样本秩和个样本秩和从小到大排序后所比较的两个秩和间所涵盖的秩从小到大排序后所比较的两个秩和间所涵盖的秩和个数(包括二者本身);和个数(包括二者本身);n根据计算结果查阅根据计算结果查阅q界值表(附表界值表(附表4),获得),获得P值值例例8-9数据的两两比较结果数据的两两比较结果qa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论