基于秩次的假设检验方法(研究生3学时修改)2015.10.ppt_第1页
基于秩次的假设检验方法(研究生3学时修改)2015.10.ppt_第2页
基于秩次的假设检验方法(研究生3学时修改)2015.10.ppt_第3页
基于秩次的假设检验方法(研究生3学时修改)2015.10.ppt_第4页
基于秩次的假设检验方法(研究生3学时修改)2015.10.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于秩次的假设检验方法,XX 流行病与卫生统计学系,【例1】 某医师用改良的Seldingers插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t检验,得t =2.460,P0.05,差异有统计学意义,故认为治疗前后血中HCG的含量有差别。,【问题1】 (1)这是什么资料? (2)该实验属于何种设计方案? (3)该医师统计方法是否正确?为什么?,【分析】 (1)该资料为计量资料。 (2)该实验属自身配对设计方案。 (3)该医师统计方法不正确。 首先,配对资料一般采用对

2、每对数据求之差值后进行比较,而该医师采用完全随机设计资料的检验方法,统计方法与设计类型不符; 其次,该医师考虑了数据相差较大,即不满足t检验的前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后的数据经对数变换后,其差值的变异仍然较大(经正态性检验,P0.05 ) ,因此仍不满足配对t检验的条件,故该资料宜采用非参数检验方法,即Wilcoxon配对设计的符号秩和检验,目的是推断配对资料的差值是否来自中位数为零的总体。,前面介绍的t检验、方差分析等假设检验方法,大都假定样本所来自的总体分布为正态分布,但其参数(即正态总体均数)为未知,统计推断的目的就是对这些未知参数进行检验,这一类依赖于总

3、体分布的具体形式的统计推断方法称为参数统计方法或参数检验(parametric test) 。 但在许多实际问题中,如例1资料呈明显偏态,或分布不明的资料,需要用另一类不依赖总体分布类型的检验即非参数统计方法或非参数检验(nonparametric test),或任意分布检验(distribution-free test)。,条件不满足时采用非参数统计的方法,参数检验的特点,分析目的:对总体参数( )进行估计或检验 分布:要求总体分布已知,如: 连续性资料正态分布 计 数 资 料二项分布、POISSON分布等 统计量:有明确的理论依据(t分布、Z分布) 有严格的适用条件,如: 正态分布 Nor

4、mal 总体方差齐 Equal Variance 数据间相互独立 Independent,?,非参数检验的优点在于它不受总体分布的限制,因此它的适用范围广,且方法简便易学。 但适宜参数检验方法的资料,如果用非参数检验方法,由于没有充分利用资料提供的信息,就降低了检验效率,即第类错误的概率 增大。 故适合参数检验条件的资料,应首选参数检验,但若参数检验的条件得不到满足,则非参数检验更适合。,非参数检验方法很多,本章介绍常用的秩转换(rank transformation) 的非参数检验即秩和检验(rank sum test)。秩和检验的适用范围: 未加精确测量的资料(包括等级资料) 如“50mg

5、”、“0.01mg”; 偏态分布且无法转化为正态分布的资料; 分布不清的资料。,秩和检验,秩次: 指将观察值由小到大按升序排列后,每 个数据的次序号(Rank ) 编秩:将观察值按顺序由小到大排列,并用序号代替原始变量值本身 秩和:用秩次号代替原始数据,并对某些秩次号求和(R sum) 相持: 出现相同秩次的现象,秩次和秩和,设有以下两组数据: A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7 两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下: A组 2.6 3.2 4.7 5.2 6.4 B组 1.7 2.3 2.6 3.

6、6 3.7 秩次 1 2 3 4 5 6 7 8 9 10 A组秩和: 3.5+5+8+9+10=39.5 B组秩和: 1+2+3.5+6+7=19.5 从两组的原始变量值也可以初步看出:A组偏大,B组偏小。现在得出的秩和也是A组大于B组,与由变量值所观察到的一致,秩次(rank)将数值变量值从小到大,或等级变量值从弱到强所排列的序号 例1 11只大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60 例2 9名 肺炎病人的治疗结果: 治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效,秩次(rank)将数值变量值从小到大,或等级变量值从弱到强所排列的序号 例1 11只大鼠存

7、活天数: 4, 10, 7, 50, 3, 15, 2, 9, 13, 60, 60 例2 9名 肺炎病人的治疗结果: 治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效,秩次 1 2 9 7 3 5 4 6 8,秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5,平均秩次 2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5,内容提要,第一节 配对设计资料的符号秩和检验 第二节 完全随机设计两样本资料的秩和检验 第三节 完全随机设计多个样本资料的秩和检验 第四节 多个样本之间的两两比较 第五节 单样本资料的秩和检验 第六节 随机区组设计资料的秩和检验,配

8、对资料的秩和检验或配对符号秩和检验即Wilcoxon符号秩和检验(Wilcoxon signed rank test或Wilcoxon配对法) 它用于资料配对设计计量差值的比较和单一样本与总体中位数的比较。 以例1资料为例介绍Wilcoxon符号秩和检验基本步骤。,第一节 配对设计资料的秩和检验,【检验步骤】 1. 建立检验假设,确定检验水准 H0:差值的总体中位数等于零,即Md=0 H1:差值的总体中位数不等于零,即Md0 a=0.05 2. 计算检验统计量T值 (1)求差值d:见表9-2第(4)栏。 (2)编秩:按差值的绝对值大小从小到大编秩次, 再根据差值的正负给秩次冠以正负号,若差值为

9、0,舍去不计,例数n相应减少;若差值的绝对值相等,称为相持(tie),这时取平均秩次。,(3)求秩和,确定统计量T: 分别求出正、负秩和T+和T- , T+和T-之和应为n(n+1)/2。 本例T+=36,T-=0,总秩和为36,而n(n+1)/2=8(8+1)/2=36,表明秩和计算无误。取T=36。 双侧检验,以绝对值较小者为统计量T值;单侧检验时, 任取其一为统计量。,3. 定P值,做出统计推断 (1) 查表法:根据统计量T和对子数n查附表C8(配对比较的符号秩和检验用,p578) ,确定P值 T值在T界值范围内,P大于T界值范围相应的概率; T值等于T界位范围的下限或上限,P值等于T界

10、值范围相应的概率; T值在T界值范围外,P小于T界值范围相应的概率,结合专业作出结论。 本例n=8,T=0,查表,T等于T0.050,8的界值333,所以P0.05,按a=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为治疗前后病人血中HCG含量有差别,治疗后有所下降。,当n25时,超出T界值表的范围,可按近似正态分布用Z检验,练习题1 用二乙胺化学法与气相色谱法测定车间空气中CS2的含量(mg/m3),见下表,问两法所得结果有无差别?,表1 两种方法测定车间空气中CS2含量(mg/m3),一般步骤,建立假设检验 H0:差值的总体中位数为0; H1:差值的总体中位数不为0(双侧);或

11、差值的总体中位数0(0)(单侧);确定检验水准为0.05。,编秩次,求秩和 去掉d=0的对子,总的对子数也要相应减去; 用绝对值d编秩次,如果出现绝对值相等时(ties),则将它们的平均秩次值作为他们的秩次; 把差值的符号标在秩上,如果d0,则秩次为“+”,d0,则秩次为“-”; 求正负秩次之和T+与T-,绝对值较小者,作为统计量T值。,表9.1 两种方法测定车间空气中CS2含量(mg/m3),用不为“0”的对子数n及T(任取T+或T-)查检验界值表得到P值作出判断。 配对比较的符号秩和检验表,确定P值范围。 本例n=9, T+=19.5, T-=25.5查T界值表T0.05(9)=540,P

12、0.05,因此不拒绝H0。,【知识点】 1. Wilcoxon符号秩和检验的基本思想:在H0成立的前提下,配对差值的总体分布是对称的,总体中位数应为0,T+与T-应接近n(n+1)/4。若正、负秩和相差悬殊,则H0成立的可能性很小。 2. Wilcoxon符号秩和检验适用于不满足t检验条件的配对设计的计量资料、等级资料和其他不能精确测量的资料。,28,对于计量数据,完全随机设计两独立样本如果资料方差相等,且服从正态分布,就可以用t检验比较两样本均数。 如果此假定不成立或不能确定是否成立,就应采用Wilcoxon秩和检验来分析两样本是否来自同一总体。,第二节 完全随机设计两独立样本的秩和检验,2

13、9,适用条件: 1.完全随机设计的两组定量资料,若 不满足参数检验的应用条件,则用 本法 2.有序分类变量两组独立样本比较,30,1.n110(n1是较小的n), n2-n110时,查附表的T界值表 2.否则,用正态近似检验 若两组有相同秩次,要校正 tj 为第j个相同秩次的个数,n为总例数,31,表10.4 两独立样本秩和检验计算表,例10.4 用某方法对样品进行检测,得到样品的直径(mm),问两样本的直径有无差异?,1 定量变量两组独立样本的秩和检验,32, H0:两样本来自相同总体; H1:两样本来自不同总体(双侧) =0.05 或H1:样本A高于样本B(单侧),(2)编秩:两样本从小到

14、大混合编秩次,如果在同一组内可顺次编秩,否则,若不在同一组内,相同观察值取 原秩次的平均秩次。 (3)求秩和并确定统计量T 两组秩次分别求和,T1= 89,T2=47。 若两组例数相等,任取一组的秩和为统计量T, 若两组例数不等,则以样本例数较小者对应的 秩和为统计量T。 本例T =47,33,(4) 确定P值作出推断结论: 查表法 (n110,n2n110) 查附表C9 如果T 位于检验界值区间内, ,不拒绝H0; 否则, ,拒绝 H0 。 本例T =47,取=0.05,查附表得双侧检验界值区间(49,87),T 位于区间外,P0.05,因此在=0.05的水平上,拒绝H0,接受H1 。认为两

15、样本的直径有差异。,【例9-7】 某医生用某种中药治疗1型糖尿病患者和2型糖尿病患者共45例,结果见表9-5为评价该中药对两型糖尿病的疗效有无差异,问:该中药对两型糖尿病患者的疗效是否相同?,2 有序分类变量两组独立样本的秩和检验,【检验步骤】 1. 建立检验假设,确定检验水准 H0:某种中药治疗两型糖尿病疗效的总体分布相同 H1:某种中药治疗两型糖尿病疗效的总体分布不同 a=0. 05 2.计算检验统计T值 (1)求各等级的秩次范围:将两组数据统一按等级顺序由小到大编秩次。先计算各等级的合计数,依等级顺序按合计数确定秩次范围。本例见表9-6, 在第4栏各等级合计的基础上,确定各等级的秩次范围

16、。 (2)求各等级的平均秩次:将秩次范围的上下限相加除以2即得平均秩次。在第5栏各等级秩次范围的基础上,计算产出各等级的平均秩次。如表中“无效”的平均秩=(1+12)/2=6.5。,(3)求秩和:以各等级的平均秩次分别与各组各等级的相应例数相乘,再求和,得到各组的秩和T1与T2。见第7与8栏。T1 =414,T2=621。,(4)确定统计量T值:本例n1=22,超过了两组比较T界值表的范围,需用正态近似检验。由于相持较多(每个等级的人数表示相同秩次的个数,即tj) ,按下式计算zc值。,3.确定P值,做出统计推断 zc=2.2111.96,P0.05, 按a=0.05水准,拒绝H0,接受H1,

17、差异有统计学意义,可认为该中药治疗两型糖尿病的疗效分布不同该药治疗型糖尿病的疗效较高。,【知识点9-4】 1. Wilcoxon两样本秩和检验的基本思想:如果H0成立,则两样本来自分布相同的总体,两样本的平均秩次T1/n1与T2 /n2应相等或相近,含量n1的样本的秩和T1应在n1 (N+1)/2的左右变化。若T值偏离此值太远,H0成立的可能性就很小。若偏离出给定值所确定的范围时,则P,拒绝H0。 2. Wilcoxon两样本秩和检验用于完全随机设计两样本资料的比较,可用于分布偏态或方差不齐的计量资料的比较,也可用于单向有序资料或无法精确测量的资料的比较。目的是推断两样本分别代表的总体分布是否

18、不同。,第三节,完全随机设计多个样本资料的秩和检验,41,适用条件: 不满足参数检验应用条件的完全随机设计的多个样本比较 多个等级资料比较 基本思想: 如果各总体分布相同,则各组混合编秩的平均秩次应该相差不大 采用Kruskal-Wallis 秩和检验,又称K-W检验或H 检验,42,1.建立假设,确定检验水准 H0:多个总体分布相同 H1:多个总体分布不全相同 =0.05 2.编秩:多组数据从小到大混合编秩。 遇相同数据,取平均秩次。 3.求各组秩和:将各组秩次相加,即Ti, i 表示组号。 4.计算检验统计量,假设检验步骤,43,统计量计算公式: 为各组的秩和, 为各组对应的例数, N为总

19、例数,44,当相同秩次较多时,采用校正公式,45,5.确定p值,得出结论: (1)当g=3(g为组数),每组例数ni 5,查H界值表(附表C7,三样本比较的秩和检验用)。 (2)当g3,ni5,近似服从 = g 1 的 2 分布,查2 界值表(附表 卡方界值表) 。,【例9-5】 某医生为研究慢性阻塞性肺部疾病患者的肺动脉血氧分压情况,按肺动脉压的分级标准将44例患者分为三组,分别测量了肺动脉血氧分压,结果见表9-7。问:三组患者之间动脉血氧分压有无明显差异?,1 定量变量多组独立样本的秩和检验,【检验步骤】 1. 建立检验假设,确定检验水准 H0:三组患者动脉血氧分压的总体分布相同 H1:三

20、组患者动脉血氧分压的总体分布不同或不全相同 =0. 05 2.计算检验统计量H值 (1)各自排序:为便于编秩,先将各组数据分别由小到大排序。 (2)统一编秩:将各组数据由小到大统一编秩。有相同数据时,取平均秩次。 (3)求秩和:各组秩次分别相加得各组秩和,本例的秩和分别为R1=483,R2=329.5和R3=177.5(表9-8),(4)计算统计量H值,【例9-6】 某医生用七氟醚对即行肺切除术治疗的三组患者进行麻醉,麻醉效果分三级,结果见表9-9。问:七氟醚对三组患者麻醉效果无差别。,2 有序变量多组独立样本的秩和检验,【检验步骤】 1. 建立检验假设,确定检验水准 H0:三组患者麻醉效果的

21、总体分布相同 H1:三组患者麻醉效果的总体分布不同或不全相同 a=0.05 2.计算检验统计量H值 (1)求各等级的秩次范围:与两组等级资料相同,将各组数据统一按等级顺序由小到大编秩次。先计算各等级的合计数,依等级顺序按合计数确定秩次范围。本例据表9-10第5栏各等级的合计确定第6栏各等级的秩次范围。,(2) 求各等级的平均秩次:在第6栏各等级秩次范围的基础上,计算出各等级的平均秩次,见第7栏。 (3)求秩和:以各等级的平均秩次分别与各组各等级的相应例数相乘,求和得到秩和Ri。见第8至10栏。R1=1915,R2=2405.5,R3=2700.5。,完全随机设计多个独立样本的多重比较,用K-W

22、秩和检验,当推断结论为拒绝H0,接受 H1时,需要做组间的多重比较。,例11-10 某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%),结果见表11-10,试比较不同实验条件下小鼠巨噬细胞的吞噬率有无差别?,Ri 924 701 145 ni 24 19 16 38.5 36.89 9.06,假设检验步骤,1.建立假设检验 H0:第i组与第j组所代表的总体分布相等。 H1:第i组与第j组所代表的总体分布不等 0.05 2.计算统计量 1)Wilcoxon秩和检验:对任意两组组合

23、检验, 可得精确P值(用统计软件),2)正态近似法:样本量较大时采用,当有相同秩次时,用校正值:,3.确定P值,做出推断结论 检验水平的调整:,A菌组和B菌组分别和对照组吞噬率的分布有显著差异,两实验组见吞噬率的分布无显著差异。,【知识点9-5】 1.完全随机设计多组比较的秩和检验是由Kruskal和Wallis在Wilcoxon秩和检验的基础上扩展而来,又称为K-W检验或H检验。该检验的目的是推断多组样本分别代表的总体分布是否不同。其原理与两组样本的秩和检验相同。 2.H检验适用于方差不齐或不服从正态分布的多组定量资料的比较。 3.H检验还可用于多组有序分类资料的比较或多组无法精确测量资料间

24、的比较。,第五节,单样本资料的秩和检验,【例9-2】 某医师在某地某工厂随机抽取16名工人,测得尿铅含量(mol/L)为0.65,0.78,2.13,2.48,2.54,2.68,2.73,3.01,3.13,3.27,3.54,4.38,4.47,5.05,6.08,11.27。已知该地正常人尿铅含量的中位数为2.50mol/L。问该厂工人的尿铅含量是否高于当地正常人?,【检验步骤】 1. 建立检验假设,确定检验水准 H0:差值的总体中位数等于零,即Md=0,该厂工人的尿铅含量与正常人相同 H1:差值的总体中位数大于零,即Md0,该厂工人的尿铅含量高于正常人 单侧=0.05 2.计算检验统计

25、量T值 (1)求差值:d=Xi-M0,见表9-3第(2)栏 (2)编秩:对差值的绝对值从小到大编秩,再根据差值的正、负给秩次冠以正负号,见表9-3第(3)栏。差值为零,舍去不计,例数n减少。差值绝对值相等时,则取平均秩次。 (3)求正负秩和,确定统计量:T+=109, T-=27,取T=27。,M0= 2.50mol/L,3.确定P值,做出统计推断 与配对符号秩和检验相同,查附表(配对比较的符号秩和检验T界值表),n=16,T=27,得单侧0.01P0.025,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为该厂工人尿铅含量高于当地正常人。,第六节,随机区组设计资料的秩和检验,【

26、例9-7】 观察龙葵浓缩果汁对S180实体瘤鼠NK细胞活性的影响。将同种属的40只大白鼠按窝别、性别、体重配成10个区组,建成S180实体瘤模型,一定时间后将小鼠脱椎处死,测定并计算NK细胞活性(%),结果见表9-ll。研究者对该资料进行了随机区组设计的方差分析,剂量组间F=2.864,P=0.055,故认为不同剂量全组之间小鼠NK细胞活性无差异。,【检验步骤】 1.建立检验假设,确定检验水准 H0:四个剂量组小鼠NK细胞活性的总体分布相同 H1:四个剂量组小鼠NK细胞活性的总体分布不同或不全相同 a=0.05 2.计算统计量M值 (1)编秩:每一区组内数据从小到大编秩,相同数据取平均秩次(表

27、9-12)。 (2)分别计算各处理组的秩和Ri:本例各组分别为35,25.5,24.5,15。(见表9-12),【知识点9-6】 1. Friedman的M检验的基本思想:在H0成立的条件下,各区组内观测值取秩为1,2,k的概率相等,则各处理组的秩和应接近 ,而M值反映了实际获得的k个处理组的秩和与 偏离的程度。M值越大,就越有理由怀疑各处理组的总体分布不同。随着b和k的增大,M值近似服从自由度为k-1的分布。 2. Friedman的M检验适用于随机区组设计的资料,但不满足随机区组设计方差分析的前提条件,也可用于随机区组设计的等级资料比较。目的是推断各处理组样本分别代表的总体分布是否不同。,二、随机区组设计资料的多重比较,【分析】 与完全随机设计资料的秩和检验相同,对于随机区组设计资料,当用Friedman的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论