10基于秩次的非参数检验.ppt_第1页
10基于秩次的非参数检验.ppt_第2页
10基于秩次的非参数检验.ppt_第3页
10基于秩次的非参数检验.ppt_第4页
10基于秩次的非参数检验.ppt_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第十章 非参数检验,2,教学要求 了解:通过电脑实验了解不同设计类型的秩和检验和相应t检验的功效有何不同。 熟悉:理解非参数统计的概念;熟悉不同设计类型的秩和检验方法。 掌握:掌握不同设计类型的秩和检验的实施方法及其应用条件。,3,在实践中我们常常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等,这类资料有如下特点: 资料的总体分布类型未知; 资料分布类型已知,但不符合正态分布; 或某些变量可能无法精确测量: 疼痛程度 无、轻度、中度、重度 疾病治疗结果 控制、显效、有效、无效 。,对于此类资料,除了进行变量变换或t检验外

2、,可采用非参数统计方法。,4,在统计推断方法中,凡是以样本来自已知分布(如正态分布)的总体为假设基础,对总体参数(如总体均数)进行估计或检验的方法,称为参数统计(parametric statistics)。,5,但在实际工作中,有时总体的分布不易确定,或分布呈明显偏态而又无适当的正态转换方法,则需要应用一种不依赖于总体的分布类型,可以不考虑被研究对象为何种分布以及分布是否已知的统计推断方法。此类方法通常不会涉及到研究对象的参数。这时统计推断是比较分布而不是比较参数,称为“非参数统计”(nonparametric statistics)。 非参数统计可以不考虑被研究对象为何种分布以及分布是否已

3、知,其统计推断的基础是比较分布而不是比较参数。,6,非参数统计的基本思想,在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,7,非参数统计方法的主要优点,适用范围广。对变量的类型和分布无特殊要求,不论样本资料所来自的总体分布形式如何,甚至是未知的,都能适用。,8,对数据要求不严。对某些指标不便准确测定,只能以严重程度,优劣等级,先后次序等作记录的资料也可应用。 对样本量无严

4、格要求。,9,非参数统计方法的主要缺点,对于符合参数检验的资料如果用非参数检验,由于没有充分利用资料提供的信息,故检验效能低于参数检验,若要使检验效能相同,往往需要更大的样本含量。,10,因此,在实际工作中对符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;若不能满足参数检验条件的资料,应选用非参数检验。,非参数统计方法很多,本章主要介绍其中应用最广的秩和检验。,11,参数统计 (parametric statistics),非参数统计 (nonparametric statistics),对于符合参数统计分析条件者,采用非参数统计分析,其检验效能较低。,12,第一节 配对设

5、计和单样本资料的符号秩和检验 第二节 完全随机化设计两组独立样本的秩和检验 第三节 完全随机化设计多组独立样本的秩和检验 第四节 随机化区组设计资料的秩和检验 第五节 多个样本间的多重比较,13,第 一 节 配对设计和单样本资料的符号秩和检验,14,配对设计的符号秩和检验又称Wilcoxon 符号秩和检验(Wilcoxon 配对法,或Wilcoxon signed rank test)是推断其差值是否来自中位数为零的总体的方法,可用于配对设计差值的比较和单一样本与总体中位数的比较。,15,一、配对设计的两样本的比较,例101 为研究长跑运动对增强普通高校学生的心功能的效果,某学校随机抽取15名

6、男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如表所示,问长跑锻炼后的晨脉次数是否降低?,16,表10.1 某校15名学生5个月长跑锻炼前后的晨脉次数(单位:次/分钟),17,【解题思路】,本研究属于配对设计的定量资料,首先判断是否符合配对设计t检验的适用条件,即差值是否来自正态分布。通过对差值进行正态性检验(见后),发现差值不是来自正态总体,所以用配对符号秩和检验(Wilcoxon matched-pairs signed-ranks test)进行统计分析。,18,正态性检验结果,19,1 建立假设,确定检验水准 H0:差值的总体中位数等于零 Md=0 H1;差值的总体中位数不等于零

7、 Md0 =0.05 2 计算检验统计量,20,(1)求各对的差值 见表10-1的第4栏。 (2)编秩 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,如本例差值的绝对值为1的有两个,它们的位次为1、2,取平均秩次为(1+2)/2=1.5;差值的绝对值为22的有3个,它们的位次是13、14、15,取平均秩次为(13+14+15)/3=14。编秩时如遇差值为0,则舍去不计。,21,(3)求秩和,确定统计量T 分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,两者中较小者为统计量T,本例取T=10.0。 T+与T-之和应等于n(n+1)

8、/2(其中n为不等于0的对子数),此式可验算T+和T-的计算是否正确。本例T+=110, T-=10,其和为120,n=15, 15(15+1)/2=120,可见T+、T-计算无误。,22,表10.2 15名学生5个月长跑锻炼前后的晨脉次数和编秩用表,23,3 确定P值,做出推断结论 (1)查表法:以T值查T界值表(配对设计用 P450),若检验统计量T值在上、下界值范围内,其P值大于相应的概率水平;若T值在上、下界值上或范围外,则P值小于相应的概率水平。,24,本例n=15,T=10,查T界值表,得双侧P0.05。在=0.05水准上,拒绝H0,接受H1,认为差值的总体中位数不等于0。结合本题

9、,可知长跑后晨脉次数低于长跑前晨脉次数。,25,26,(2)正态近似法(n50),27,校正公式;,式中tj为第j(j=1,2)个相同秩次的个数。如上例中,有两个差值,其绝对值均为1,对应的秩和均为1.5;有两个差值的绝对值均为4,对应的秩和均为3.5; 有两个差值的绝对值均为15,对应的秩和均为7.5;有两个差值的绝对值均为17,对应的秩和均为9.5;有三个差值的绝对值均为22,对应的秩和均为14, 则:t1=2,t2=2,t3=2,t4=2, t5=2。,28,29,【电脑实验】,数据录入,30,Analyze Nonparametric Tests 2 Related Samples T

10、est pair(s) List框锻炼前锻炼后 Test Type Wilcoxon OK,配对资料的秩和检验,其具体操作过程:,31,秩和检验的结果:,32,【结果报告】,表10.3 15名学生5个月长跑锻炼前后的晨脉次数(M),采用配对资料的秩和检验: Z=2.844,P=0.004,33,二、单一样本与总体中位数的比较 例7.2 已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如下:2.15,2.10,2.20,2.12,2.42,2.52,2.62,2.72,2.99,3.19,3.37,4.57。问该厂工人的尿氟含量是

11、否高于当地正常人?,34,1建立检验假设,确定检验水准 H0:工人的尿氟含量总体中位数等于2.15, M=2.15 H1:M2.15 单侧=0.05 2计算检验统计量 (1)求差值,见表10-2,与配对资料符号秩和检验不同的是,这里的差值是各观察值与已知总体中位数之差。,35,表10.2 12名工人尿氟含量测定结果,36,(2)编秩,方法同上。 (3)求秩和T+=62.5,T-=3.5,取T=3.5。 3确定P值,做出推断结论 本例n=11,T=3.5,查T界值表得P0.05,按 =0.05检验水准,拒绝H0,接受H1。可认为该厂工人尿氟含量高于当地正常人。,37,38,第二节 完全随机设计

12、两样本比较的秩和检验,39,完全随机设计两样本比较的秩和检验,亦称成组设计的两个样本比较的秩和检验(Wilcoxon两样本比较法)。本法利用两样本观察值的秩和来推断样本分别代表的总体分布是否相同。,40,一、两组连续变量资料的秩和检验 例103 在河流监测断面优化研究中,研究者从某河流甲乙两个断面分别随机抽取10和15个样品,测得其亚硝酸盐氮的含量如表10-3,试比较甲、乙两个河流断面亚硝酸盐氮的含量有无差别?,41,42,【解题思路】,本例目的在于比较河流甲断面和河流乙断面亚硝酸盐氮含量有无差别,在设计类型上,属于成组设计两样本定量资料的比较。原则上对此类资料的假设检验应首先考虑t检验,前边

13、我们介绍了两样本均数的t检验,但两样本均数的t检验要求两个样本必须来自正态总体且总体方差齐同。,43,1.建立检验假设,确定检验水准 H0:两总体分布相同 H1:两总体分布不同 =0.05 2.计算统计量T值,44,(1)编秩 将两组数据由小到大统一编秩。编秩时如遇有相同数据时取平均秩次,如两组均有0.018,应编秩次为2、3,取平均秩次(2+3)/2=2.5。 注意:编秩时如遇有相同数据,且相同数据在不同组时,必须取其平均秩次,如果相同数据在同一组,可以取其平均秩次,也可不取,对秩和没有影响。,45,(2)求秩和,确定统计量T 两组秩次分别相加,其对应的秩和分别为136和189。若两组例数相

14、等,则任取一组的秩和为统计量。若两组例数不等,则以样本例数较小者对应的秩和为统计量。本例n1=10,检验统计量T=136。,46,3 确定P值,做出推断结论 (1)查表法 : (n1 10且 n2-n1 10) 查T界值表(P451 ),先从左侧找到n1(较小的n),本例为10,再从表上方找两组例数的差(n2-n1),本例n2-n1=5,在两者交叉处即为T的界值。,47,48,将检验统计量T值与T界值相比,136在94166范围内,故P0.05。按=0.05检验水准,不拒绝H0 。不能认为甲、乙两个河流断面亚硝酸盐氮含量的总体分布不同。,49,(2)正态近似法 如果n1或n2-n1超出了成组设

15、计T界值的范围,可用正态近似检验。 若相同秩次较多(比如超过25%)时,应按 进行校正。 其中, ,tj为第j个相同秩次的个数。,50,二、两组有序变量资料的秩和检验,例104 某研究者欲评价新药按摩乐口服液治疗高甘油三酯血症的疗效,将高甘油三酯血症患者189例随机分为两组,分别用按摩乐口服液和山楂精降脂片治疗,数据见表104,问两种药物治疗高甘油三酯血症的疗效有无不同 ?,51,52,【解题思路】,本例目的在于比较按摩乐口服液和山楂精降脂片治疗后高甘油三酯血症的疗效有无不同。由于测量指标为等级资料,所以考虑用秩和检验(如果用卡方检验,则只能说明两组构成比有无差别)。,53,1.建立检验假设,

16、确定检验水准 H0:两种药物疗效的总体分布相同 H1:两种药物疗效的总体分布不同 =0.05 2.计算统计量T值,54,(1)编秩:在编秩时,相同等级的个体属于相持。先按组段计算各等级的合计人数,见表10-4第(4)栏,由此确定第(5)栏各组段秩次范围,然后计算出各组段的平均秩次。 (2)求秩和:以各组段的平均秩次分别与各等级例数相乘,再求和得到T 1和T 2,55,(3)计算统计量,56,确定P值,做出推断结论 3.30691.96 P0.05,拒绝H0 ,认为两种药物治疗高甘油三酯血症的疗效不同。,57,第三节 成组设计多样本比较的秩和检验,58,该法是由Kraskal和Wallis在Wi

17、lcoxon秩和检验的基础上扩展的方法,又称为K-W检验或H检验。本法利用多个样本的秩和来推断各样本分别代表的总体的分布有无差别。,59,一、多组连续变量资料的秩和检验 例 10-5 某研究者欲研究 A、B两个菌种对小鼠巨噬细胞吞噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常现巨噬细胞吞噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?,60,61,解题思路,本例目的在于比较三组断面亚硝酸盐氮含量有无差别,在设计类型上,属于成组设计两样本定量资料的比较。原则上对此类资料的假设检验应首先考虑t检验,前边我们介绍了两样本均数的t检验,但两样本均数的t检验

18、要求两个样本必须来自正态总体且总体方差齐同。,62, 1建立检验假设,确定检验水准 H0:三个总体的分布位置相同 H1:三个总体的分布位置不同或不全相同 =0.05,63, 2计算统计量H值 (1)编秩 将各组数据统一由小到大排序并编秩,如遇有相等数值则取平均秩次,如吞噬指数为1.5的有三个,它们的位次为3、4、5取平均秩次为(3+4+5)/3=4。 (2)求秩和 分别将各组秩次相加(即Ri) (3)计算H值,64,当相同秩次较多时(如超过25%),需进行校正值:Hc=H/C,65, 3确定P值,做出推断结论 (1) 当处理组数k为3且每组数小于等于5时,查H界值表(P452), (2)否则,

19、查2界值表(=k-1) 本例P0.05,按=0.05检验水准,拒绝H0,接受H1,可认为不同菌种对小鼠巨噬细胞吞噬指数 的作用不同。,66,二、多组有序变量资料的秩和检验 例106 四种疾病患者痰液内嗜酸性粒细胞的检查结果见表106。问四种疾病患者痰液内嗜酸性粒细胞的等级分布有无差别?,67,68, 1建立检验假设,确定检验水准 H0:四种疾病患者痰液内嗜酸性粒细胞 总体分布相同 H1:四种疾病患者痰液内嗜酸性粒细胞总体分布不同 =0.05,69, 2计算统计量H值 (1)编秩 类似与两样本 (2)求秩和 (3)计算H值,70, 3确定P值,做出推断结论 查2界值表得P0.05,按=0.05检

20、验水准,拒绝H0,接受H1,认为不同疾病患者痰液内嗜酸性粒细胞总体分布不同。,71,第四节 随机化区组设计的秩和检验,72,例10-7 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机相同和智力水平、学习情况相近作为配伍条件,将4名学生分为一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经过相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?,73,74, 1建立检验假设,确定检验水准 H0:四个总体分布相同 H1:四个总体分布不同 =0.05,75, 2计算统计量M值 (1)编秩 将各区组内数据

21、由小到大编秩,遇相同数据求平均秩次。 (2)求各组秩和 (3)计算M值,76,77,教 学 模 式,Level,A,Level,B,Level,C,秩和,Level,D,12,15,23.5,29.5,78,79, 3确定P值,做出推断结论 (1)查P 453 M界值表(b15, k15) 得P0.05,按=0.05检验水准,拒绝H0,接受H1,可认为不同教学方式对学生学习成绩的综合评分有影响。,80,(2)2分布近似法:当处理组数或区组数超出M界值表范围时,81,82,83,数 据 录 入,【电脑实验】,84,85,86,第五节 多个样本间的多重比较,多个样本间的秩和检验只是个趋势性的检验,当推断结论为拒绝H0,接受H1时,只能得出各总体分布不全相同的结论,但不能说明任两个总体分布不同。若要对每两个总体分布做出有无不同的推断,需要做组间的多重比较。,87,以完全随机设计为例,其两两比较的方法有两种: 拆开做两样本比较的秩和检验(注意对检验水准进行校正,类似与卡方分割)。 用正态近似法(适用于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论