SAS软件应用之一致性检验kappa.ppt_第1页
SAS软件应用之一致性检验kappa.ppt_第2页
SAS软件应用之一致性检验kappa.ppt_第3页
SAS软件应用之一致性检验kappa.ppt_第4页
SAS软件应用之一致性检验kappa.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第22章 一致性检验kappa,学习目标,熟悉Kappa值的判断标准; 掌握Kappa值的计算以及检验方法; 掌握二分类资料和有序分类资料的一致性分析;,Kappa检验,在诊断试验中,研究者希望考察不同的诊断方法在诊断结果上是否具有一致性。诊断试验的一致性检验经常用于下列两种情况:一种是评价新的诊断试验方法与金标准的一致性;另一种是评价两种诊断试验方法对同一个样本或研究对象的化验结果的一致性、两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性等。1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明,它是一个描述诊

2、断的一致性较为理想的指标,因此在临床试验中得到广泛的应用。,Kappa检验,Kappa是评价一致性的测量值。检验是否沿对角线格子中的计数(接收比率一样的零件)与那些仅是偶然的期望不同。设Po =对角线单元中观测值的总和,Pe=对角线单元中期望值的总和。则Kappa =(Po - Pe)/(1 - Pe)。Kappa是测量而不是检验。其大小用一个渐进和标准误差构成的t统计量决定。一个通用的经验法则是Kappa大于0.75表示好的一致性(Kappa最大为1);小于0.4表示一致性差。Kappa不考虑评价人间的意见不一致性的程度,只考虑他们一致与否。,Kappa检验,对于用Kappa值判断一致性的建

3、议参考标准为: Kappa =+1,说明两次判断的结果完全一致; Kappa =-1,说明两次判断的结果完全不一致; Kappa =0,说明两次判断的结果是机遇造成; Kappa0,此时说明有意义,Kappa愈大,说明一致性愈好; Kappa0.75,说明已经取得相当满意的一致程度; Kappa0.4,说明一致程度不够理想;,二分类资料一致性分析,前面我们已经介绍四格表资料的2检验,本节需要介绍的是Kappa检验。那么Kappa检验与配对2检验有什么区别呢?Kappa检验重在检验两者的一致性,配对2检验重在检验两者间的差异。对同一样本数据,这两种检验可能给出矛盾的结论。主要原因是两者对所提供的

4、有统计学意义的结论要求非常严格所致。,KAPPA值的计算及检验,对两法测定结果一致部分进行检验,看一致部分是否是由偶然因素影响的结果,它叫做“一致性检验”,也称Kappa检验。说明两种方法测定结果的实际一致率与随机一致率之间的差别是否具有显著性意义。需要计算反映两法一致性程度高低的系数,叫做Kappa统计量。具体公式如下: P0为实际一致率,Pe为理论一致率。,KAPPA值的计算及检验,Kappa是一个统计量,也有抽样误差,其渐进标准误(ASE)。由于uKappa/ASE近似服从标准正态分布,故可借助正态分布理论。H0:Kappa0,H1:Kappa0。如果拒绝H0认为两种方法具有较高的一致性

5、。,KAPPA值的计算及检验,在诊断试验的研究中,数据资料多为双向有序的列联表资料,即两个变量都是有序变量,而且属性相同。属性相同分为三种情况,一种情况是属性、分级水平数和分级水平都完全相同。如甲医生和乙医生都把病人的检查结果分为1、2、3、4四个等级。此时可直接作Kappa检验。当这两个变量都只有2个水平时,就成为配对设计的四格表资料,可使用配对2检验,即McNemar检验。,KAPPA值的计算及检验,第二种是属性相同的分级水平数相同,但分级水平不全相同。如甲医生和乙医生都把病人的检查结果分为四个等级,但甲医生的分级为1、2、3、4,而乙医生的分级为2、3、4、5。在这种情况下,由于列联表的

6、行数和列数仍然是一致的,即列联表仍为方表,所以也可计算出相应的Kappa统计量。第三种是属性相同,但分级水平数和分级水平不全相同。这种情况就是我们所说的列联表的行列数不一致。由于收集上来的数据不能轻易删除掉,所以我们考虑添加行或列使联表成为方表。如行数为n,例数为n-1,则我们只需要添加第n列,在第n行第n列的格点中添加权值0001,而第n行的其它格点均设为0,就可以命名其成为方表,并计算Kappa统计量了。由于权值系数很小,所以不会影响Kappa值的计算结果。,KAPPA值的计算及检验,另一方面,如果两个变量中有一个变量是金标准,那么我们不但能分析出检验结果的一致性,还可以计算出敏感度、特异

7、度、误诊率和漏诊率等指标。如果有不同的诊断分界点,还可以绘制出ROC曲线。 诊断试验的评价在医学研究中具有十分重要的意义,目前大多数文献都使用Kappa统计量来检验结果的一致性。所以本研究主要是对Kappa系数作一个探讨和分析。诊断试验评价的统计学方法还会随着更多问题的提出和解决而不断得到发展、修正和扩展。,有序分类资料一致性分析,RC表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。 双向无序RC表 RC表中两个分类变量皆为无序分类变量,对于该类资料:若研究目的为多个样本率(或构成比)的比较,可用行列表资料的2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切

8、程度时,可以用行列表资料的2检验以及Pearson列联系数进行分析。,有序分类资料一致性分析,单向有序RC表 有两种形式。一种是RC表中的分组变量是有序的,而指标变量是无序的。此种单向有序RC表资料可用行列表资料的2检验进行分析。另一种情况是RC表中的分组变量是无序的,而指标变量是有序的,此种单向有序RC表资料宜用秩和检验进行分析。,有序分类资料一致性分析,双向有序属性不同的RC表 RC表中的两分类变量皆为有序且属性不相同。对于该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。 双向有序属性相同的RC表中的两分类变量皆为有序且属性相同。实际上是22配对设计

9、的扩展,此时宜用一致性检验(或称Kappa检验)。 所以,对于双向有序且属性相同的数据,我们可以采用Kappa检验判断其一致性。,本章小节,1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明,它是一个描述诊断的一致性较为理想的指标,因此在临床试验中得到广泛的应用。Kappa是评价一致性的测量值。检验是否沿对角线格子中的计数(接收比率一样的零件)与那些仅是偶然的期望不同。设Po =对角线单元中观测值的总和,Pe=对角线单元中期望值的总和。则Kappa =(Po - Pe)/(1 - Pe)。Kappa是测量而不是检验。其大小用一个渐进和标准误差构成的t统计量决定。一

10、个通用的经验法则是Kappa大于0.75表示好的一致性(Kappa最大为1);小于0.4表示一致性差。,本章小节,对两法测定结果一致部分进行检验,看一致部分是否是由偶然因素影响的结果,它叫做“一致性检验”,也称Kappa检验。说明两种方法测定结果的实际一致率与随机一致率之间的差别是否具有显著性意义。,本章小节,SAS过程中也是用FREQ过程进行一致性检验,只需要在TABLES语句中添加agree选项即可输出Kappa值,但是要进行一致性检验,需要编写其它程序语句。双向有序属性相同的RC表中的两分类变量皆为有序且属性相同。实际上是22配对设计的扩展,此时宜用一致性检验(或称Kappa检验)。,第

11、23章 概率抽样方法,学习目标,掌握简单随机抽样及SAS程序; 掌握系统(机械、等距)抽样及SAS程序; 掌握分层抽样及SAS程序; 掌握整群抽样及SAS程序。,概述,抽样调查可以分为两类,即概率抽样和非概率抽样。概率抽样是按照随机原则进行抽样,不加主观因素,组成总体的每个单位都有被抽中的概率(非零概率),可以避免样本出现偏差,样本对总体有很强的代表性。非概率抽样是按主观意向进行的抽样(非随机的),组成总体的很大部分单位没有被抽中的机会(零概率),使调查很容易出现倾向性偏差。,概述,现代被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重

12、要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。,概述,概率抽样的原则,就是总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。,概述,抽样调查按抽样的组织形式划分,有以下几种主要方法: 简单随机抽样:按照等概率的原则,直接从含有N个元素的总体中抽取n个元素组成的样本(Nn)。 系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然

13、后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。,概述,K(抽样距离)=N(总体规模)/n(样本规模) 前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。,概述,分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。 分层抽样

14、是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。,概述,分层标准为: 以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。 以那些有明显分层区分的变量作为分层变量。,概述,分层的比例问题: 按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,

15、则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。,概述,整群抽样:抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。 优点:简便易行、节省费用,特别是在总体抽样框难以确定的情况下非常适合。 缺点:样本分布比较集中、代表性相对较差。 一般来说,类别相对较多、每一类中个体相对较少的做法效果较好。,概述,多阶抽样(分段抽样):按照元素的隶属关系后层次关系,把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体

16、分布的范围特别广时。 二重抽样(又称两相抽样):就是先抽取一个容量比较大的初始样本,用初始样本估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为“总体”,从中抽取容量合适的样本进行比较详细的调查。特点是,适合用于对总体信息了解比较少的调查。,概述,比率抽样(PPS抽样):就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。,概述,在抽样调查的实际工作中,经常是要将几种抽样方法结合起来应用。比如,城市居民的收支调查,是将二重抽样、多阶段抽样、分

17、层抽样、机械抽样等多种方法结合起来使用。 在现实的商业性的市场调查中也有非概率抽样的应用。如,配额抽样、随意抽样、志愿者抽样、判断抽样、修正的概率抽样和滚雪球抽样等等,由于这些抽样方法容易出现偏差,所以只在对共性特别强的群体的商业性调查中应用。,简单随机抽样及SAS程序,SAS系统中利用SURVEYSELECT过程步进行简单随机抽样。 SURVEYSELECT过程的语法格式如下: PROC SURVEYSELECT DATA= OUT= METHOD= SAMPSIZE= SAMPRATE= REP= SEED= NOPRINT; ID variable; RUN;,简单随机抽样及SAS程序,

18、DATA语句指定要分析的数据集名及一些选项; OUT选择项指定输出结果的SAS数据集名,用来保存抽样输出的结果; METHOD选择项指定抽样方法,其中SRS(simple random sampling)为简单随机抽样,SYS(system random sampling)为系统随机抽样,等等; SAMPSIZE选择项指定需要抽样的样本量;,简单随机抽样及SAS程序,REP选择项指定可以重复抽样的次数; SAMPRATE选择项指定抽样的比例; SEED选择项指定产生随机随机数字的初始数,缺省是0或负值; NOPRINT选择项指定不对输出结果进行打印; ID语句指定数据集中需要包含的变量指标。,

19、系统(机械、等距)抽样及SAS程序,把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。在SURVEYSELECT过程步中,只需要将METHOD选择项设定为SYS(systematic random sampling)即可,通过CONTROL语句设定某个变量作为抽样距离参考变量,即抽样之前按照CONTROL变量对原始样本进行排序,然后按照规定的样本量确定抽样距离,随机选取第一个样本并进行系统抽样。,整群抽样及SAS程序,整群抽样抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的

20、所有元素构成调查的样本。把“成群的个体”当作个体来看待,那么整群抽样与简单随机抽样的原理就是一样的。,多阶抽样及SAS程序,是将总体分成若干小的群体,但并不在每一小的群体中抽取一个样本,而是将这些小群体称为第一性抽样单元,将它们看作个体进行抽样,然后,再对抽中的第一性抽样单元中的个体抽样,这样的抽样当然可以不止二阶而是多阶的,先抽第一性样单元,再在第一性样单元钟抽第二性样单元,再在第二性样单元中抽第三性样单元,如此直至最基层的个体。,多阶抽样及SAS程序,当总体中个体数量太大,或其他技术上的原因,无法直接对个体编号时,可以采用多阶抽样,先按第一性单元编号,抽取若干个,再在抽得的第一性单元内编号,抽取下一级单元。多阶抽样会使现场观测的样本单元比较集中,有利于节省调查费用。 多阶抽样的SAS程序也是以简单随机抽样和系统性抽样为基础的,只是每一次抽样过程编写一个SAS程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论