spss之roc曲线-【word】可编辑_第1页
spss之roc曲线-【word】可编辑_第2页
spss之roc曲线-【word】可编辑_第3页
spss之roc曲线-【word】可编辑_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、莇艿薈羈芃芈蚀螁腿莇螂羆肅莆蒂蝿羁莅薄羄莀莄螆袇芆莃衿肃膂莃薈袆肈莂蚁肁羄莁螃袄芃蒀蒃聿腿葿薅袂肅蒈螇肈肁蒇袀羀荿蒇蕿螃芅蒆蚂罿膁蒅螄螂肇蒄蒄羇羃薃薆螀节薂蚈羅膈薁袀螈膄薁薀肄肀薀蚂袆莈蕿螅肂芄薈袇袅膀薇薇肀肆芄虿袃羂芃螁聿芁节蒁袁芇芁蚃膇膃芀螆羀聿艿袈螂莇艿薈羈芃芈蚀螁腿莇螂羆肅莆蒂蝿羁莅薄羄莀莄螆袇芆莃衿肃膂莃薈袆肈莂蚁肁羄莁螃袄芃蒀蒃聿腿葿薅袂肅蒈螇肈肁蒇袀羀荿蒇蕿螃芅蒆蚂罿膁蒅螄螂肇蒄蒄羇羃薃薆螀节薂蚈羅膈薁袀螈膄薁薀肄肀薀蚂袆莈蕿螅肂芄薈袇袅膀薇薇肀肆芄虿袃羂芃螁聿芁节蒁袁芇芁蚃膇膃芀螆羀聿艿袈螂莇艿薈羈芃芈蚀螁腿莇螂羆肅莆蒂蝿羁莅薄羄莀莄螆袇芆莃衿肃膂莃薈袆肈莂蚁肁羄莁螃袄芃蒀蒃聿

2、腿葿薅袂肅蒈螇肈肁蒇袀羀荿蒇蕿螃芅蒆蚂罿膁蒅螄螂肇蒄蒄羇羃薃薆螀节薂蚈羅膈薁袀螈膄薁薀肄肀薀蚂袆莈蕿螅肂芄薈袇袅膀薇薇肀肆芄虿袃羂芃螁聿芁节蒁袁芇芁蚃膇膃芀螆羀聿艿袈螂莇艿薈羈芃芈蚀螁腿莇螂羆肅莆蒂蝿羁莅薄羄莀莄螆袇芆莃衿肃膂莃薈袆肈莂蚁肁羄莁螃袄芃蒀蒃聿腿葿薅袂肅蒈螇肈肁蒇袀羀荿蒇蕿螃芅蒆蚂罿膁蒅螄螂肇蒄蒄羇羃薃薆螀节薂蚈羅膈薁袀螈膄薁薀肄肀薀蚂袆莈蕿螅肂芄薈袇袅膀薇薇肀肆芄虿袃羂芃螁聿芁节蒁 spss 之roc曲线(一) roc曲线的概念受试者工作特征曲线(receiver operator characteristic curve, roc曲线),最初用于评价雷达性能,又称为接收者操作特

3、性曲线。roc曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析。roc曲线的评价方法与传统的评价方法不同,无须此限制,而是根据实际情况,允许有中间状态,可以把试验结果划分为多个有序分类,如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。因此,roc曲线评价方法适用的范围更为广泛。(二)roc曲线的主要作用1.roc曲线能很容易地查出任意界限值时的对疾病的识别能力。2.选择最佳的诊断界限值。roc曲线越靠近左上角,试验的准确性就越高

4、。最靠近左上角的roc曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。3.两种或两种以上不同诊断试验对疾病识别能力的比较。在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的roc曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的roc曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的roc曲线下的面积(auc)进行比较,哪一种试验的auc最大,则哪一种试验的诊断价值最佳。(三)roc曲线分析的主要步骤1.roc曲线绘制。依据专业知识,对疾病组和参照组测定结果进行分析,确定测定值的上下限、组距以及截断点(cut-off point),按选择的组距间隔列出累积频数分布

5、表,分别计算出所有截断点的敏感性、特异性和假阳性率(1-特异性)。以敏感性为纵坐标代表真阳性率,(1-特异性)为横坐标代表假阳性率,作图绘成roc曲线。2.roc曲线评价统计量计算。roc曲线下的面积值在1.0和0.5之间。在auc0.5的情况下,auc越接近于1,说明诊断效果越好。auc在0.50.7时有较低准确性,auc在0.70.9时有一定准确性,auc在0.9以上时有较高准确性。auc0.5时,说明诊断方法完全不起作用,无诊断价值。auc0.5不符合真实情况,在实际中极少出现。3.两种诊断方法的统计学比较。两种诊断方法的比较时,根据不同的试验设计可采用以下两种方法:当两种诊断方法分别在

6、不同受试者身上进行时,采用成组比较法。如果两种诊断方法在同一受试者身上进行时,采用配对比较法。(四)roc曲线的优点 该方法简单、直观,通过图示可观察分析方法的临床准确性,并可用肉眼作出判断。roc曲线将灵敏度与特异性以图示方法结合在一起,可准确反映某分析方法特异性和敏感性的关系,是试验准确性的综合代表。roc曲线不固定分类界值,允许中间状态存在,利于使用者结合专业知识,权衡漏诊与误诊的影响,选择一更佳截断点作为诊断参考值。提供不同试验之间在共同标尺下的直观的比较,roc曲线越凸越近左上角表明其诊断价值越大,利于不同指标间的比较。曲线下面积可评价诊断准确性。roc(receiver opera

7、ting characteristic)曲线,用于二分类判别效果的分析与评价.一般自变量为连续变量,因变量为二分类变量.基本原理是:通过判断点(cutoff point/cutoff value)的移动,获得多对灵敏度(sensitivity)和误判率(1-specificity(特异度),以灵敏度为纵轴,以误判率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大,判断价值越高.灵敏度:就是把实际为真值的判断为真值的概率.特异度:就是把实际为假值的判断为假值的概率.误判率:就是把实际为假值的判断为真值的概率,其值等于1-特异度.将绘成的曲线与斜45度的直线对比,若差不多重合,说明自变量对

8、因变量的判断价值很差,若越远离斜45度的直线即曲线下的面积越大,说明自变量对因变量的判断价值越好,即根据自变量可以较为正确的判断因变量.使用spss的操作过程如下:graphs/roc curve:test variable选自变量(连续型变量),state varibale选因变量(二分类变量)display的选项一般全选.运行结果:1.roc曲线,可直观地看到曲线形状.2.area under the curve:曲线下方的面积,包括面积值,显著性分析,置信区间.3.coordinates of the curve:roc曲线各点对应的灵敏度和误判率.一般来说,如不做特殊考虑,一般以约登指

9、数最大,即使(灵敏度特异度1)达到最大所对应的值为最佳诊断界值。可以把spss求出的所有界点的灵敏度和特异度导出为excel格式,然后求出所有界点的(灵敏度特异度)的值,找出最大值,其所对应的诊断指标的值即为最佳诊断界值。这是目前国内文献用得最多的求最佳诊断界值的方法。求出最佳诊断界值后,还可以反过来根据该最佳诊断界值求出诊断指标的特异度和灵敏度,以验证该最佳诊断界值的诊断效果。spss15.0作图结果:(只能进行roc曲线下面积auc的非参数估计,以及找出最佳工作点,使用该软件的感觉有点像matlab,有两个窗口,个人感觉该软件功能很强大,只是软件的下载很费事,要下载相应的算号器。在安装的过

10、程中,使用算号器破解。)1:建立数据表(filenewdata)输入数据,数据表的界面如图二,可以在data view(修改数据的数值) 和 variable view(修改数据的类型)之间切换。2:analyzeroc curvetest variable(选择你的测试值,可以有多个,本例为test1、test2、和test3的比较,故选择3个值),state variable(选择测试结果值,本例为diagnosis)value state(判断正确的取值,本例为1)disply的选项全选。在output窗口可以得到如图所示的曲线。 薂袇袂芄螇螃袁莆薀虿袀蒈莃羈罿膈蕿袄羈芀莁螀羈蒃薇螆羇膂蒀蚂羆芅蚅羁羅莇蒈袇羄葿蚃螃羃腿蒆虿肂芁蚂薅肂莄蒅袃肁肃蚀衿肀芆薃螅聿莈螈蚁肈蒀薁羀肇膀莄袆肆节蕿螂膆莄莂蚈膅肄薈薄膄膆莀羂膃荿蚆袈膂蒁葿螄膁膁蚄蚀膀芃蒇罿膀莅蚃袅艿蒈蒅螁芈膇蚁蚇袄莀蒄蚃袃蒂蝿羁袃膂薂袇袂芄螇螃袁莆薀虿袀蒈莃羈罿膈蕿袄羈芀莁螀羈蒃薇螆羇膂蒀蚂羆芅蚅羁羅莇蒈袇羄葿蚃螃羃腿蒆虿肂芁蚂薅肂莄蒅袃肁肃蚀衿肀芆薃螅聿莈螈蚁肈蒀薁羀肇膀莄袆肆节蕿螂膆莄莂蚈膅肄薈薄膄膆莀羂膃荿蚆袈膂蒁葿螄膁膁蚄蚀膀芃蒇罿膀莅蚃袅艿蒈蒅螁芈膇蚁蚇袄莀蒄蚃袃蒂蝿羁袃膂薂袇袂芄螇螃袁莆薀虿袀蒈莃羈罿膈蕿袄羈芀莁螀羈蒃薇螆羇膂蒀蚂羆芅蚅羁羅莇蒈袇羄葿蚃螃羃腿蒆虿肂芁蚂薅肂莄蒅袃肁肃蚀衿肀芆薃螅聿莈螈蚁肈蒀薁羀

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论