ROC分析方法概要_第1页
ROC分析方法概要_第2页
ROC分析方法概要_第3页
ROC分析方法概要_第4页
ROC分析方法概要_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章ROC曲线分析综述本文首先介绍了ROC理论的一些基本知识,如特异性和敏感性,然后简要介绍了非参数ROC分析方法,并建立了ROC模型。最后介绍了ROC曲线及其在R软件中的绘制。2.1 ROC分析的基本要素ROC分析的基本要素包括真阳性和假阳性,也称为敏感性和特异性,以及“黄金标准”“黄金标准”将受试者的真实状态分为两类:对照组和病例组。常见的金标准包括随访、活检、尸检、手术探查等。尽管“黄金标准”不一定是完美的,但“黄金标准”应该独立于要评估的诊断系统,并且比要评估的诊断系统更可靠。当“金本位”不完善时,可以通过贝叶斯、模糊金本位、EM估计等方法来解决。对于根据“金标准”确定的两类人群,对照组和病例组分别将诊断试验结果表示为阴性和阳性。假设总样本量为n,则诊断测试有四种可能的结果:受试者患病且被正确诊断为患病,受试者无病且被错误诊断为患病,受试者无病且被正确诊断为无病,受试者无病且被错误诊断为患病。我们可以用一个22人的列表来表达他们之间的关系。诊断结果“金本位制”组合仪表病人健康的人积极的a(真阳性)b(假阳性)a b否定c(假阴性)d(真负数)c d总数a cb da b c d=NTPR=aa c FPR=bb d在医学研究中,敏感性和特异性是最常用的诊断测试准确性指标。敏感度,也称为真阳性率(TPR),是在阳性人群中,被检测者患病且被正确诊断为患病的样本量的比例。灵敏度值越大,假阴性率越小。根据表2-1,计算公式为:灵敏度)=真阳性率(TPR)=1假阴性率(FRN)=aa c标准误差:SETPR=ac/(a c)3特异性,也称为真正的非阳性率(TNPR),是指无疾病且被正确诊断为无疾病的受试者的样本量与阴性人群的比例。假阳性率(FPR)=1-特异性特异性值越大,假阳性率越小。根据表2-1,计算公式为:特异性)=真阴性率(TNPR)=1-假阳性率(FPR)=db d标准误差:seppr=BD/(bd)3假设两类人口都服从正态分布,TPR、FPR、TNPR和FNPR之间的关系可以用图2-1来描述。在图中,x=c是截止点(诊断阈值),是假阳性率(FPR),是假阴性率(FNPR)。2.2 ROC准确度评估指标的优势诊断试验的准确性评价指标包括准确率、灵敏度和特异性。虽然他们都可以反映诊断的准确性,但评价效果不是很理想。正确率是正确诊断的病例数和占总数的百分比。计算公式为:正确百分比=100%标准误差为:标准误差修正百分比=a d(b c)/N3正确百分比的不足:1.在很大程度上,这取决于流行率。例如,尽管患病率为5%,但如果所有样本都被判断为健康,则可能有95%的正确百分比。2.受诊断阈值的限制;3.假阳性和假阴性假诊断的比例没有显示,并且不存在唯一性,即使存在两个具有相同正确百分比的群体,也可能存在非常不同的假阳性和假阴性。在此基础上,分别计算灵敏度和特异性,以弥补正确率的不足。如果两个指标的值较高,诊断评价效果会更好。事实上,它不是。在比较诊断系统时,如果单独使用灵敏度和特异性,将会有很大的不足:这两个指标取决于诊断阈值(或截止点),改变诊断阈值可以提高诊断灵敏度,但同时降低特异性;另一方面,如果诊断的特异性增加,则有必要降低灵敏度。另外,也有人提出了尤登指数、正似然比、真阳性率与假阳性率之比、负似然比等概念。尤登指数是指真阳性率和假阳性率之间的差异尤登指数=敏感性特异性-1=真阳性率-假阳性率=TPR-FPR=aa c -bb d标准误差为:塞尤登指数=aca c3 bdb d3正似然比(LR)是真阳性率与假阳性率之比,即灵敏度与(1-特异性)之比,它是对应于ROC曲线工作点的斜率。负似然比(LR-)是假阴性率与真阴性率之比,即(1-敏感性)与特异性之比。这些诊断指标综合考虑了敏感性和特异性,但一个指标只能对应一个诊断阈值。当诊断阈值改变时,会得到不同的指标值,给诊断准确性的比较带来不便。因此,通常选择最大正似然比或尤登指数作为最佳工作点。ROC分析用于评估整个诊断方法的准确性。当诊断阈值改变时,可以同时获得灵敏度和特异性,并且还可以获得TPR和FPR值。ROC曲线以FPR为横坐标,TPR为纵坐标,ROC曲线下的面积测量诊断系统的识别能力。2.3 ROC曲线的构建假阳性率(FPR)作为横坐标,真阳性率(TRP)作为纵坐标,形成一个正方形。ROC操作点标在图上,这些低海拔用线依次连接,构成一条不平滑的ROC曲线。为了构造一条平滑的曲线,需要协商控制组和病例组服从某种分布(如正态分布、伽玛分布等)。),通过曲线拟合技术估计其参数,并通过参数直接生成曲线。无论数据类型如何,曲线都必须通过两点(0,0)和(1,1)。这两点对应于灵敏度=0,特异性=1,灵敏度=1,特异性=0。从理论上讲,诊断实验的TPR=1,FPR=0。完全没有价值的诊断是TPR=FPR。这条线叫做概率线或机会线,也叫做无信息线。ROC曲线直接反映了同一尺度上诊断的准确性,描述了诊断实验对阳性和阴性状态的区分能力。曲线上的每个点都是通过改变其诊断阈值(截止点)获得的,这是灵敏度和特异性之间的折衷。改进诊断标准导致较低的灵敏度和较高的特异性。降低诊断标准会导致更高的灵敏度和更低的特异性。如果比较两种诊断方法的效果,较高的ROC曲线具有更好的诊断性能。如果曲线相交,则计算曲线下的面积,以便进一步比较。ROC曲线下面积(AZ)用于反映诊断测试的准确性,可视为正确决策的概率。该区域的值范围为(0.5,1),且完全无价值的诊断AZ=0.5;完美诊断AZ=1。传统上,ROC曲线下面积为0.50 0.70,诊断准确率低。在0.70和0.90之间,诊断准确度适中。面积大于0.90表示诊断准确性更高。2.4 ROC曲线的拟合方法ROC曲线通过两个不同的群体(正常组和异常组)获得。其横轴和纵轴(假阳性率和真阳性率)有相关性。因此,不能假定它们来自单一群体,也不能用一般的非线性模型来拟合。ROC曲线拟合方法主要包括两种正态模型参数法和非参数法。除了主要的ROC分析方法外,还有有序回归模型(包括位置标度模型、比例优势模型、GEE方法)、COX比例风险模型等。也可以拟合ROC曲线,计算ROC曲线下面积和标准误差。这些模型还考虑了协变量的混杂效应。2.4.1双正态模型的参数方法双正态模型假设正常和异常群体都服从正态分布。目前,该模型在ROC分析方面比较完善,可以处理不同的ROC数据,得到平滑的ROC曲线。当样本量较大且有序分类数大于5时,该模型得到的结果相对可靠。然而,当样本量较小时,双正态模型拟合会产生退化数据,最大似然估计不会迭代收敛。根据“金标准”,受试者被分为正常组和异常组,假设他们分别服从总体平均值0、1(01)和方差02的正态分布n 0、02、N1、12。对于任何诊断阈值(截止点)t,假阳性率为:FPR=Prx0t正常=1- (t- 0 0)真正的阳性率是:TPR=Prx1t异常=1- (t- 1 1)其中x0和x1分别代表正常组和异常组的实验测量值或有序分类;t是截止点,实验测量值xt为正,xt为负。()是标准正态累积分布函数。让t= 0 0-1 (1-FPR),然后:TPR=1-0101-1 FPR如果A= 1- 0 1,B= 0 1,则上述公式可写成:TPR=b-1 FPR,0FPR1其中-1是标准正常偏差值。整个ROC曲线下的面积为:AZ=a1 B2参数A和B由最大似然估计。2.4.2非参数ROC拟合方法非参数方法主要包括汉利和麦克尼尔方法、德隆和克拉克-皮尔逊方法。非参数方法对正常组和异常组的分布没有要求。它们能充分利用所有截断点,对连续样本量没有显著影响,不会导致计算结果不收敛。当截止点(或有序分类)大于5时,结果是理想的。当截止点持续增加时,ROC曲线将逐渐接近平滑的参数曲线。汉利和麦克尼尔非参数方法假设正常组中观察值的数量为n0,则记录为x1j (j=1,2,n0);异常组中观察值的数量为n1,记录为X0i (I=1,2,N1)。异常组的观察值较大。根据威尔克森曼-惠特尼统计,ROX曲线下面积等于异常组的每个观察值大于正常组的每个观察值的概率。也就是说,AZ=1n1n0j=1n0i=1n1(x0i,x1j)x0i,x1j=1 x1j x0i 0.5 x1j=x0i 0 x1j x0i阿兹的标准误差是:SEAZ=AZ1-AZ n1-1 Q1-AZ2N 0-1Q 2-AZ2N 1N 0其中Q1是两个随机跟随的异常组观察比一个随机选择的正常组观察更可能被分类为异常的概率。Q2是一个随机跟随的异常组观察值,它比随机选择的正常组观察值更可能被归类为异常。2.5基于非参数方法的ROC分析基于本文实证分析中使用的非参数方法的ROC模型,本文将主要介绍非参数方法的ROC分析。2.51秩变量的非参数ROC分析在正常情况下,诊断系统获得的原始数据记录有两种形式:离散和连续。许多用于生物医学诊断测试的测量工具是连续的,例如血清抗原和酶浓度。医学成像诊断测试的诊断结果是离散的。对于不同的形式,ROC曲线的估计方法是相同的,我们以离散诊断结果为例。如果诊断指标按顺序分为k类,k=1,其中,类别1表示根本没有疾病,类别K表示肯定有疾病。假设每个分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论