特异度敏感度.docx_第1页
特异度敏感度.docx_第2页
特异度敏感度.docx_第3页
特异度敏感度.docx_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

真阳性TP金标准认定患有某种疾病,并且试验也认为患有某种疾病; 真阴性TN金标准认定不患有某种疾病,并且试验也认为不患有该种疾病的情况;假阳性FP金标准认定不患有某种疾病,但是试验认为患有该种疾病;假阴性FN金标准认定患有某种疾病,但是试验认为不患有该种疾病。TP:与金标准一样的TN:不是这个病FP:误诊FN:漏诊正确率(Accuracy)又称符合率,是试验所检出的真阳性和真阴性例数之和占总例数的百分比。它反映试验结果与金标准诊断结果的符合程度。计算方法为(TP+TN)/(TP+TN+FP+FN)。灵敏度(Sensitivity),又称真阳性率,召回率,指金标准确诊的病例被试验判为阳性的百分比。它可衡量试验正确地识别患某病者的能力。计算方法为TP/(TP+FN)。召回率又称查全率,是指正确是被的实体个数占测试集中所有实体个数的比例。漏诊率,又称假阴性率(False negative rate),指金标准确诊的病例被试验错判为阴性的百分比。漏诊率=1-灵敏度。特异度(Specificity),又称真阴性率,指金标准确诊的非病例被试验判为阴性的百分比。它可衡量试验正确地识别非病例的能力。计算方法为TN/(FP+TN)。或1-假阳性率。它反映筛检试验确定非病人的能力。误诊率,又称假阳性率(false positive rate),指金标准确诊的非病例被试验错判为阳性的百分比。误诊率=1-特异度。Precision = TP/TP+FP, 精度是真属于x类的元素在所有属于x类的元素中的比例。精度是指正确识别的实体个数占所有被识别实体个数的比例。正确识别的个数/正确识别的个数+错误识别的个数F值(F-measure)通过精度和召回率的加权平均,将前两个度量值融为一个度量值,其中是精度和召回率的相对权重。当1时,精度比召回率重要;当1时,召回率比精度重要。一般情况下,取=1,即认为精度和召回率同等重要。F=P*R*(2+1)R+2*PThe confusion matrix is more commonly named contingency table. In our case we have two classes, and therefore a 2x2 confusion matrix, the matrix could be arbitrarily large. The number of correctly classified instances is the sum of diagonals in the matrix; all others are incorrectly classified (class a gets misclassified as b exactly twice, and class b gets misclassified as a three times).The True Positive (TP) rate is the proportion of examples which were classified as class x, among all examples which truly have class x, i.e. how much part of the class was captured. It is equivalent to Recall. In the confusion matrix, this is the diagonal element divided by the sum over the relevant row, i.e. 7/(7+2)=0.778 for class yes and 2/(3+2)=0.4 for class no in our example.真阳性率=召回率=灵敏度,是被分成x类的元素在所有例子中真属于x类的比例The False Positive (FP) rate is the proportion of examples which were classified as class x, but belong to a different class, among all examples which are not of class x. In the matrix, this is the column sum of class x minus the diagonal element, divided by the rows sums of all other classes; i.e. 3/5=0.6 for class yes and 2/9=0.222 for class no.假阳性率是被分成属于x类的,但是实际属于其他类的元素,与所有不属于x类的元素的比例The Precision is the proportion of the examples which truly have class x among all those which were classified as class x. In the matrix, this is the diagonal element divided by the sum over the relevant column, i.e. 7/(7+3)=0.7 for class yes and 2/(2+2)=0.5 for class no.精度是真属于x类的元素在所有属于x类的元素中的比例The F-Measure is simply 2*Precision*Recall/(Precision+Recall), a combined measure for precision and recall.PPV也叫做precisionRelated calculations False positive rate () =type I error= 1 specificity = FP / (FP + TN) = 180 / (180 + 1820) = 9% False negative rate () =type II error= 1 sensitivity = FN / (TP + FN) = 10 / (20 + 10) = 33% Power= sensitivity = 1 Likelihood ratiopositive = sensitivity / (1specificity) = 66.67% / (191%) = 7.4 Likelihood ratio negative = (1sensitivity) / specificity = (166.67%) / 91% = 0.37似然比(likelihood ratio, LR) 是反映真实性的一种指标,属于同时反映灵敏度和特异度的复合指标。即有病者中得出某一筛检试验结果的概率与无病者得出这一概率的比值。该指标全面反映筛检试验的诊断价值,且非常稳定。似然比的计算只涉及到灵敏度与特异度,不受患病率的影响。因检验结果有阳性与阴性之分,似然比可相应地区分为阳性似然比(positive likelihood ratio, +LR)和阴性似然比(negative likelihood ratio, LR)。阳性似然比是筛检结果的真阳性率与假阳性率之比。说明筛检试验正确判断阳性的可能性是错误判断阳性可能性的倍数。比值越大,试验结果阳性时为真阳性的概率越大。阴性似然比是筛检结果的假阴性率与真阴性率之比。表示错误判断阴性的可能性是正确判断阴性可能性的倍数。其比值越小,试验结果阴性时为真阴性的可能性越大。分类是一种重要的数据挖掘算法。分类的目的是构造一个分类函数或分类模型(即分类器),通过分类器将数据对象映射到某一个给定的类别中。分类器的主要评价指标有准确率(Precision)、召回率(Recall)、Fb-score、ROC、AOC等。准确率(Precision) 和召回率(Recall)是信息检索领域两个最基本的指标。准确率也称为查准率,召回率也称为查全率。它们的定义如下:Precision=系统检索到的相关文件数量/系统检索到的文件总数量Recall=系统检索到的相关文件数量/系统所有相关文件数量Fb-score是准确率和召回率的调和平均:Fb=(1+b2)*P*R/(b2*P+R),比较常用的是F1。在信息检索中,准确率和召回率是互相影响的,虽然两者都高是一种期望的理想情况,然而实际中常常是准确率高、召回率就低,或者召回率低、但准确率高。所以在实际中常常需要根据具体情况做出取舍,例如对一般搜索的情况是在保证召回率的情况下提升准确率,而如果是疾病监测、反垃圾邮件等,则是在保证准确率的条件下,提升召回率。但有时候,需要兼顾两者,那么就可以用F-score指标。ROC和AUC是评价分类器的指标。ROC是受试者工作特征曲线 receiver operating characteristic curve ) 的简写,又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已1。ROC是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线。AUC是ROC曲线下面积(Area Under roc Curve)的简称,顾名思义,AUC的值就是处于ROC curve下方的那部分面积的大小。通常,AUC的值介于0.5到1.0之间,AUC越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。为了解释ROC的概念,让我们考虑一个二分类问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被预测成正类,即为真正类(True positive),如果实例是负类被预测成正类,称之为假正类(False positive)。相应地,如果实例是负类被预测成负类,称之为真负类(Truenegative),正类被预测成负类则为假负类(falsenegative)。列联表或混淆矩阵如下表所示,1代表正类,0代表负类。基于该列联表,定义敏感性指标为:sensitivity=TP/(TP+FN)。敏感性指标又称为真正类率(truepositive rate ,TPR),刻画的是分类器所识别出的正实例占所有正实例的比例。另外定义负正类率(false positive rate, FPR),计算公式为:FPR=FP/(FP+TN).负正类率计算的是分类器错认为正类的负实例占所有负实例的比例定义特异性指标为:Specificity=TN/(FP+TN)=1-FPR。特异性指标又称为真负类率(True Negative Rate,TN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论