诊断试验的评价与ROC分析_第1页
诊断试验的评价与ROC分析_第2页
诊断试验的评价与ROC分析_第3页
诊断试验的评价与ROC分析_第4页
诊断试验的评价与ROC分析_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、临床诊断试验与评价,临床试验的类型,I期临床试验:人体药物的耐受程度,药物在人体中的代谢情况。参加试验的人员是健康人或病人(20左右) II期临床试验:药效、安全性的初步评价。患者参加试验(200例以上) III期临床试验:药效与安全性的确认阶段,我国法规要求试验组人数300以上,总人数400-500人 IV期临床试验:上市后的临床研究。更大范围使用后的疗效与安全性,一、诊断试验的研究设计,随机 对照 重复 伦理 盲法 试验设计中的要素 一、处理因素 二、受试对象 三、试验效应,临床试验避免偏倚的技巧,随机 对照 重复 盲法,临床试验资料的数据集,分析应包括在知情同意的基础上,愿意参加试验的所

2、有随机化后的受试者,也即原计划好处理(治疗)的受试者都需进入分析,而不是根据实际上完成的受试者。 按此原则所作的分析是最好的分析,研究在病人知情同意的前提下,应该考虑参与者的依从性,制定合理的纳入排除标准,要求每一个随机分到试验组或对照组的受试者都应该尽量完整地随访,记录研究结果如疗效、安全性评价指标以及脱离原因。同时,要考虑参与者和不愿意参与者的差异,以及给研究结果带来的偏倚。 意向性分析(Intention to treat) 全分析集(full analysis set, FAS) 安全性评价(safety set,临床有效性的统计学评价,为什么要学习诊断试验的评价,选择最科学合理的诊断

3、方法,循证医学的重要内容 根据实际需要,提供具有优势的诊断试验(试剂、药物、方法,金标准的选择,最为可靠的诊断标准,二、诊断试验的评价指标,诊断实验的灵敏度和特异度不会受到患病率的影响,但是预测值指标会受到患病率高低的影响,阳性预测值的应用,诊断试验的评价指标,二、诊断试验中常用的评价指标:灵敏度、特异度、误诊率、漏诊率 三、预测指标:阳性预测值、阴性预测值 四、诊断试验的综合评价指标:正确率、Youden指数、比数积、阳性似然比、阴性似然比,诊断试验中常用的评价指标,例13.2 表13.2 ECG诊断试验的结果,常用指标有(一)正确百分率、(二)灵敏度、(三)特异度、(四)Youden指数、

4、(五)阳性似然比、(六)阴性似然比、(七)阳性预报值、 (八)阴性预报值,例13.2 表13.2 ECG诊断试验的结果,例13.2 表13.2 ECG诊断试验的结果,例13.2 表13.2 ECG诊断试验的结果,灵敏度与特异度的优缺点,优点:灵敏度与特异度不受患病率的影响,其取值范围均在(0, 1)之间,其值越接近于1,说明其诊断准确性越好。 缺点:当比较两个诊断试验时,单独使用灵敏度或特异度,可能出现矛盾。 解决办法:将两指标结合:Youden指数、阳性似然比、阴性似然比等,例13.2 表13.2 ECG诊断试验的结果,例13.2 表13.2 ECG诊断试验的结果,例13.2 表13.2 E

5、CG诊断试验的结果,医生最关心的问题: 1. 试验阳性时患病的概率多大? 2. 试验阴性时不患病的概率多大? 3. 如何选择合适的诊断界值,做出合理的诊断,使患者获得最好的处理,例13.2 表13.2 ECG诊断试验的结果,例13.2 表13.2 ECG诊断试验的结果,例13.2 表13.2 ECG诊断试验的结果,阳性预报值与阴性预报值,五、 截断点的选择与ROC曲线,在进行诊断临界点选择的时候,需要综合考虑灵敏度和特异度,选择最佳诊断界值。ROC曲线提供了很好的临界点选择工具,ROC【receiver(relative) operating characteristic的缩写,译为“接受者工

6、作特征”】 ROC曲线研究历史 1950s 雷达信号观测能力评价 1960s中期 实验心理学、心理物理学 1970s末与1980s初 诊断医学,ROC的涵义与起源,诊断试验:泛指血液生化、影像学、免疫学、细胞学、病理学、统计模型等检查。 重要性: 1. 循证医学的重要组成部分 2. 诊断试验评价方法可用于: 临床试验评价 临床检验评价 流行病学筛查试验评价 实验室检验评价 统计学模型评价,ROC曲线评价诊断试验的重要性,灵敏度,特异度,假阴性率,假阳性率,Test variable,医学诊断试验多数不能将病例和对照完全分开,而只有将二者100%的分开时,才能够获得100%正确的诊断,不同诊断界

7、值时灵敏度与特异度间的平衡(trade off,0,20,40,60,80,100,50,60,70,80,90,100,特异度,灵敏度,百分率(,Test variable,完美与无用的ROC曲线,真阳性率 即 灵敏度,假阳性率 即 1特异度,机率线(chance line)(diagonal reference line,诊断准确度较低,0.7,0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.6,0.8,1.0,FPR,T,P,R,A,0.664,A,0.830,诊断准确度较高,0.9,0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.

8、6,0.8,1.0,FPR,T,P,R,A,0.938,ROC曲线下面积(Area)与诊断准确度高低 高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F,似然比(LR)在ROC曲线空间的涵义,白细胞计数诊断白血病,LR7.5,LR0.7,LR2.3,LR25.0,基本概念小结,ROC曲线反映了灵敏度与特异度间的平衡 (增加灵敏度将降低特异度;增加特异度将降低灵敏度)。 在ROC曲线空间,如果曲线沿着左边线,然后沿着上边

9、线越紧密,则试验准确度越高。 在ROC曲线空间,如果曲线沿着机会线(45度对角线)越紧密,则试验准确度越低。 在诊断界值(cutpoint)处的正切线的斜率就是该试验值对应的阳性似然比(likelihood ratio,LR)。在ROC曲线空间的左下角LR+最大,随着曲线从左下往右上方移动,LR+逐渐减小。 ROC曲线下面积是重要的试验准确度指标,主要任务: 计算ROC曲线工作点(Coordinate point或Operating point)(FPR, TPR) 连接相邻两点,一、ROC曲线工作点的计算与曲线绘制,连续型数据的ROC曲线工作点(TPR,FPR)计算,将这9个数据从大到小排列

10、,以前8个数,分别作为诊断界值,大于等于诊断界值者判为阳性,小于该值者判为阴性。这样,可整理成8个四格表,表133 假想的连续型数据,有序分类数据的ROC曲线工作点(TPR,FPR)计算,将诊断分类数据按大到小排序,以前4个分类作为诊断界值,大于等于诊断界值者为阳性,小于该值者为阴性。这样,可整理出4个四格表,每个四格表对应的ROC曲线的工作点见下表,2,二、ROC曲线下面积的计算,ROC曲线下面积 (Area) 部分ROC曲线下的面积 FPR为某值对应的TPR值,一) Hanley 和 McNeil非参数法,ROC曲线下面积(Az)就是异常组观察值大于正常组观察值的概率,Mann-Whitn

11、ey U 统计量,Hanley 和 McNeil法ROC曲线下面积与Mann-Whitney U 检验,由秩和检验中的Mann-Whitney U统计量(SPSS等软件均可计算)可计算ROC曲线下面积 零假设H0:总体ROC面积0.5的检验等价于Mann-Whitney U检验,SPSS输出的ROC面积检验P值即为上述Z值对应的概率,Hanley 和 McNeil法ROC曲线下面积与梯形规则(trapezoidal rule,Hanley 和 McNeil法ROC曲线下面积等于所有曲线下梯形(包括最左侧的三角形)面积之和,二)其他ROC曲线下面积计算方法,1. 双正态法 2. 有序回归模型 3

12、. 其他模型(如双Gama法、双指数法,三、ROC曲线下面积的假设检验,单个连续型资料(实例1) 单个有序分类资料(实例2) 两个相关连续型资料(实例3) 两个相关有序分类资料(实例4,二、ROC分析的数据类型,Test variables,实例1:采用骨髓诊断作为金标准,对100例缺铁性贫血疑似患者进行确诊,患该病者为异常组(34例),未患该病者为正常组(66例)。为了考察红细胞平均容积(MCV)诊断缺铁性贫血的效果,测得每一个体的MCV值如下,State Variable,Test Variable,实例1:MCV诊断缺铁性贫血,图4,连续性资料的两组频率分布,0.3,0.2,0.1,0,

13、0.1,0.2,0.3,55,60,65,70,75,80,85,90,95,100,105,组段上限值,异,常,组,频,率,实例1的SPSS输入格式,State Variable 骨髓诊断,Test Variable MCV结果,0正常组1异常组,Value of State Variable:1,SPSS的GraphsROC Curve界面,如果试验测量值越小患病的可能性越大时应改变默认的Options,SPSS输出结果,SPSS输出结果,SPSS输出结果,SPSS输出结果,MCV诊断缺铁性贫血的ROC曲线,0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.6,0

14、.8,1.0,FPR,T,P,R,双正态,机率线,工作点,实例2:某放射医生将已知实际分类的影像,按肯定正常、可能正常、疑似异常、可能异常、肯定异常,分别分为1、2、3、4、5五类,State Variable,Test Variable,Frequency Variable,实例2:放射医生影像分类,图6,单个有序分类资料的两组频率分布,0.5,0.4,0.3,0.2,0.1,0,0.1,0.2,0.3,0.4,0.5,1,2,3,4,5,分类,异,常,组,频,率,实例2的SPSS输入格式,State Variable 组别,Test Variable 诊断分类,0正常组1异常组,Value

15、 of State Variable:1,SPSS的GraphsROC Curve界面,如果试验测量值越小患病的可能性越大时应改变默认的Options,在调用Graphs前,必须先用DataWeight Casesby: 频数,0.8,1.0,FPR,T,P,R,双正态,机率线,工作点,诊断实验的正确应用,1. 以金标准为对照的基础 2. 盲法原则 3. 研究对象选择要具有代表性 4. 对试验对象要有清楚的说明 5. 应说明诊断试验的实用性 6. 需要进行试验的方法要有应用前景,以金标准为对照的基础,金标准 疾病诊断的准确标准 肿瘤的病理诊断 高血压病人的血压 糖尿病人的血糖 对于目前没有诊断

16、金标准的疾病,需要采用传统上认为最为准确的方法作为对照,甚至需要采用不能常规使用的一些能够准确诊断出疾病的方法来进行对比,盲法原则,双盲原则 单盲原则,研究对象选择要具有代表性,选用样本应该和将来诊断方法使用的目标人群一致,对试验对象要有清楚的说明,在研究设计阶段,考虑所试验的方法将来使用的目标人群,达到准确检验方法的诊断效果的目标,需要准确地制定研究的纳入和排除标准。 比如纳入的病人是否有年龄、性别限制 比如纳入的病人是否能够有其它疾病 作为健康组病人应该如何选择 所选择的人群应该和将来方法应用的目标人群尽量一致,应说明诊断试验的实用性,主要是与现有金标准相比的优势 诊断的灵敏度 诊断的特异

17、度 方法的成本 方法的可接受程度,需要进行试验的方法要有应用前景,医生 患者 医疗费用提供者,诊断试验的串联 诊断试验的并联,Data sample13_5; Do group=1,0; Do test_val=1 to 5; Input freq ; Output;end;end; Cards; 3 2 2 11 33 33 6 6 11 2 ; Proc logistic descending; Model group=test_val/ Scale=none outroc=roc1; Freq freq; symbol1 i=join v=none c=blue; proc gplot

18、data=roc1; title ROC Curve sample13_5; plot _sensit_*_1mspec_=1 / vaxis=0 to 1 by .1 cframe=ligr; run; Proc print; Run,The LOGISTIC Procedure Model Information Data Set WORK.SAMPLE13_5 Response Variable group Number of Response Levels 2 Frequency Variable freq Model binary logit Optimization Techniq

19、ue Fishers scoring Number of Observations Read 10 Number of Observations Used 10 Sum of Frequencies Read 109 Sum of Frequencies Used 109 Response Profile Ordered Total Value group Frequency 1 1 51 2 0 58 Probability modeled is group=1. Model Convergence Status Convergence criterion (GCONV=1E-8) sati

20、sfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 152.656 94.735 SC 155.348 100.117 -2 Log L 150.656 90.735,Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 59.9217 1 ChiSq Intercept 1 -3.9137 0.7510 27.1547 .0001 test_val 1 1.1426 0

21、.1957 34.1060 .0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits test_val 3.135 2.136 4.600 Association of Predicted Probabilities and Observed Responses Percent Concordant 84.1 Somers D 0.786 Percent Discordant 5.4 Gamma 0.878 Percent Tied 10.5 Tau-a 0.395 Pairs 2958 c 0.89

22、3,ROC Curve sample13_5 16:47 Tuesday, November 13, 2013 14 Obs _PROB_ _POS_ _NEG_ _FALPOS_ _FALNEG_ _SENSIT_ _1MSPEC_ 1 0.85807 33 56 2 18 0.64706 0.03448 2 0.65853 44 45 13 7 0.86275 0.22414 3 0.38087 46 39 19 5 0.90196 0.32759 4 0.16404 48 33 25 3 0.94118 0.43103 5 0.05891 51 0 58 0 1.00000 1.0000

23、0,Data sample13_3; Input group $ num; Do i=1 to num; Input test_val; Output ; End; Cards; Case 5 16.5 13.5 12.8 11.2 5.0 Control 4 8.5 6.4 4.6 1.7 ; Proc logistic data=sample13_3; Model group=test_val /scale =none outroc=roc1; symbol1 i=join v=none c=blue; proc gplot data=roc1; title ROC Curve sampl

24、e13_3; plot _sensit_*_1mspec_=1 / vaxis=0 to 1 by .1 cframe=ligr; run; Proc print; Run,The LOGISTIC Procedure Model Information Data Set WORK.SAMPLE13_3 Response Variable group Number of Response Levels 2 Model binary logit Optimization Technique Fishers scoring Number of Observations Read 9 Number

25、of Observations Used 9 Response Profile Ordered Total Value group Frequency 1 Case 5 2 Control 4 Probability modeled is group=Case. Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 14.365 10.905 SC 14.563 11.299 -2 Log L 12.365 6.905,Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 5.4607 1 0.0194 Score 4.4156 1 0.0356 Wald 2.6937 1 0.1007 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论