版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章诊断试验与筛检试验预防医学第一页,共80页。案例1心力衰竭是多种心脏疾病晚期共同表现出的一种综合征,是心源性死亡的重要原因。B型利钠肽(BNP)、心房利钠肽(ANP)、N-末端ANP(NT-ANP)是人体内重要的心脏激素,研究显示,充血性心力衰竭时,血浆BNP、ANP和NT-ANP浓度升高。通过放射免疫法检测三项指标的血浆浓度变化对心力衰竭有诊断价值。图1是测定三种不同利钠肽的血浆浓度水平和后前位X线胸片测心胸比例(CTR)对诊断心力衰竭效能的ROC曲线比较。BNP、ANP、NT-ANP和CTR的ROC曲线下面积分别为0.96、0.93、0.89和0.79。第二页,共80页。
图1三种利钠肽浓度和后前位X线胸片测心胸比例对诊断心力衰竭效能的ROC曲线(CowieMR,etal.Lancet,1997;350:1349-53)作为一名医生,你认为何项指标是最佳诊断的指标?第三页,共80页。神经母细胞瘤(NB)是最常见的儿童恶性肿瘤之一,它可产生于自主神经系统的各个神经网络(肾上腺髓质最为常见),但其发病率较低(英国每年患此病的人不足100例)。目前,超过50%的NB在诊断时已从原发部位扩散,过去20年中,该病的生存状况并未改善。本病预后取决于患儿年龄和疾病诊断的阶段,疾病发现越早,预后越好。检测尿中儿茶酚胺(VMA)及其代谢产物的含量可对该病进行筛查。案例2第四页,共80页。目前在英国尚未确立神经母细胞瘤的筛查方案,但该病的筛查方案已在日本实施。神经母细胞瘤有自发消退的可能,筛查可能会导致过度诊断。如何建立一个研究以探讨在英国实行神经母细胞瘤筛检的价值?第五页,共80页。学习目的定义诊断和筛检,比较诊断试验与筛检试验有何不同;学会计算试验评价的各种指标;应用真实性、可靠性和收益等指标评价诊断试验和筛检试验;列举和讨论试验结果阳性截断值的选定方法及注意的问题;讨论患病率、灵敏度、特异度及预测值等各类指标的相互关系;了解提高试验效率的方法。第六页,共80页。第一节概述第二节诊断试验与筛检试验的评价第三节提高试验效率的方法内容第七页,共80页。一、概念筛检(screening)是运用快速、简便的检验、检查或其它措施,在健康的人群中,发现那些表面健康,但可疑有病或有缺陷的人。筛检也称筛查,筛检所用的各种手段和方法称为筛检试验(screeningtest),它可以是体检、实验室检查和问卷调查等。
第一节概述第八页,共80页。筛检试验只是将人群中可疑有病或有缺陷者(试验阳性者)与那些可能无病者(试验阴性者)区分开来,仅是一个初步的检查,对筛检结果阳性或可疑阳性者需进一步做确诊检查,对确诊者还需进行治疗。第九页,共80页。图2筛检试验流程图
(引自:连志浩《流行病学》北京医科大学,北京,1989)第十页,共80页。筛检的目的1.疾病的二级预防,早发现、早诊断、早治疗。如乳腺癌等筛检。2.疾病的一级预防,高危人群,采取相应的干预措施。例如筛检高血压预防脑卒中。3.识别疾病的早期阶段,帮助了解疾病的自然史,揭示疾病的“冰山现象”。4.合理分配卫生资源。第十一页,共80页。是指在临床上医务人员通过详尽的检查及调查等方法收集各种信息,经过整理加工后对病人病情的基本认识和判断。据此制定下一步的治疗或干预方案,完成救治任务。
诊断(diagnosis)第十二页,共80页。用于诊断的各种检查及调查的方法称诊断试验(diagnostictest)。诊断试验的含义是广泛的,它既包括各种实验室检查,也包括放射线、B超等物理检查手段,还包括病史、体检等临床资料。
第十三页,共80页。诊断的主要目的是对病人病情做出及时、正确的判断,以便采取相应有效的治疗措施。此外,还可应用诊断试验进行病例随访,确定疾病的转归、判断疗效和估计预后以及监测治疗的副作用等。第十四页,共80页。二、应用原则筛检的应用原则
1.被筛检的疾病或缺陷是当地重大的卫生问题。2.对被筛检的疾病或缺陷有进一步确诊的方法与条件。3.对发现并确诊的病人及高危人群有条件进行有效的治疗和干预,且应有统一的标准。4.了解被筛检疾病的自然史,有可供识别的早期症状和体征或测量的标志。5.筛检试验要快速、简便、经济、可靠、安全、有效及易为群众接受。第十五页,共80页。诊断的应用原则
诊断是临床采取有效治疗措施的前提,因此诊断试验必须能正确判断病人和非病人,还要为受检者所接受,所以诊断试验要求:
1.灵敏度、特异度要高。
2.快速、简单、价廉、容易进行。
3.安全、可靠、尽量减少病人的损伤和痛苦。
第十六页,共80页。三、诊断试验与筛检试验的区别筛检试验诊断试验目的用以区别可疑病人与可能无病者用来区别病人与可疑有病但实际无病的人对象健康或表面健康的人病人或可疑病人要求快速、简便,有高灵敏度,尽可能发现所有可能的病人较高的准确性、特异度和灵敏度,尽可能诊断出所有病人和排除所有非病人费用简单、廉价的方法一般价格较高处理阳性者须进一步作诊断试验以确诊阳性者需要进一步观察和及时治疗第十七页,共80页。图3宫颈癌自然史与筛检和诊断的示意图(Ahrens2005)第十八页,共80页。不管是“诊断试验”还是“筛检试验”都需要针对该方法对疾病“诊断”的真实性和价值做出评价。第十九页,共80页。一、试验评价的基本步骤试验的评价就是将待评价的试验结果与“金标准”(goldstandard)结果——进行同步盲法比较,判定该方法对疾病“诊断”的真实性和价值。第二节筛检试验的评价第二十页,共80页。金标准特定人群病人非病人待评价方法评价指标
图4试验评价的基本步骤+-+-第二十一页,共80页。(一)确定“金标准”“金标准”指当前临床医学界公认最可靠、最权威的、可以反映有病或无病实际情况的诊断方法称为金标准(goldstandard),是诊断疾病的最可靠的方法,也称为标准诊断。活/尸检手术发现微生物培养特殊检查影像诊断长期随访的结果第二十二页,共80页。应注意:金标准会随着医学的发展不断更新,如金标准选择不当,则可造成错误分类偏倚,影响对试验的正确评价。一些较难诊断的疾病可能没有真正意义上的金标准,或金标准复杂且昂贵、甚至使受检者遭受痛苦或冒一定风险,此时可选一种相对公认的诊断方法作金标准,但要考虑此类金标准的假阳性率和假阴性率。第二十三页,共80页。(二)选择研究对象用于评价诊断试验和筛检试验的研究对象,应能代表筛检试验和诊断试验可能应用到的目标人群。因此,筛检的研究对象应从社区人群中选择,诊断试验的研究对象应从可疑人群或高危人群中选择。
用金标准确诊‘有病’的病例,应包含典型的、不典型病例,早、中、晚期病例,轻、中、重病例、有和无并发症的患者。代表性使评价结果具有普遍意义。来自男性、年轻人群的试验评价结果一般不能适用于女性、老年人群。第二十四页,共80页。(三)样本大小的计算待评试验的灵敏度待评试验的特异度显著性检验水平α,一般为0.05容许误差δ,一般为0.05~0.10当灵敏度和特异度均接近50%时,可用近似公式
待评价方法的灵敏度或特异度正态分布中累积概率等于α/2时的Ζ值(双侧)此公式适用于p接近50%时,当预期的灵敏度或特异度小于20%或大于80%时,需对灵敏度或特异度的估计值做平方根反正弦转换。第二十五页,共80页。(四)同步盲法测试对用金标准所确定的病例组与非病例组的研究对象,用待评价试验进行同步盲法测试。第二十六页,共80页。(五)整理分析资料待评价试验金标准确诊合计病例非病例阳性a(真阳性)b(假阳性)a+b阴性c(假阴性)d(真阴性)c+d合计a+cb+dn表1评价试验的整理表第二十七页,共80页。在收集和分析试验资料时,盲法的使用具有非常重要的意义,可以减少人为的主观偏差。假设未实施盲法,研究者可能对同样可疑的结果,倾向于将金标准确诊的病人判断为试验阳性,金标准诊断为非病人的判断为试验阴性,这样就会过高估计待评价试验的价值。(六)质量控制第二十八页,共80页。除采用同步盲法测试以保证结果的真实性外,对试验所用的仪器型号、试验条件、试验方法、所用试剂的质量、标号等要统一、标准化,尽量采用客观指标,对调查员要进行严格培训,将误差减小到最低。第二十九页,共80页。二、试验评价的指标(一)真实性(validity,效度)指测量值与实际值(金标准)相符合的程度,故又称准确性(accuracy)灵敏度(sensitivity)与假阴性率(falsenegativerate)特异度(specificity)与假阳性率(falsepositiverate)约登指数(Youden’sindex)粗一致性(crudeagreement)第三十页,共80页。灵敏度又称敏感度或真阳性率,指金标准确诊的病例中待评价试验也判断为阳性者所占的百分比。它可反映待评价试验能将实际患病的病例正确地判断为患某病的能力。理想值应为100%。
式中n为实际患病人数,即计算灵敏度的分母。
第三十一页,共80页。特异度又称真阴性率,指金标准确诊的非病例中待评价试验也判断为阴性者所占的百分比。它可反映待评价试验能将实际未患某病的研究对象正确地判断为未患某病的能力。理想值也应为100%。式中n为实际无病人数,即计算特异度的分母。
第三十二页,共80页。假阴性率又称漏诊率,是指金标准确诊的病例中待评价试验错判为阴性者所占的百分比,理想值也应为0%,漏诊率=1-灵敏度。灵敏度越高,漏诊率越低。
第三十三页,共80页。假阳性率又称误诊率,是指金标准确诊的非病例中待评价试验错判为阳性者所占的百分比,理想值应为0%,误诊率=1-特异度。特异度越高,误诊率越低。第三十四页,共80页。灵敏度与特异度是评价试验真实性的两个基本指标。临床上,病人和医生都希望获得高灵敏度和高特异度的诊断试验或筛检试验,即尽可能没有漏诊和误诊,但大多数情况下是难以达到的。第三十五页,共80页。因为许多试验是用定量或半定量方法判定阳性与阴性,而患者与非患者的测量值多不能截然分开,有重叠现象,故灵敏度与特异度之间往往顾此失彼。往往提高了试验的灵敏度却降低了试验的特异度,而提高了试验的特异度却又降低了试验的灵敏度,下图说明了两者的关系,当判断标准移向B时,提高了特异度降低了灵敏度,当判断标准移向A时,提高了灵敏度降低了特异度。第三十六页,共80页。图5人群中血清钙水平的分布图第三十七页,共80页。约登指数也称正确指数是灵敏度与特异度之和减去1表示试验方法发现真正病人与非病人的总能力范围在0~1之间,指数越大,其真实性越高粗一致性是指试验所检出的真阳性和真阴性例数之和占受试人数的百分比。它反映试验结果与金标准诊断结果的符合程度。第三十八页,共80页。表2人群某病患病状况与试验结果的关系(虚拟数据)表示在无甲状旁腺功能亢进的人中血清钙试验阴性或正常者占95.00%。表示在甲状旁腺功能亢进确诊的病人中血清钙试验阳性或异常者占60.00%。第三十九页,共80页。表示在甲状旁腺功能亢进确诊的病人中血清钙试验阴性或正常者占40.00%。表示在无甲状旁腺功能亢进的人中血清钙试验阳性或异常者占5.00%。约登指数=(0.60+0.95)-1=0.55表示血清钙试验阳性和阴性结果均正确的概率是86.25%。第四十页,共80页。(二)评价试验的可靠性
(reliability)
也称信度、精确度(precision)或可重复性(repeatability),指在相同条件下用某测量工具(如待评试验)重复测量同一受试者时获得相同结果的稳定程度。影响试验可靠性的因素
受试对象自身生物学差异观察者差异试验方法的差异
第四十一页,共80页。评价试验可靠性的指标标准差变异系数(CV)符合率(agreement/consistencyrate)Kappa值第四十二页,共80页。符合率又称一致率是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例表3可靠性评价的资料归纳表第四十三页,共80页。然而仅仅通过符合率来评价筛检或诊断试验的一致性是不全面的。第一,符合率未表明结果不一致性的具体原因:两个观察者所得的阳性结果和阴性结果是否相同?还是其中一个观察者更倾向于阳性结果?第二,许多一致性是由偶然性造成的,然而符合率不能表明偶然性的大小。若要考虑机遇因素对观察一致性的影响,则需进行Kappa分析。第四十四页,共80页。
Kappa值:是一个有用的测量分类变量的可靠性分析指标,该值表示不同观察者对同一批结果的判定和同一观察者在不同情况下对同一批结果判定的一致程度。
Kappa值不同于观察一致率,它在判断两次测量的一致性时,考虑了机遇因素对试验一致性的影响。第四十五页,共80页。Kappa值的取值范围为-1~+1,若K为负数,说明观察一致率比机遇造成的一致率还要低;K=-1,说明两结果完全不一致。K=0,表明观察一致率完全是由机遇所致。如K>0,说明观察一致率比机遇所致的一致率高;K=1,说明两结果完全一致。Kappa值越高一致性越好,<0.2以下一致性可忽略不计,0.2~0.4较差一致性,0.4~0.6中度一致性,0.6~0.8较好一致性,>0.8以上极好一致性。第四十六页,共80页。表4两位临床医生对100名病人判定心脏杂音的一致性比较Kappa值为0.78或78%,表明两位临床医生的诊断一致性较好。第四十七页,共80页。在评价试验时应注意,一个诊断试验具有较好的真实性,不一定具有较好的可靠性,而可靠性较好,不一定有较好的真实性。真实性和可靠性不是必定相关的。因此在选择评价试验时既要考虑其真实性,又不能忽略其可靠性。第四十八页,共80页。(三)评价试验的收益预测值(predictivevalue)
反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。阳性预测值(positivepredictivevalue,PPV)阴性预测值(negativepredictivevalue,NPV)第四十九页,共80页。
PPV
指试验阳性结果中真正患病(真阳性)的比例
NPV
指筛检试验阴性者不患目标疾病的可能性第五十页,共80页。试验的预测值与试验的灵敏度、特异度及受检人群中所检疾病的患病率有关。在患病率一定时,试验的灵敏度越高,阴性预测值越高;试验的特异度越高,阳性预测值越高。灵敏度和特异度对阳性预测值的影响较阴性预测值明显。第五十一页,共80页。注:图中实线为阳性预测值曲线,虚线为阴性预测值曲线,
较粗的曲线代表灵敏度和特异度均为95%时的预测值,
较细的曲线代表灵敏度和特异度均为85%时的预测值灵敏度越高,阴性预测值越高
特异度越高,阳性预测值越高图6预测值与和患病率、灵敏度和特异度的关系第五十二页,共80页。似然比(likelihoodratio)是指病例组中某种试验结果出现的概率与非病例组中该试验结果出现的概率之比。因试验结果有阴阳之分,所以似然比也有阳性似然比和阴性似然比。第五十三页,共80页。阳性似然比(positivelikelihoodratio,LR+):是指试验结果真阳性率与假阳性率之比,说明病人中出现某种试验结果阳性的概率是非病人的多少倍。其值越大,试验结果阳性者为真阳性的概率越大。一个诊断价值高的试验,LR+应显著高于1。第五十四页,共80页。阴性似然比(negativelikelihoodratio,LR-):是指试验结果假阴性率与真阴性率之比,说明病人中出现某种试验结果阴性的概率是非病人的多少倍。其值越小,试验结果阴性者为真阴性的可能性越大。第五十五页,共80页。如果LR+值大,LR-值小,该试验是个理想的试验。试验分析时可以计算LR+和LR-的比值,来评价试验的阳性和阴性。LR+/LR-为12.0/0.42,等于28.5,这个数值没有预期的高(一般<50试验效果弱)。如果数据来源于2×2表,可以通过计算比值比(ad/bc=33.48)得到相同的结果。第五十六页,共80页。由于各级医院的诊治水平不同,以及各地区疾病的患病率也有差异,故到不同医院就诊的人员中患病率差别也较大。因此在一所医院或一个地区进行的诊断试验评价,其预测值不能外延至其他级别或其他地区的医院。而似然比的计算不受患病率的影响,只与灵敏度和特异度有关,虽然不如预测值直观,但在医院评价诊断试验时不失为一种有效方法。第五十七页,共80页。验后概率(post-testprobability)
进行诊断试验的目的是提高对疾病诊断的准确性,及时进行合理的治疗。因此,临床医生应善于估计就诊个体患病的验后概率,即诊断试验为阳性(或阴性)时研究对象患某病(或未患某病)的概率。验前比=验前概率/(1-验前概率)验后比=验前比×LR+验后概率=验后比/(1+验后比)第五十八页,共80页。在诊断试验中,如果患病率为验前概率,那么阳性预测值即为验后概率。诊断试验的似然比综合了灵敏度、特异度的信息,在已知患病率与似然比的情况下,可以根据诊断试验特定测量值相应的似然比计算验后比,从而准确地估计单个病人的患病概率,以帮助临床医生进行诊断决策。第五十九页,共80页。例:患者男,60岁,有间歇性的胸前绞痛,当地医生怀疑心肌梗死,根据该病病例统计,此年龄段有该症状的男性患心肌梗死可能性为60%。实验室进一步作血清肌酸激酶检查,结果为异常。血清肌酸激酶试验的灵敏度为90%,特异度为83%。该患者患急性心肌梗死的概率是多少?验前概率=患病率=0.60验前比=验前概率/(1-验前概率)=0.60/(1-0.60)=1.5阳性似然比=真阳性率/假阳性率=0.9/(1-0.83)=5.3验后比=验前比×LR+=1.5×5.3=7.95验后概率=验后比/(1+验后比)=7.95/(1+7.95)=0.8883
第六十页,共80页。该患者在血清肌酸激酶试验阳性后,患急性心肌梗死概率比验前概率明显上升,为88.83%,因此,对该患者患急性心肌梗死的诊断有88.83%的把握。第六十一页,共80页。三、试验阳性结果截断值的确定截断值(cutoffvalue)是判定试验阳性与阴性的界值,即确定某项指标的正常值,以区分正常与异常。
第六十二页,共80页。
理想的筛检试验灵敏度、特异度均应接近100%。但在实际工作中很难达到,往往表现为灵敏度↑↓则特异度↓↑。两者高低的转换与确定筛检试验阳性结果的截断值(cutoffpoint)或临界点的选择密切相关。第六十三页,共80页。图7病人与非病人观测值分布类型第六十四页,共80页。确定截断值的方法有多种,如均数±2倍标准差法、百分位数法、从治疗和预防的实际应用出发确定截断值等,但在常规情况下,即灵敏度、特异度均很重要的情况下,最常用的还是受试者工作特征曲线法。第六十五页,共80页。定义
用真阳性率和假阳性率作图得出的曲线,可反映灵敏度和特异度的关系
受试者工作特性曲线(Receiveroperatorcharacteristiccurve,ROC)第六十六页,共80页。表5糖尿病血糖试验不同血糖水平的灵敏度和特异度分布
餐后2小时血糖mg/100ml灵敏度(%)特异度(%)7098.68.88097.125.59094.347.610088.669.811085.784.112071.492.513064.396.914057.199.415050.099.616047.199.817042.9100.018038.6100.019034.3100.020027.1100.0第六十七页,共80页。图8糖尿病血糖试验的ROC曲线横轴表示假阳性率(1-特异度)纵轴表示真阳性率(灵敏度)点代表筛检试验的特定阳性标准值相对应的灵敏度和特异度对子第六十八页,共80页。
最理想ROC曲线是纵坐标垂直上升,横坐标缓慢增加,如图9最上方的曲线(最优曲线)。若计算所得的灵敏度总与假阳性率相同,那么所得的ROC曲线为一条从左下角到右上角的对角线,即图9中最下方的线(无意义线)。临床试验中,所得的ROC曲线一般位于两者之间,如图9中所标记出的较优曲线和一般曲线。ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值,从而帮助临床医师作出最佳选择。第六十九页,共80页。图9ROC曲线%%第七十页,共80页。ROC曲线在各领域运用的十分广泛。其中一种方法就是通过比较各ROC曲线下的面积来进行显著性检验。曲线下面积越大,试验的诊断价值就越高。在图10中,ROC曲线为对角状的无效曲线(灵敏度与假阳性率相同)下的面积为50%,<50岁病例组的曲线下面积约为60%,≥50岁病例组的曲线面积可占90%。因此,在得到病理报告前,≥50岁病人的肿瘤直径大小对临床医生决定是否要摘除肿瘤更具有指导意义,而对年轻的病人来说,意义不大。第七十一页,共80页。图10滤泡型甲状旁腺肿瘤直径大小与肿瘤恶性有关的ROC曲线%%第七十二页,共80页。优化试验方法联合试验的应用选择患病率高的人群作为受试对象第三节提高试验效率的方法第七十三页
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年营养学基础概念测试题目
- 2026年澳洲天气驾驶中文题
- 2026年上半年四川成都开放大学考核招聘9名高层次人才笔试参考试题及答案详解
- 2026年药学专业考试复习全攻略
- 晋中联通2026招聘法律事务题
- 2026年城市广场管理知识测试题
- 2026年福建泉州发展集团权属企业开源集团、发展地产集团招聘工作人员考试备考试题及答案解析
- 2026福建三明三元区人社系统见习单位招聘就业见习人员4人考试模拟试题及答案解析
- 2026重庆涪陵区事业单位“绿色通道”引进人才30人考试备考题库及答案解析
- 2026年数字文旅沉浸式云游题库
- 交管12123驾照学法减分题库500题(含答案)
- 广东佛山市顺德区2024-2025学年八年级物理下册期末试卷(解析版)
- 中学体育体能教案
- 2026年入团团员知识考试题库100题及答案
- 牛场安全防疫培训课件
- 网络信息茧房的形成机制与破局路径研究毕业答辩
- 消渴目病中医辨证施护体系与临床护理方案
- 化工厂人员定位施工方案
- 2025小学五年级英语阅读理解专项训练50篇
- (16)普通高中体育与健康课程标准日常修订版(2017年版2025年修订)
- 国企财务预算编制实操案例
评论
0/150
提交评论