诊断试验的评价培训课件_第1页
诊断试验的评价培训课件_第2页
诊断试验的评价培训课件_第3页
诊断试验的评价培训课件_第4页
诊断试验的评价培训课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

诊断试验的评价

诊断VS诊断试验临床诊断:临床医生根据病人的症状、体征、实验室检查、影像学检查等资料,结合医生本人的专业知识和经验,对疾病做出的临床判断。诊断试验主要是在用“金标准”确诊的患有某病和为患有该病的样本中实施的一种评价研究,目的旨在对某种诊断技术的诊断特性做出科学的界定。2诊断试验的评价3诊断试验(diagnostictest)狭义是指实验室所做的试验和检查。从广义上来说,也包括从病史、体格检查或X线检查所获得的临床资料或临床所见。目的是把病人和非病人区分开来。todistinguishbetweensubjectsinthepopulationwhohavethediseaseandthosewhodonot.touseinmedicaldiagnosis,screening,andresearch诊断试验的评价4一、诊断试验研究与评价的理论依据就大多数诊断指标而言,在正常人中符合正态分布,在病人中也符合正态分布,但病人和正常人之间有部分重叠。如图19-1所示,A、B之间既有病人又有正常人,A为病人的最低值,B为正常人的最高值。如果我们把诊断标准定在A上,则有一部分正常人被判为病人如果把诊断标准定在B上,则有一部分病人被判作正常人;如果诊断标准定在C上则既有病人被判作正常人,又有正常人被判作病人。这就是临床上的漏诊和误诊问题。诊断试验的评价5诊断试验的评价6distributionofbloodglucoseindiabeticandnormalsubjectsNon-diseaseddistributionDiseaseddistributionFrequencycut-offvalueab诊断试验的评价7

例如,以舒张压为诊断指标在病人与正常人群中检查。如果将诊断标准定为90mmHg,则有部分本是正常人,但按此标准被判为高血压病人。亦有部分本是高血压患者但按诊断标准被判为正常人。即有些人舒张压虽未超过90mmHg,但是高血压患者。降低诊断标准,使正常人被判为高血压的比例增加;提高诊断标准,使病人被判为正常人的比例增加。这种分布上的重叠是由于机体的个体差异所造成的。由于重叠使得临床疾病的诊断较为复杂。也由于分布的重叠,使得对诊断试验的研究和诊断标准的把握成为临床工作之必需。诊断试验的评价8诊断试验的评价9诊断试验的评价10

正常人与病人间分布上的重叠是研究诊断试验的理论依据。对诊断试验研究的目的在于正确地认识重叠,制定合理的诊断标准,正确区分正常与异常,做出疾病的准确诊断。

确定医学参考值范围(正常值范围);对诊断试验进行评价;确定诊断标准;诊断试验的评价11试验方法评价的方法被评价的方法与与标准方法作同步、盲法试验。一、确定金标准二、选择研究对象:病人和非病人三、样本大小四、同步试验、盲法(doubleblind)观察五、根据试验检查的结果,评价其诊断价值诊断试验的评价12金标准是指一种疾病标准诊断方法,是当前医学界公认的、诊断某病的可靠的诊断方法,应用该标准能较正确区分某种疾病的人和不具有该病的人。常见的金标准有:病理学检查(组织活检和尸体解剖)诊断肿瘤、外科手术发现结石诊断胆结石、特殊的影像学诊断如冠状动脉造影诊断冠心病。要评价一个试验方法,金标准的选择是非常重要的。一项诊断试验的准确程度只有在金标准诊断的病人组和非病人组中进行考核,才能得到正确地评价。金标准(goldstandard)诊断试验的评价13在诊断试验方法评价中,研究对象包括两组,一是被金标准确诊的病例组,另一组是金标准证实无该病的人群,即对照组。所有的研究对象都要有代表性,病例组和对照组都应代表各自的总体。研究对象样本大小p为试验的预期特异性或灵敏度,为容许误差,为第一类误差的概率,U值由U界值表可查得。诊断试验的评价14诊断试验方法的评价

一、真实性(validity)真实性是指测量值与实际值的符合程度。二、可靠性(reliability)也称重复性(repeatability),指一项试验在相同的条件重复试验获得相同结果的稳定程度。三、预测性灵敏度和特异度是一项诊断试验的特征,在决定是否采用某项试验时医生应考虑这些特征。一旦采用了某项诊断试验,医师就要仔细考虑试验结果的意义。如获阳性结果,患某病的可能性是多少;若获阴性结果,未患某病的可能性是怎样?这就是预测值。诊断试验的评价15被评价试验结果金标准

有病无病合计阳性A(真阳性)B(假阳性)A+B阴性C(假阴性)D(真阴性)C+D合计A+CB+DN试验方法评价的结果诊断试验的评价16可靠性的评价(reliability)变异系数(Coefficientofvariation)符合率或一致性(consistency)调整一致性(adjustedconsistency)诊断试验的评价17表示两种试验的结果的一致性的程度Kappa值被评价试验结果金标准

有病无病合计阳性A(真阳性)B(假阳性)A+B阴性C(假阴性)D(真阴性)C+D合计A+CB+DN诊断试验的评价18Kappa值的解释Kappa值考虑了机遇因素对异质性的影响并加以调整,从而提高了判断的准确度。Kappa值在-1~1之间。Kappa<0说明由机遇因素所致一致率>观察一致性;Kappa=0表示观察一致率完全由机遇所致;Kappa>0说明观察一致性大于因机遇所致的一致程度;Kappa=1说明两个结果完全一致;Kappa值越高表示一致性程度越好。一般认为,Kappa值在0.75~1之间为一致性高;0.4~0.74为一般;小于0.39以下为一致性差。诊断试验的评价19甲、乙二医生阅读胸部X线片诊断结果

甲医生诊断

乙医生诊断

合计

肺门淋巴结结核正常

肺门淋巴结结核46(a)10(b)56(r1)正常12(c)32(d)44(r2)合计58(c1)42(c2)100(N)观察一致率=(46+32)/100=78%机遇一致率=[(58×56)/100+(42×44)/100]/100=51%Kappa=(78%-51%)/(1-51%)=0.55诊断试验的评价20影响试验可靠性的因素

实验方法本身或仪器的差异调查对象的生物学变异观察者的测量变异诊断试验的评价21试验方法真实性的评价对有病的识别能力对无病的识别能力诊断试验的评价22真实性评价指标1、灵敏度(sensitivity,Se)

在真正有病的人中,试验结果阳性的百分率,即真阳性率。灵敏度表示试验方法对疾病的检出能力。灵敏度越高,说明试验方法对疾病检出能力越强,病人漏诊机会越少。诊断试验的评价232、特异度(specificity,Sp)

特异度是指在无病的人中试验结果阴性的百分率,即真阴性率。特异度表示试验方法对无病的检出能力。特异度越高,说明对无病的判断能力越强,无病的人误诊机会越少。诊断试验的评价24灵敏度和特异度的特点当试验方法和阳性标准固定时,每个诊断试验的灵敏度和特异度是恒定的。区分诊断试验正常和异常的临界点会影响灵敏度和特异度。诊断试验的评价25灵敏度和特异度的应用(1)灵敏度高的试验,漏诊率低,适用于:疾病漏诊可能会造成严重后果(AIDS);有几个假设诊断,为排除某病的诊断;用于筛检无症状病人而该病的发病率又比较低,当试验结果呈阴性时,价值更大。诊断试验的评价26灵敏度和特异度的应用(2)特异度高的试验,误诊率低,适用于:凡假阳性结果会导致病人精神和肉体上严重危害时;要肯定诊断时,当试验结果呈阳性时,价值更大。诊断试验的评价27似然比(likelihoodratio,LR)一项诊断价值高的试验,应当是真阳性率(灵敏度)高而假阳性率低。两者的比值称为诊断试验的似然比。诊断试验的评价28也称正确指数。灵敏度和特异度是反映一项诊断试验的两个基本指标,两者之和减去1,即为约登指数。约登指数(Youden’sIndex)诊断试验的评价29一致性(agreement)

粗一致性(crudeagreement)或符合率

调整一致性(adjustedagreement)诊断试验的评价30患病率表示受试人群中患有研究疾病的率。患病率是指到该医院心内科因疑似心肌梗死而就诊人群患心肌梗死的频率,与通常所说的某人群的患病率表示不同的含意。

诊断试验的评价31评价甲胎蛋白诊断肝癌的价值,以肝穿刺作为金标准,试验结果如下表。甲胎蛋白试验结果肝穿刺结果合计肝癌非肝癌异常205(a)31(b)236正常29(c)37(d)66合计23468302(N)诊断试验的评价32诊断试验的评价33

诊断试验研究为一个样本研究,所得灵敏度、特异性、Youden指数均为样本值,因此存在抽样误差。从样本值来推断总体值,须进行统计推断。不同方法的比较应排除抽样误差,进行统计学检验。

诊断试验评价的统计学推断诊断试验的评价34样本指标标准误可信区间灵敏度(Se)

特异性(Sp)

粗一致性

Youden指数

Se±USse

Sp±USsp

CA±USCA

YI±USYI

诊断性试验指标的参数估计

诊断试验的评价35诊断性试验研究的假设检验适用情况检验假设(Ho)计算公式两个试验的总一致性比较

两个试验的Youden指数比较两方法总体粗一致性相等

两方法总体的YI值相等

诊断试验的评价36如应用血清铁蛋白(SF)和血清原卜啉(ZPP)试验法进行铁缺乏症的临床诊断。以骨髓涂片铁染色检查作为诊断缺铁的金标准,确诊为缺铁性贫血50例,非缺铁性贫血78例。结果如表18-6,试比较两试验的Youden指数的优劣。

SF和ZPP法诊断缺铁性贫血的结果

金标准合计缺铁非缺铁SF(ng/ml)<3047350≥3037578ZPP(ng/Ghb)≥14281038<14226890合计5078128诊断试验的评价37SF法:灵敏度=(47/50)×100%=94%

特异度=(75/78)×100%=96%Youden指数=94%+96%-1=0.90ZPP法:灵敏度=(28/50)×100%=56%

特异度=(68/78)×100%=87%Youden指数=56%+87%-1=0.43从Youden指数看,SF法要高于ZPP法。但这是两个样本值的差别,是由于两方法的总体Youden指数不同,还是由于抽样误差所引起?需进行假设检验。

H0:SF法的总体Youden指数与ZPP法相同。α=0.05,并根据公式计算如下:SF法的Youden指数方差同理,ZPP法的方差:

S2YI2=0.006361

查z

临界值表,z0.05=1.96,z>z0.05,P<0.05,按=0.05水准拒绝H0,即SF法与ZPP法总体Youden指数不同,SF法较优。诊断试验的评价385.受试者工作特征曲线(receiveoperatorcharacteristiccurve,ROC曲线)

ROC曲线以灵敏度为纵坐标,假阳性率(1-特异度)为横坐标作图所得的曲线。该曲线反映灵敏度与特异度之间相互关系的一种方法。诊断试验的评价39诊断试验的评价40ROC曲线的用途用来决定最佳临界点;比较两种或两种以上诊断试验的价值.诊断试验的评价41不同诊断水平对灵敏度、特异性的影响

诊断试验的评价42血糖水平mg/100ml灵敏度%特异度%80100.01.29098.67.310097.125.311092.948.412088.668.213081.482.414074.391.215064.396.116055.798.617052.999.618050.099.819044.399.820037.1100.0不同诊断水平对灵敏度、特异性的影响诊断试验的评价431.统计学方法:人为、无生物学基础如数据呈正态分布:如数据呈偏态分布:双侧:P2.5~P97.5;单侧:0~P95或>P52.危险度决定法(临床界限):按疾病的各种危险因素的危险度决定正常值范围。如根据调查发现,尿酸在7mg/dl或以下不会发生痛风,超过这一数值发生痛风的危险性上升,如超过9.0mg/dl,则无一幸免。因此最有意义的界限值应为8.0—9.0mg/dl(相当于99%位数)。3.预后界限:如血压的标准4.实用界限:满足灵敏度、特异度和正确指数的要求四、临床参考值(referencevalue)的确定诊断试验的评价44预测值(predicativevalue,PV)

阳性预测值是指试验结果阳性者患病的概率。阴性预测值是指试验结果阴性者无病的概率

诊断试验的评价45预测值的特点灵敏度越高的试验,阴性预测值越高;特异度越高的试验,阳性预测值越高;患病率的高低对预测值的影响更大。诊断试验的评价46影响阳性预测值的因素1、试验方法的灵敏度和特异度患病率为2%时,不同灵敏度,特异度的阳性预测值(%)特异度(%)灵敏度(%)50607080909599506070809095992.02.53.34.89.217.050.52.43.03.95.810.919.755.02.83.44.56.712.522.258.83.23.95.27.614.024.662.03.54.45.88.415.526.964.73.74.66.18.816.227.966.03.94.86.39.216.828.866.9诊断试验的评价48灵敏度为99%、特异度为95%的诊断试验在不同患病率的人群检查的阳性预测值

患病率

1%2%10%(1)试验人数100010001000(2)确实有病人数1020100(3)确实无病人数990980900(4)试验阳性(2)×0.9910(应为9.9)20(19.8)99(5)试验假阳性(3)×(1-0.95)50(应为49.5)4945(6)总阳性数(4)+(5)6069144(7)阳性预测值(4)/(6)10/60=17%20/69=29%99/144=68.8%2、患病率对预测值的影响诊断试验的评价49提高诊断试验效率的方法

一、选择合适而正确的指标二、选择患病率较高的人群

1.设立专科门诊

2.选择高危人群

3.选择有特殊临床表现的人群三、联合试验并联(平行)试验串联(系列)试验。诊断试验的评价50试验A试验B并联试验串联试验+++++-+--++-----联合试验诊断试验的评价51

指同时做几项试验,只要有一个试验结果阳性,结果即判断阳性。对于试验A和B,并联试验后灵敏度和特异度分别为:灵敏度AB=灵敏度A+(1-灵敏度A)×灵敏度B特异度AB=特异度A×特异度B1.并联(平行)试验(paralleltest)诊断试验的评价52在串联试验中,只有每项试验均为阳性,最后结果才判断为有病,其灵敏度和特异度分别为:灵敏度AB=灵敏度A×灵敏度B特异度AB=特异度A+(1-特异度A)×特异度B2、串联试验:又称系列试验(serialtests)诊断试验的评价53表5-10诊断心肌梗死的酶试验的灵敏度、特异度酶试验方法灵敏度(%)特异度(%)CPK9657SGOT9174LDH8791三法串联7895诊断试验的评价54第五节疾病筛检筛检(screening)是指应用快速的试验、检查或其他方法找出未被识别的疾病患者或缺陷病人(即表面健康的临床早期或临床前期的病人)的一种主动的卫生保健措施。筛检试验不同于诊断,阳性者或可疑阳性者应当指定就医,进一步诊断和必要的治疗。诊断试验的评价55诊断试验的评价56疾病筛检的程序诊断试验的评价5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论