《诊断试验的评价》PPT课件.ppt_第1页
《诊断试验的评价》PPT课件.ppt_第2页
《诊断试验的评价》PPT课件.ppt_第3页
《诊断试验的评价》PPT课件.ppt_第4页
《诊断试验的评价》PPT课件.ppt_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,诊断试验的评价,余 运 贤 浙江大学医学院流行病学教研室,2,诊断试验(diagnostic test),狭义是指实验室所做的试验和检查。从广义上来说,也包括从病史、体格检查或X线检查所获得的临床资料或临床所见。目的是把病人和非病人区分开来。,3,诊断指标,主观指标 半客观(或半主观)指标 客观指标,4,一、诊断试验研究与评价的理论依据 就大多数诊断指标而言,在正常人中符合正态分布,在病人中也符合正态分布,但病人 和正常人之间有部分重叠。 如图19-1所示,A、B之间既有病人又有正常人,A为病人的最低值,B为正常人的最高值。如果我们把诊断标准定在A上,则有一部分正常人被判为病人如果把诊断标准定在B上,则有一部分病人被判作正常人;如果诊断标准定在C上则既有病人被判作正常人,又有正常人被判作病人。 这就是临床上的漏诊和误诊问题。,6,例如,以舒张压为诊断指标在病人与正常人群中检查。如果将诊断标准定为90mmHg l2kPa),则有部分本是正常人,但按此标准被判为高血压病人。亦有部分本是高血压患者但按诊断标准被判为正常人。即有些人舒张压虽未超过90mmHg(l2kPa),但是高血压患者。降低诊断标准,使正常人被判为高血压的比例增加;提高诊断标准,使病人被判为正常人的比例增加。 这种分布上的重叠是由于机体的个体差异所造成的。由于重叠使得临床疾病的诊断较为复杂。也由于分布的重叠,使得对诊断试验的研究和诊断标准的把握成为临床工作之必需。,7,8,9,正常人与病人间分布上的重叠是研究诊断试验的理论依据。对诊断试验研究的目的在于正确地认识重叠,制定合理的诊断标准,正确区分正常与异常,做出疾病的准确诊断。 对一种诊断试验的研究与评价包括三方面内容:确定医学参考值范围(正常值范围);对诊断试验进行评价;确定诊断标准。,10,试验方法评价的方法,被评价的方法与与标准方法作同步、盲法试验。 一、确定金标准 二、选择研究对象:病人和非病人 三、样本大小 四、同步试验、盲法(double blind)观察 五、根据试验检查的结果,评价其诊断价值,11,金标准是指一种疾病标准诊断方法,是当前医学界公认的、诊断某病的可靠的诊断方法,应用该标准能较正确区分某种疾病的人和不具有该病的人。 常见的金标准有:病理学检查(组织活检和尸体解剖)诊断肿瘤、外科手术发现结石诊断胆结石、特殊的影像学诊断如冠状动脉造影诊断冠心病。 要评价一个试验方法,金标准的选择是非常重要的。一项诊断试验的准确程度只有在金标准诊断的病人组和非病人组中进行考核,才能得到正确地评价。,金标准(gold standard),12,在诊断试验方法评价中,研究对象包括两组,一是被金标准确诊的病例组,另一组是金标准证实无该病的人群,即对照组 。 所有的研究对象都要有代表性,病例组和对照组都应代表各自的总体 。,研究对象,样本大小,p为试验的预期特异性或灵敏度,为容许误差,为第一类误差的概率,U值由U界值表可查得。,13,3 同步测试 对确定的每个受试对象,用金标准和被评价的诊断试验同时进行测试。 可以理解,将受试对象用金标准诊断分为病人与非病人,而用待评价的诊断试验测试,在真正病人中有的将被判为病人 (阳性),有的将被判为非病人 (阴性),即将其分为两部分。在真正非病人中待评价的诊断试验也将其判为两部分,病人 (阳性)与非病人 (阴性) 。,14,试验方法的评价,包括两方面: 一、真实性(validity) 真实性是指测量值与实际值的符合程度。 二、可靠性(reliability) 也称重复性(repeatability),指一项试验在相同的条件重复试验获得相同结果的稳定程度。,15,试验方法评价的结果,16,可靠性的评价,变异系数 符合率或一致性 调整一致性,17,表示两种试验的结果的一致性的程度,Kappa值,18,Kappa值的解释,Kappa值在-11之间。 Kappa观察一致性; Kappa= -1说明两个结果完全不一致; Kappa=0表示观察一致率完全由机遇所致; Kappa0说明观察一致性大于因机遇所致的一致程度; Kappa=1说明两个结果完全一致; Kappa值越高表示一致性程度越好。一般认为,Kappa值在0.751之间为一致性高;0.40.74 为一般;小于0.39以下为一致性差。,19,甲、乙二医生阅读胸部X线片诊断结果,观察一致率= (4632)/10078 机遇一致率(5856)/100(4244)/100/100=51% Kappa=(78%-51%)/(1-51%)=0.55,20,影响试验可靠性的因素,1实验方法本身或仪器的差异 2调查对象的生物学变异 3观察者的测量变异,21,试验方法真实性的评价,包括两个方面: 1、对有病的识别能力 2、对无病的识别能力,22,真实性评价指标,1、灵敏度(sensitivity, Se) 在真正有病的人中,试验结果阳性的百分率,即真阳性率。,灵敏度表示试验方法对疾病的检出能力。灵敏度越高,说明试验方法对疾病检出能力越强,病人漏诊机会越少。,23,2、特异度(specificity,Sp ),特异度是指在无病的人中试验结果阴性的百分率,即真阴性率。特异度表示试验方法对无病的检出能力。特异度越高,说明对无病的判断能力越强,无病的人误诊机会越少。,24,似然比(likelihood ratio, LR),一项诊断价值高的试验,应当是真阳性率(灵敏度)高而假阳性率低。两者的比值称为诊断试验的似然比。,25,也称正确指数。灵敏度和特异度是反映一项诊断试验的两个基本指标,两者之和减去1,即为约登指数。,约登指数(Youdens Index),26,一致性(agreement),粗一致性(crude agreement)或符合率,调整一致性(adjusted agreement),27,患病率 表示受试人群中患有研究疾病的率。,需要说明的是,此处的患病率是指到该医院心内科因疑似心肌梗死而就诊人群患心肌梗死的频率,与通常所说的某人群的患病率表示不同的含意。,28,评价甲胎蛋白诊断肝癌的价值,以肝穿刺作为金标准,试验结果如下表 。,29,30,诊断试验研究为一个样本研究,所得灵敏度、特异性、Youden指数均为样本值,因此存在抽样误差。从样本值来推断总体值,须进行统计推断。不同方法的比较应排除抽样误差,进行统计学检验。,诊断试验评价的统计学推断,31,诊断性试验指标的参数估计,32,诊断性试验研究的假设检验,33,如应用血清铁蛋白(SF)和血清原卜啉(ZPP)试验法进行铁缺乏症的 临床诊断。以骨髓涂片铁染色检查作为诊断缺铁的金标准,确诊为缺铁性贫 血50例,非缺铁性贫血78例。结果如表18-6,试比较两试验的Youden指数的 优劣。,SF和ZPP法诊断缺铁性贫血的结果,34,SF法:灵敏度=(4750)100%=94% 特异度=(7578)100%=96% Youden指数=94%+96%1=0.90 ZPP法:灵敏度=(2850)100%=56% 特异度=(6878)100%=87% Youden指数=56%+87%1=0.43 从Youden指数看,SF法要高于ZPP法。但这是两个样本值的差别,是由于两方法的 总体Youden指数不同,还是由于抽样误差所引起?需进行假设检验。,H0:SF法的总体Youden指数与ZPP法相同。 =0.05,并根据公式计算如下: SF法的Youden指数方差 同理,ZPP法的方差: S2YI2=0.006361 查z 临界值表,z0.05=1.96,zz0.05,P0.05,按0.05水准拒绝H0, 即SF法与ZPP法总体Youden指数不同,SF法较优。,35,5.受试者工作特征曲线(receive operator characteristic curve, ROC曲线) ROC曲线以灵敏度为纵坐标,假阳性率(1特异度)为横坐标作图所得的曲线。该曲线反映灵敏度与特异度之间相互关系的一种方法。,36,37,不同诊断水平对灵敏度、特异性的影响,38,不同血糖标准时血糖试验的灵敏度、特异度,39,不同血糖标准时血糖试验的灵敏度、特异度,40,四、临床参考值(reference value)的确定,参考值是指正常人体在解剖、生理、生化上的正常水平以及人体对各种试验的正常反应值。这里的正常人是指没有得所检查疾病的人. 确定参考值的方法主要有: 1.统计学方法: 人为、无生物学基础 如数据呈正态分布: 如数据呈偏态分布: 双侧:P2.5P97.5 单侧: 0P95, 或 P5,41,2危险度决定法(临床界限):按疾病的各种危险因素的危险度决定正常值范围。如根据调查发现,尿酸在7mg/dl或以下不会发生痛风,超过这一数值发生痛风的危险性上升,如超过9.0mg/dl,则无一幸免。因此最有意义的界限值应为8.09.0mg/dl(相当于99%位数)。危险度决定法在足够样本量的前瞻性队列研究基础上,能够较确切地反映该地区人群某种指标的正常值范围。 3预后界限:如血压的标准 4实用界限:满足灵敏度、特异度和正确指数的要求,42,预测值(predicative value, PV),表示试验结果阳性者可能有该病的概率,阳性预测值越高,诊断价值越高。,43,影响阳性预测值的因素,1、试验方法的灵敏度和特异度,患病率为2%时,不同灵敏度,特异度的阳性预测值(%),44,2、患病率对预测值的影响,灵敏度为99%、特异度为95%的诊断试验在不同患病率的人群(1%、2、10检查的阳性预测值是多少?,45,灵敏度为99%、特异度为95%的诊断试验在不同 患病率的人群检查的阳性预测值,46,47,提高诊断试验效率的方法,一、选择合适而正确的指标 二、选择患病率较高的人群 1.设立专科门诊 2.选择高危人群 3.选择有特殊临床表现的人群 三、联合试验 并联(平行)试验 串联(系列)试验。,48,提高诊断试验的效率有两个途径: 1、提高诊断试验的灵敏度与特异度 2、合理使用诊断试验 提高诊断试验的灵敏度与特异度主要靠新的诊断方法的发明与应用、诊断技术的改进、专业人员诊断水平的提高等。这对于临床医生来讲是无能为力的。因此重点是合理使用诊断试验,选择合适的诊断指标和诊断标准等。,49,(一)依据就诊者选择诊断试验 尽管一种疾病可采用多种诊断试验,但是每一种诊断试验对不同疾病诊断的准确度是不同的,因此临床医生在对具体患者做诊断检查时要注意以下几方面:,50,1、根据症状体征所表现出可能的疾病,选择诊断该病最准确的方法,即在了解病史及作体格检查后再考虑使用何种检查手段。决不能对就诊者一律作某些检查后考虑患什么病, 也不能对所有患者将医院具有的各种诊断手段通通查一遍。 2、同样情况下选择简便易行、费用低、出结果快的诊断试验,不要一味求先进。 3、对疾病的诊断过程要有一个明确思路,首先选什么诊断试验,在其结果阳性时再用什么诊断试验,阴性结果时、鉴别诊断时、待确诊的病确诊时该用什么诊断试验。,51,(二)根据临床目的选择诊断试验 临床目的可分为三个方面: 1、发现疾病 其目的是在无明显临床表现的人群中发现疾病或疾病早期。见于两种情 况:一种是疾病筛查 (screening);另一种是对某些到医院就诊者, 希望受检者只要有病,就能够被检出,因而要求这种试验具有较高的灵敏度。 2、排除疾病 排除疾病是一种鉴别诊断。目的在于有效排除一种或几种可疑的疾病,所以该类试验是费用较高、相对复杂、准确性较好的试验。 3、证实疾病 证实疾病的诊断试验是在采用发现疾病与排除疾病的诊断试验后对高度怀疑患某病者做出确实诊断,因此应尽可能使假阳性率降低,即选择特异度高的诊断试验。,52,(三)选择患病率高的人群 从前面所述的预测值与患病率之间的关系可以看出,患病率越高,阳性预测值越高,因而选择患病率高的人群应用诊断试验,可有效地提高诊断试验的质量与效率。 尽管临床医生难以做到这点,但在实践中注意下列人群的患病率相对较高:转诊患者;高危人群;有临床症状人群。,53,联合试验,54,1.并联(平行)试验(parallel test) 指同时做几项试验,只要有一个试验结果阳性,结果即判断阳性。对于试验A和B,并联试验后灵敏度和特异度分别为: 灵敏度AB=灵敏度A+(1灵敏度A)灵敏度B 特异度AB=特异度A特异度B,55,2、串联试验: 又称系列试验(serial tests) 在串联试验中,只有每项试验均为阳性,最后结果才判断为有病,其灵敏度和特异度分别为: 灵敏度AB=灵敏度A灵敏度B 特异度AB=特异度A+(1特异度A)特异度B,56,表5-10 诊断心肌梗死的酶试验的灵敏度、特异度,57,第五节、疾病筛检,筛检(screening)是指应用快速的试验、检查或其他方法找出未被识别的疾病患者或缺陷病人(即表面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论