临床生物化学诊断试验的性能基础与评价ppt课件.ppt_第1页
临床生物化学诊断试验的性能基础与评价ppt课件.ppt_第2页
临床生物化学诊断试验的性能基础与评价ppt课件.ppt_第3页
临床生物化学诊断试验的性能基础与评价ppt课件.ppt_第4页
临床生物化学诊断试验的性能基础与评价ppt课件.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章临床生物化学诊断试验的性能基础与评价,1,.,教学目标与要求,掌握:临床诊断试验、临床生物化学诊断试验与金标准的概念,诊断试验结果与患病情况的关系,参考范围、临界值与医学决定水平的概念,诊断试验的准确性、有效性和可靠性评价的常见指标,ROC曲线的概念、构建与应用。熟悉:参考范围的建立,参考范围概念的正确使用,临界值的选择,诊断试验的评价。了解:医学决定水平的制定,诊断试验样本含量的估计,ROC曲线下面积的计算。,2,临床诊断试验(clinicaldiagnostictest):临床上用于确定或排除疾病的方法或项目,又称临床诊断性试验,简称诊断试验。临床生物化学诊断试验:临床生物化学实验室中用于疾病诊断、筛查和监测的方法或项目。,诊断试验,3,诊断学评价(诊断试验的诊断性能评价):方法或项目与疾病之间的关系,评价该方法或项目对某种疾病的诊断价值。方法学评价(技术性能的方法学评价):方法与项目之间的关系,评价该方法对某项目测定的准确度和精密度。,诊断学评价与方法学评价的区别,4,目录,返回总目录,5,图3-1参考范围的建立流程,第一节参考范围,一、参考范围的建立,6,1参考个体按预定标准选择的正常个体。纳入标准:地区、民族、性别、年龄段等;排除标准:不能有血压不正常、器质性疾病、乙肝阳性,不能有近期的急性感染、输血或手术、用药、妊娠或哺乳等。2参考总体所有参考个体的集合。,原始概念,7,3参考抽样组参考总体的抽样,又称参考样本。4参考值每一个参考个体的检测值。5参考值范围各个参考值剔除离群值并补充数据后的集合范围。,原始概念,8,6参考值区间包含95的参考总体的参考值范围。双侧正态(均数法):1.96s,即(1.96s)(1.96s);双侧偏态(百分位数法):2.5位数(P2.5)的参考限97.5位数(P2.5)的参考限。单侧正态:1.65s以下或1.65s以上;单侧偏态:P5的参考以下或P95的参考限以上。,原始概念,9,1.样本数一般为100例以上,若为偏态分布(非正态分布)则应在120例以上。特殊情况时也至少在30例以上。2.离群值的判断与处理为离群值,必须剔除,再补足数据。,建立参考范围的注意事项,10,3.双侧与单侧双侧:项目偏高、偏低均属异常;单侧:项目只偏低或只偏高属异常。百分位数法:偏态分布、正态分布,但常用于偏态分布。均数法:正态分布。,建立参考范围的注意事项,11,4.国内所称呼的参考范围(referenceinterval)95的正常人某指标所在范围。等于国际所称呼的参考值区间。5.国内所称呼的参考值含义同参考范围,但不提倡使用,因为参考范围不是一个具体的值而是一个范围。,建立参考范围的注意事项,12,6.参考范围并非恒定同一指标,除有个体差异以外,在不同实验室(仪器、试剂、测量程序)或者不同测量方法(原理),或者同一测量方法但是不同生产厂家(批号),等等,都会不同,故不能机械地搬用。,建立参考范围的注意事项,13,不能称为“正常值”、“正常值范围”、“正常范围”等,主要原因在于:不正常的人被纳入“正常”。是正常的人被判为“不正常”。,二、参考范围概念的正确使用,返回章目录,14,临界值(cutoffvalue):指划分诊断试验结果正常与异常的界值,又称阈值、分界值、鉴别值、指定值、诊断界值、截断点等。,一、临界值,第二节临界值与医学决定水平,15,DL:医学决定水平,D:临界值,TN:真阴性,TP:真阳性,FN:假阴性,FP:假阳性,图3-2正常人和病人分布曲线,临界值的选择,16,图3-2B临界值的选择:当D向右移动,假阳性减少,假阴性增加,灵敏度降低,特异度增加;反之,变化相反。,图3-2正常人和病人分布曲线,临界值的选择,17,应当注意的是,在少数情况下正常人的测定值分布高于病人的测定值分布时,如缺铁性贫血患者的血清铁蛋白含量明显低于正常人,此时的临界值制定偏高或偏低后的指标变化情况正好与图3-2B相反。,临界值的选择,18,另外,还有一种低值某一类疾病病人、正常人、高值另一类疾病病人三条交叉分布曲线形式,有2个临界值,应分开后按上述方式讨论。,临界值的选择,19,医学决定水平(medicaldecisionlevel,MDL,DL):临床上按照不同病情给予不同处理的指标阈值。DL(或用Xc表示)可以用来排除或确定某一临床情况或预告将会出现某一生理变化现象。,二、医学决定水平,20,A、正常人参考范围B、无关疾病患者的参考范围C、有关疾病患者分型、分期的测定值D、文献资料及医生意见,医学决定水平的制定依据,21,不同指标的DL数量、数值不同:A低、高B低、低、高C低、高、高不同实验室的水平值也略有不同。,医学决定水平的水平值模式,22,表3-1临床生物化学检验指标的医学决定水平(Xc),*参考范围、Xc:不同实验室的范围、水平值略有不同,23,“低、高”模式血清氯有二个DL:90mmol/L、112mmol/L。90mmol/L以下时,应加做其他检查以确诊或排除:如严重呕吐、腹泻等胃肠道丢失。长期限制氯化钠的摄入。代谢性碱中毒。艾迪生病。112mmol/L以上时,应加做其他检查以确诊或排除:高氯血症性代谢性酸中毒。氯化物摄入过多。高钠血症:失水大于失盐,氯化物相对浓度增高。,医学决定水平的临床应用举例,24,“低、低、高”模式血清清蛋白(Alb)有三个DL:20g/L、35g/L、52g/L。20g/L表示肝病患者的预后严重;35g/L为检查低清蛋白血症的界值;52g/L则稍高于参考范围上限,可排除许多假阳性。,医学决定水平的临床应用举例,25,“低、高、高”模式血清总钙有三个DL:1.75mmol/L、2.75mmol/L、3.38mmol/L。1.75mmol/L以下时,应加做其他检查以明确病人发生低血钙抽搐的可能性,并采取预防措施;2.75mmol/L作为观察副甲状腺(甲状旁腺)功能是否亢进的血清钙低限值,等于或高于该值时,应加做其他检查以确诊或排除原发性副甲亢的诊断;3.38mmol/L以上则考虑为高血钙昏迷,应及时做出诊断,不得延误。,医学决定水平的临床应用举例,返回章目录,26,金标准(goldstandard):当前为临床医学界公认的诊断某种疾病最可靠的诊断方法,可通过活检、尸检、外科手术、随访等所作出的决定性诊断,又称确诊试验。,第三节诊断试验的指标与评价,金标准,有一些疾病目前尚无金标准,由专业学术委员会或世界卫生组织(WHO)制定的诊断标准可作为参考标准。,参考标准,27,确立金标准后,再与诊断试验同步盲法测量研究对象,据金标准将研究对象划分为“有某病”、“无某病”,据诊断试验的临界值将其划分为“阳性”、“阴性”结果,然后整理出相应的四格表计算准确性、有效性等评价指标。,研究程序,28,诊断试验的四格表,29,真阳性(truepositive,TP):金标准确诊为有某病且诊断试验检出为阳性的例数。假阳性(falsepositive,FP):金标准确诊为无某病且诊断试验检出为阳性的例数。真阴性(truenegative,TN):金标准确诊为无某病且诊断试验检出为阴性的例数。假阴性(falsenegative,FN):金标准确诊为有某病且诊断试验检出为阴性的例数。,诊断试验的四种结果,30,1.准确性评价指标又称为真实性评价指标,包括如灵敏度、特异度和准确度等。2.有效性评价指标包括预测值、流行率和似然比等。3.可靠性评价指标指重复进行试验得到相同结果的稳定程度,包括变异系数、符合率等。,一、诊断试验的指标,31,表3-2诊断试验结果与常见评价指标,32,1.灵敏度与漏诊率2.特异度与误诊率3.准确度,诊断试验的准确性评价指标,33,4正确指数又称尤登指数(youdenindex,YI)SeSp115Kappa指数又称为总一致性指数,公式为:尤登指数与Kappa指数在01之间变动,其值愈大,诊断试验与金标准的一致性愈好。一般在0.75以上时被认为具有高度的一致性。,诊断试验的准确性评价指标,34,1.预测值2.流行率3.似然比,诊断试验的有效性评价指标,35,一项诊断试验能够确定或排除某疾病存在与否的诊断概率,称为预测值(predictivevalue,PV),又称预告值,也称为试验后诊断为患某病的可能性即验后概率(posttestprobability)。包括阳性预测值(positivepredictivevalue,+PV)和阴性预测值(negativepredictivevalue,PV)。,预测值,36,流行率(prevalence,P),又称患病率,也称为试验前诊断为患某病的可能性即验前概率(pretestprobability)。Bayes公式:预测值与流行率、灵敏度及特异度的关系式:PV=PV,流行率,37,可见,流行率对阳性预告值(+PV)的影响最大。临床上很好的试验,在流行率偏低时用作普查效果并不理想。,表3-3流行率、灵敏度和特异度对某疾病PV的影响,流行率,38,诊断试验检测的患某病者中阳性率、阴性率分别与未患某病者中之比称为似然比(likelihoodratio,LR)。似然比包括阳性似然比(positivelikelihoodratio,LR或LR()和阴性似然比(negativelidelihoodratio,LR或LR()。似然比性质稳定,不因流行率的改变而改变。,似然比,39,LR真阳性率愈高,则LR愈大。LR真阴性率愈高,则LR愈小。,似然比,40,似然比可直接判断一个诊断试验的好坏:LR2.05.0,认为该试验不太好;超过10.0,可认为是好的试验。LR0.50.2,认为该试验不太好,而小于0.1,可认为是好的试验。,似然比,41,Bayes公式:预测值与流行率及似然比的关系式:,似然比,42,可靠性(reliability),又称重复性(repeatability)、精密度(precision)1.变异系数或标准差2.符合率两名操作者同时对比检测,列四格表计算。符合率愈高,试验的可靠性愈好符合率,诊断试验的可靠性评价指标,43,描述诊断试验可靠性符合率与诊断试验准确性评价指标总符合率的含义不同,前者是两名操作者相互比较,而后者以金标准为依据。,可靠性指标符合率的含义,44,1.受试者的生物学变异2.操作者的测量变异包括操作者的变异和试验方法差异,诊断试验可靠性的影响因素,45,血压:测量结果可因时间、地点及受试者的情绪等而异,此为受试者的生物学变异。,受试者的生物学变异,46,1.操作者的变异操作者对测定结果判断的不一致所致的差异,包括同一操作者内的变异(如不同时间、条件时)和不同操作者之间的变异。2.试验方法差异仪器、试剂以及测定条件等因素所引起的变异。因此,提高诊断试验可靠性的方法是加强诊断试验的标准化,如对操作者严格训练等。,操作者的测量变异,47,准确性与可靠性不是必定相关,二者之间的关系有4种情况:准确性与重复性都好准确性好但重复性差准确性差但重复性好准确性与重复性都差,诊断试验可靠性与准确性的关系,48,1.金标准应有可靠性2.研究对象应有代表性与可比性3.样本含量应足够4.诊断指标与方法应标准、具体、可靠5.金标准与诊断试验应同步盲法测量6.临界值的选择应合理7.诊断试验应具有临床实用性,二、诊断试验的评价,49,1.诊断标准是不是金标准。金标准一般都是由专业学术委员会或WHO制定,包括若干条款。但在一些疾病没有金标准时其所制定的诊断标准可作为参考标准。2.实际诊断时金标准的测试结果是不是可靠。在使用金标准时必须按其条款进行,确保测试结果的可靠性,避免产生偏倚。,金标准应有可靠性,50,受试者分为病例组和对照组。均应按照按性别、年龄、身高、生理期、职业、地域等分层抽样,并且:1.病例组应包括各型病例,如典型和不典型病例,轻、中、重型病例,早、中、晚期病例,有、无并发症病例,经过治疗与未经过治疗的病例。病例组的来源:包括一般人群、特殊人群、普通门诊或专科门诊。2.对照组包括健康人和有其他疾病的患者,特别是要有容易被混淆而需要鉴别的其他疾病病例。,研究对象应有代表性与可比性,51,样本含量n的计算公式:其中,总体率的估计值P为灵敏度或特异度。当P为灵敏度时,n为病例组例数;当P为特异度时,n为对照组例数。为允许误差(样本率总体率),常取总体率可信区间间距的一半;为第一类错误(应该接受但被拒绝因而误诊或“弃真”)的概率,是对应可信度为1的正态离差(正态分布的面积),查u值表,有单侧与双侧之分,一般取值0.05,单侧1.64,双侧1.96。,样本含量应足够,52,例3.1测定血清肌酸激酶(CK)的阳性结果(200U/L)诊断急性心肌梗死(AMI),据初步试验资料,其灵敏度为0.9,特异度为0.85,设定为0.05,为0.08,试估计所需样本含量。已知P1=0.9,P2=0.85,双侧1.96,0.08,按样本含量计算公式:因此,该诊断试验需要AMI病人54例,无AMI的对照组77例。,样本含量举例,53,1.三类诊断指标要标准、具体主观指标:如研究对象的主诉;半主观指标(或半客观指标):如观察者看到的体征;客观指标:如用仪器测量的数据。2.诊断方法应标准、可靠如方法与材料的详细描述,受试者是否需要限制饮食、禁用某药、试验前后的注意事项、有无副反应等,都要有具体的标准。同一操作者、其他医疗单位在相同条件下进行重复试验时结果都应相同,使诊断试验具有可靠性。,诊断指标与方法应标准、具体、可靠,54,金标准与待评价诊断方法进行同步盲法测量比较。盲法:试验操作者不知道谁有某病,谁无某病;医生也不知道谁的结果阳性,谁的结果阴性。同步:同时间、同地区、同人群。,金标准与诊断试验应同步盲法测量,55,按受试者工作特征曲线(ROC曲线,后述)的构建程序,一般先取多个临界值,计算评价指标如灵敏度或特异度等,再进行比较,选取假阴性和假阳性最少时的值确定为合理的临界值。,临界值的选择应合理,56,实用性:该试验需用何种仪器、试剂,是否安全、方便、费用低廉,病人能否接受,对病人有无损害、有无毒副作用等。,诊断试验应具有临床实用性,57,1.选择高患病率的人群来提高阳性预告值Bayes公式:当诊断方法的敏感度与特异度不变时,阳性预告值随患病率(患病率、验前概率)的升高而变大。2.利用联合试验来提高诊断灵敏度或特异度联合试验:平行试验可提高诊断灵敏度,但降低了特异度;系列试验可提高诊断特异度,但降低了灵敏度。,三、提高临床诊断效率的方法,58,表3-4平行试验与系列试验的区别,返回章目录,59,第四节受试者工作特征曲线,一、受试者工作特征曲线的基本概念,以灵敏度为纵坐标、(1特异度)为横坐标,将相对应的各临界值连接起来的折线图,称为受试者工作特征曲线(receiveroperatingcharacteristiccurve,ROC曲线),简称受试者工作曲线。ROC曲线最早用于描述雷达信号和噪声之间的关系,以评价雷达性能,又称为接收者操作特性曲线,或称为相对工作特征曲线、相对工作曲线(relativeoperatingcharacteristiccurve)。,60,ROC曲线,61,传统的诊断试验与ROC曲线方法比较,62,二、受试者工作特征曲线的构建与曲线下面积的计算,根据金标准诊断结果将诊断试验数据分段、设定各临界值、划分四格表,再计算各临界值下的真阳性率、假阳性率,最后绘制ROC曲线,计算曲线下面积(areaunderthecurve,AUC)。,63,例3.2果糖胺(FTA)诊断糖尿病(DM)。收集无糖尿病血清55例、有糖尿病血清74例,测定FTA含量。现选取4个截断点(1.30、1.50、1.70、1.90mmol/L将FTA检测值分成5个部分:正常(1.30)、大致正常1.30,1.50)、可疑1.50,1.70)、大致异常1.70,1.90)和异常(1.90),评估患糖尿病的可能性(表3-5)。试做ROC曲线,计算AUC与标准误(SE)。,ROC曲线举例,64,表3-5129例中老年人果糖胺检测结果,65,诊断试验结果:连续性资料(定量试验资料);有序分类资料(定性试验资料)。本例FTA检测值为连续性资料,为简化计算,转化成了5种有序分类资料的形式。取4个临界值1.30、1.50、1.70、1.90mmol/L,整理出相应的四格表及计算评价指标(表3-6)。,整理资料成为四格表,66,表3-6果糖胺在4个临界值时的分类评价指标,67,以真阳性率(灵敏度)为纵坐标、假阳性率(1特异度)为横坐标,将相对应的各临界值(截断点)连接起来得到ROC曲线(图3-3)。为计算AUC及便于观察,将图中的原点、右上角与相邻临界值点相连接。,ROC曲线的绘制,68,表3-7计算ROC曲线下面积与标准误的中间结果,*717412,余类推*275501918,余类推,69,AUC与标准误(SE)的计算,70,AUC的判断,判断标准:AUC在0.9以上时有较高准确性。本例AUC95的置信区间为:AUC1.96SE0.96361.960.01470.9348,0.9924该区间大于0.9,表明果糖胺对糖尿病的诊断价值较高。,71,500名收入冠心病监护室的病人,在入院当天抽血作CK检查,CK结果分布见下表。医生在不知道CK结果的情况下,根据心电图结果和临床报告,确诊300名病人患心肌梗死,其它200名无心肌梗死。,CK结果分布表,ROC曲线举例,72,试问:从定性上观察,CK活性与心肌梗死有何关系?从表中可以选定6个阈值:10U/L、180U/L、360U/L、540U/L、720U/L、900U/L,试列表计算前4个阈值的诊断敏感度、特异度及试验后诊断的可能性(PV、PV);采用哪个阈值时诊断效果最好?,ROC曲线举例,73,CK越大,患心肌梗死的概率就越大。各个阈值下的计算结果见下表:,各阈值下的敏感度、特异度及预测值的计算结果,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论