ROC曲线软件在处理不同类型资料中的应用探讨.doc_第1页
ROC曲线软件在处理不同类型资料中的应用探讨.doc_第2页
ROC曲线软件在处理不同类型资料中的应用探讨.doc_第3页
ROC曲线软件在处理不同类型资料中的应用探讨.doc_第4页
ROC曲线软件在处理不同类型资料中的应用探讨.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国循证医学杂志 2004年 4卷 2期 起止页码:132-135,103ROC曲线软件在处理不同类型资料中的应用探讨牛华 肖质 刘莉 孙鹥 王建琼 黄永红 台虹 赵崇吉云南省临床检验中心 ( 650032 昆明)摘要:目的 探讨在进行ROC曲线分析过程中对不同类型资料处理时应注意的问题及其解决方法。方法 用云南省临床检验中心开发的中文ROC曲线分析软件,根据各心肌损伤标志物心肌肌钙蛋白(cTNT)、肌红蛋白(MYO)和肌酸激酶同工酶质量(CK-MB mass)测定结果资料分布特点及类型选择在全程数据范围内(即两组资料从最低值至最高值范围)或选择在重叠范围内进行ROC曲线分析处理。结果 各心肌损伤标志物在不同时间内原始测定结果的资料分布极差非常大,经对数转换后资料分布极差明显减小可直接进行全程数据范围的ROC曲线分析,否则分析的结果无效或很不理想;若选择用两组资料重叠范围内的处理方法,其分析结果与对数转换后进行的全程数据范围处理结果一致。结论 在进行ROC曲线分析时,应注意资料数据的分布规律,选择不同的统计方式。 关键词: ROC曲线 中文软件 心肌标志物 对数转换 The application of ROC program with different types dataNiu Hua, Xiao Zhi, Liu Li, Sun Yi, Wang Jianqiong, Huang Yonghong, Tai Hong, Zhao Chongji. Yunnan Provincial Clinical Laboratory Center, Kunming, 650032, China.【Abstract】 Objective To explore the solutions of problems with the ROC analysis for different types data. Methods Two kinds of ROC analyses of three cardiac infarction markers, cTNT, MYO and CK-MB mass, were performed with the ROC program developed by Yunnan Provincial Clinical Laboratory Center. Results The distribution of prime data had a large range, which produced a bad analysis result. After logarithmic transformation, the prime data that had smaller range now can be analyzed with full-span method. The results were similar to the ROC analyzed with the overlapped data. Conclusion We should choose different statistical method depend on the distribution of data when we performed ROC analyses.Key words ROC curve; Chinese software; Cardiac infarction markers; logarithmic transformationROC (Receiver Operating Characteristic)曲线分析在诊断性试验中,用于诊断临界点的正确选择,对临床实验室工作尤为重要。但目前国内外应用的ROC曲线软件有的是选择在全程数据范围内进行处理分析(既疾病组与非疾病组分布的两组资料从最低值至最高值范围);有的是选择在两组资料重叠范围内进行处理分析。不同软件提供的分析功能不同,对分析数据的要求也不同,若忽视数据资料的分布情况,可能会导致ROC曲线分析结果不理想或得出错误的结果。本文依据各心肌损伤标志物心肌肌钙蛋白(cTNT)、肌红蛋白(MYO)和肌酸激酶同工酶质量(CK-MB mass)测定结果资料分布特点及类型选择在全程数据范围内或选择在重叠范围内进行ROC曲线分析处理,以探讨ROC曲线分析不容忽视的数据分布问题及其处理方法。材料和方法一研究对象1. AMI组 符合WHO标准诊断1的AMI患者79例(男70 例,女9 例) ,年龄3188岁。2. 疾病对照组 同期住院的不稳定心绞痛患者35例、心绞痛患者18例、缺血性心肌病患者14例和冠心病并心衰13例(男 39 例,女 41 例),年龄4791岁。二标本采集患者在入院2小时内、24小时内和48小时内分别采集静脉血标本并立即分离血清进行测定。三仪器和试剂1仪器 Elecsys2010电化学自动免疫分析仪 Roche公司生产1试剂 (1)CK-MB mass检测试剂:Roche公司生产,批号15765102 ,校准液批号156389。(2)cTNT检测试剂:Roche公司生产,批号158468,校准液批号154259。(3)MYO检测试剂:Roche公司生产,批号15908601,校准液批号154400。质控品批号:156988。四软件的开发1软件的开发环境Windows 98 中文版 (美国Microsoft公司)Delphi 7.0 英文版 (美国Borland公司)2软件设计方案2.1 统计指标:ROC曲线下面积、真阳性数、假阳性数、真阴性数、假阴性数、敏感度、特异度、诊断指数、准确度、阳性预测值、阴性预测值、患病率、阳性似然比、阴性似然比、验后概率。共计15项。2.2 为适应不同数据的分布情况,数据分组可选择全程分组或数据重叠区分组的方法。2.3统计图:频数分布图、单一ROC曲线图和ROC曲线图综合图。2.4图表保存:可任意命名,以BMP格式保存到任意路径,可插入到WPS、Word、Eexcel、Power Point等文字处理、办公软件中。2.5打印:A4幅面,分为原始数据、统计指标和统计图三种打印格式。2.6数据库格式:MDB。2.7数据库接口:ActiveX数据对象(ActiveX Data Objects,ADO)。2.8帮助文件:chm格式。3软件发布方式以光盘为载体的安装盘。每套软件包括安装盘一片,使用手册一本,注册后即可运行。4 软件运行环境中文Windows98/2000/XP五数据统计方法1对各心肌损伤标志物测定结果原始数据进行算术平均值、中位数及对数转换值的算术平均值、中位数统计处理。2各心肌损伤标志物测定结果进行对数转换的方法: cTNT对数值=lg(cTNT1000);CK-MB mass对数值=lg(CK-MB10);MYO对数转换值=lg(MYO)。结 果一. 非AMI及AMI患者不同时间各心肌标志物测定结果原始数据的均值、中位数、范围和对数转换值的均值、中位数、范围见表1表1 非AMI及AMI患者不同时间各心肌标志物的测定结果Tab 1. Levels of Cardiac infarction markers in non-AMI and AMI patients at different time phrases项 目测 定 值非AMI患者对照组AMI患者入院2小时内AMI患者入院24小时内AMI患者入院48小时内心肌肌钙蛋白cTnT(g /L)肌酸激酶同工酶质量CK-MB-mass(g /L)肌红蛋白MYO(g /L)原始数据均值原始数据中位数原始数据范围对数转换值均值对数转换值中位数对数转换值范围原始数据均值原始数据中位数原始数据范围对数转换值均值对数转换值中位数对数转换值范围原始数据均值原始数据中位数原始数据范围对数转换值均值对数转换值中位数对数转换值范围0.0120.010.010.0561.0621.001.01.7482.3572.321.154.121.3571.365 1.0611.61544.3841.52199.231.6201.6181.3221.9960.5310.1670.014.02.1482.2221.03.633.69920.611.38250.42.2012.3141.1393.398356.61123.824.6929062.1332.093 1.3923.4631.3550.6320.01210.352.7462.8011.0794.01575.52423.061.945002.3752.3621.2883.698275.411729.919282.2072.0681.4763.2852.1380.8710.01518.482.8812.9411.1764.26740.866.651.23251.52.0561.8221.0893.400163.0762.028.4114961.9291.7921.4533.174表1结果显示:非AMI患者各心肌标志物测定结果的均值近似等于中位数,数据分布极差较小。而AMI患者在入院2小时内、24小时内和48小时内cTNT测定结果原始数据的均值与中位数相差2-4倍,数据范围最高值与最低值相差4001232倍,数据分布极差很大。CK-MB mass和MYO的情况也与之相同。二 应用ROC曲线分析软件(第一版) 2进行两组资料全程数据的处理分析从表1看出,若以cTNT 24小时内资料分析为例,原始数据对照组测定值从0.010.056g /L,而测定组的值从0.01210.35g /L,两组资料重叠范围为0.0120.056g /L,两组资料全程范围为0.0110.35g /L;经对数转换后,cTNT对照组测定值从1.01.748,测定组的值从1.0794.015,两组资料重叠范围为1.0791.748,两组资料全程范围为1.04.015。若要在两组资料重叠范围得出5个诊断临界值,可按软件的提示选择输入组间距2,则原始数据的组间距应选为0.0088g /L,全程ROC曲线分析要分成1175组;而对数转换值的组间距应选为0.13g /L,全程ROC曲线分析要分成23组。同样,cTNT 48小时内资料分析原始数据全程ROC曲线分析要分成2252组。故,当cTNT这类原始资料若选择的组间距及全程分组达不到要求时,可导致全程ROC曲线分析软件处理结果无效。但采用对数转换值进行的全程ROC曲线分析结果非常理想(见图1),当要求诊断临界值越多时,则输入的组间距越小,全程分组越多。从图1得知,cTNT 24小时内诊断指数最大时的对数临界值为1.78,取其反对数值应为0.06g /L,对应的敏感度为0.89,特异度为1.0,AUC面积为0.973;cTNT 24小时内最佳对数临界值为1.65,取其反对数值应为0.045g /L,对应的敏感度为0.92,特异度为0.95;cTNT其他时间的评价结果及CK-MB mass和MYO的评价结果见表2。图1 cTNT 24小时内测定结果对数转换值ROC曲线图 (选全程分析)Fig 1. ROC curve of cTNT in 24 hours after logarithmic transformation (analyzed with full-span data)三应用ROC曲线分析软件(第二版)进行两组资料重叠范围内的处理分析从表1看出,若以cTNT 24小时内资料分析为例,原始数据全程分布范围为0.0110.35g /L,两组资料重叠范围为0.0120.056g /L。当临界值选为0.012g /L时,其敏感度为1.0;若临界值选为0.056g /L时,其特异度为1.0;随着临界值由小到大的改变,其敏感度由高降低,特异度由低升高。若要在两组资料重叠范围得出5个诊断临界值,则组间距应选为0.0088g /L,ROC曲线分析只需分成5组(见图2)。从图2得知,cTNT 24小时内诊断指数最大时的临界值为0.06g /L ,对应的敏感度为0.89,特异度为1.0,AUC面积为0.97;cTNT 24小时内最佳临界值(见图中十字光标处)为0.044g /L,对应的敏感度为0.92、特异度为0.95、阳性似然比为20.46、验后慨率为0.95;cTNT其它时间的评价结果及CK-MB mass和MYO的评价结果见表2。图2 cTNT 24小时内原始测定结果ROC曲线图 (选重叠范围分析)Fig 2. ROC curve of cTNT in 24 hours without logarithmic transformation (analyzed with overlapped data)从图1和图2的分析结果得出,两组资料重叠范围内的分析结果与采用对数转换值进行的全程ROC曲线分析结果是一致的,同时采用人工计算复核分析结果也一致。四应用ROC曲线分析软件(第二版)进行ROC曲线综合图的处理分析 以24小时内cTNT、CK-MB mass和MYO分析为例,在ROC曲线综合图中,点击【打开】选择24小时内cTNT、CK-MB mass、MYO三组数据资料,即可得到三组资料的综合ROC曲线图(见图3)。图3 24小时内cTNT、CK-MB mass和MYO三项指标ROC曲线综合图Fig 3. ROC curves of cTNT, CK-MB mass and MYO in 24 hours注:AUC1:0.97(cTNT)、AUC2:0.93( CK-MB mass)、AUC3:0.82(MYO)四. AMI患者各心肌损伤标志物ROC曲线评价指标AMI患者在入院2小时内、24小时内和48小时内各心肌损伤标志物ROC曲线部分特性见表2表2 AMI患者不同时间各心肌标志物ROC曲线评价指标Tab 2.Evaluation for ROC curve of Cardiac infarction markers in AMI patients at different time phrases项 目时 间最佳临界值AUC(%)灵敏度(%)特异度(%) 准确度(%)阳性似然比阴性似然比cTnT(g /L)CK-MBmass(g /L)MYO(g /L)2小时内24小时内48小时内 2小时内24小时内48小时内2小时内24小时内48小时内0.04 0.0450.043.803.473.2677.876.274.197.097.394.589.493.284.281.982.472.988.092.088.079.091.077.064.059.052.095.095.096.093.095.091.096.096.0 80.089.093.090.084.089.084.078.080.074.017.618.422.026.313.010.719.6914.75 8.80.130.080.130.220.10.270.420.43 0.59讨 论根据循证检验医学对选择诊断性试验研究对象的要求,我们选择轻、中与重型AMI病例为测定组,而选择容易与AMI混淆的不稳定心绞痛、心绞痛、缺血性心肌病和冠心病并心衰等病例为对照组。故,从表1结果可看出,这三项心肌损伤标志物测定结果的数据分布范围极差很大,但重叠范围反而比较小,尤其是cTNT和CK-MB mass两项标志物。因此,若我们选择使用的是全程数据分析方式时,就要求组间距非常小及全程分组比较多(如cTNT 24小时内和48小时内的全程ROC曲线分析要分成1175组和2252组),否则,可导致全程ROC曲线分析软件处理结果无效。例如国外提供的免费ROC曲线分析软件“ROCKIT 0.9 B” 3,其采用的即为全程ROC曲线分析法,当资料全程分布范围为0.1417.0,两组资料重叠范围为0.8682.618时,它进行了249组的全程ROC曲线分析,其对应的分界值有249个。采用全程ROC曲线分析法除得到相应的诊断分界值外,可对所有数据进行全面分析比较,如图1可直观显示全部数据的诊断分界值及其对应的敏感度和特异度。最适合大样本不同检测水平的分层似然比的分析,既从最低值开始分层计算各检测水平的诊断分界值及其对应的阳性似然比或阴性似然比,依据不同分层的似然比和验前概率,可进行患病的验后概率的计算,对诊断性试验进行综合的评价。我们开发的中文ROC曲线分析软件具有依据不同分层的似然比和估计的验前概率进行患病的验后概率的计算功能(见图2)。为此,应依据资料的类型和分析目的来选择处理方式。国内林龙顺等编的医学试验评价系统(在DOS3.2环境下)中ROC 曲线分析部分,采用的是在两组资料重叠范围内人工选择输入多个分析临界值的处理方法,既要根据资料的情况由小到大输入或由大到小输入分析临界值,这对使用者如何正确选择分析临界值有一定的要求。而我们的软件可按软件的提示选择输入分析临界值。常用的统计学方法要求资料呈正态分布或近

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论