ROC曲线软件在处理不同类型资料中的应用探讨_第1页
ROC曲线软件在处理不同类型资料中的应用探讨_第2页
ROC曲线软件在处理不同类型资料中的应用探讨_第3页
ROC曲线软件在处理不同类型资料中的应用探讨_第4页
ROC曲线软件在处理不同类型资料中的应用探讨_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国循证医学杂志2004年4卷2期起止页码:132-135,103ROC曲线软件在处理不同类型资料中的应用探讨牛华肖质刘莉孙鹥王建琼黄永红台虹赵崇吉云南省临床检验中心( 650032 昆明摘要:目的探讨在进行ROC曲线分析过程中对不同类型资料处理时应注意的问题及其解决方法。方法用云南省临床检验中心开发的中文ROC曲线分析软件,根据各心肌损伤标志物心肌肌钙蛋白(cTNT、肌红蛋白(MYO和肌酸激酶同工酶质量(CK-MB mass测定结果资料分布特点及类型选择在全程数据范围内(即两组资料从最低值至最高值范围或选择在重叠范围内进行ROC曲线分析处理。结果各心肌损伤标志物在不同时间内原始测定结果的资料

2、分布极差非常大,经对数转换后资料分布极差明显减小可直接进行全程数据范围的ROC曲线分析,否则分析的结果无效或很不理想;若选择用两组资料重叠范围内的处理方法,其分析结果与对数转换后进行的全程数据范围处理结果一致。结论在进行ROC曲线分析时,应注意资料数据的分布规律,选择不同的统计方式。关键词:ROC曲线中文软件心肌标志物对数转换The application of ROC program with different types dataNiu Hua, Xiao Zhi, Liu Li, Sun Yi, Wang Jianqiong, Huang Yonghong, Tai Hong, Zha

3、o Chongji. Yunnan Provincial Clinical Laboratory Center, Kunming, 650032, China. 【Abstract】Objective To explore the solutions of problems with the ROC analysis for different types data. Methods Two kinds of ROC analyses of three cardiac infarction markers, cTNT, MYO and CK-MB mass, were performed wi

4、th the ROC program developed by Yunnan Provincial Clinical Laboratory Center. Results The distribution of prime data had a large range, which produced a bad analysis result. After logarithmic transformation, the prime data that had smaller range now can be analyzed with full-span method. The results

5、 were similar to the ROC analyzed with the overlapped data. Conclusion We should choose different statistical method depend on the distribution of data when we performed ROC analyses.Key words ROC curve; Chinese software; Cardiac infarction markers; logarithmic transformationROC (Receiver Operating

6、Characteristic曲线分析在诊断性试验中,用于诊断临界点的正确选择,对临床实验室工作尤为重要。但目前国内外应用的ROC曲线软件有的是选择在全程数据范围内进行处理分析(既疾病组与非疾病组分布的两组资料从最低值至最高值范围;有的是选择在两组资料重叠范围内进行处理分析。不同软件提供的分析功能不同,对分析数据的要求也不同,若忽视数据资料的分布情况,可能会导致ROC曲线分析结果不理想或得出错误的结果。本文依据各心肌损伤标志物心肌肌钙蛋白(cTNT、肌红蛋白(MYO和肌酸激酶同工酶质量(CK-MB mass测定结果资料分布特点及类型选择在全程数据范围内或选择在重叠范围内进行ROC曲线分析处理,以

7、探讨ROC曲线分析不容忽视的数据分布问题及其处理方法。材料和方法1. AMI组符合WHO标准诊断1的AMI患者79例(男70 例,女9 例 ,年龄3188岁。2. 疾病对照组同期住院的不稳定心绞痛患者35例、心绞痛患者18例、缺血性心肌病患者14例和冠心病并心衰13例(男39 例,女41 例,年龄4791岁。患者在入院2小时内、24小时内和48小时内分别采集静脉血标本并立即分离血清进行测定。1.试剂(1CK-MB mass检测试剂:Roche公司生产,批号15765102 ,校准液批号156389。(2cTNT检测试剂:Roche公司生产,批号158468,校准液批号154259。(3MYO检

8、测试剂:Roche公司生产,批号15908601,校准液批号154400。质控品批号:156988。Windows 98 中文版 (美国Microsoft公司Delphi 7.0 英文版 (美国Borland公司2.1 统计指标:ROC曲线下面积、真阳性数、假阳性数、真阴性数、假阴性数、敏感度、特异度、诊断指数、准确度、阳性预测值、阴性预测值、患病率、阳性似然比、阴性似然比、验后概率。共计15项。2.2 为适应不同数据的分布情况,数据分组可选择全程分组或数据重叠区分组的方法。2.3统计图:频数分布图、单一ROC曲线图和ROC曲线图综合图。2.4图表保存:可任意命名,以BMP格式保存到任意路径,

9、可插入到WPS、Word、Eexcel、Power Point等文字处理、办公软件中。2.5打印:A4幅面,分为原始数据、统计指标和统计图三种打印格式。2.6数据库格式:MDB。2.7数据库接口:ActiveX数据对象(ActiveX Data Objects,ADO。2.8帮助文件:chm格式。以光盘为载体的安装盘。每套软件包括安装盘一片,使用手册一本,注册后即可运行。4 软件运行环境中文Windows98/2000/XP1.对各心肌损伤标志物测定结果原始数据进行算术平均值、中位数及对数转换值的算术平均值、中位数统计处理。2.各心肌损伤标志物测定结果进行对数转换的方法:cTNT对数值=lg(

10、cTNT×1000;CK-MB mass对数值=lg(CK-MB×10;MYO对数转换值=lg(MYO。结果一.非AMI及AMI患者不同时间各心肌标志物测定结果原始数据的均值、中位数、范围和对数转换值的均值、中位数、范围见表1表1 非AMI及AMI患者不同时间各心肌标志物的测定结果Tab 1. Levels of Cardiac infarction markers in non-AMI and AMI patients at different time phrases项目测定值非AMI患者对照组AMI患者入院2小时内AMI患者入院24小时内AMI患者入院48小时内心肌肌

11、钙蛋白cTnT(g /L肌酸激酶同工酶质量CK-MB-mass(g /L肌红蛋白MYO(g /L 原始数据均值原始数据中位数原始数据范围对数转换值均值对数转换值中位数对数转换值范围原始数据均值原始数据中位数原始数据范围对数转换值均值对数转换值中位数对数转换值范围原始数据均值原始数据中位数原始数据范围对数转换值均值对数转换值中位数对数转换值范围24.6929061.9450011729.9192828.411496表1结果显示:非AMI患者各心肌标志物测定结果的均值近似等于中位数,数据分布极差较小。而AMI患者在入院2小时内、24小时内和48小时内cTNT 测定结果原始数据的均值与中位数相差2-

12、4倍,数据范围最高值与最低值相差4001232倍,数据分布极差很大。CK-MB mass和MYO的情况也与之相同。二.应用ROC曲线分析软件(第一版 2进行两组资料全程数据的处理分析从表1看出,若以cTNT 24小时内资料分析为例,原始数据对照组测定值从0.010.056g /L,而测定组的值从0.01210.35g /L,两组资料重叠范围为0.0120.056g /L ,两组资料全程范围为0.0110.35g /L ;经对数转换后,cTNT 对照组测定值从1.01.748,测定组的值从1.0794.015,两组资料重叠范围为1.0791.748,两组资料全程范围为1.04.015。若要在两组

13、资料重叠范围得出5个诊断临界值,可按软件的提示选择输入组间距2,则原始数据的组间距应选为0.0088g /L ,全程ROC 曲线分析要分成1175组;而对数转换值的组间距应选为0.13g /L ,全程ROC 曲线分析要分成23组。同样,cTNT 48小时内资料分析原始数据全程ROC 曲线分析要分成2252组。故,当cTNT 这类原始资料若选择的组间距及全程分组达不到要求时,可导致全程ROC 曲线分析软件处理结果无效。但采用对数转换值进行的全程ROC 曲线分析结果非常理想(见图1,当要求诊断临界值越多时,则输入的组间距越小,全程分组越多。 从图1得知,cTNT 24小时内诊断指数最大时的对数临界

14、值为1.78,取其反对数值应为0.06g /L ,对应的敏感度为0.89,特异度为1.0,AUC 面积为0.973;cTNT 24小时内最佳对数临界值为1.65,取其反对数值应为0.045g /L ,对应的敏感度为0.92,特异度为0.95;cTNT 其他时间的评价结果及CK-MB mass 和MYO 的评价结果见表2。 Fig 1. ROC curve of cTNT in 24 hours after logarithmic transformation (analyzed with full-span data三.应用ROC 曲线分析软件(第二版进行两组资料重叠范围内的处理分析从表1看出

15、,若以cTNT 24小时内资料分析为例,原始数据全程分布范围为0.0110.35g /L ,两组资料重叠范围为0.0120.056g /L 。当临界值选为0.012g /L 时,其敏感度为1.0;若临界值选为0.056g /L 时,其特异度为1.0;随着临界值由小到大的改变,其敏感度由高降低,特异度由低升高。若要在两组资料重叠范围得出5个诊断临界值,则组间距应选为0.0088g /L ,ROC 曲线分析只需分成5组(见图2。、阳性似然比为20.46、验后慨率为0.95;cTNT 其它时间的评价结果及CK-MB mass 和MYO 的评价结果见表2。 Fig 2. ROC curve of cT

16、NT in 24 hours without logarithmic transformation (analyzed with overlapped data从图1和图2的分析结果得出,两组资料重叠范围内的分析结果与采用对数转换值进行的全程ROC 曲线分析结果是一致的,同时采用人工计算复核分析结果也一致。四.应用ROC 曲线分析软件(第二版进行ROC 曲线综合图的处理分析以24小时内cTNT 、CK-MB mass 和MYO 分析为例,在ROC 曲线综合图中,点击【打开】选择24小时内cTNT 、CK-MB mass 、MYO 三组数据资料,即可得到三组资料的综合ROC 曲线图(见图3。 注

17、:AUC1:0.97(cTNT、AUC2:0.93( CK-MB mass、AUC3:0.82(MYO四. AMI 患者各心肌损伤标志物ROC 曲线评价指标AMI 患者在入院2小时内、24小时内和48小时内各心肌损伤标志物ROC 曲线部分特性见表2表2 AMI 患者不同时间各心肌标志物 ROC 曲线评价指标 最佳 临界值 0.04 0.045 0.04 3.80 3.47 3.26 77.8 76.2 74.1 灵敏度 (%) 88.0 92.0 88.0 79.0 91.0 77.0 64.0 59.0 52.0 特异度 (%) 95.0 95.0 96.0 93.0 95.0 91.0 9

18、6.0 96.0 80.0 准确度 (%) 89.0 93.0 90.0 84.0 89.0 84.0 78.0 80.0 74.0 阳性 似然比 17.6 18.4 22.0 26.3 13.0 10.7 19.69 14.75 8.8 阴性 似然比 0.13 0.08 0.13 0.22 0.1 0.27 0.42 0.43 0.59 Tab 2.Evaluation for ROC curve of Cardiac infarction markers in AMI patients at different time phrases 项 目 cTnT (g /L 时 间 2 小时内 2

19、4 小时内 48 小时内 2 小时内 24 小时内 48 小时内 2 小时内 24 小时内 48 小时内 AUC (%) 97.0 97.3 94.5 89.4 93.2 84.2 81.9 82.4 72.9 CK-MB mass (g /L MYO (g /L 讨 论 根据循证检验医学对选择诊断性试验研究对象的要求,我们选择轻、中与重 型 AMI 病例为测定组,而选择容易与 AMI 混淆的不稳定心绞痛、心绞痛、缺血 性心肌病和冠心病并心衰等病例为对照组。故,从表 1 结果可看出,这三项心肌 损伤标志物测定结果的数据分布范围极差很大,但重叠范围反而比较小,尤其是 cTNT 和 CK-MB m

20、ass 两项标志物。因此,若我们选择使用的是全程数据分析方 式时,就要求组间距非常小及全程分组比较多(如 cTNT 24 小时内和 48 小时内 的全程 ROC 曲线分析要分成 1175 组和 2252 组) ,否则,可导致全程 ROC 曲线 分析软件处理结果无效。例如国外提供的免费 ROC 曲线分析软件 “ROCKIT 0.9 B” 3 ” ,其采用的即为全程 ROC 曲线分析法,当资料全程分布 范围为 0.1417.0,两组资料重叠范围为 0.8682.618 时,它进行了 249 组的全程 ROC 曲线分析,其对应的分界值有 249 个。 采用全程 ROC 曲线分析法除得到相应的诊断分界

21、值外,可对所有数据进行 全面分析比较, 如图 1 可直观显示全部数据的诊断分界值及其对应的敏感度和特 异度。最适合大样本不同检测水平的分层似然比的分析,既从最低值开始分层计 算各检测水平的诊断分界值及其对应的阳性似然比或阴性似然比, 依据不同分层 的似然比和验前概率,可进行患病的验后概率的计算,对诊断性试验进行综合的 评价。我们开发的中文 ROC 曲线分析软件具有依据不同分层的似然比和估计的 验前概率进行患病的验后概率的计算功能(见图 2) 。为此,应依据资料的类型 和分析目的来选择处理方式。 国内林龙顺等编的医学试验评价系统(在 DOS3.2 环境下)中 ROC 曲线分 析部分, 采用的是在两组资料重叠范围内人工选择输入多个分析临界值的处理方 法,既要根据资料的情况由小到大输入或由大到小输入分析临界值,这对使用者 如何正确选择分析临界值有一定的要求。 而我们的软件可按软件的提示选择输入 6 分析临界值。 常用的统计学方法要求资料呈正态分布或近似正态分布,进行 ROC 曲线分 析虽对资料分布没有要求。但如果采用的软件是全程 ROC 曲线分析法,则对分 布范围很大(即极差大)的资料应进行适当的数据转换以使其分布范围减小,在 进行有限的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论