如何阅读医学论文(六) 汇总其他论文的论文(系统性文献综述和汇总分析)..pdf_第1页
如何阅读医学论文(六) 汇总其他论文的论文(系统性文献综述和汇总分析)..pdf_第2页
如何阅读医学论文(六) 汇总其他论文的论文(系统性文献综述和汇总分析)..pdf_第3页
如何阅读医学论文(六) 汇总其他论文的论文(系统性文献综述和汇总分析)..pdf_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育与争鸣 如何阅读医学论文 六 汇总其他论文的论文 系统性文献综述和汇总分析 How to read a paper Papers that summarise other papers systematic reviews and meta2 analyses Trisha Greenhalgh 您还记得学生时常写的文章吗 那 时 您要查阅大量书目和杂志 以期找到相 关的章节把它摘出来 如果看到的内容与 您正在构想的理论不符 您就会把它舍弃 这多多少少就是杂志中文献综述 对原始 研究的总结概括 所用的方法 而这种方法 在对原始研究进行挑选 确定和分析时是 不系统的 即非标准化的 非客观的 系统性综述则与之相反 它在对原始 的研究进行总结概括时 要明确说明综述 的目的 材料和方法 而且还用明确的 可 重复的方法进行文献综述 图 1 框图1列出了系统性综述的一些优 点 在进行系统性综述时 不仅是对有关 文献的检索和搜寻要全面 客观 而且还要 有舍弃 有缺陷 文章的明确标准 这些标 准不应受研究结果的影响 最经得起时间 考验的有用的系统性综述 如由Cochrane Collaboration做的有名的综述 要定期更 新 以把最新的研究证据包括进来1 2 既便不是大多数 但仍有很多医学综 述文章采用叙述或杂志用文章的形式撰写 的 Paul Knipschild教授曾描述了诺贝尔 生物化学奖获得者Linus Pauling是如何选 择性地摘录医学文献 以 证明 他提出的 维生素C帮助你活得更长 感觉更好 的 本文要点 一篇系统的综述是用明确的可重复 的方法对原始研究进行概括总结 汇总分析是用数学方法对两个或更 多的研究假说 研究方法相同的原 始研究结果进行综合 尽管汇总分析可能提高结果的精 度 但重要的是 要保证综述的方法 准确可靠 理论3 4 Knipschild及其同事系统地检索 了有关支持和反对这一假设的文献 他们 发现尽管有一两个实验非常肯定地表明维 生素C可能对普通的感冒有预防作用 但 是 有更多的研究没有显示维生素C有任 何益处 有些专家多年致力于某个研究领域 知道所从事的研究 应该 得到什么样结 果 因此 在他们工作的领域里专家对文献 的综述就不如非专家那样客观5 6 如果我 们能指望专家的意见与独立的 系统的文 献综述结果一致 这个问题也许就无关紧 要 可是实际的情况往往并非如此7 58英国医学杂志中文版2000年5月第3卷第2期 本文是系列文章 之六 第1 5篇 见本刊1999年第 1 4期 及2 0 0 0 年第1期 其他文 章将陆续刊出 Unit for Evidence2Based Practice and Policy Department of Primary Care and Population Sciences University College London Medical School Royal Free Hospital School of Medicine Whittington Hospital London N19 5NF Trisha Greenhalgh senivr lecturer p greenhalgh ucl ac uk 1995 2004 Tsinghua Tongfang Optical Disc Co Ltd All rights reserved 图1 对随机对照试验进行系统性综述的方法 系统性文献综述的优点3 用明确的 规定的 方法减少了研究入选或除外所 带来的偏差 由于应用了一些有效的方法使结论更加可靠 准确 医疗卫生人员 研究人员及政策制定者能很快地利 用综述所提供的大量信息 缩短了将研究成果应用于有效诊断和治疗实践的 时间 可以用正规系统的方法对不同研究的结果进行比 较 来确定研究结果有多大的普遍意义 以及各个 研究结果的一致性 无异质性 可以发现造成这些研究异质性 不同研究的结果不 一致 的原因 并有可能针对特殊的亚人群提出新 的研究假说 定量的系统性综述方法 汇总分析 对多个研究的 结果进行全面概括 从而提高了总结果的精度 对系统性综述的评价 问题1 您是否确定了综述所要阐述的重要临 床问题 综述作者首先必须精确定义系统性综述所要阐 述的问题 他才能对每一篇可能有关的文献做出判 断 是将它放到综述中 还是将其判为 与本题无关 而剔除 例如 在进行文献综述时 抗凝剂是否能 预防心房纤颤病人的中风 这一临床问题应被精确 定义为这样一个目的 在非风湿性心房纤颤患者 中 应用华法林类 warfarin2 type 抗凝剂预防继发中 风 既往有过中风或短暂脑缺血发作 的效果及安全 性评价 与安慰剂做比较8 问题2 您是否全面地检索了有关的数据库 并 且查找了其他可能的重要信息来源 即使对美国国立卫生研究院医学文献联机检索 系统 Medline 做了最充分的检索 也会遗漏一些重 要的论文 所以综述作者还必需寻找其他的信息来 源9 浏览文献中的参考文献往往能找到在最初查 询时未查到的有用文章10 此外对一些主流医学以 外的问题 如物理疗法或替代医学等 检索 灰色文 献 框图 2 可能特别重要11 最后要指出的是 如 果要对结果进行统计综合 汇总分析 也许还需要 向原作者索要所发表文章中未包括的个体病人原始 数据 系统性文献综述资料来源一览表 医学文献联机检索系统 Medline Cochrane临床对照试验记录系统 其他的医学及与医学有关的资料库 外文文献 灰色文献 研究生论文 内部报告 未列入数据库 选择范围的杂志 制药工业资料 原始资料中列出的参考文献 以及文献中的参考文 献等 本领域专家了解的其他未发表的资料 通过私人交 流查询 已发表的研究报告的原始资料 通过私人交流获 得 问题3 是否对研究方法的质量作了评估 并相 应地对实验给予了不同的权重 系统性综述作者的工作之一是拟定一套进行综 述的标准 它包括基本的 适用于所有的研究领域 和特定的 只适用于某个特定的研究领域 质量评估 标准 人们可以根据这些标准对每个试验研究进行 评价 框图 3 但是由于在评估一项试验研究 真 实的 方法学质量时没有金标准12 而且综合的质量 评分在实际应用中既不真实有效也不可靠 所以在 68英国医学杂志中文版2000年5月第3卷第2期 教育与争鸣 1995 2004 Tsinghua Tongfang Optical Disc Co Ltd All rights reserved 进行质量评分时应格外小心13 14 Cochrane的各专 业小组正在制定适用于不同专题的评分方法15 以 对所综述的研究进行质量评分 对系统性综述中各项试验研究赋予权重等级 应对每一试验研究的下列方面进行评估 方法学质量 研究设计和实施在多大程度上控 制了系统误差 偏差 精确性 精度 随机误差可能性大小的测量指 标 通常以结果的可信区间宽度来表示 外部真实性 可外推性 研究结果有多大的普 遍意义 还是适用于特定的靶人群 问题4 文献综述的方法是如何影响综述的结 果或结论的 Carl Counsell及其同事 证实 了摇骰子的结果 与急性中风治疗效果之间的完全虚假的联系16 他 们描述了一系列人为的摇骰子实验 在实验中红色 白色和绿色骰子分别代表急性中风的不同疗法 总 体上看 这些 实验 并未显示此3种疗法具有显著 的疗效 随后 模拟汇总分析过程中一些看似非常 合理的做法 例如 由于发表偏差而把一些 阴性 实 验排除在外 亚组分析时把红骰子所表示的治疗方 法的数据剔除 因为从一些结果的回顾分析来看 红 骰子疗法似乎有害 还有一些甚至是随意的做法 例如以 方法的质量问题 为由剔除一些研究等等 这样模拟以后 就使这些 原本无效的 疗法显示了 很好的治疗急性中风的效果 如果这些模拟的结果确实是医学研究中遇到的 问题 那么你将怎样发现这些不易识别的偏差呢 你或许需要通过 假设 结果会怎样 What ifs 这种自问式的方法进行分析 例如 假设文献综述 的作者改变了入选的标准 结果会怎样 假设他们 把未发表的研究排除在外 结果会怎样 假设对这 些研究进行 质量加权 时方法不一 结果会怎样 假设分析中包括 或排除 了方法学质量较低的研 究 结果会怎样 假定一项临床试验中所有失访的 病人已经死亡 或已治愈 了 结果会怎样 这种 假设 结果会怎样 的分析解释被称 为敏感性分析 如果你发现把这些综述的资料从不 同的方面分析解释后 得到的结果与综述的总结果 差异不大或无差别 你就可以认为综述的结论是比 较可靠的 但是 当随着任何 假设 条件的变化 主 要结果也发生改变时 你下结论时就要非常慎重 你 也不要轻易地就依照这样的结论来改变你的临床工 作实践 问题5 是否把定量结果作了合理的解释 是否 适当地考虑了将问题夸大所带来的影响 任何定量的结果 无论它多么精确 准确 有显 著意义 或是说是多么无可争议 最终还是要看它 能否回答综述所要阐明的全部问题 这个问题可能 极简单或极泛泛 无论这个结果怎样 有显著意义 或没有 临床医生都要确定是否应该根据这样的定 量结果去改变对个体病人的治疗 在进行系统性综 述时 还有一个特别重要的问题要加以考虑 那就是 综述中所收集的临床试验研究的外部真实性 可外 推性 或者说这些研究的实际意义 非统计学家的汇总分析 对非统计学专业的学者来说 阅读一篇好的汇 总分析文章常常比阅读此汇总分析采用的大量原始 研究论文更易于理解 汇总分析除了要对定量资料 进行汇总之外 还要对有关信息进行归纳列表 例如 根据入选的标准 样本大小 试验前病人的基线特 征 失访率以及在主要试验终点和次要试验终点时 的研究结果等等 尽管这些表格看上去常常令人生 畏 但是它们却使你摆脱了查阅每篇论文的方法学 的麻烦 而且不需要将一个作者的列表结果与另一 个作者的圆图或柱形图结果进行比较 目前 人们趋向于用比较标准的形式来表示汇 总分析的结果 例如 用Meta View计算机软件分析 图2是汇总分析结果的一个图示 俗称 森林图 它显示的是由8个随机对照试验汇总的比值比 这 些随机对照试验是比较冠脉侧枝搭桥术与经皮冠脉 血管成形术两种方法对严重心绞痛的治疗效果17 这个汇总分析的基本 主要 结局变量是1年内死亡 或心脏病发作 与8个试验研究对应的每条水平线代表随机分 配到实施冠脉成形术组或冠脉侧枝搭桥术组的病人 1年内死亡或心脏病发作的相对危险度的比较 每 条线中间的 小点 是两组结果差异的点值估计 搭 桥术而不是成形术挽救生命效益的最佳点值估计 每条线的长度代表此估计值的95 可信限区间 图形中央的黑色竖线称为 无效线 其意义相当于 78英国医学杂志中文版2000年5月第3卷第2期 教育与争鸣 1995 2004 Tsinghua Tongfang Optical Disc Co Ltd All rights reserved 图2 8个冠脉侧枝搭桥术与经皮冠脉血管成形术疗效比较的随机对照试验的汇 总比数比 MetaView格式显示 此图复制得到了作者许可17 相对危险度为1 0 如果结果 水平线 的可信区间穿过了无效线 垂直线 可能会有两种解释 或是两种疗法的效果 无显著差异 或样本量太小 以致人们不能肯定地确 定真正的结果所在的位置 与侧枝搭桥术比较 每 一研究得到的冠脉血管成形术的相对危险度的点估 计值在0 5到5 0之间 某些研究的可信区间太大 了 以致无法完全显示在图中 位于所有水平线下 面的小菱形点代表这8个试验资料汇总的结果 与 侧枝搭桥手术比较 冠脉血管成形术总合相对危险 度为1 08 这一新汇总后的相对危险度的可信区 间 0 79 1 50 明显变窄了 因为菱形点与无效线 有明显的重叠 所以我们可以认为就基本的试验终 点 第1年内死亡或心脏病发作 来说 这两种疗法 分不出谁好谁坏 在这个例子中 虽然8个试验研 究中的每个试验都表明两种疗法的疗效无显著差 异 然而没有一个研究的样本量大到使人们能肯定 这样的阴性结果的程度 应该注意的是 就这个小小的菱形点并不说明 你可以干脆就给每个心绞痛病人都做冠脉血管成形 术 而不做冠脉侧枝搭桥手术了 这个结果的意义 是极其有限的 它只说明汇总分析中所包含的研究 里 不论病人被随机给予了两种疗法中的哪一种 他 们发生主要试验结局 在1年内死亡或心机梗死 的 可能性相同 如果你读一下Pocock及其同事写的 文章17 你会发现在不同手术治疗组间的心绞痛患 病率及初次治疗后再进行手术治疗的需求是有重大 差异的 对异质性 heterogeneity 的 解释 在汇总分析中 同质性 homo2 geneity 指的是每一试验结果与其他 任一试验结果在数学上是相互兼容 的 若试验结果以图2和图3显示 的格式表示出来 人们一眼就能对同 质性作个估计 从图2可以看出 每 个试验结果的可信限的下限均低于 其他每一个试验结果的可信限的上 限 也就是说所有水平线区域在某种 程度上均有重叠 在统计学上就可 以认为这些试验是同质的 与之相 反 图3显示某些水平线并不完全重叠 以此便可认 为这些试验是异质的 对异质性做确切的检验 要做统计前处理 比起 拿尺子在森林图上量一量稍复杂一些 因为该检验 要证实的问题是各试验间的结果变异是否比由机会 造成的变异大 所以最常用的统计学方法是卡方检 验 就这个方法Thompson提出这样的经验之谈18 一般情况下 若卡方值与自由度相等 在上面的例子 中汇总分析中的试验次数减1 就可认为统计学上 不存在异质性 所以 若8个试验的卡方值等于7 则可认为这8个试验在统计学上不是异质的 值得 注意的是 统计学上的异质性分析仅仅是数学分析 图3 采取降低胆固醇的措施后心脏病危险性降低 此图复制 得到了Chalmers和Altman的许可18 88英国医学杂志中文版2000年5月第3卷第2期 教育与争鸣 1995 2004 Tsinghua Tongfang Optical Disc Co Ltd All rights reserved 是统计学家的事 然而 对异质性的解释 发现和说 明临床意义的异质性 则是一个分析和说明的过程 它还需要一定的想象 需要常识 还要有临床实践能 力和科研经验 图3显示了10项降低胆固醇措施 的试验结果 此结果以每降低血清胆固醇0 6 mmol L可使心脏病危险性降低的百分比来表示 即使人们不知道卡方值为127 通过表示结果的 95 可信区间的水平线也能明显地看出 这些试验 有很高的异质性 把试验数据中研究对象的年龄加 以调整后 异质性检验的卡方值减少为45 换句话 来说 对这些试验结果的 不一致 性在很大程度上 可以这样来理解 你在45岁时使用有效措施降低血 胆固醇水平以预防心脏病 要比你在85岁时才接受 这项措施的效果好得多 临床异质性实际上是Hans Eysenck教授不赞成 汇总分析的理由 他曾经对汇总分析作过激烈而风 趣的批评19 在研究领域里 有人愿意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论