与META分析有关的统计学知识.ppt_第1页
与META分析有关的统计学知识.ppt_第2页
与META分析有关的统计学知识.ppt_第3页
与META分析有关的统计学知识.ppt_第4页
与META分析有关的统计学知识.ppt_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Meta分析的有关统计学知识 向前 南方医科大学南方医院 一 概述 Meta 一词源于希腊文 意为 morecomprehensive 即更广泛 更全面 1976年英国心理学家G V Glass首先将合并统计量对文献进行综合分析研究的这类方法称为 Meta Analysis 现已广泛应用于医学和健康领域 尤其是针对疾病的诊断 治疗 预防和病因等问题的综合评价 80年代末该方法传入我国 中文译名有荟萃分析 二次分析 汇总分析 集成分析等 但无论何种中文译名都有不足之处 因此 很多学者建议仍然使用 Meta分析 这一名称 二 Meta分析的定义 Meta Analysisisasystematicreviewthatusesquantitativemethodstosummarizetheresults Meta分析是运用定量方法去概括 总结 多个研究结果的系统评价 Evidence BasedMedicine DavidSackett等 第247页的定义 Meta Analysisisstatisticaltechniqueforassemblingtheresultsofseveralstudiesinareviewintoasinglenumericalestimate Meta分析是文献评价中 将若干个研究结果合并成一个单独数字估计的统计学方法 TheCochraneLibrary 第3页的定义 三 Meta分析的统计目的 实例一 七个阿斯匹林预防心肌梗死的研究资料 取自FleissJL的资料 K个研究 阿斯匹林死亡数未死亡数aibi 安慰剂死亡数未死亡数cidi 合计Ni OR 95 CI下限上限 1234567 494410232852461570 56671473028572520217017 676412638522191720 55770772427135420386880 1239152916826261216452417187 0 7200 6810 8030 8010 7981 1330 895 0 4890 4570 6060 4860 5530 9350 829 1 0591 0131 0631 3191 1531 3730 966 合计 2128 12058 2286 11531 28003 表中ai bi ci di为各研究四格表数 Ni为各个研究的样本例数 ai为处理组的实际阳性数 bi为处理组的实际阴性数 ci为对照组的实际阳性数 di为对照组的实际阴性数 实例二女童掌骨 皮质厚度的11个研究 K个研究 高氟区 适氟区 P值 n1 1 s1 n2 2 s2 1234567891011 2655464545524645454244 2 262 392 502 642 812 953 153 473 633 813 99 0 320 310 300 260 350 460 390 460 380 410 56 4240505045554251454525 2 332 492 672 902 933 273 483 733 814 164 18 0 330 320 350 450 360 370 480 540 400 420 41 P 0 05P 0 05P0 05P0 05 合计 491 490 在医学研究中 传统的文献综述在处理同一问题的多个结果报道时 通常是平等 等权重方法 对待每个研究结果而得出结论 这种文献综述一般不进行文献评价 也不考虑文献的质量 主要是以某类结果文献数量的多少得出结论 传统文献综述的特点 传统文献综述的主要问题 传统文献评价的结果必然存在两个问题 一是多个研究的质量不相同 二是各个研究的样本含量的大小 权重 不相等 因此 传统文献综述的方法很难保证研究结果的真实性 可靠性和科学性 尤其当多个研究的结果不一致时 让人容易产生困惑或误解 Meta分析的统计目的 对多个同类独立研究的结果进行汇总和合并分析 以达到增大样本含量 提高检验效能的目的 尤其是当多个研究结果不一致或都没有统计学意义时 采用Meta分析可得到更加接近真实情况的统计分析结果 四 Meta分析的统计分析过程 Meta分析统计过程的主要内容 1 异质性分析2 计算合并效应量3 合并效应量的检验可信区间 Z检验 什么是异质性 在Meta分析过程中 纳入的多个研究尽管都是对同一临床问题或具有相同研究假设的研究 但是 这些研究在纳入和排除标准 样本含量 质量控制等方面很可能不相同 从而导致了同一结局指标在多个研究间的差异 异质性的定义 Cochrane协作网将异质性定义为 1 广义上用于描述试验的参与者 试验的干预措施和多个研究测量结果的变异 即各研究的内在真实性变异 2 专指统计学异质性 用于描述多个研究中效应量的变异程度 也可以用于描述除偶然机会外 多个研究间存在的差异 异质性的种类 Cochrane协作网将Meta分析的异质性分为 临床异质性 方法学异质性和统计学异质性 临床异质性是指 受试对象的不同 干预措施的差异和结局指标的变异所致的偏倚 方法学异质性是指 由于试验设计和研究质量的差异引起的 如盲法的应用和分配隐藏的应用 或由于试验过程中对结局指标的定义或测量的不一致而出现的偏倚 统计学的异质性是指 干预效果的评价在不同试验间的变异 它是研究间的变异 它是研究间的临床和方法学上变异联合作用的结果 统计学异质性 通常将Meta分析的统计学异质性简称为 异质性 它是以各研究之间可信区间 CI 的重合程度来度量异质性的大小 多个研究间的CI重合程度越大 存在统计异质性的可能性就越小 反之 各研究间存在统计学异质性的可能性就越大 临床异质性 方法学异质性和统计学异质性三者相互独立又相互关联的 临床和方法学异质性 不一定在统计学上就有异质性 反之亦然 异质性分析的意义 Meta分析的核心计算是合并 相加 按统计原理 只有同质的资料才能进行合并或比较等统计分析 反之 则不能 异质性检验 testsforheterogeneity 又称同质性检验 testsforhomogeneity 用假设检验的方法检验多个独立研究是否具有异质性 同质性 异质性检验的方法 目前 多用由下式计算 Q Wi di 2 Widi2 Widi 2 Wi Wi为每个研究的权重 第i个研究的权重Wi按下式计算 Wi 1Var di 该检验统计量Q服从自由度为K 1的卡方 2 分布 因此 当计算得到Q后 需由卡方分析获取概率 故又将此检验叫做卡方检验 Chisquaretest 异质性检验的方法 若异质性检验检验结果为P 0 10时 多个研究的异质性无统计学意义 若异质性检验结果为P 0 10时 多个研究的异质性有统计学意义 I2的计算 2I Q k 1 Q 100 式中的Q为异质性检验的卡方值 2 K为纳入Meta分析的研究个数 描述多个研究间异质性大小 即I2 其计算公式如下 I2的意义 I2可用于衡量多个研究结果间异质程度大小的指标 这个指标用于描述由各个研究所致的 而非抽样误差所引起的变异 异质性 占总变异的百分比 在Cochrane系统评价中 只要I2不大于50 其异质性可以接受 异质性分析与处理的方法 当异质性检验出现P 0 10时处理的方法 1 首先 检查每个研究的原始数据是否正确 检查提取数据的方法是否正确 2 如果产生异质性的原因可能是由于疗程长短 用药剂量 病情轻重 对照选择等所致 可使用亚组分析 subgroupanalysis 或Meta回归 异质性分析与处理的方法 3 敏感性分析 排除可能是导致异质性的某些 个 研究后 重做Meta分析 与未排除这些 个 研究的Meta分析结果比较 探讨被去除的研究对合并效应的影响 通过比较了解其异质性的来源 异质性分析与处理的方法 4 通过临床专业知识 统计学知识和前述的异质性分析方法 仍然无法解释异质性的原因 可采用随机效应模型 randomeffectmodel 进行Meta分析 5 不做Meta分析 四 合并效应量的计算 多个试验效应的合并 将多个独立研究的结果合并 或汇总 成某个单一的效应量 effectsize 或效应尺度 effectmagnitude 即用某个指标的合并统计量 以反映多个独立研究的综合效应 合并统计量的计算 当多个独立研究的例数不等时 它们的综合效应不等于这多个单独效应的平均数 如三个均数的总均数不等于这三个均数之和除以3 所以 怎样合理的对多个独立研究效应进行合并 是Meta分析统计过程的主要问题之一 1 分类变量 category dichotomous 固定效应模型 fixedeffectmodel 指标 1 RD ratedifference riskdifference 率差 2 RR relativerisk 相对危险度 3 OR oddsratio 比值比随机效应模型 randomeffectmodel RD RR OR的DerSimonian Laird D L 法 2 数值变量 continuous 固定效应模型MD MeanDifference 均数差法 WMD WeightedMeanDifference 加权均数差法SMD StandardisedMeanDifference 标准化均数差法随机效应模型 D L法 分类变量RD OR RR及可信区间 RD 率差 及可信区间 两个发生率的差即为率差 也称危险差 ratedifference riskdifference RD 如 试验组发生率 ERR 与对照组发生率 CER 的差 其大小可反映试验效应的大小 RD ERR CER两率差的可信区间由下式计算 p1 p2 u SE p1 p2 RD u SE RD RD u SE RD RD的意义 当RD 0时 可认为试验组的发生率与对照组的发生率相同 当RD 0时 可认为试验组的发生率大于对照组的发生率 当RD 0时 可认为试验组的发生率小于对照组的发生率 实例分析 阿司匹林治疗心肌梗死的效果 该例的RD为 RD ERR CER 0 12 0 25 0 13即该例试验组的病死率比对照组少13 该试验两率差 RD 的可信区间为 ERR CER u SE p1 p2 即RD u SE p1 p2 RD95 的可信区间为RD 1 96 SE RD RD的可信区间 CI 阿斯匹林治疗心肌梗死的效果EER 15 125 12 CER 30 120 25 两率差的标准误 SE p1 p2 实例RD的标准误 该试验两率差 RD 的可信区间为 RD u SE p1 p2 0 12 0 25 1 96 0 049 0 23 0 03该例两率差的可信区间为 0 23 0 03 上下限均小于0 不包含0 两率有差别 可认为阿斯匹林可降低心肌梗死的病死率 实例RD的可信区间 CI RD的可信区间的图示 无统计学意义 试验组 对照组 试验组 对照组 0无效值 RR及可信区间 相对危险度RR relativerisk RR 是前瞻性研究中较常用的指标 它是试验组某事件发生率P1与对照组 或低暴露 的发生率P0之比 用于说明前者是后者的多少倍 常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小 其计算方法为 RR P1 P0 EER CER 当RR 1时 可认为试验因素与疾病无关 当RR 1时 可认为试验因素与疾病有关 当RR 1时 可认为试验组发生率大于对照组 当RR 1时 可认为试验组发生率小于对照组 RR的可信区间 应采用自然对数进行计算 即应求RR的自然对数值ln RR 和ln RR 的标准误SE lnRR 其计算公式如下 SE lnRR ln RR 的1 可信区间为 ln RR u SE lnRR RR的可信区间为 exp ln RR u SE lnRR 阿斯匹林治疗组的病死率P1 15 125 对照组的病死率P0 30 120 其RR和可信区间为 RR 0 48 ln RR ln 0 48 0 734 SE lnRR 0 289 RR的95 可信区间为 exp ln RR 1 96SE lnRR exp 0 734 1 96 0 289 0 272 0 846 该例RR的95 可信区间为0 272 0 846 使用阿斯匹林治疗的病人 其病死率小于对照组 可认为阿斯匹林可降低心肌梗死有效 OR及可信区间 在回顾性研究 如病例对照研究 中 往往无法得到某事件的发生率CER或EER 如死亡率 病死率 发病率 也就无法计算出RR 但是当该发生率很低时 如发生率小于等于5 可计算出一个RR的近似值 即为比值比 oddsratio OR 又称优势比等 公式为 OR ad bc 回顾性研究的数据表 OR的计算 病例组暴露与未暴露的比值 即odds1 a b 对照组暴露与未暴露的比值 即odds0 c d 以上两个比值之比即为比值比 oddsratio OR 又称机会比 优势比等 公式为 OR 当所研究疾病的发病率较低时 即a和c均较小时 OR近似于RR 故在回顾性研究中可用OR估计RR 由于前瞻性研究中 RR的可信区间与OR的可信区间很相近 且OR的计算更为简便 因此 常用OR可信区间的计算来代替RR的可信区间的计算 OR值的解释与RR相同 OR的意义 当OR 1时 可认为病例组的暴露率与对照组的暴露率相同 当OR 1时 可认为病例组暴露率大于对照组 当OR 1时 可认为病例组暴露率小于对照组 OR的意义 OR的可信区间同样需要采用自然对数计算 其ln OR 的标准误SE lnOR 按下式计算 SE lnOR ln OR 的可信区间为 ln OR u SE lnOR OR的可信区间为 exp ln OR u SE lnOR 例如 前述阿斯匹林治疗心肌梗死的效果试估计其OR的95 可信区间 OR 0 409 ln OR ln 0 409 0 894 OR的95 可信区间为 exp ln OR 1 96SE lnOR exp 0 894 1 96 0 347 0 207 0 807 该例OR的95 可信区间为0 207 0 807 可以认为阿斯匹林治疗心肌梗死有效 RR或OR的可信区间的图示 无统计学意义 试验组 对照组 试验组 对照组 1无效值 数值型变量MD WMD SMD及可信区间 1 WMD 加权均数差 WMD WeightedMeanDifference 某个研究的两均数差d可按下式计算 从公式可见 加权均数差 WeightedMeanDifference WMD 即为两均数的差值 该指标以试验原有的测量单位 真实地反映了试验效应 消除了绝对值大小对结果的影响 在实际应用时 该指标容易被理解和解释 标准化均数差 StandardisedMeanDifference SMD 某个研究的标准化均数差d 可按下式计算 d X 1 SC X 2 1 34N 9 SC 2 SMD 标准化均数差 SMD 的标准误 可按下式计算 SE SMD SMD可简单地理解为两均数的差值再除以合并标准差的商 它不仅消除了某研究的绝对值大小的影响 还消除了测量单位对结果的影响 因此 该指标尤其适用于单位不同或均数相差较大的数值资料分析 但是 标准化均数差 SMD 是一个没有单位的值 因而 对SMD分析的结果解释要慎重 WMD和SMD的可信区间 若选择WMD或SMD为合并统计量时 其95 CI与假设检验的关系如下 若其95 CI包含了0 等价于P 0 05 即合并统计量无统计学意义 若其95 CI的上下限均大于0或均小于0 等价于P 0 05 即合并效应量有统计学意义 WMD与SMD的CI计算 WMD合并95 的可信区间 WMD合并 1 96 SE WMD SMD合并95 的可信区间 SMD合并 1 96 SE SMD MD与SMD的森林图示意 试验组 对照组 0无效线 无统计学意义 试验组 对照组 合并统计量的两种统计模型 固定效应模型 fixedeffectmodel 若多个研究具有同质性 无异质性 时 可使用 可使用固定效应模型 随机效应模型 randomeffectmodel 若多个研究不具有同质性时 先对异质原因进行处理 若异质性分析与处理后仍无法解决异质性时 可使用随机效应模型 关于随机效应模型 1 随机效应模型一种对异质性资料进行Meta分析的方法 但是 该法不能控制混杂 也不能校正偏倚或减少异质性 更不能消除产生异质性的原因 目前 随机效应模型多采用D L法 DerSimonian Laird法 Wi2 Wi D L法是1986年 由DerSimonian和Laird首先提出 该法不仅可用于分类变量 也适用于数值变量 D L法主要是对权重Wi进行校正 即将各式中的Wi按下式进行计算 Wi D 1 1Wi 其中D按下式计算 D Q K 1 Wi 关于随机效应模型 2 关于随机效应模型 3 D L法是通过增大小样本资料的权重 减少大样本资料的权重来处理资料间的异质性 而这种处理存在着较大风险 通常小样本资料往往质量较差 偏倚较大 而大样本资料往往质量较好 偏倚较小 因此 经随机效应模型处理的结果 可能削弱了质量好的大样本信息 增大了质量差的小样本信息 故应谨慎使用随机效应模型 对其结论也应当较为委婉 固定 二分类变量 Dichotomous 合并统计量 Summarystatistic OR oddsratio RR relativerisk 模型 Model 固定固定随机 固定 计算方法 Method Peto法Mantel Haenszel法D L法Mantel Haenszel法 RD riskdifference 随机 随机 D L法Mantel Haenszel法D L法 数值变量 Continuous WMD weightedmeandifference 固定随机 倒方差法 inversevariance D L法 个案资料 Individual SMD standardisedmeandifference OR oddsratio 固定随机 固定 倒方差法 inversevariance D L法Peto法 资料类型 Typeofdata 5 合并效应量的检验 用假设检验 hypothesistest 的方法检验多个独立研究的总效应量 效应尺度 是否具有统计学意义 其原理与常规的假设检验完全相同 两种方法 u检验 Ztest 卡方检验 Chisquaretest 根据z或 u 值或卡方值得到该统计量下概率 P 值 若P 0 05 多个研究的合并效应量有统计学意义 若P 0 05 多个研究的合并效应量没有统计学意义 6 合并效应量的可信区间 可信区间 confidenceinterval CI 是按一定的概率估计总体参数 总体均数 总体率 所在的范围 区间 如 95 的CI 是指总体参数在该范围 区间 的可能性为95 可信区间主要有估计总体参数和假设检验两个用途 在Meta分析中 常用可信区间进行假设检验 95 的可信区间与 为0 05的假设检验等价 99 的可信区间与 为0 01的假设检验等价 此外 森林图即是根据各个独立研究的95 可信区间及合并效应量的的95 可信区间绘制的 OR与RR的可信区间 若选择OR或RR为合并统计量时 其95 的可信区间与假设检验的关系如下 若其95 CI包含了1 等价于P 0 05 即合并统计量无统计学意义 若其95 CI的上下限均大于1或均小于1 等价于P 0 05 即合并效应量有统计学意义 固定效应模型的计算 PetoOR合并 exp ai Ei Vi OR合并 aidi Ni bici Ni RR合并 exp WilnRRi Wi RD合并 ain1icin2i NiNi n1in2i Ni WMDorSMD Widi Wi OR与RR的CI计算 OR合并95 的可信区间 exp OR合并 1 96 SE lnOR PetoOR合并95 的可信区间 exp OR合并 1 96 SE lnPetoOR RR合并95 的可信区间 exp RR合并 1 96 SE lnRR 五 分类变量的实例分析 分类变量 category dichotomous 的单个研究的统计量di 可选择OR RR或RD 四格表数据如下表 Summary2 2TableForCounts Event NoEvent TreatmentControl aicim1i bidim2i n1in2iNi 单个分类变量的研究数据 K研究的分类变量资料整理 Treatment Control i个研究 Event NoEvent Event NoEvent 123 aia1a2a3 bib1b2b3 n1in11n12n13 cic1c2c3 did1d2d3 n2in21n22n23 实例一 七个阿斯匹林预防心肌梗死的研究资料 取自FleissJL的资料 K个研究 阿斯匹林死亡数未死亡数aibi 安慰剂死亡数未死亡数cidi 合计Ni OR 95 CI下限上限 1234567 494410232852461570 56671473028572520217017 676412638522191720 55770772427135420386880 1239152916826261216452417187 0 7200 6810 8030 8010 7981 1330 895 0 4890 4570 6060 4860 5530 9350 829 1 0591 0131 0631 3191 1531 3730 966 合计 2128 12058 2286 11531 28003 表中ai bi ci di为各研究四格表数 Ni为各个研究的样本例数 ai为处理组的实际阳性数 bi为处理组的实际阴性数 ci为对照组的实际阳性数 di为对照组的实际阴性数 OR和RR的森林图 OR和RR的森林图 forestplots 无效线竖线的横轴尺度为1 每条横线为该研究的95 可信区间上下限的连线 其线条长短直观地表示了可信区间范围的大小 线条中央的小方块为OR值的位置 其方块大小为该研究权重大小 若某个研究95 可信区间的线条横跨为无效竖线 该研究无统计学意义 反之 若该横线落在无效竖线的左侧或右侧 该研究有统计学意义 例一的Revman5 1森林图M H法 例一的Revman5 1森林图Peto法 漏斗图及用途 漏斗图 funnelplots 最初是用每个研究的处理效应估计值为X轴 样本含量的大小为Y轴的简单散点图 scatterplots 对处理效应的估计 其准确性是随样本含量的增加而增加 小样本研究的效应估计值分布于图的底部 其分布范围较宽 大样本研究的效应估计值分布范围较窄 当没有发表偏倚时 其图形呈对称的倒漏斗状 故称之为 漏斗图 RevMan中的漏斗图 在RevMan软件中 漏斗图是采用OR或RR对数值 logOR或logRR 为横坐标 OR或RR对数值标准误的倒数1 SE logRR 为纵坐标绘制的 然后 以真数标明横坐标的标尺 而以SE logRR 标明纵坐标的标尺 漏斗图的用途 漏斗图主要用于观察某个系统评价或Meta分析结果是否存在偏倚 如发表偏倚或其他偏倚 如果资料存在偏倚 会出现不对称的漏斗图 不对称越明显 偏倚程度也就越大 漏斗图的不对称性主要与发表偏倚有关 但也可能存在其他原因 漏斗图不对称的主要原因 导致漏斗图不对称的主要原因有 选择性偏倚 Selectionbias 发表偏倚 Publicationbias 语言偏倚 Languagebias 引用偏倚 Citationbias 重复发表偏倚 Multiplepublicationbias 等等 例一的Revman5 1漏斗图 FunnelPlot 六 数值变量的实例分析 数值变量 continuous 的单个研究的统计量di 可选择WMD和SMD法 单个研究的数据如下表 均数 标准差 例数 ki Ski nki 试验组对照组 1122 S11S22 n11n22 单个数值变量的研究数据 K研究的数值变量资料整理 试验组 对照组 均数 标准差 例数 均数 标准差 例数 第i个研究 S1i n1i 2i S2i n2i Ni i 1i 2i 3 S11S12S13 n11n12n13 212223 S21S22S23 n21n22n23 N1N2N3 实例二女童掌骨 皮质厚度的11个研究 K个研究 高氟区 适氟区 P值 n1 1 s1 n2 2 s2 1234567891011 2655464545524645454244 2 262 392 502 642 812 953 153 473 633 813 99 0 320 310 300 260 350 460 390 460 380 410 56 4240505045554251454525 2 332 492 672 902 933 273 483 733 814 164 18 0 330 320 350 450 360 370 480 540 400 420 41 P 0 05P 0 05P0 05P0 05 合计 491 490 WMD和SMD的森林图 WMD和SMD的森林图 无效线竖线的横轴尺度为0 每条横线为该研究的95 可信区间上下限的连线 其线条长短直观地表示了可信区间范围的大小 线条中央的小方块为WMD或SMD值的位置 其方块大小为该研究权重大小 若某个研究95 可信区间的线条横跨为无效竖线 即该研究无统计学意义 反之 若该横线落在无效竖线的左侧或右侧 该研究有统计学意义 例二的Revman5 1森林图 WMD法 例二的Revman5 2森林图 SMD法 例二的Revman5 1漏斗图 FunnelPlot 七 Meta分析的软件 1 ReviewManager Revman 该软件是国际Cochrane协作网系统评价的标准化专用软件 其中包含了cochrane系统评价的各项功能 也包括该组织推荐的各种Meta分析功能 具有操作简单 结果直观的特点 该软件是一个免费软件 用户可在如下网址免费下载 www cochrane es Download Files revman htmhttp www cochrane org software revman htm 2 STATA该软件是美国ComputerResourceCenter研制的统计软件 从1985年起 连续推出了多个版本 该软件可完成二分类变量和连续性变量的Meta分析 也可以进行Meta回归分析 还可以绘制Meta分析的相关图型 如森林图 Forest 漏斗图 Funnel 和L Abbe图 3 SASforwindows 国际权威的统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论