Meta分析教程13968_第1页
Meta分析教程13968_第2页
Meta分析教程13968_第3页
Meta分析教程13968_第4页
Meta分析教程13968_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Meta-分析的统计过程赵亚双哈尔滨医科大学流行病学教研室2006年11月30日概述n60年代开始,在医学文献中,陆续出现了对多个独立研究的统计量进行合并的报道n76年,G.V.Glass首先将合并统计量对文献进行综合分析研究的这类方法称为“Meta-Analysis”n80年代末该方法传入我国,中文译名有荟萃分析,二次分析,汇总分析,集成分析等,但无论何种中文译名都有不足之处,因此,很多学者建议仍然使用“Meta-分析”这一名称Meta-分析的定义nMeta-Analysis is a systematic review that uses quantitative methods to s

2、ummarize the resultsnMeta-分析是运用定量方法去概括(总结)多个研究结果的系统评价 Evidence-Based Medicine-David Sackett等,第247页的定义nMeta-Analysisis a statistical technique for assembling the results of several studies in a review into a single numerical estimatenMeta-分析是文献评价中,将若干个研究结果合并成一个单独的数字估计的统计学方法。 The Cochrane Library第3页的定

3、义Meta-分析的定义Meta-分析实例一K个研个研究究阿司匹林阿司匹林.合计合计RR95%CI死亡数死亡数未死亡数未死亡数死亡数死亡数未死亡数未死亡数aibicidiNi下限下限上限上限1495666755712390.7200.4891.0592447146470715290.6810.4571.013310273012672416820.8030.6061.063432285382716260.8010.4861.3195857255235412160.7980.5531.15362462021219203845241.1330.9351.373715707017172068801718

4、70.8950.8290.966合计合计21281205822861153128003七个阿斯匹林预防心肌梗死的研究资料(取自Fleiss JL)表中ai、bi、ci、di为各研究四格表数,Ni为各研究的样本例数,ai为处理组的实际阳性数Meta-分析实例二K个研究个研究高氟区高氟区适氟区适氟区P值值N1X1S1N2X2S21262.260.32422.330.330.052552.390.31402.490.320.053462.500.30502.670.350.054452.640.26502.900.450.056522.950.46553.270.370.057463.150.394

5、23.480.480.058453.470.46513.730.540.059453.630.38453.810.400.0510423.810.41454.160.420.05合计合计491490女童掌骨II型皮质厚度的11个研究方积乾 医学统计学与电脑实验 第二版 上海科学技术出版社,2001,349-350传统文献综述的特点n在医学研究中,传统的文献综述在处理同一问题的多个结果报道时,通常是平等(等权重方法)对待每个研究结果而得出结论。n这种文献综述一般不进行文献评价,也不考虑文献的质量,主要是以某类结果文献数量的多少得出结论传统文献综述的主要问题n传统文献评价的结果必然存在两个问题n多

6、个研究质量不相同n各个研究的样本含量的大小不相等n因此,传统文献综述的方法很难保证研究结果的真实性、可靠性和科学性,尤其当多个研究结果不一致时,容易让人产生困惑和误解Meta-分析的统计目的n增加统计功效 由于单个临床试验往往样本较小,难以明确肯定某种效应,而这些效应对临床医生来说又可能是重要的。 n解决各研究结果的不一致性。n寻求新的假说Meta-分析与系统评价n在系统评价中,当数据资料适合Meta-分析时,用Meta-分析可以克服传统文献综述的两大难题,其分析结果的可靠性更高n当数据资料不适合于作Meta-分析时,系统评价只能解决文献评价的问题,不能解决样本含量的问题,因此,对其分析结论应

7、慎重n没有按系统评价标准操作规范实施,或未经严格文献评价的研究,即使用了Meta-分析也不一定是系统评价的研究,更难说是高质量的研究Meta-分析的统计分析过程nMeta-分析计算的主要步骤n计算每个研究的效应量和方差n计算每个研究效应量的权重n计算合并效应量n异质性检验n合并效应量的可信区间n合并效应量的检验单个研究的统计量n根据资料类型选择单个研究的统计量n分类变量可选择的统计量n比值比,OR(odds ratio)n相对危险度,RR(relative risk)n率差,RD(rate difference)n数值变量可选择的统计量n加权均数差WMDn标准化均数差SMDn由于描述各研究的实

8、验结果,其结果解释与常规统计描述指标相同单个研究的方差n根据资料类型选择单个研究的统计量di的方差Var(di) 单个研究统计量di的计算方法确定后,其方差的计算方法也随之确定n方差可用于可信区间和假设检验的计算异质性检验与异质性分析 Meta- -分析前先做异质性分析;分析前先做异质性分析; 只有同质的资料才能进行合并或比较等统只有同质的资料才能进行合并或比较等统计分析,计分析, 异质性检验(异质性检验(tests for heterogeneitytests for heterogeneity) 又称同质性检验(又称同质性检验(tests for tests for homogeneity

9、homogeneity) 用假设检验方法检验多个独立研究是否用假设检验方法检验多个独立研究是否具有异质性(同质性)具有异质性(同质性)异质性检验方法n目前,多用下面公式计算:nWi为每个研究的权重,第i各研究的权重Wi按下式计算:n该检验统计量Q幅从自由度为K-1的卡方(x2)分布,因此,当计算得到Q后,需由卡方分析获取概率,故又将此检验叫做卡方检验(Chisquare test,Chi2)iiiiiiiWdWdWddWQ222)()()(1iidVarW n若异质性检验结果为p0.10时,多个研究具有同质性,可选择固定效应模型(fixed effect model);n若多个研究的异质性检验

10、结果为p0.10时,多个研究不具有同质性,首先应进行异质性分析和处理,若仍无法消除异质性的资料,可选择随即效应模型(random effect model)异质性检验方法I2及计算 在revman中,I2可用于衡量多个研究结果间异质程度大小的指标。这个指标用于描述由各个研究所致的,而非抽样误差所引起的变异(异质性)占总变异的百分比I2及计算nI2:异质性的定量分析:异质性的定量分析nQ is the chi-squared statisticndf is the degrees of freedomnI2值从值从0%至至100%,0%时无异质性,时无异质性,I2值越大,值越大,异质性越大;异质

11、性越大;nI2描述了去除抽样误差(机遇)后的异质性。描述了去除抽样误差(机遇)后的异质性。I2=Q-dfQ nHow much is too much heterogeneity?n一般说来,用一般说来,用I2=25%,或,或50%,或,或75%将异将异质性划分为低,中,高;质性划分为低,中,高;n但不宜机械应用;但不宜机械应用;nI2大于大于50%可认为有实质性的异质性可认为有实质性的异质性。异质性分析与处理的方法n当异质性检验出现p0.10时,首先应找出产生异质性的原因,如疗程长短、用药剂量、病情轻重、对照选择等是否相同n由上述原因引起的异质性,可使用亚组分析(subgroup analy

12、sis),Breslow-Day法和回归近似法n根据Cochrane系统评价要求,在系统评价的计划书中尽可能地对一些重要的亚组间差异进行叙述,也就是说对重要的亚组分析,应在计划书中加以说明n此外,在同一个系统评价中,不提倡使用太多的亚组分析多个试验效应的合并n将多个独立研究的结果合并成某个单一的效应量或效应尺度,即用某个指标的合并统计量,以反映多个独立研究的综合效应n当多个独立研究的例数不等时,他们的综合效应不等于多个单独效应的平均数,如三个均数的总均数不等于这三个均属之和除以3n所以,怎样合理的对多个独立研究效应合并,是Meta-分析统计过程的主要问题合并统计量的两种模型n固定效应模型固定效

13、应模型(fixed effect model):若多个研究具有同质性时,可使用固定效应模型n随机效应模型随机效应模型(random effect model):若多个研究不具有同质性时,先对异质原因进行处理,若异质性分析与处理后仍无法解决异质性时,可使用随机效应模型分类变量(category dichotomous)n固定效应模型:指标RR、OR1.Standard odds ratio法2.Mantel-Haenzel法3.Peto法n随机效应模型:指标RR、OR 如:Dersimonian&Laird(D-L)法数值变量(continuous)n固定效应模型1.WMD,加权均数差法2.SM

14、D,标准化均数差法n随机效应模型 D-L法试验组与对照组舒张压改善值的比较例:WMD加权均数差法计算各研究的效应值、方差和权重ECdXX22(1)(1)2EECCECNSNSSNN2211()dECSSNN21dwS研究结果的效应值、方差和权重 对各研究结果的效应值进行齐性检验 H0:各研究的效应值相等。H1:各研究的效应值不相等。 由于齐性检验的检验效能较低所以通常将检验水准定为=0.10。计算统计量Q Q=29.694, df =15, p= 0.013。Q服从自由度为M1的2 分布。2()iiQW dd计算合并的效应值 n固定效应模型的合并效应值 : (各研究的效应值相等)其方差为:ii

15、iW ddW21diSW计算合并的效应值n随机效应模型的合并效应值 : (各研究的效应值不等)DerSimonian and Laird方法 其方差为:*iiiDLW ddW2*1dDLiSWDerSimonian and Laird方法中权重 的计算方法 其中为固定效应模型时效应值的方差,D为随机效应部分的方差。 其中为固定效应模型时各研究的权重,Q为齐性检验时的统计量。 *iW*21idWSD2(1)max,0iiiQkDWWW研究结果的效应值、方差和权重 WMD的问题的问题n对临床的一些重要变化常常不能清楚地反映出来;n有严格的高质量的标准,标准差较小的研究有较大的权重;n相同的测量指标

16、并不总是可比的,如美国和英国的医疗费用;n有些卫生政策可以左右“医疗过程”测量指标的变化。标准化均数差标准化均数差n如果各研究测量相同的指标而采用不同的量度,就需要在合并之前对不同量度进行转换;n在“转换系数”知道的情况下可直接进行转换;n“标准化”转换可使用:量度因子:每个研究中的标准差选择量度:自然标准差单位n“标准效应量”的计算: 效应量=均数差值/平均标准差SMD的问题的问题n难以用难以用SD单位解释结果单位解释结果但是可以转化回不同的量度但是可以转化回不同的量度n对于重要的临床改变不清楚对于重要的临床改变不清楚建议使用建议使用0.5SD, , 以及以及0.25 SDn具有严格的高质量

17、标准的研究效应量要增加具有严格的高质量标准的研究效应量要增加n“自然变异自然变异”的估计不总是可用的估计不总是可用SD比较比较改变分值改变分值n有些研究分析有些研究分析“改变改变”而不是而不是“终点值终点值”n如果这种改变的如果这种改变的SD是已知的,则可改变是已知的,则可改变MA分值分值n但是常常只有在给出治疗前和治疗后的但是常常只有在给出治疗前和治疗后的SD值值才可使用才可使用nSD改变值取决于治疗前后的值,在没有此值改变值取决于治疗前后的值,在没有此值时无法计算时无法计算n给出与给出与“改变分值改变分值”和和“终点值终点值”相应的权相应的权重重标准差的计算n标准差可从以下途径计算:标准差

18、可从以下途径计算:标准误标准误可信区间可信区间t- -检验检验从从t- -检验计算的检验计算的P- -值值n标准差也可从以下途径估计:标准差也可从以下途径估计:RangesRangesInterquartileInterquartile ranges ranges从非参数检验获得的从非参数检验获得的P- -值值校对校对SD的方法的方法n它是否可信?它是否可信?n它与其它它与其它SD是否不同?是否不同?n该研究是否有很大的权重?该研究是否有很大的权重?n使用使用n的开方是否使它更加可信?的开方是否使它更加可信?n它是否报告显著性检验和它是否报告显著性检验和P- -值?值?资料类型与采用的计算方法

19、资料类型资料类型合并统计量合并统计量模型模型计算方法计算方法Type of dataSummary statisticModelMethod二分类变量二分类变量Odds Ratio固定固定Peto固定固定Mantel-Haenszel随机随机D-LRR固定固定Mantel-Haenszel随机随机D-LRD固定固定Mantel-Haenszel随机随机D-L数值变量数值变量WMD固定固定倒方差法倒方差法随机随机D-LSMD固定固定倒方差法倒方差法随机随机D-L个案资料个案资料OR固定固定Peto合并效应量的检验n用假设检验(hypothesis test)的方法检验多个独立研究的总效应量是否具

20、有统计学意义,其原理与常规的假设检验完全相同n两种方法: U检验(Z test) 卡方检验(Chi square test)n根据Z或U值或卡方值得到该统计量下概率(P)值n若P0.05,多个研究的合并效应量由统计学意义n若p0.05,多个研究的合并统计量没有统计学意义合并效应量的可信区间n可信区间(confidence interval,CI)是按一定的概率估计总体参数(总体均数、总体率)所在的范围(区间)n如:95%的CI,是指总体参数在该区间的可能性为95%n可信区间主要有估计总体参数和假设检验两个用途n在Meta-分析中,常用可信区间进行假设检验,95%的可信区间与为0.05的假设检验

21、等价,99%的可信区间与为0.01的假设检验等价n 森林图即是根据各个独立研究的95%可信区间及合并效应量的95%可信区间绘制的OR与RR的可信区间n若选择若选择OROR或或RRRR位合并统计量时,其位合并统计量时,其95%95%的可的可信区间与假设检验的关系如下:信区间与假设检验的关系如下:n若其若其95%CI95%CI包含了包含了1 1,等价于,等价于P P0.05,0.05,即合并统计即合并统计量无统计学意义量无统计学意义n若其若其95%CI95%CI的上下限均大于的上下限均大于1 1或均小于或均小于1 1,等价于,等价于P0.05,P0.05,即合并的统计量有统计学意义即合并的统计量有

22、统计学意义WMD和SMD的可信区间n若选择若选择WMDWMD或或SMDSMD为合并统计量时,其为合并统计量时,其95%CI95%CI与假设检验的关系如下:与假设检验的关系如下:n若其若其95%CI95%CI包含的包含的0 0,等价于,等价于P P0.050.05,即合并统计,即合并统计量无统计学意义量无统计学意义n若其若其95%CI95%CI的上下限均大于的上下限均大于0 0或小于或小于0 0,等价于,等价于P0.05P0.05,即合并效应量由统计学意义,即合并效应量由统计学意义分类变量的实例分析n单个分类变量的研究数据n分类变量(category,dichotomous)的单个研究的统计量d

23、i,可选择OR、RR或RD,四格表数据如下表:EventNo eventTreatmentaibin1iControlcidin2im1im2i实例一K个研究个研究阿司匹林阿司匹林安慰剂安慰剂合计合计OR95%CI死亡数死亡数未死亡数未死亡数死亡数死亡数未死亡数未死亡数aibicidiNi下限下限上限上限1495666755712390。7200.4891.0592447146470715290。6810.4571.013310273012672416820。8030.6061.063432285382716260。8010.4861.3195857255235412160。7980.5531

24、.15362462021219203845241。1330.9351.37371570701717206880171870。8950.8290.966合计合计21281205822861153128003七个阿斯匹林预防心肌梗死的研究资料(取自Fleiss JL)表中ai、bi、ci、di为各研究四个表数,Ni为各研究的样本例数,ai为处理组的实际阳性数OR或RR的森林图nOR或RR的森林图(forest plots),无效线竖线的横轴尺度为1,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为OR值的位置,其方块大小为该研究权重大小。若

25、某个研究95%CI的线条横跨为无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,该研究有统计学意义例一 Revman4.2.8森林图(M-H法)例一 Revman4.2.8森林图(Peto法)纳入的研究个数多时,与M-H法相同。纳入的研究个数少时,采用Peto法,Peto法只有固定效应模型,无随机效应模型漏斗图及用途n漏斗图(funnel plots)最初使用每个研究的处理效应估计值为X轴,样本含量的大小为Y轴的简单散点图(scatter plots)n对处理效应的估计,其准确性是伴随样本含量的增加而增加,小样本研究的效应估计值分布于图的底部,其分布范围较宽;大样本研究的

26、效应估计值分布范围较窄,当没有发生偏移时,其图形成对称的倒漏斗状,故称之为“漏斗图”Revman中的漏斗图n在Revman软件中,漏斗图是采用OR或RR对数值(logOR或logRR)为横坐标,OR或RR对数值标准误的倒数1/SE(logRR)为纵坐标绘制的,然后,以真数标明横坐标的标尺,而以SE(logRR)标明纵坐标的标尺漏斗图的用途n漏斗图主要用于观察某个系统评价或Meta-分析结果是否存在偏倚,如发表偏倚或其他偏倚。n如果资料存在偏倚,会出现不对称的漏斗图,不对称越明显,偏倚程度也就越大。漏斗图的不对称性主要与发表偏倚有关,但也可能存在其他原因漏斗图不对称主要原因n选择性偏倚(sele

27、ction bias)n发表偏移(publication bias)n语言偏倚(language bias)n引用偏倚(citation bias)n重复发表偏倚(multiple publication bias)n异质性(True heterogeneity)n研究的规模对效应值的影响(Size of effect differs according to study sizen 干预的强度(Intensity of intervention)n 潜在的影响因素的差异(Differences in underlying risk)n数据不规范(Data irregularities)n 小

28、规模的研究在研究设计方面存在问题(Poor methodological design of small studies)n 使用了不适当的分析方法(Inadequate analysis)n伪造数据(Fraud、Artefactual)n测量指标的选择(Choice of effect measure)n偶然性(Chance) 例一的Revman4.2.8漏斗图(funnel plots)数值变量的实例分析n单个数值变量的研究数据n数值变量(continuous)的单个研究的统计量di,可选择WMD和SMD法,单个研究数据如下表:均数标准差例数XStdN试验组X1S1n1对照组X2S2n2实

29、例二 数值变量的Meta-分析K个研究个研究高氟区高氟区适氟区适氟区P值值N1X1S1N2X2S21262.260.32422.330.330.052552.390.31402.490.320.053462.500.30502.670.350.054452.640.26502.900.450.056522.950.46553.270.370.057463.150.39423.480.480.058453.470.46513.730.540.059453.630.38453.810.400.0510423.810.41454.160.420.05合计合计491490女童掌骨II型皮质厚度的11个

30、研究方积乾 医学统计学与电脑实验 第二版 上海科学技术出版社,2001,349-350数值变量单个效应量及方差分析n目前,数值资料的单个研究,主要是用加权均数差WMD和标准化均数差SMD来描述其效应量nWMD和SMD的意义和可信区间如同前述WMD和SMD的森林图nWMD和SMD的森林图,无效竖线的横轴尺度为0,每条横线为该研究的95%可信区间上下限的连线,其线条长短直观地表示了可信区间范围的大小,线条中央的小方块为WMD或SMD值的位置,其方块大小为该研究权重大小。n若某个研究95%可信区间的线条横跨无效竖线,即该研究无统计学意义,反之,若该横线落在无效竖线的左侧或右侧,即该研究有统计学意义实例二的Revman4.2.8森林图 (WMD法)实例二的Revman4.2.8森林图 (SMD法)实例二的Revman4.2.8漏斗图 (funnel plots)有关Meta-分析的讨论nMeta-分析的局限性n目前,Meta-分析的统计学方法尚不够完善,还不能满足不同资料类型和不同的临床设计方案,如多个均数比较、等级资料比较时,仍无成熟的Meta-分析方法n关于Meta分析的争论 对Meta-分析的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论