Meta-分析的统计学基础-王洪源_第1页
Meta-分析的统计学基础-王洪源_第2页
Meta-分析的统计学基础-王洪源_第3页
Meta-分析的统计学基础-王洪源_第4页
Meta-分析的统计学基础-王洪源_第5页
已阅读5页,还剩180页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Meta-分析的统计学基础王洪源北京大学公共卫生学院流行病学与卫生统计学系一、概述什么是循证医学Evidence-basedmedicine(EBM)循证医学是在对个体病人制定临床决策时应基于当前最佳的科学研究成果。循证医学是最佳的证据、临床经验和病人价值的有机结合。用X线进行乳腺癌筛查

MammographyforbreastcancerisanestablishedscreeningmethodIsscreeningwithmammographyjustifiable?Gotzsche&Olsen[NordicCochraneCentre]conductedasystematicreviewin2000andupdateditin2001.Theyidentified8largeRCTsonthistopic,withover182,000womenrandomizedTheauthorsfoundthatnotrialdatawereofhighqualityTwowereofmediumquality,andtherestwerepoorqualityorflawed.Whentheresultsofthetwomediumqualitytrialswerecombined,theriskratiowas1.00(95%CI0.96,1.05)Theyconcludedthat“screeningforbreastcancerwithmammographyisunjustified”TheUSPreventiveServicesTaskForcereviewedthesamesetoftrialsRecently,a2001CochraneCollaborationreviewofthesametrialsconcludedthat

sixoftheeighttrialswere"flawed"orof"poorquality"andthatthepooledresultsfromtheremainingtwobettertrialsdidnotsupportabenefitfrommammography.

Themeta-analysisperformedfortheUSPSTFonthemostcurrentpublisheddatafoundthatthepooledeffectsizeofthecombinedtrialswassizableandstatisticallysignificant:thesummaryrelativerisk(RR)ofbreastcancerdeathamongwomenrandomizedtoscreeninginseventrialsthatincludedwomenolderthan50was0.77(95percentCI,0.67-0.89).TheUSPSTFrecommendsscreeningmammography,withorwithoutclinicalbreastexamination,every1-2yearsforwomenaged40andolder.

被动吸烟的危害AtopicofgreatdebateandcontroversyformanyyearsFirstfewepidemiologicstudieswerepublishedin1918

Hackshawetal.

conductedaverycomprehensive

systematicreviewin1997

Theyidentified37publishedstudiesthatreportedriskoflungcanceramonglifelongnon-smokingwomenaccordingtothehusband’ssmokingstatusTheirmeta-analysisrevealedthattheoverallriskoflungcanceramonglifelongnon-smokingwomenwas1.24timeshigherwhentheirhusbandssmoked,ascomparedtothosewomenwhosehusbandsdidnotsmoke.

什么是循证医学

利用发表的文献证据解决临床问题对证据进行严格分级,提供指导对医学文献评价分级的实践指南,并充分考虑病人的需求和意愿解决具体临床问题。

但这绝非否认从古至今传统决策中亦在部分使用上述方法。循证方法的两个关键方面证据应从最强(如随机试验及随机试验的系统评价)到最弱(如:运用生理学指标且非系统的临床观察)分级。医疗决策仅靠证据远远不够,还须考虑病人的价值取向和意愿。循证医学证据的分级

一级:所有RCT的系统评价/Meta-分析。二级:单个样本量足够大的RCT。三级:设有对照组但未用随机方法分组的研究。四级:无对照的系列病例观察。五级:无证据支持的专家意见。系统性综述Systematicreviews(系统评价)是循证医学重要的手段。是根据某一具体的临床问题,采用系统、明确的方法收集、选择和评估相关的临床原始研究,筛选出合格者并从中提取和分析数据,为疾病的诊治提供科学的依据。

循证医学与传统医疗实践的四个重要区别(1992JAMA)系统收集的证据优于非系统的临床观察以病人终点结局为判效指标的试验优于仅根据生理学原理制定指标的试验解释医学文献对医生是一项重要技能,有必要正规学习一些证据的相关通则,以达到熟练解释的程度医生对病人的个体化评价优于专家意见。Meta-analysis

是在系统性综述时为了合并多个独立的研究结果,所使用的统计方法。可以将针对同一问题的,多个独立的研究结果进行定量分析。目前,国外文献常常将系统评价与Meta-分析交叉使用。Allsystematicreviewsarenotmeta-analyses!

Howtoreadasystematicreview?研究显示NotallSRsaretrulysystematic(Petticrew1999;Jadad1998)ThequalityofSRsarehighlyvariable(Mulrow1987;McAlister1999)Cochranereviews,onaverage,maybemorerigorousandbetterreportedthanjournalreviews(Mulrow1987;McAlister1999)However,recentstudiesshowthatevenCochranereviewshavemethodologicalproblems(Olsen2001;Shea2002)EvaluationofqualityofprimarystudiessetssystematicreviewsapartfromtraditionalreviewsEmpiricresearchshowsthatnotallSRsassessstudyquality:240SRsfromjournals:48%assessedquality(Moher1999)480SRsinDARE:52%assessedquality(Petticrew1999)50SRsonasthma:28%reportedvalidityassessmentcriteria(Jadad2000)Berkeley,2002onqualityofSRsonHIV,publishedduring2001Qualityassessmentdonein56%ofreviewsTestingforheterogeneitydonein56%ofreviewsNotallSRswithsignificantheterogeneityexploredreasonsforitManyreviewsdidnotstatetherationaleforchoiceofmodelsusedforcombiningdataOnly12%ofreviewsevaluatedpublicationbias近年Meta分析文献中存在的主要问题

(2002年到2004年5月)㈠提供Meta分析流程图㈡文献搜索范围㈢发表偏倚的说明㈣异质性检验执行情况㈤敏感度分析Meta分析流程图仅有2篇文献有进行流程图的描述,这种情况的发生可能与国内期刊并不要求等因素有关。异质性检验执行情况本次调查搜集所得文献中有88.0%的文献进行了异质性评价。但是其中30.2%的文献仅仅是提及了异质性评价,说明异质性评价的重要性并未引起国内研究者的普遍重视。只有22.0%的国内研究者尝试对异质性来源进行了解释,相对的大部分的作者都未进行这个项目。发表偏倚的说明及评估仅有11.8%的文献提及发表偏倚及偏倚的评估方法,其中有0.9%的文献采用失安全系数发进行评价。发表偏倚还有其他的评估方法,如漏斗图估计、线性回归法估计等,但是执行情况和失安全系数几乎相同。

因此当你找到所需的系统性综述时,你有责任去评价它的质量。系统性综述与Meta-analyses

的质量评价标准QUOROM评价标准

(thequalityofreportingofMeta-analyses)。

适用于随机对照试验性研究Meta分析MOOSE评价标准

适用于观察性研究Meta分析

二、Metaanalysis原理

和基本思想

在用样本信息推断总体参数时,是存在抽样误差的,并且抽样误差的大小与样本量的大小有关。统计学用抽样分布的理论来描述样本统计量的变化规律。

从一个均数为1.5,标准差为0.7的正态总体中进行随机抽样,样本量分别为20,50,100,200,300,500,1000,不同的样本量均进行20次抽样,共得到140个样本。分别计算每个样本的均数,标准差和标准误。

以样本的均数为横坐标,以样本量为纵坐标作散点图从均数为1.5,标准差为0.7的正态总体的140次随机抽样结果

由于抽样过程存在抽样误差,样本量较大时抽样误差较小。所以从图中可以看出所有的点以样本量较大时的均数为轴,左右是基本对称的。用方差分析的方法对不同的样本所对应的总体均数是否相等进行检验,方差分析的结果为F=0.862,P=0.878。说明140个样本对应的总体均数是相同的。用这140个样本的信息来估计总体的均数和标准差,

=1.501,

=0.699。这样做的结果是提高了估计的精度。理想状态下SND与Precision的关系

SND

用样本均数除以相应的标准误Precision标准误的倒数SND与Precision呈直线关系,且该回归直线的延长线是通过原点的。

理想状态

我们把不同作者对相同问题进行的研究可以看作从同一总体中进行抽样得到的一个随机样本,如果他们都是按照相同的设计得到的研究结果,并且我们可以找到每一项研究的结果,这样就可以根据上面的原理得到一个更为可靠的结果。实际情况不同作者:所使用的设计方案会有一定的差别,选择的实验对象有所不同,研究结果不一定都能发表到专业杂志上。因此实际能够得到的资料可能是不完整的,甚至是有偏性的,如阳性结果的文章,以及和目前大家普遍能够接受的观点一致的文章可能更容易发表在专业杂志上。

重复发表。认为修改数据。

有出版偏性的散点图

Metaanalysis的目的及适用性

增加统计功效由于单个临床试验往往样本较小,难以明确肯定某种效应,而这些效应对临床医生来说又可能是重要的。解决各研究结果的不一致性。寻求新的假说。三、Cochrane系统评价的

基本方法Cochrane系统评价的基本方法确立题目、制订系统综述的计划书

检索文献

选择文献评价文献质量

收集数据

分析资料和报告结果

解释系统评价的结果(讨论和结论)更新系统评价

确立题目有意义目前或近期有没有发表的系统性综述目前有没有一定数量的可供使用的原始文献检索文献确定检索主题词确定检索数据库确定检索年限非发表文献的搜集方法会议网站同行了解准备与作者联系的相关文件

选择文献、评价文献质量

确定纳入标准和排除标准根据纳入标准和排除标准筛选收集的原始文献确定原始文献质量的评价标准两个人分别完成筛选和质量评价两个人评价不一致时的处理方法进行Meta分析前

需要准备的技术文件计划书检索策略入选、排除标准原始文献评价标准数据提取表格与作者联系的信件选择文献的基本步骤

绘制筛选文献流程图

收集文献数量因不同原因排除文献的数量最终纳入文献数量排除文献的特征入选文献质量的评价不同类型的研究设计,有相应的评价标准。Jadad

质量记分法RCT

JadadAR,MooreRA,CarrollD,etal.AssessingthequalityofreportsofRandomizedclinicaltrials:isblindingnecessary.ControlClinTrials1996;17:1-12.

提取数据文献作者、年代、来源、研究设计特征,研究对象特征干预特征评价指标质量分析资料和报告结果计算各研究的效应值、方差和权重对各研究结果的效应值进行齐性检验计算合并的效应值固定效应模型的合并效应值随机效应模型合并的效应值绘制各研究的效应值和置信区间----森林图

(ForestPlot)试验组与对照组舒张压改善值的比较计算各研究的效应值、方差和权重研究结果的效应值、方差和权重

对各研究结果的效应值进行齐性检验

H0:各研究的效应值相等。H1:各研究的效应值不相等。由于齐性检验的检验效能较低所以通常将检验水准定为

=0.10。计算统计量Q

Q=29.694,df=15,p=0.013。Q服从自由度为M-1的

2

分布。计算合并的效应值

固定效应模型的合并效应值:(各研究的效应值相等)其方差为:计算合并的效应值随机效应模型的合并效应值:(各研究的效应值不等)DerSimonianandLaird方法

其方差为:DerSimonianandLaird方法中权重的计算方法其中为固定效应模型时效应值的方差,D为随机效应部分的方差。

其中为固定效应模型时各研究的权重,Q为齐性检验时的统计量。

研究结果的效应值、方差和权重

Meta-analysis

--------------------------------------------------------

Pooled95%CIAsymptoticNo.of

MethodEstLowerUpperz_valuep_valuestudies

--------------------------------------------------------------------------

Fixed1.9591.2892.6305.7260.00016

Random2.3621.2463.4774.1480.000

--------------------------------------------------------------------------

Testforheterogeneity:

Q=29.694on15degreesoffreedom(p=0.013)

分析资料和报告结果偏性的估计漏斗图(FunnelPlot)是以每个研究的效应值为横坐标,以每个研究的样本量或效应值方差的倒数为纵坐标做成的散点图。采用直线回归的方法来评价FunnelPlot的不对称秩相关检验导致funnelplots对称性差的原因选择偏性(Selectionbias)出版偏性(Publicationbias)定位偏性(Locationbiases)

英语偏性(Englishlanguagebias)

引用偏性(Citationbias)

重复发表偏性(Multiplepublicationbias)异质性(Trueheterogeneity)研究的规模对效应值的影响(Sizeofeffectdiffersaccordingtostudysize

干预的强度(Intensityofintervention)

潜在的影响因素的差异(Differencesinunderlyingrisk)数据不规范(Datairregularities)

小规模的研究在研究设计方面存在问题(Poormethodologicaldesignofsmallstudies)

使用了不适当的分析方法(Inadequateanalysis)伪造数据(Fraud、Artefactual)测量指标的选择(Choiceofeffectmeasure)偶然性(Chance)

分析资料和报告结果偏性的估计--失安全系数可以评价结果的稳定性,将原始研究的检验统计量转换成正态性得分后计算出来的它表示需要多少篇与所收集到文献的平均样本量相当的阴性文献才可以使合并的结果逆转。它反映了MetaAnalysis结果的稳定性,失安全系数越大表明结果的稳定性越好。分析资料和报告结果偏性的估计-trim&fillanalysis

利用统计学方法去除一些研究点使漏斗图(FunnelPlot)达到对称。根据去除点的特征,加上相应的可能被丢失研究点,得到近似理想状态的情况。对增补后的资料进行合并估计。此时可以得到近似无偏性的合并结果。

TrimandFill(剪切-添补法)

基本思路TrimandFill(剪切-添补法)Thetrimandfillalgorithmisbasedonaformalizationofthequalitative(定性的)approachusingthefunnelplot.理想状态下收集的数据实际收集的数据(不全)TrimandFill(剪切-添补法)wetrimofftheasymmetricoutlyingpartofthefunnelafterestimatinghowmanystudiesareintheasymmetricpart.剪切后的数据减去的部分TrimandFill(剪切-添补法)Wethenusethesymmetricremaindertoestimatethetruecenterofthefunnelandthenreplacethetrimmedstudiesandtheirmissingcounterpartsaroundthecenter.镜像填补填补(调整)后的数据TrimandFill(剪切-添补法)Thefinalestimateofthetruemean,andalsoitsvariance,arethenbasedonthefilledfunnelplot.利用调整后的数据进行估计TrimandFill(剪切-添补法)

基本原理有n个研究

每个研究的效应值为这类研究的效应值为定义随机效应模型研究间随机效应研究内效应如果,则实际上表示固定效应。如果只收集到n个研究,有K0个研究没有找到,我们需要估计总体的效应值

。假定总体效应值已知计算:按照编秩次:如果为正秩次如果为负秩次为Xi的符号秩次Definethe“trimmed”rankteststatisticfortheobservednvaluesasLetdenotethelengthoftherightmostrunofranks通过它们估计K0-13-10-7-6-2-134589111214-6-2-134589111214-6-2义三个估计量三个估计量的均数和方差可以看出

在总体效应值已知时,通过收集到研究的信息就可以估计出未收集到的研究数K0。但是我们实际遇到的情况是不知道总体效应值,因此要同时估计出总体效应值、和未收集到的研究数K0。迭代算法先计算效应值的估计值,再计算出K0的估计值。去掉相应的研究。再用剩余的研究估计新的效应值的估计值,再计算出新的K0的估计值。再去掉相应的研究。直到新的K0的估计值与上一次迭代计算出K0的估计值相等;且新的效应值的估计值与上一次迭代计算效应值的估计值。MetaanalysisonSTATASJ-4-2pr0012.......Submenuanddialogsformeta-analysiscommandsSTB-38sbe16.........................Meta-analysisSJ-3-4sbe19_5..........Testsforpublicationbiasinmeta-analysisSTB-56sbe20.1.Assessingheterogeneityinmeta-annl.:theGalbraithplotSTB-42sbe22....................CumulativemetaanalysisSTB-42sbe23....................Meta-analysisregressionSTB-45sbe24.1........metan--analternativemeta-analysiscommandSTB-56sbe26.1.Assessingtheinfluenceofasinglestudyinmeta-analysisSTB-56sbe28.1...................Meta-analysisofp-valuesSTB-61sbe39.2.Nonpar.trim&fillanal.ofpublicationbiasinmeta-analsSJ-4-2st0061................Funnelplotsinmeta-analysis(StataJournal,StataTechnicalBulletin)STATAFilledMeta-analysis-------------------------------------------------------------------------Pooled95%CIAsymptoticNo.ofMethodEstLowerUpperz_valuep_valuestudies-------------------------------------------------------------------------Fixed1.7581.0942.4215.1950.00018Random1.9230.6303.2152.9160.004-------------------------------------------------------------------------Testforheterogeneity:Q=45.364on17degreesoffreedom(p=<0.001)分析资料和报告结果同质性的检验是Meta分析过程中必要进行的工作。异质性与合并效应评价同样重要。同质性评价需回答两个问题:

是否存在异质性?

如何解释和处理异质性?如果不同研究之间存在异质性可采取以下措施:1.如果能得到每个研究的原始数据,可以探讨异质性来源,并可对每个研究可以采用统一的多元回归模型进行分析,从而避免了由于使用的模型不一致导致的异质性。

如果不同研究之间存在异质性可采取以下措施:2.按不同研究的特征分组进行分析,即分亚组分析。3.敏感性分析,在排除可能是异常结果的研究后,重新进行Meta分析,与未排除异常结果研究的Meta分析结果进行比较,探讨被去除的研究对合并效应的影响程度。或根据研究的不同特征分组进行Meta分析,通过比较了解异质性的来源。如果不同研究之间存在异质性可采取以下措施:4.选用随机效应模型进行Meta分析。5.选用Meta回归以及混合模型进行分析,利用回归模型控制混杂因素,以消除异质性。

6.若异质性过于明显,则应放弃进行Meta分析,只对结果进行一般性的统计描述。试验组与对照组舒张压改善值的比较计算各研究的效应值、方差和权重研究结果的效应值、方差和权重

对各研究结果的效应值进行齐性检验

H0:各研究的效应值相等。H1:各研究的效应值不相等。由于齐性检验的检验效能较低所以通常将检验水准定为

=0.10。计算统计量Q

Q=29.694,df=15,p=0.013。Q服从自由度为M-1的

2

分布。研究结果的效应值、方差和权重

Meta-analysis

--------------------------------------------------------

Pooled95%CIAsymptoticNo.of

MethodEstLowerUpperz_value

p_valuestudies

--------------------------------------------------------------------------

Fixed1.9591.2892.6305.7260.00016

Random2.3621.2463.4774.1480.000

--------------------------------------------------------------------------

Testforheterogeneity:

Q=29.694on15degreesoffreedom(p=0.013)

探讨异质性原因需要的准备工作一定数量的文献摘录原始文献的特征文献来源特征研究设计特征研究对象的特征分析方法的特征Meta-RegressionMeta-Regression不是使用的普通的多元回归模型。Meta-Analysis的数据是一次抽样的统计量,而不是原始个体数据。3/8/20259:42AM124Meta-Regression的模型多水平模型(multilevelmodol)MLM分层线性模型(HierarchicalLinearModels)HLM混合模型(MIXEDModels)特点:不同的变量对结果的影响是不对等学校数据班、校个人之间有差异地区消费数据地区平均的物件水平个人收入两水平模型两水平模型两水平模型两水平模型由于同一单位内的个体存在组内相关,因此不能用普通的分析方法,参数估计的方法可以使用约束最大似然估计(REML)。Meta-Analysis数据特征合并数据、同一研究内的平均水平没有个体数据Level-1研究内个体水平Level-2研究水平trialsofBCGvaccineagainsttuberculosis

ByColditz

et合并效应值Meta-analysis(exponentialform)|Pooled95%CIAsymptoticNo.ofMethod|EstLowerUpperz_value

p_valuestudies-----------+----------------------------------------------------------------Fixed|0.6500.6010.704-10.6250.00013Random|0.4900.3450.695-3.9950.000Testforheterogeneity:Q=152.233on12degreesoffreedom(p=0.000)Meta-analysisregression

Noofstudies=13tau^2methodremltau^2estimate=.1364Successivevaluesoftau^2differbylessthan10^-4:convergenceachieved-----------------------------------------------------------------------------------|Coef.Std.Err.zP>|z|[95%Conf.Interval]---------+-------------------------------------------------------------------------

startyr|-.00497.01628-0.310.760-.03688.02694latitude|-.027048.01182-2.290.022-.05021-.00388_cons|9.890932.025160.310.75-52.8771772.65914---------------------------------------------------------------------------------------Meta-analysisregression

Noofstudies=13tau^2methodmltau^2estimate=.28Successivevaluesoftau^2differbylessthan10^-4:convergenceachieved-----------------------------------------------------------------------------------------------|Coef.Std.Err.zP>|z|[95%Conf.Interval]---------+------------------------------------------------------------------------------------_cons|-.7111991.1718968-4.140.000-1.048111-.3742876-----------------------------------------------------------------------------------------------exampleForatrialbeginningin1950,atlatitude50o,theestimatedlogriskratioisgivenby:Logriskratio=9·891–0·00497×1950–0·0270×50=–1·1505riskratio=exp(–1·1505)=0·316解释系统评价的结果

必须基于研究的结果:(1)系统评价的论证强度

(2)推广应用性

(3)对干预措施的利弊和费用进行卫生经济分析

(4)对医疗和研究的意义

BMJ更新系统评价

在系统评价发表以后,定期收集新的原始研究,按前述步骤重新进行分析、评价,以及时更新和补充新的信息,使系统评价更完善。

TestsforPublicationBias

egg'sTest

adj.Kendall'sScore(P-Q)=28

Std.Dev.ofScore=22.21

NumberofStudies=16

z=1.26

Pr>|z|=0.207

z=1.22(continuitycorrected)

Pr>|z|=0.224(continuitycorrected)

Egger'stest

----------------------------------------------------------------------------------------

Std_Eff|Coef.Std.Err.tP>|t|[95%Conf.Interval]

----------------------------------------------------------------------------------------

slope0.5845064.89160320

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论