高级医学统计学:交互作用(一)_第1页
高级医学统计学:交互作用(一)_第2页
高级医学统计学:交互作用(一)_第3页
高级医学统计学:交互作用(一)_第4页
高级医学统计学:交互作用(一)_第5页
已阅读5页,还剩93页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

交互作用(一)

DetectingInteractionindifferentstudydesigns研究生《医学统计学》课程张汝阳zhangruyang@研究背景客观事实要求复杂疾病的发生由基因、环境相互影响,共同作用所致科研实际情况可能忽视交互作用(遗漏一篇高质量的论文)2主要内容病例对照研究交互作用的基本概念交互作用的检测方法交互作用的检出策略交互作用的重要贡献交互作用的交互阶数单纯病例研究不完全病例对照研究病例交叉研究3病例对照研究交互作用的基本概念交互作用的检测方法交互作用的检出策略交互作用的重要贡献交互作用的交互阶数4交互作用的基本概念定义(1):因素A的效应在因素B的不同水平上存在差异,则认为因素A、B之间存在交互作用。定义(2):因素A、B的联合效应不等于两因素独立效应之和或之积。5交互作用示意(1)6I2=0.00,无异质型性(P=0.42)无不同研究因素A有1.25(1.07,1.45)因素B的OR(95%CI)1.15(1.03,1.34)无交互作用1.00I2=93.8%,有异质性(P<0.01)无因素A有1.25(1.07,1.45)0.83(0.73,0.94)有交互作用交互作用的基本概念定义(1):因素A的效应在因素B的不同水平上存在差异,则认为因素A、B之间存在交互作用。森林图展示因素B不同水平上因素A的效应。通过I2,异质性检验判断有无交互作用78交互作用示意(2)A0ABB无交互作用(AB=A+B)A0ABB正交互作用(AB>A+B)A0ABB负交互作用(AB<A+B)A0ABB无交互作用(AB=A+B)交互作用的基本概念定义(2):因素A、B的联合效应不等于两因素独立效应之和或之积。因素A、B取值的分组效应图展示交互作用通过直线是否平行、假设检验判断有无交互作用9交互作用的检测方法叉生分析分层分析回归模型10叉生分析—基因/环境的ORGE病例数对照数OR含义++aa0联合效应+-bb0基因的主效应-+cc0环境的主效应--dd01(reference)对照11R口服避孕药和factorvleiden基因突变与静脉血栓栓塞的病例对照研究

GE病例数对照数OROR值95%CI++252OReg34.77.83~310.0+-104ORg6.91.83~31.80-+8463ORe3.72.18~6.32--3610011总计15516912资料引自VandenbrouckeJP等.Lancet.1994;344:1453-7.

交互作用交互作用ORI>1表示有正向的交互作用协同作用(synergisticinteraction)ORI<1表示有负向的交互作用拮抗作用(antagonisticinteraction)ORI=1表示没有交互作用。13口服避孕药和factorvleiden基因突变与静脉血栓栓塞的病例对照研究

GE病例数对照数OROR值++252OReg34.7ORI=

1.35+-104ORg6.9-+8463ORe3.7--3610011总计15516914叉生分析—假设检验交互作用的对数变换交互作用对数变换后的标准误统计量和P值15重要概念联合效应(jointeffect)——OReg两因素共同作用时,对结果产生的总效应主效应(maineffect)——ORe,ORg仅一个因素作用时,对结果产生的独立效应交互作用(interaction)——ORI联合效应超过主效应之积的部分16相乘交互作用分层分析—不同环境暴露时,基因的ORGE病例数对照数OR++aa0-+cc0+-bb0--dd017不同环境暴露时,基因的ORGE病例数对照数OR++252-+8463+-104--3610018分层分析—不同基因型时,环境的ORGE病例数对照数OR++aa0+-bb0-+cc0--dd019R不同基因型时,环境的ORGE病例数对照数OR++252+-104-+8463--36100分层分析—假设检验STATA软件META命令metanlnORlnCILlnCIU,eformclassicboxsca(150)textsize(150)by(study)label(namevar=group)2122分层分析—假设检验定性的方式可信区间是否重叠定量的方式异质性Q检验异质性I22324异质性Q检验251/25+1/10+1/4+1/2=[(3.46-1.61)/2]2如何计算log(OR)的方差/标准误?异质性Q检验26如何计算合并(pooled)OR?各层OR的加权均数以方差的倒数作为权重15.254134=1/0.065556、1.1235956=1/0.88999990.93139491=15.254134/(15.254134+1.1235956)如何进行异质性Q检验Q统计量满足自由度为(组数-1)的卡方分布!Q检验实际上是卡方检验异质性Q检验27(1.31-1.33)2/0.07+(1.61-1.33)2/0.89异质性I2k等于(组数-1)若算的I2为负数时,则定义取值为0I2

>50%,中度异质性;I2

>75%,重度异质性有异质性提示变量间可能存在异质性28重要概念修饰因子(modifier)不同环境暴露下基因的效应不一样,则认为环境因素是基因效应的修饰因子不同基因型的人群,环境暴露效应不一样,则认为基因型是环境因素的修饰因子29回归模型—logistic模型30R基因/环境的ORE=0E=1E=0E=1G=000G=1无交互作用有交互作用在对数尺度上是相加的基因/环境的ORE=0E=1E=0E=1G=011G=1无交互作用有交互作用在对数尺度上是相加的,其实是相乘的交互作用。交互作用交互作用

>0表示有正向的交互作用,协同作用

<0表示有负向的交互作用,拮抗作用

=0表示没有交互作用。数据格式(频数)

case fge eg1.1 251112.1 101003.1 840104.1 360005.0 21116.0 41007.0 630108.0 100000STATA命令与结果.logisticcaseegeg[fw=f]

LogitestimatesNumberofobs=324LRchi2(3)=59.57Prob>chi2=0.0000Loglikelihood=-194.49004PseudoR2=0.1328------------------------------------------------------------------y|OddsRatioStd.Err.zP>|z|[95%Conf.Interval]------+-----------------------------------------------------------e|3.703704.94828965.110.0002.2423126.117533g|6.9444444.3244313.110.0022.04917423.53402eg|1.351.3196590.310.759.19872979.170748------------------------------------------------------------------三种方法比较叉生分析、分层分析、回归模型两个因素,每因素两水平,不调整协变量三种方法结果等价其他条件时,结果相似,结论基本相同推荐使用回归模型方便快捷调整混杂36重要概念边际效应(marginaleffect)不考虑其他因素时(不调整其他因素),一个因素对结果产生的独立效应。传统单因素分析,单个因素的效应估计值。主效应(maineffect)考虑其他因素(调整其他因素),一个因素对结果产生的独立效应。即其他因素没有作用时,某因素的独立效应。叉生分析中,单个因素的独立效应分层分析中,层内单个因素的效应回归分析中,单个因素独立的效应37交互作用的类型相乘交互作用(multiplicativeinteraction)相加交互作用(additiveinteraction)38E=0E=1G=01OReG=1ORgORge相加交互作用的假设检验计算ORge,

ORg,

ORe根据ORge–ORg–ORe+1计算相加交互作用假设检验Permutation获得相加交互作用的分布,计算P值(结果不可靠)Bootstrap获得相加交互作用的标准误,计算可信区间(结果可靠)39MeanORI相加交互作用的permutation检验expandfpermutecaseOR_Interaction_add=(exp(_b[ge]+_b[g]+_b[e])-exp(_b[g])-exp(_b[e])+1),reps(2000):logitcasegege40相加交互作用bootstrap检验AssmannSF(1996)提出通过bootstrap获得相加交互作用的可信区间。产生5000个bootstrap样本,计算每个样本的相加交互作用根据5000个bootstrap相加交互作用2.5%分位数、97.5%分位数获得可信区间该方法适用于频数不稀疏的列联表。若频数稀疏仍使用该法,所得可信区间很宽。41相加交互作用bootstrap检验通过bootstrap命令获得正态近似可信区间bootstrapOR_Interaction_add=(exp(_b[ge]+_b[g]+_b[e])-exp(_b[g])-exp(_b[e])+1),reps(5000):logitcasegege42相加交互作用bootstrap检验以下是直接计算百分位数的结果43相加交互作用bootstrap检验当列联表频数稀疏的时候,可通过LeiNie(2010)所提出的bootstrap联合线性校正方法获得相加交互作用的可信区间。2000次bootstrap每次连续性校正44相加交互作用相关概念RothmanKJ(1998)基于相加交互作用提出交互作用指数(thesynergyindex,S):交互作用归因比(attributableproportionofinteraction,AP):表示总效应中有多大比例归因于交互作用。纯交互作用归因比(AP*):45相加交互作用相关概念交互作用超额相对危险度(RelativeExcessRiskofInteraction,RERI):等价于相加交互作用。只有计算相加交互作用时,才能应用S、AP、AP*、RERI统计量。46交互作用的检出策略单因素分析多因素分析多因素全模型变量精简主效应模型交互作用最终模型47交互作用检测策略—实例分析STORYBEHINDTHEDATA:Lowbirthweightisanoutcomethathasbeenofconcerntophysiciansforyears.Thisisduetothefactthatinfantmortalityratesandbirthdefectratesareveryhighforlowbirthweightbabies.Awoman'sbehaviorduringpregnancycangreatlyalterthechancesofcarryingthebabytodeliverababyofnormalbirthweight.STATA-基础操作1:单因素分析2:多因素分析样本量足够,则纳入所有变量建立多因素全模型,再修剪模型样本量不够,则纳入以下变量,则修剪模型有重要临床意义者单因素分析P小于界值(0.2)者单、多因素分析系数变化较大者(>50%)多因素全模型结果3:主效应模型精简模型剔除对模型贡献没有统计学意义的变量似然比卡方检验,大Wald检验性质相同的变量可进行逐步回归筛选较重要者精简模型的过程主效应模型的结果逐步回归精简模型逐步回归为何不用直接用逐步回归?卡片机(全自动傻瓜式)单反(手动调焦)建模的注意事项切勿忽略专业上重要的指标!模型没有最好,只有合理!仁者见仁,智者见智革命尚未成功、同志仍需努力!4:最终模型探索交互作用的方式排位变化法逐步前进法,P=0.9999,探索独立效应强的变量逐步后退法,P=0.0001,探索联合效应强的变量比较两法变量进入和剔除的顺序变化,探索交互作用项穷举法列举所有可能的交互作用项组合,似然比卡方检验STATA-统计分析策略针对有边际效应的变量探索两两组合是否有交互作用STATA-统计分析策略没有边际效应的变量可能也存在交互作用交互作用的重用贡献提高变量的检出能力无边际效应可能有较强的主效应或交互作用提高模型的预测能力反应真实的结局变量与解释变量间关系,提高模型诊断能力或预测精度61提高变量的检出能力提高模型的预测能力提高模型的预测能力从GWAS中筛出6对SNP-SNP交互作用建立以下4个模型模型1:预测变量为年龄、性别、吸烟模型2:增加6个已验证成功的SNP模型3:增加12个组成交互作用的SNP模型4:增加6个交互作用项64Sensitivity0.000.250.500.751.000.000.250.500.751.001-SpecificityAUC4=0.756AUC3=0.686AUC2=0.684AUC1=0.665模型1环境因素模型2增加已验证的6个位点模型3增加交互项位点主效应模型4增加交互作用项3.16%10.16%65交互作用的交互阶数一阶交互作用(one-orderinteraction)two-wayinteractionA+B+AB二阶交互作用(two-orderinteraction)three-wayinteractionA+B+C+ABC……66高阶交互作用的负担GWAS中所研究的遗传因素变量有50万个。在每10分钟50万次计算速度下:遍历一阶交互作用需要:4.76年!遍历二阶交互作用需要:792740年!…………67高阶交互作用的样本量交互作用阶数越高,变量取值组合下的样本量将越稀疏,为获得稳定的结果,样本量需求越大!高阶交互作用比较难以解释。受样本量限制,实际工作中建议检测2阶以下交互作用大数据时代,机器学习类的方法暂露头角!68单纯病例研究单纯病例研究的概念交互作用的检测方法单纯病例研究的特点69单纯病例研究的概念Piegorsch(1994)在病例-对照研究(case-controlstudy)的基础上提出了一种新的流行病学方法-单纯病例研究(case-onlystudy),又称病例-病例研究(case-casestudy)。70单纯病例研究的概念单纯病例设计在健康人群中环境暴露和遗传因素之间互相独立,且所研究的疾病发病率较低时,仅用患病人群作为研究对象,收集研究对象的环境暴露及基因分型资料。若环境暴露于遗传因素之间存在关联,则估计暴露和遗传因素之间存在交互作用。71收集病例以下资料检验E与G之间的关联性卡方检验Logistic回归单纯病例研究交互作用检测方法EG-+-ab+Cd72单纯病例研究交互作用检测方法交互作用标准误73口服避孕药和factorvleiden基因突变与静脉血栓栓塞多数情况下单纯病例研究的交互作用结论与病例对照研究的结论一致。74单纯病例研究的特点与传统的病例一对照研究相比,单纯病例设计在检测交互作用时,具有较高的检验效能和较精确的估计,且所估计的交互作用可信区间更窄;能够节省样本含量,特别适合肿瘤及罕见慢性病的研究。模拟研究表明(易洪刚,2004),在相同样本量且交互作用不是很大时,单纯病例设计的检验效能是病例一对照研究的2~10倍;在相同检验效能时,病例一对照研究所需的病例数是单纯病例设计的2~4倍。因此,该设计备受应用者青睐。75单纯病例研究的特点单纯病例设计的前提是假定遗传因素和环境暴露互相独立。虽然在很多情况下这种假定是合理的,但有时候这种假定却不成立。模拟结果显示(AlbertPS,2001),当环境与遗传之间互相独立这个假设不成立时,I类错误就会增大,从而导致假阳性增加。因此单纯病例研究的一个潜在的用途就是预试验以及危险因素的初筛。一旦单纯病例研究有阳性结果时,通常再进行以人群为基础的随访研究,进一步证实所得结果。76联合分组—基因/环境的ORGE病例数对照数OR含义++aa0联合效应+-bb0基因的主效应-+cc0环境的主效应--dd01(reference)对照77分层分析—不同人群,暴露基因间的ORGE病例数对照数OR++aa0-+cc0+-bb0--dd078单纯病例研究的特点79单纯病例研究的特点单纯病例设计仅选择病例作为研究对象,避免选择对照不恰当所致的选择性偏倚。虽然可以避免由于遗传背景不同所造成的选择性混杂,但是当研究对象中环境暴露率和基因型外显率不同时就会造成偏倚(WeinbergCR,2000)。当所研究的疾病发病率相对较高时。单纯病例设计分析的结果容易导致偏倚(TanQ,2002)。80单纯病例研究的特点由于缺乏真正意义上的对照,单纯病例设计不能单独估计环境暴露或遗传的主效应,而只能估计其交互作用(Piegomch,1994)。因此,常常将单纯病例设计和病例一对照研究结合起来。既能评价各自的主效应,又能较精确地评价交互作用,从而具有较高的研究效率。假设环境与遗传相互独立,比假定其他非遗传因素互相独立更为有效和合理,这就是单纯病例设计通常不用来研究非遗传因素间交互作用的原因(KhouryMI,1994)。81不完全病例-对照研究病例有基因型、环境暴露资料对照仅有环境暴露资料82不完全病例-对照研究可以估计环境的主效应标准误小于传统病例对照研究要求对照中基因和暴露无关83不完全病例-对照研究可以估计交互作用84病例交叉研究病例交叉研究是概念交互作用的检测方法病例交叉研究的特点85病例交叉研究的概念Maclure(1991)提出病例交叉研究(case-crossoverstudy),用于研究短暂暴露对罕见急性病的瞬间影响。其基本思想是选择发生某种急性事件的病例,比较在急性事件或突发事件发生前一段时间的暴露情况与未发生事件的某段时间内的暴露情况。属自身前后对照。如果暴露与事件有关,那么在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。86暴露多暴露少病例交叉研究的概念病例交叉设计的研究对象包含“病例”和“对照”两个部分.“病例部分”为危险期(riskperiod),是疾病或事件发生前的一段时间“对照部分”为对照期(controlperiod),是指危险期外特定的一段时间通过比较危险期和对照期内的暴露信息达到危险度评价的目的。87病例交叉研究的概念根据对照期时间的选择,病例交叉研究可以分为单向(unidirectional)双向(bidirectional)对称双向(symmetricbidirectional,SBI)半对称双向(semi-symmetricbidirectional,SSBI)88病例交叉研究的概念单向对照时间是事件发生前的时间,当暴露存在时间趋势时,这种单向回顾性选择对照的方法就会导致明显的偏倚(Gre

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论