观察性研究中的因果推断方法三30分钟_第1页
观察性研究中的因果推断方法三30分钟_第2页
观察性研究中的因果推断方法三30分钟_第3页
观察性研究中的因果推断方法三30分钟_第4页
观察性研究中的因果推断方法三30分钟_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2016 07 27 天津 FuzhongXue 薛付忠 山东大学公共卫生学院生物统计学系DepartmentofBiostatistics SchoolofPublicHealthShandongUniversity 中国生物统计2016年学术年会导师讲坛 天津 观察性研究中的因果推断方法 三 30分钟 观察性研究中的偏倚及控制策略 inthePerspectiveofCausaldiagram 2 Outline 3 StatisticalAssociation 偏倚及其来源 4 Definitionsofbias 偏倚及其来源 5 Definitionsofbias 偏倚及其来源 8 选择偏倚 selectionbias 的来源 选择偏倚及其控制 Selectionbiascanoccurinseveralways Selectionofacomparisongroup controls thatisnotrepresentativeofthepopulationthatproducedthecasesinacase controlstudy Controlselectionbias Differentiallosstofollowupinacohortstudy suchthatthelikelihoodofbeinglosttofollowupisrelatedtooutcomestatusandexposurestatus Losstofollow upbias Refusal non response oragreementtoparticipatethatisrelatedtotheexposureanddisease Self selectionbias Usingthegeneralpopulationasacomparisongroupforanoccupationalcohortstudy Healthyworker effect Differentialreferralordiagnosisofsubjects 9 选择偏倚及其控制 比较组 G1 G2 存在很高的选择效应 由于对E S D中S施加条件 选择 开放了偏倚路E D 其后果是被选择样本的效应 RR1 与未入选样本的效应 RR0 不等 RR1 RR0 RR1缺乏总体人群 RRP 的代表性 选择偏倚的特点 1 难以通过调整而消除其影响 2 需要在设计阶段消除 3 影响E D的因果推断 选择偏倚的因果图模型 10 选择偏倚 selectionbias 举例 在HIV阳性者中 怀孕是否影响到发展为艾滋病的进程的观察性研究中 研究者希望知道新怀孕对HIV阳性者发展为艾滋病的时间效应 如果该研究在产前保健诊所进行 则怀孕和新诊断为艾滋病这二个事件均可影响去诊所就诊的几率 新怀孕者更易于就诊 而诊断为艾滋病者也影响就诊机会 这样证明怀孕与发展为艾滋病之间关系就会收到选择偏倚的影响 选择偏倚及其控制 11 选择偏倚及其控制 12 信息偏倚 Informationbias 信息偏倚 又称观察偏倚 错误分类偏倚或测量偏倚 是由于测量 疾病 暴露 不准确 诊断标准不明确以及原始记录不完整等原因所造成的偏倚 包括 1 回忆偏倚 由于研究对象不能准确 完整地回忆以往发生的事情和经历时所产生的差异 2 报告偏倚 由于研究对象有意扩大或缩小某些信息造成的偏倚 它与回忆偏倚是不同的 3 诊断怀疑偏倚 由于研究者和被研究者事先了解被研究者的暴露或分组情况 怀疑被研究者已经患病 或希望出现阳性结果 因而在诊断或分析时做出带倾向性的判断而造成的偏倚 4 暴露怀疑偏倚 研究者事先了解研究对象的患病情况或结局 可能会对其使用与对照组不可比的方法探寻认为与某病或结局有关的因素 而对同一组研究对象以不同的方法调查 这样 结果会出现很大差异 5 测量偏倚 是指对研究所需指标或数据进行测量时产生的偏倚 信息偏倚及其控制 13 信息偏倚及其控制 信息偏倚 Informationbias 回忆偏倚 14 CorrectClassificationVS Misclassification 错分偏倚 信息偏倚及其控制 15 信息偏倚及其控制 信息偏倚及其控制 信息偏倚的因果图模型 信息偏倚及其控制 信息偏倚的因果图模型 信息偏倚及其控制 信息偏倚的因果图模型 信息偏倚及其控制 信息偏倚的因果图模型 20 混杂偏倚 confoundingbias 混杂因子亦称混杂因素或外来因素 是指与研究因素和研究结局均有关 若在比较的人群组中分布不匀 可以歪曲 掩盖或夸大 因素暴露与结局之间真正联系的因素 基本特点是 必须是所研究结局的独立危险因子 必须与研究因素 暴露因素 有关 一定不是研究因素与研究结局 疾病 因果链上的中间变量 具备这几个条件的因素 如果在比较的人群组中分布不均 即可导致混杂偏倚产生 例如 人群中观察到肺癌患者往往指甲发黄 研究假设为 黄指甲是肺癌的危险因素 此时 吸烟就是研究假设的一个混杂因素 混杂偏倚及其控制 控制混杂偏倚的基本方法 设计阶段 21 随机化分配 Randomization 混杂偏倚及其控制 控制混杂偏倚的基本方法 设计阶段 22 随机化分配 有效范围 E 混杂偏倚及其控制 23 QiY FanJ LiuJ WangW WangM SunJ LiuJ XieW ZhaoF LiY ZhaoD Cholesterol overloadedHDLparticlesareindependentlyassociatedwithprogressionofcarotidatherosclerosisinacardiovasculardisease freepopulation acommunity basedcohortstudy JAmCollCardiol 2015Feb3 65 4 355 63 升高血清HDL的药物 CETP 控制混杂偏倚的基本方法 设计阶段 随机化分配 理解病理生理机制的重要性 混杂偏倚及其控制 控制混杂偏倚的基本方法 设计阶段 24 随机化分配 理解病理生理机制的重要性 混杂偏倚及其控制 控制混杂偏倚的基本方法 设计阶段 25 限制 Restriction 研究受教育水平对记忆力的影响时 儿童认知能力是一个混杂因子 此时可以选择认知能力相同的儿童 此时由于将混杂限制在了固定水平 从而实现对其控制 C E D 选择认知能力相同的儿童 C E D S 混杂偏倚及其控制 L和E通过两条路L S E和L E而有向相连 d connected 然而 在配对设计中L与E是相互独立的 在L S E中 由于对S施加条件而导致L与E相关 但方向与L E的相关相反而相互抵消 保证L与E在匹配亚队列中仍独立 因而 匹配并未产生混杂 不必要调整 26 控制混杂偏倚的基本方法 设计阶段 匹配 Matching 在队列设计中匹配 引自 MansourniaMA IntJEpidemiol 2013 42 3 860 9 混杂偏倚及其控制 右图是匹配混杂因子C的匹配病例对照设计 C对D的作用通过C D C E D C D 是有C S D形成的碰撞偏倚路 而有向连接 匹配混杂因子C后 C在病例组与对照组间相等 故C与D独立 意味着C D C E D C D三条路的关联性之和必定为零 则 C D与C D的关联性之和必定不为零 因此 混杂路E C D仍然开放 所以 匹配并不能消除C的混杂作用 不仅如此 由于对C S D中碰撞节点S施加条件 匹配 还额外引入了碰撞偏倚C D 27 引自 ShaharE ClinEpidemiol 2012 4 137 44 控制混杂偏倚的基本方法 设计阶段 匹配 Matching 在病例对照设计中匹配 混杂偏倚及其控制 28 RelativeRisk 27 75 14 81 2 1 Smokers Non smokers RelativeRisk 1 25 2 50 1 0 RelativeRisk 26 50 12 31 1 3 控制混杂偏倚的基本方法 分析阶段 分层分析 Stratifiedanalysis 化学物暴露 吸烟 恶性肿瘤 混杂偏倚及其控制 U 3 参考文献 ShaharE ClinEpidemiol 2012 4 137 44 29 控制混杂偏倚的基本方法 分析阶段 更受青睐的控制方法 混杂偏倚及其控制 为了消除混杂L对推断暴露 A 结局 Y 的因果效应的影响 采用逆处理概率加权 IPTW 法 对样本中每个个体进行加权 以构造出阻断混杂路L A后的准样本人群 Pseudopopulation 然后在准样本人群中采用边际回归模型推断A Y IPTW计算方法为 当时 则个体i的权重为 当时 则个体i的权重为 在纵向设计条件下 稳定 stable 的IPIW计算方法为 DMarginalStructralModel RobinsJM Epidemiology 2000 11 5 550 60 横断面设计 基线 纵向设计 随访 Inverse probability of treatmentweights IPTW 30 控制混杂偏倚的基本方法 分析阶段 混杂偏倚及其控制 基于准样本人群 用各种边际回归模型 logistic回归模型 Cox回归模型 广义估计方程 联合模型等均可作为边际回归模型 估计A Y的因果效应 例如 采用logistic回归的边际结构回归模型为 推荐文献及SAS程序 DouglasFaries etal AnalysisofObservationalHealthCareDataUsingSAS SASInstitute 2010 DMarginalStructralModel RobinsJM Epidemiology 2000 11 5 550 60 横断面设计 基线 纵向设计 随访 Inverse probability of treatmentweights IPTW 31 控制混杂偏倚的基本方法 分析阶段 混杂偏倚及其控制 32 控制混杂偏倚的基本方法 分析阶段 混杂偏倚及其控制 33 Anexample Statins Cholesterol andColorectalCancer MamtaniR etal DisentanglingtheAssociationbetweenStatins Cholesterol andColorectalCancer ANestedCase ControlStudy PLOSMedicine April26 2016 混杂偏倚控制方法的正确应用 普遍存在的表2谬误 在人群观察性研究的医学论文中 通常用两个表报道研究结果 1 在表1中 通常描述和比较暴露组与对照组 或病例组与对照组 人群的人口学 社会经济 临床特征 2 在表2中 通常报告多元回归模型 如多元线性回归 Logistic回归 Cox回归等 调整协变量后的关联分析结果 展示主要变量在调整了次要变量后对结局的影响 34 WestreichD GreenlandS AmJEpidemiol 2013 177 4 292 8 条件logistic回归模型 混杂偏倚控制方法的正确应用 35 Anexample Statins Cholesterol andColorectalCancer AssociationbetweenHyperlipidemiaandColorectalCancer MamtaniR etal PLOSMedicine April26 2016 混杂偏倚控制方法的正确应用 36 Anexample Statins Cholesterol andColorectalCancer AssociationbetweenHyperlipidemiaandColorectalCancer ORsforassociationbetweencolorectalcancerriskandtotalcholesterolmeasuredatdifferenttimeintervalsbeforecolorectalcancerdiagnosis amongstatinnonusers n 15 052cases n 46 043controls Adjustedforobesity BMI30kg m2 eversmoking chronicuseofaspirinorNSAIDs hormonereplacementtherapy alcoholconsumption diabetesmellitus performanceofbowelscreening andnon statincholesterol loweringmedication MamtaniR etal PLOSMedicine April26 2016 混杂偏倚控制方法的正确应用 37 Anexample Statins Cholesterol andColorectalCancer AssociationbetweenReductioninSerumCholesterolandColorectalCancer MamtaniR etal PLOSMedicine April26 2016 混杂偏倚控制方法的正确应用 38 Anexample Statins Cholesterol andColorectalCancer 胆固醇水平升高是否一定是导致结直肠癌风险降低的原因 MamtaniR etal PLOSMedicine April26 2016 U U 混杂偏倚控制方法的正确应用 Ananotherexample 混杂偏倚控制方法的正确应用 从 流行病学三角 谈起 Startingfromthe epidemiologytriangle 40 混杂偏倚控制方法的正确应用 对混杂路上的混杂因子施加条件 可以控制混杂偏倚 图1中 引自 HernanMA AmJEpidemiol 2002 155 2 176 84 暴露 E 和疾病 D 有共同原因C 因此C是混杂因子 用粗ORED测量E对D的效应会产生混杂偏倚 对C施加条件可控制混杂偏倚 图2和图3中 暴露 E 和疾病 D 的共同原因U 未观察或不可测量 但在混杂上有已知的混杂因子C 对C施加条件也可以控制混杂偏倚 这是因为对C施加条件后 就阻断了整个混杂路 41 混杂偏倚控制方法的正确应用 对替代混杂因子施加条件 也可以控制混杂偏倚 图4中 引自 HernanMA AmJEpidemiol 2002 155 2 176 84 C不是混杂因子U 未观察或不可测量 的混杂路上的混杂因子 此时 理论上对C施加条件并不能控制混杂因子U 但是 若C与U高度相关 对C施加条件则可以控制混杂因子U 此时C称为U的替代混杂因子 surrogateconfounding 通常情况下 当混杂因子不可测量时 控制其替代混杂因子可以部分控制混杂偏倚 例如 如果C体现了混杂因子U的错分 C与U之间的相关性越强 考虑C为一个混杂并对其施加条件就越符合情理 42 混杂偏倚控制方法的正确应用 对因果路上的中介因子施加条件 可能会导致过度调整偏倚 图5 引自 SchistermanEF Epidemiology 2009 20 4 488 95 是一个对中介变量施加条件的简单因果图模型 过度调整偏倚 overadjustmentbias 是指在估计暴露E对结局D的总效应时 对暴露到结局因果路上的中介变量 intermediatevariable M或中介变量的代理变量 proxyforanintermediatevariable 施加条件 而导致的偏倚 1 直接对中介变量M施加条件 则产生过度调整偏倚 43 混杂偏倚控制方法的正确应用 对因果路上的中介因子施加条件 可能会导致过度调整偏倚 2 对中介变量的后代代理节点施加条件 也会产生过度调整偏倚 自然流产史 图6 引自 SchistermanEF Epidemiology 2009 20 4 488 95 是对未测量或观察的中介变量U的后代代理节点 descendingproxyforanintermediatevariable M施加条件的例子 此时 使因果路E U D部分地被阻塞 而导致过度调整偏倚 在E对D没有直接效应 DE 0 时的采用广义线性模型 自然流产史 未调整M 调整M bias 图6 D M 目的 估计E对D的总效应 图6 44 混杂偏倚控制方法的正确应用 对因果路上的中介因子施加条件 可能会导致过度调整偏倚 3 对中介变量的祖先代理节点施加条件 不会产生过度调整偏倚 图7 引自 SchistermanEF Epidemiology 2009 20 4 488 95 是对未测量或观察的中介变量U的祖先代理节点 ascendingproxy M施加条件的例子 此时 不会阻塞因果路E U D 故不导致过度调整偏倚 在E对D没有直接效应 DE 0 时的广义线性模型为 bias 未调整M 调整M 则 目的 估计E对D的总效应 45 混杂偏倚控制方法的正确应用 图11a 图11d中 引自 HernanMA AmJEpidemiol 2002 155 2 176 84 暴露 E 和疾病 D 没有共同原因 在暴露 E 与疾病 D 之间没有其它的因果路 因此 粗ORED 可以测量E对D的效应 若对碰撞节点 C 施加条件 反而会导致新的偏倚产生 对碰撞节点施加条件 会产生碰撞偏倚 collider stratificationbias FIG 11a FIG 11b FIG 11b3 FIG 11b3 46 混杂偏倚控制方法的正确应用 举例1 对于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论