混杂偏倚-效应修正【PPT课件】_第1页
混杂偏倚-效应修正【PPT课件】_第2页
混杂偏倚-效应修正【PPT课件】_第3页
混杂偏倚-效应修正【PPT课件】_第4页
混杂偏倚-效应修正【PPT课件】_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

混杂偏倚的识别与控制 一、混杂偏倚的概念 在病因研究中 , 当对所关心的某种暴露因素 (E)与某种疾病 (D)之间的关联进行定量估计时 , 由于其他因子 (F)的影响 , 致使 之间关联的真实性被歪曲 , 关联强度被放大或缩小 , 这种歪曲关联真实性的作用被称作混杂作用 ( 起到混杂作用的因子被称为混杂因子 ()。 混杂偏倚本质 一种人为造成的偏倚 是在研究的设计阶段未对混杂因子加以控制 或资料分析时未能进行正确校正所致 是完全可以避免和控制的一种系统误差 混杂因子成立的条件 (1)必须是所研究疾病的危险因素或保护性因素 (2)必须和暴露因素之间存在统计学关联 (3)一定不是暴露因素与疾病因果链上的中间变量 二、混杂偏倚产生的机理 例 :氡气与肺癌的定群研究 以 肺癌患者(D+) 未患肺癌者 (D ) 暴露于氡 气的人群 (E) a b a+b 未暴露于氡 气的人群 ( ) c d c+d a / (a+b) c / (c+d) 以四格表的数据计算关联强度指标 此 关联强度 , 完全取决于下述条件: (1)氡气暴露人群 ( E) 和未暴露人群 ( ) 之 间在产生肺癌的易感性方面是否可比 (2)导致肺癌的其它危险因素在两组人群之间 的分布频率是否可比。 “ a” 例肺癌的归因可能性 (来自暴露人群 ): ( A) 由氡气所致 ( B) 由吸烟所致 ( 研究者已知道的致肺癌 因素 ) ( C) 由其它未知因素所致 “ c” 例肺癌的归因可能性 (来自非暴露人群 ): ( B) 由吸烟所致 ( C) 由其它未知因素所致 对 此相对危险度 ( A)氡气的致癌效应 ( B)吸烟的致癌效应 ( C)其它未知因素的致癌效应 ( B)吸烟的致癌效应 ( C)其它未知因素的致癌效应 当 吸烟的致癌效应 1时 下述情况下吸烟可导致该研究产生 混杂偏倚: 研究设计阶段:未保证吸烟者在两人群中 的均衡性 分析阶段:未先将两人群按吸烟和未吸烟 分层 , 然后再按每一层去确定氡气暴露和 肺癌之间的关联 该研究中混杂偏倚产生的机理: 是因为导致肺癌产生的另一因素吸烟在两 组人群中分布不均衡 。 三 、 混杂偏倚和混杂因子的判别 根据专业知识确定研究中可能存在的混杂 因子 在流行病学研究中,混杂因子可分为两类: 1. 人口统计学因子 : 年龄 、 性别 、 种族 、 职业 、 经济收入 、 文 化水平等人口统计学指标 , 是经常遇到的 混杂因子 。 2. 暴露因素以外的其它危险因子: 研究中混杂因子广泛存在 , 表现形式多样 , 常常在隐匿中起到混杂作用 。 利用分层分析进行定量判别 以定群研究为例 分层分析:将研究人群按是否暴露于可疑 混杂因子 ( 最简单可分为暴露与不 暴露两组 ) , 然后再做单因素分析 。 未分层资料的分析 暴露人群 (E) a b a+b 未暴露人群 ( ) c d c+d 患者 (D+) 非患者 (暴露人群 (E) a1 暴露人群 () c1 者(D+) 非患者( 分层资料的分析 a2 b2 c2 者(D+) 非患者(暴露第三因子 F 未暴露第三因子 F D+ D E+ a1 c1 + D E+ a2 c2 + D E+ a b E c d + F 用 简单公式描述: 1. 的混杂偏倚。 2. 或 的混杂偏倚。 上述分析也可适用于病例对照的 四、混杂偏倚的方向 根据偏倚的产生机理,当混杂因子对暴露与疾 病之间的关联产生歪曲时,混杂偏倚具有一定 的方向性和大小。其方向可正可负,其作用可 大可小,取决于 E、 之间的关系。 正混杂: 放大,高于真实值 负混杂: 缩小,低于真实值 五、混杂偏倚的控制 (一 ) 在设计阶段进行控制 1. 限制。 2. 随机分配:随机分配又可细分为简单随机分配 和分层随机分配( 两种方式。 3. 匹配( 匹配是最经常用于控制混 杂因子的方法。 群体频数匹配 指混杂因子发生的频度在不同组应大致平横; 个体匹配 指按一个至数个混杂因子分层 , 为病例选择同层 的对照 , 一个病例配的对照数多为 1 匹配的好处 可以有效地控制混杂因子的作用 , 提高研究 结果的真实性; 在减少总样本数的情况下得到结论 , 提高研 究的效率 。 匹配的缺点 : (A) 难以对匹配掉的混杂因子及交互作用做深 入分析; (B) 在病例对照调查中 , 用匹配的方法控制混 杂经常低估暴露对疾病的作用 , 严重时会 引起过度匹配 ( 的问题 , 掩盖暴露的真实作用 。 (C) 过分苛刻的匹配 , 会使得部分病例找不到 对照 , 致使信息浪费 , 使研究的效率反而 降低 。 (二 ) 在分析阶段控制混杂 1. 分层分析: 分层分析是按混杂因素分层后 , 分别就暴露 对疾病的关联做分析 , 可以使用 可以评价在各层中暴露与疾病的关联; 可整体估价用分层技术排除混杂后的暴露 与疾病总的关联强度 。 例:食管癌病因研究 病例对照研究设计 因素 病例 对照 年龄(岁) 25- 1 115 35- 9 190 45- 46 167 55- 76 166 65- 55 106 75+ 13 31 均值 准差 精(克 /天) 0- 29 386 40- 75 280 80- 51 87 120+ 45 22 均值 准差 管癌病例组和对照组暴露因素分布 对资料进行初步审查 (1) 对照组年轻人比重大于病例组 (2) 在病例组中,饮酒消耗量的均值大于对照 组,且重度饮酒者的比例大于对照组 (3) 年龄和饮酒之间呈现轻度的负相关 根据上述资料和已往医学知识,即食管癌在年 龄大者中多见,推测年龄这一因素可能对判断 饮酒与食管癌之间的关联起一定的混杂作用。 饮酒 (E) 食管癌 (D) 年 龄 (F) 计算未分层时总的比值比 酒 不饮酒 计 食管癌病例 96(a) 104(b) 200(对照 109(c) 666(d) 775(计 205(770(975(N) (96 x 666) / (104 x 109) = ( 2 (N 1) n0 m0 n1 1, P 负交互作用: 龄 (岁) 组别 每日饮酒量 0克 025- 病例 对照 1 9 0 106 35- 病例 对照 4 26 5 164 5- 病例 对照 25 29 21 138 5- 病例 对照 42 27 34 139 5- 病例 对照 19 18 36 88 5+ 病例 对照 5 0 8 31 第三因子年龄分层后计算的每层比值比 各层 示年龄可能是效应修正因子 通过一致性 2检验,确定层间差异是否有统计学意义 2检验公式为: 0111 221 ;m hi i m hV a R 式中理论值 是根据 年龄组相应的四格表中 值的 计算可按下述公式解一元二次方程: 01 1;1 1 1 1i m hi i a r a O D (本例中 调整混杂效应后总的 25 115 10 + = ( 1 ( 10 x : 12 1 + 0 解 35 190 30 + = ( 9 ( 30 x 75岁组: 各层方差 由上述公式计算: 25 = ( ) 5 = ( ) : 75岁组: = ( ) 1 1 10 . 3 2 0 . 6 8 9 . 6 8 1 0 5 . 3 2 1 1 1 14 . 0 4 4 . 9 6 2 5 . 5 6 1 6 4 . 0 4 1 1 1 13 . 1 7 9 . 8 3 1 . 8 3 2 9 . 1 7 将上述各值代入一致性 2 检验公式为: 2 = 2 2 22 2 21 0 . 3 2 4 4 . 0 4 2 5 2 4 . 1 60 . 2 1 2 . 0 2 7 . 8 14 2 3 9 . 2 1 1 9 2 3 . 5 6 5 3 . 1 71 0 . 6 0 6 . 2 7 1 . 0 0 = 6 1 = 5; P = 结论 根据 2 检验结果,提示按年龄分层后,各层 现的差别由机遇所致的概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论