流行病学研究中的偏倚幻灯片_第1页
流行病学研究中的偏倚幻灯片_第2页
流行病学研究中的偏倚幻灯片_第3页
流行病学研究中的偏倚幻灯片_第4页
流行病学研究中的偏倚幻灯片_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

流行病学研究中的偏倚学习要点1.偏倚、误差的概念2.偏倚的种类3.常见偏倚产生的原因4.常见偏倚的控制

样本总体人群外推随机抽取真实性—推论的可靠程度影响真实性的因素观测值真实值误差+随机误差(机遇)系统误差+(偏倚)180,174,215,305233,276,146,195205,188,190,295170,164,248,162220,219,228,250295,146,220,162,228219,164,190,188,233305,276,195,215,170源群体

样本A

样本B

样本C

高胆固醇率

=40%=20%

=0%

高胆固醇率=25%(>240mg/dL)

图1源群体与样本高胆固醇率的样本变异性示例

源群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。如果增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大图2膳食与药物预防心机梗死的样本变异性示例一般而言,研究样本越大,效应估计值的抽样误差越小(95%可信限越小),此为随机误差;系统误差与样本含量无关。图2,研究A和研究B中膳食改良组五年内发生心梗死的风险为9%,降胆固醇药物组为6%A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,从而发生重叠,统计检验无显著性差异 研究B样本较大(2000人),两组效应指标的95%可信限较小,从而未发生重叠,统计检验有显著性差异一般而言,研究样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小Bias(600-540BC)Bias是古希腊时代七贤人之一Lydia的国王克利萨斯向Bias咨询建造、部署战舰防御爱奥尼亚人的最好方法Bias为了避免战争、流血,骗克利萨斯国王说,爱奥尼亚人正在买马准备陆地战后来,Bias向克利萨斯国王承认,他说了谎,爱奥尼亚人实际上也在建造战舰克利萨斯国王对Bias的本意表示赞许,与爱奥尼亚人讲和后人将“背离事实”称为bias(HunterD.Fatherofallbias?BMJ2002;324:1071)常见偏倚选择偏倚

(selectionbias)信息偏倚(informationbias)混杂偏倚(confoundingbias)选择偏倚

(SelectionBias)不同类型(就研究的暴露、结局特征而言)的个体入选研究的概率不同。排除或过分代表某一类型个体。

无偏抽样选择偏倚(吸烟与肺气肿)肺气肿、继续吸烟的人生存期短常见的选择偏倚

入院率偏倚

(admissionrate)/Berkson偏倚现患病例-新发病例偏倚

(prevalence-incidencebias)/奈曼(Neyman)偏倚无应答偏倚(non-responsebias)和志愿者偏倚(volunteerbias)入院率偏倚(admissionrate)/Berkson偏倚入院病人解决办法:不同类型的多家医院病例组与对照组(其他疾病的患者)入院率不同入选的与不入选的暴露率不同现患-新发病例偏倚(prevalence-incidencebias)/Neyman偏倚入选的为现患或存活病例不包括死亡病例、病程短的病例解决办法:新发病例志愿者偏倚内华达州烟雾型原子试爆试验:核弹试验观察员中白血病的发病率最终联系到76%的现场观察员参加本次调查,了解这些人中白血病的发生情况82%是调查员主动联系他们的18%是自己主动联系调查员的这些人中白血病的发病率是那些由调查员找到的人的4.4倍暴露者较不暴露者更易因某些症状较早较频就医检查,提高了早期病例检出率如果入选者中早期病例较多的话,则暴露比例必然被虚假的解决办法:早、中、晚期病例检出征候偏倚(detectionsignalbias)/暴露偏倚(unmaskingbias)选择偏倚无应答偏倚:调查对象不合作或因种种原因不能或不愿意参加,从而降低了应答率,以后亦未补查。如应答率低于70%就较难以调查结果来估计整个研究人群的现况。失访偏倚应控制在5%以下,若超过10%,作出结论应慎重。如果暴露组与未暴露组的失访率相似,失访者与未失访者的结局发生率也相似,则失访将不会产生偏倚。比较现实可行的方法是把失访者与未失访者的基线资料中的一些特征加以比较,如差别不大,则可假定结局发生率的差别可能也不大。否则,对选择偏倚可能产生的影响应有充分估计。选择偏倚的控制充分了解可能的选择偏倚的来源,在研究的设计过程中尽量避免。在病例对照研究和现况研究中,尽量选择新发病例而不是现患病例。在研究中采取相应措施,尽量取得研究对象的合作,以获得尽可能高的应答率。尽量采用多种对照。常见偏倚选择偏倚(selectionbias)信息偏倚

(informationbias)混杂偏倚(confoundingbias)信息偏倚

(InformationBias)又称分类偏倚、观察偏倚。是在收集信息过程中由于测量暴露与结局的方法(工具)有缺陷,使采集到的信息不准确(即不完全真实),从而引起偏倚。常见偏倚回忆偏倚

(recallbias):病例对照研究报告偏倚(reportingbias)调查者偏倚(interviewerbias)调查工具、手段等引起的偏倚错分是测量不准确导致的最直接的结果。暴露的非差异性错分解决办法:客观的指征、明确的定义暴露:酗酒调查方式:询问暴露的非差异性错分暴露:被动吸烟调查方式:询问解决办法:客观的指征、明确的定义暴露的非差异性错分解决办法:客观的指征、明确的定义暴露的差异性错分暴露:皮肤晒黑能力疾病:黑素瘤调查方式:询问暴露的差异性错分暴露:母亲孕期暴露疾病:新生儿先天畸形调查方式:询问病例比对照会报告更多的不实的暴露对照较病例会漏掉更多的暴露信息偏倚的控制校准测量工具统一资料收集方法和人群分类标准采用盲法收集资料收集客观资料广泛收集资料严格的设计和保证研究人员的科学态度常见偏倚选择偏倚

(selectionbias)信息偏倚(informationbias)混杂偏倚

(confoundingbias)混杂偏倚(confoundingbias)

当研究某一因素和疾病的关系时,由于某个与研究的因素和研究的疾病均有关的因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,这种现象称为混杂,该因素称混杂因素,其带来的偏倚即混杂偏倚。参见P119吸烟、火柴与肺癌烟草公司的研究者坚持认为火柴暴露可以引起肺癌他们开展了一项大型的病例对照研究来检验这个假说研究者通过人群登记系统找到了1000名肺癌病例,其中820人曾携带过火柴从人群中随机抽取了1000名对照,经X线确认未患肺癌,其中340人曾携带过火柴根据这批数据,定量估计火柴与肺癌之间的关联吸烟、火柴与肺癌火柴与肺癌想分别了解一下吸烟者与不吸烟者中火柴与肺癌的关系结果发现在1000名病例中,900名为吸烟者,其中810名曾携带火柴在1000名对照中,300名为吸烟者,其中270名曾携带火柴分层绘制2×2表,计算火柴与肺癌的关联效应值吸烟、火柴与肺癌OR粗

=8.8(7.2,10.9)OR吸烟者=1.0(0.6,1.5)OR不吸烟者=1.0(0.5,2.0)吸烟、火柴与肺癌这个例子说明:即使本来没有任何效应,混杂也可以引起明显的效应在火柴与肺癌的关系中,吸烟就是一个混杂因素(confoundingfactor,confounder)吸烟混淆了火柴与肺癌之间的真实关系问题:火柴对于吸烟与肺癌的关系是不是一个混杂因素混杂:吸烟、火柴与肺癌OR粗=21.0(16.4,26.9)OR携带火柴=21.0(10.7,41.3)OR不携带火柴

=21.0(13.1,33.6)吸烟、火柴与肺癌吸烟不是混杂因素火柴肺癌夜灯女孩Sonia,旁边是盏夜灯。夜里开着这盏夜灯很方便,父母可以随时从门口查看屋里的情况。夜灯与近视(Quinnetal.Nature1999)现患比=2岁以前周围环境的夜灯-儿童近视的发生于是,父母关掉了Sonia房中的夜灯,开始每天在屋子里抹黑蹒跚后来,还是在Nature上,又发表了2篇文章,说夜灯与近视的发生没有关联(Zadniketal.andGwiazdaetal.Nature,2000)夜灯与近视父母的担心没有了,于是又把夜灯打开了,皆大欢喜什么样的因素是混杂因素?与暴露相关混杂因素要么是所研究的暴露因素的“因”,要么是“果”,要么为简单“相关”,而非因果关系混杂因素与所研究的暴露因素间的关联必须独立于其与所研究的疾病间的关联,即,混杂因素与研究的暴露因素间的关联必须可见于无病个体中与疾病相关不一定是疾病的“病因”,可以只是真正病因的一个标志指标混杂因素与所研究的疾病间的关联必须独立于其与所研究的暴露因素间的关联,即,混杂因素与所研究的疾病间的关联必须可见于无暴露个体中如果为所研究疾病的结果,不管其与所研究暴露因素的关系,该变量都不是混杂因素研究因素与疾病因果链中的中间变量只与可疑暴露有关而与疾病无关的因素什么样的因素不是混杂因素?C混杂因素E暴露因素D疾病与暴露相关与暴露相关与疾病相关与疾病相关病因链上的中间变量控制混杂的方法研究设计阶段随机化限制匹配资料分析阶段分层分析多因素分析标准化随机化目标人群患病人群未患病人群某些特征5/102/103/10病例与对照匹配

频数匹配(frequencymatching)病例与对照匹配

1:1个体匹配(individualmatching)某些特征配对(pairmatching)目标人群患病人群未患病人群病例与对照匹配

1:R个体匹配(individualmatching)目标人群患病人群未患病人群某些特征1:2,1:3…1:R下章案例2002年11月在中国广东省部分地区陆续出现一些不明原因肺炎病例,最初称为传染性非典型肺炎。2003年1月起疫情加速扩散,2月已呈全球流行态势。3月15日,世界卫生组织(WHO)将其名称公布为严重急性呼吸道综合症(severeacuterespiratorysyndrome,缩写为SARS)。4月16日,WHO宣布SARS是由一种新的冠状病毒感染所引起。下章案例SARS发病主要集中在2003年3月至5月,6月疫情逐渐平息。截止到当年8月7日,全球累计报告SARS病例8422例,死亡916例,病例分布于各大洲的32个国家和地区。中国内地总发病数达5327例,死亡349例,病例分布于24个省市。其中北京、广东分别发生2521例和1512例,占全国总病例数的75.7%。病例以青壮年为主,20-29岁病例占30%,20-60岁占85%。病例具有明显职业特点,医务人员所占比例高达20%。发病无明显性别差异。问题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论