流行病学之偏倚及其控制课件_第1页
流行病学之偏倚及其控制课件_第2页
流行病学之偏倚及其控制课件_第3页
流行病学之偏倚及其控制课件_第4页
流行病学之偏倚及其控制课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第九章 偏倚及其控制Biases and Their Control 研究的解说涉及到研究的真实性的问题。研究的真实性直接关系到是否获得正确的结论,而真实性需要通过变异性估计来确定。引 言7/28/20222 第一节 研究结果的变异性 第二节 研究的真实性 第三节 研究的偏倚目 录7/28/20223第一节 研究结果的变异性 概 述 个体水平的变异性 群体水平的变异性 样本水平的变异性 7/28/20224变异性(variability) 研究结果包括描述性和分析性数据(指标)的变动或波动。第一节 研究结果的变异性一 、概 述7/28/20225生物学(真实)变异和测量变异生物学变异 真实的

2、客观变异测量变异 测量过程的误差随机变异和系统变异随机变异 绝对值和方向交错变化,正态分布系统变异 绝对值和方向保持恒定第一节 研究结果的变异性 变异的来源分为两个层次7/28/20226某个体特征测得值的变化,是个体真值随时间的改变,或是由于测量误差引起的变化。第一节 研究结果的变异性二、个体水平的变异性7/28/20227日间变异年龄膳食运动环境仪器标度差仪器精密度差读数或记录错误个体状态测量误差7/28/20228个体的累计变异 群体中的个体具有不同的遗传素质并受环境影响常大于个体变异 根据群体的变异范围确定“正常值”范围,用于判定个体测得值是否“正常”群体水平的变异性受测量误差影响第一

3、节 研究结果的变异性三、群体水平的变异性7/28/20229通过不同样本研究所得结果的差异性 为什么高水平的血清总胆固醇是不利的或不健康的? 这可以在关于血清总胆固醇与心血管死亡风险呈正相关的研究中找到答案。 如Framingham心脏研究。第一节 研究结果的变异性四、样本水平的变异性7/28/202210描述性结果的样本变异性第一节 研究结果的变异性样本A样本C样本B7/28/202211 在图8-1中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。 增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。第一节 研究结果的变异性7/28/202212

4、分析性结果的样本变异性膳食改良组膳食改良组降低胆固醇药物组降低胆固醇药物组 研究A(研究对象200人,随机分配到两组)第一节 研究结果的变异性7/28/202213 如图8-2,研究A和B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。 研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,发生重叠,无显著性差异。 研究B样本较大(2000人),两组效应指标(心肌梗死风险)的95%CI较小,未发生重叠,有显著性差异。第一节 研究结果的变异性7/28/202214 样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小

5、。 样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。7/28/202215第二节 研究的真实性 概 述 内部真实性 外部真实性 7/28/202216 真实性(效度) 定义 指研究收集的数据、分析结果和所得结论与客观实际的符合程度。 研究误差 真实性的反面变异可以是真实的(如生物学个体变异),而反映研究误差的变异肯定是不真实的。 一、概 述7/28/202217 系统误差 称为偏倚 来自于对象选取、测量和统计分析等的方法学缺陷,有固定方向和固定大小的误差 。 随机误差 用统计学方法来估计,增大样本含量可减少,没有固定方向和固定大小,一般呈正态分布。研究误差的

6、两种常见类型7/28/202218二、内部真实性 内部真实性(internal validity)定义研究结果与实际研究对象真实情况的符合程度,它回答一个研究本身是否真实或有效。 改善措施 限制研究对象的类型和研究的环境条件。 第二节 研究的真实性7/28/202219 三、外部真实性 外部真实性(external validity) 定义研究结果与推论对象真实情况的符合程度,又称为普遍性(generalizability)。它回答一个研究能否推广应用到研究对象以外的人群。 改善措施增加研究对象的异质性,使得研究对象的代表性范围扩大。第二节 研究的真实性7/28/202220 在实际研究时,需

7、要综合平衡考虑 研究对象的同质性和异质性问题7/28/202221第三节 研究的偏倚 选择偏倚 信息偏倚 混杂偏倚 混杂偏倚的分层分析7/28/202222 1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。 1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类 选择偏倚 信息偏倚 混杂偏倚7/28/202223一、选择偏倚(selection bias) 定义 研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。第三节

8、 研究的偏倚7/28/202224 描述性研究的选择偏倚 主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。控制方法 尽量采用随机抽样,避免样本选取的偏向对特定群体的结果在外推上要谨慎等 第三节 研究的偏倚7/28/202225 分析性研究的选择偏倚 主要体现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。 控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关第三节 研究的偏倚7/28/202

9、226 常见选择偏倚 入院偏倚 失访偏倚 志愿者偏倚第三节 研究的偏倚7/28/202227 确定有无选择偏倚的关键 把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度 控制方法 严密掌握对象选取的各个环节,注意选取对象的代表性,增加应答和减少失访等第三节 研究的偏倚7/28/202228二、信息偏倚(information bias) 定 义 又称测量偏倚或观察偏倚,是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量,所以信息偏倚又可称为错误分类偏倚(misclassification bias)。 信息偏倚同样影响描述性

10、研究和分析性研究的结果。 第三节 研究的偏倚7/28/202229无差异性错误分类和差异性错误分类第三节 研究的偏倚无差异性错误分类差异性错误分类错误分类数据错误分类数据研究真实数据研究真实数据7/28/202230差异性信息偏倚的两种常见类型 回忆偏倚(recall bias) 产生于研究对象记忆过去活动和暴露能力的差异。 调查者偏倚(interviewer bias) 产生于调查者对研究对象有差异性地收集信息。采取盲法,可以降低调查者偏倚。第三节 研究的偏倚7/28/202231 为了减少错误分类以及改善测量的准确性,研究者们正在越来越多地使用生物学标记物(biological marke

11、rs)。它们可以用来测量易感性、内暴露(实际进入体内)剂量或生物学效应(剂量)等。第三节 研究的偏倚7/28/202232三、混杂偏倚(confounding bias) 定义 是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。 混杂的本来含义是“混合掺杂”( mixing together ),这里是指暴露因素对疾病的独立效应与混杂因素的效应混在一起,造成对暴露因素效应的估计偏倚。第三节 研究的偏倚7/28/202233 判定原则 比较混杂因素调控前后的暴露因素效应估计值,如果存在有意义的差异,就产生了混杂偏倚。 调控的统计方法 设计阶段:标准化率、分层和多变量分析 设计阶段

12、:配比、随机化分配或限制进入第三节 研究的偏倚7/28/202234 继发关联(secondary association) 定义 是一种纯粹由混杂偏倚产生的关联 即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。第三节 研究的偏倚C?DE7/28/202235例如 高血清胆固醇是冠心病的危险因素,高血清胆固醇可产生沉积于眼睑的黄色瘤,从而导致黄色瘤与冠心病的继发关联。另外,E与C也可以由于相关(因果方向不明)而产生继发关联。例如 吸烟是胰腺癌的危险因素,吸烟又与喝咖啡存在相关(没有确定的时间先后),从而造成喝咖

13、啡与胰腺癌的继发关联。第三节 研究的偏倚7/28/202236 直接因果关联的歪曲 如果怀疑病因E与疾病D既存在直接关联,又存在间接关联(图A)或与其他危险(保护)因素F存在相关(图B),暴露E与疾病D的直接因果关联程度或方向将可能受到混杂干扰,即得到歪曲的关联估计值。 第三节 研究的偏倚FDEFDE?AB7/28/202237 例如 静脉吸毒E与性乱F都是HIV感染D的危险因素,吸毒者易发生多性伴行为,即吸毒同HIV感染既存在直接关联(ED)又存在间接关联(EFD)(图8-3,(2)),吸毒与多性伴没有确定的时间先后而呈双向相关(图8-3,(3)),多性伴F将对吸毒E与HIV感染D的直接因果

14、关联起混杂或歪曲作用。第三节 研究的偏倚7/28/202238第三节 研究的偏倚图8-37/28/202239四、混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤 对可能的混杂因素进行分层 判定层间RR或OR是否相等或相近 得到控制混杂后的调整RR或OR 再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较第三节 研究的偏倚7/28/202240 队列研究(1) 累计发病率资料第三节 研究的偏倚表8-47/28/202241(2) 发病密度资料第三节 研究的偏倚7/28/202242 病例对照研究第三节 研究的偏倚7/28/202243 (1)按可能的混杂因素吸烟分层第三节 研究的偏倚ai bi m1i ci di m0ini n0 ti 7/28/202244(2) 判定层间关联效应水平是否同质按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同质性检验)的,可以应用M-H方法计算综合OR第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论