《临床流行病学》课件:8 误差、偏倚控制_2007_第1页
《临床流行病学》课件:8 误差、偏倚控制_2007_第2页
《临床流行病学》课件:8 误差、偏倚控制_2007_第3页
《临床流行病学》课件:8 误差、偏倚控制_2007_第4页
《临床流行病学》课件:8 误差、偏倚控制_2007_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、误差、偏倚及其控制 病因以及病因推断,1,第一部分误差、偏倚以及控制,2,研究的真实性和可靠性,真实性(validity)反映了研究的结果和总体的真实的情况的相符合的程度。 可靠性,表示相对稳定的情况,重复多次试验之后,与均值的符合程度。,3,举例:真实性和可靠性,4,研究的外部真实性与内部真实性 1. 外部真实性: 指研究样本的结果和结论可以外推到研究的总体人群。遵循随机抽样原则和避免产生严重的选择偏倚是保证样本代表性的重要措施。 2. 内部真实性: 指研究样本的结果真实可靠。严格控制和减少测量偏倚和混杂偏倚对结果的影响,保证研究结果真实性的关键。,5,一、误差的概念及分类,几个基本概念 误

2、 差 error 指研究所获得的实际测定值与真实值之间的差别 系统误差 systemic error 由于某种确定的原因,有固定的大小和方向,可消除 随机误差 random error (抽样误差) 由于偶然的原因,没有固定的大小和方向,无法消除,6,二、偏倚的概念及分类,1. 偏倚bias概念: 指系统误差,是指医学研究中从设计、实施到分析的各个环节,由于某些固定的原因,使研究结果与真实值之间出现倾向性的差异。,7,John Last在流行病学词典中将偏倚定义: 在进行流行病学调查研究或推论过程中,由于某种或某些因素的影响,使所研究的结果或推论与真实的情况之间产生系统差别。, 偏倚的性质:是

3、一种人为造成的系统误差,与抽样误差完全不同。偏倚可以控制,抽样误差则不能。 偏倚的特点:偏倚在整个研究过程中均可产生,从研究的设计,资料收集、结果分析直至结果的推论,其中任何一个环节均可产生 偏倚与抽样误差的区别: 偏倚是属于系统误差,人为因素造成,可以控制。 抽样误差属于随机误差,由个体差异决定,抽样研究必然存在的客观事实。,8,2. 偏倚的分类 选择偏倚 信息偏倚 混杂偏倚,(一) 选择偏倚 选择偏倚 指在对样本进行研究时,入选的研究对象与总体之间的某些特征具有较大的差别,导致样本不能代表总体,因而使样本的研究结果与总体真实值之间有差别。 入院率偏倚 现患病例新病例偏倚 检出征侯偏倚 无应

4、答偏倚 观察性和实验性研究都可能发生 易感性偏倚 志愿者偏倚 排除偏倚,10,入院率偏倚,也称Berkson偏倚,指以医院为基础的病例对照研究中,目标疾病的入院率因待研究的暴露因素的存在与否或暴露水平的不同而存在差异,由此而引起的误差。,11,Roberts (J Chron Dis, 1978) 研究了三个社区内几种疾病与一些可疑病因之间的关系。 研究对象:2784名成人;257名住院病人 研究内容:医学事件与影响因素关系 Roberts根据以人群为基础的研究所获得 OR值,显著地不同于仅以住院病例所获的结果,认为Berkson偏倚是存在的。Sackett (J Chron Dis, 197

5、9) 根据这一调查研究的资料,做了另外两项分析,该结果进一步证实了Berkson 偏倚的存在。见表1和表2。,12,OR = 1.06 OR = 4.06,表1 以不同人群为基础的骨和运动器官疾病与呼吸道疾病关系的OR值比较,13,OR = 1.89 OR = 0.37,表2 以不同人群为基础的疲劳与过敏和代谢病之间OR值的比较,14,现患病例-新病例偏倚,又称奈曼(Neyman)偏倚,如果研究对象选自现患病例,可能会得到更多的信息,但其中很多信息可能只与存活有关,而未必与该病的发病有关,从而可高估某些暴露因素的病因作用。此外,某些疾病的幸存者可能已改变了原先的生活习惯,从而降低了某危险因素的

6、水平,或当其被调查时夸大或缩小了病前生活习惯上的某些特征,从而导致对某因素与疾病关联的错误估计。,15,* 胆固醇值系第一次测量值 * 胆固醇值系第六次研究时测量值,表3 血胆固醇与冠心病的关系,16,* 患者为第六次检查时现存的患者,表4 胆固醇值在冠心病病人与非病人中的变化,17,检出症候偏倚 (Detection signal bias) :,18,检出症候偏倚,也叫暴露偏倚。病人常常因为一些与疾病无关的症状而去就医,从而提高了早期病例的检出率,导致过高的估计了暴露程度而产生的系统误差。 在研究雌激素和子宫内膜癌的关系中,Horwitz RI 进行的病例对照研究中揭示了这种偏倚。,选择偏

7、倚的控制,充分了解在整个研究中可能会出现选择偏倚的各个环节,从而在研究设计阶段加以预防。 严格掌握研究对象纳入与排除标准 尽可能多地采用多组对照 在实施阶段,通过各种措施尽量取得对象的支持与合作,降低无应答率和失访率,19,19,(二)信息偏倚 信息偏倚 又称观察偏倚(observation bias)或测量偏倚(measurement bias),是指研究实施过程中,由于测量或资料收集方面存在缺陷,最终得到的信息与真实情况有差异。 回忆偏倚 报告偏倚,即说谎偏倚 测量偏倚 暴露怀疑偏倚 诊断怀疑偏倚 错误分类偏倚,20,暴露错分: 指对病例和非病例做测量或调查时,由于测量仪器的不准确,调查员

8、的主观倾向或过失,被调查者缺乏合作或记忆不准确等原因,造成暴露情况的判别或分类不符合事实。 表5为比较医院记录和病人回忆两种方法确定 X-线暴露史的实例。 病人回忆的方法导致调查暴露率(26/75)低于真实暴露率 (37/75)。,(二)信息偏倚,21,表5 用回忆法收集孕妇X-线照射史所致偏倚,22,病例错分: 指对病例和非病例的诊断因使用了不相同的诊断标准,或使用了不相同的实验室测量方法,而产生错误分类。 表6 给出的是一模拟的情况。,(二)信息偏倚,23,表6 群组研究中病例错分所致偏倚,真实情况下的RR = (40/100)/(20/100) = 2,错分情况下的RR = (38/10

9、0)/(24/100) = 1.6(过低估计)。,24,信息偏倚的控制 明确和统一各个研究因素的定义,研究设计阶段加以预防 “盲法”收集资料 掩盖研究假说,25,(三)混杂偏倚 一、混杂偏倚的概念 在对某病的病因学研究中,当对所关心的某种暴露因素 (E) 与某种疾病 (D) 之间的关联进行定量估计时,由于其他因子 (F) 的影响,致使 E 和 D 之间关联的真实性被歪曲,关联强度被放大或缩小,这种歪曲关联真实性的作用被称作混杂作用(confounding effect),起到混杂作用的因子被称为混杂因子(confounder或confounding factor, F)。,26, 混杂偏倚性质

10、: 一种人为造成的偏倚 是在研究的设计阶段未对混杂因子加以控制 或资料分析时未能进行正确校正所致 是完全可以避免和控制的一种系统误差 (一) 混杂因子成立的条件 (1)必须是所研究疾病的危险因素或保护性因素 (2)必须和暴露因素之间存在统计学关联 (3)一定不是暴露因素与疾病因果链上的中间变量,27,(二) 混杂偏倚产生的机理 例:氡气与肺癌的队列研究 以RR值描述暴露于氡气人群与不暴露于氡气人群在肺癌发生频率之间的关联强度。,28,a / (a+b) RR = - c / (c+d),29, RR值的真实性评价: 此RR值是否真实地反映了氡气与肺癌之间的 关联强度,完全取决于下述条件: (1

11、) 氡气暴露人群(E)和未暴露人群()之 间在产生肺癌的易感性方面是否可比 (2)导致肺癌的其它危险因素在两组人群之间 的分布频率是否可比。,30, a 例肺癌的归因可能性(来自暴露人群): (A)由氡气所致 (B)由吸烟所致 (研究者已知道的致肺癌 因素) (C)由其它未知因素所致 c 例肺癌的归因可能性(来自非暴露人群): (B)由吸烟所致 (C)由其它未知因素所致,31, 对RR值的解读: 此相对危险度RR在本项研究中包含有三种 效应: (A)氡气的致癌效应 (B)吸烟的致癌效应 (C)其它未知因素的致癌效应 RR值产生混杂偏倚的条件: (B)吸烟的致癌效应RRS1 (C)其它未知因素的

12、致癌效应RRU1,32, 吸烟导致混杂偏倚产生的原因: 研究设计阶段:未保证吸烟者在两人群中 的均衡性 分析阶段:未先将两人群按吸烟和未吸烟 分层,然后再按每一层去确定氡气暴露和 肺癌之间的关联 小结: 该研究中混杂偏倚产生的机理是由于 导致肺癌产生的另一因素吸烟在两组 人群中分布不均衡所致,33,二、混杂偏倚和混杂因素的判别 (一)根据专业知识提出研究中可能存在的混杂 因子 在流行病学研究中,混杂因子可分为两类: 1. 人口统计学因素: 年龄、性别、种族、职业、经济收入、文化 水平等人口统计学指标,是经常遇到的混杂 因子。,34,2. 暴露因素以外的其它危险因子: 研究中混杂因素广泛存在,表

13、现形式多样, 常常在隐匿中起到混杂作用。 (二) 利用分层分析进行定量判别 以队列研究为例 分层分析:将研究人群按是否暴露于提 出的可疑混杂因子F分类(最简单可分为 暴露与不暴露两组),然后再做单因素 四格表分析。,35,未分层的资料分析,cRR,36,分层的资料分析 暴露第三因子F 未暴露第三因子F,aRR1 aRR2,37,38,简单公式描述为: cRR = aRR2 或 aRR1: F 不是混杂因子,cRR值不存在 F 的混杂偏倚。 (2) cRR aRR2 或 aRR1: F 是混杂因子,cRR 值存在F的混杂偏倚。 上述原则也可适用于病例对照的OR值分析。,39,三、混杂偏倚的方向

14、根据偏倚的产生机理,当混杂因子对暴露 与疾病之间的关联产生歪曲时,混杂偏倚具有 一定的方向性和大小。其方向可正可负,其作 用可大可小,取决于E、F和D之间的关系。 混杂偏倚可分为正混杂和负混杂。,40,四、混杂偏倚的控制 限制 随机化 匹配 频数匹配和个体匹配 分层、标准化和多因素分析等统计学分析手段 常见的多因素分析:多元Logistic回归分析、Cox回归分析和协方差分析等,41,三、效应修饰和交互作用,按照某因素分层后估计各个亚层内暴露与疾病的联系强度大小不同,该分层变量称为效应修正因子,其对效应产生的影响即为效应修饰。 如果两个因素联合效应不能简单地将各个因素的效应相加在一起,其中每一

15、个因素的效应随另一个因素的水平而改变,即称后一个因素对前一个因素有效应修饰。 一个因素通过放大或缩小来修饰另一个因素的效应,此即为交互作用。 效应修饰是一种客观存在的作用。,42,43,附:,随机抽样资料中混杂效应和交互作用,44,第二部分 病 因 和 病 因 推 断,45,病因概念 就是指使疾病发生概率即风险升高的因素,同时必须确定危险因素发生于疾病之前及“升高的概率”已排除了其他因素的干扰。 危险因素 保护因素,46,社会经济因素 生物学因素 环境因素 医学生物学因素 疾病 心理行为因素 (致病机制) 卫生保健因素,物质的,社会的,生物的,机体,G,病原物,宿主(人),环境,迷信阶段,朴素

16、唯物主义,生物学病因萌芽,三角模型,轮状模型,疾病因素模型,病因模型,47,1. 生态学模型, 病因宿主环境模型(流行病学三角),动因,环境,宿主,强调启动性必要病因(病原体)的作用,48,1. 生态学模型, 轮状模型,社会环境,宿主,遗传内核,理化环境,生物环境,将环境进一步分为生物、物理和社会环境,宿主包括遗传内核,而动因不再单列;各部分的相对大小可随不同的疾病而有所变化。,49,2. 疾病因素模型,在病因分类上操作性强,具有较强的实践指导意义; 将病因因素分为两个层次:外围的远因和致病机制的近因。,医学生物学因素 (致病机制),疾 病,社会经济因素,生物学因素,环境因素,心理、行为因素,

17、卫生保健因素,50,3. 病因网络模型,MacMahon (1970) 病因相互联系,按时间先后顺序联接起来就构成一条病因链,多条病因链交错联接形成一张病因网,即病因网络模型。 病因网的每一个节点是前面若干因素的结果,又是后面若干结果的原因之一,最后的“总节点”就是疾病终结局。,51,52,(三)病因学研究的方法,53,(四)病因学研究的步骤,54,55,56,57,58,2. 检验假设 分析性研究 3. 验证假说 实验性研究,59,确定两事物间是否存在统计学上的联系 / 无显著统计学意义 有显著统计学意义 | | 确定是否偏倚所致 确定是否偏倚所致 无 / 有 无 / 有 非因果联系 确定偏

18、倚种类 是否符合因果 确定偏倚种类 选择偏倚? 推论的原则 选择偏倚? 观察偏倚? / 观察偏倚? 混杂偏倚? 否 是 混杂偏倚? | | | | 克服偏倚影响 | | 克服偏倚影响 重新设计研究 非因果 因果 重新设计研究 或进行调整 联 系 联系 或进行调整 图1 确定因果关系的推论过程,60,一、确定两事物间是否存在统计学上的联系,现场观察性研究: 描述两者联系强度的指标RR或OR值,是从观察样本获得的,其意义可作三种解释: (1) 该样本所获RR或OR值是真实的联系; (2) 该RR或OR值是由机遇所致; (3) 该RR或OR值是由偏倚所致,61,现场实验 (或临床试验): 反映干预效

19、果及疗效好坏的指标如率差RD值,也同样由三方面的因素决定: (1) 干预措施(或疗法)的真实效果; (2) 偏倚效应(影响干预或治疗效果的因 素在实验组和对照组中不可比所致); (3) 随机误差 统计学检验的前提: 获得的比较组间有关描述差异或关联强度的数据 没有严重的偏倚; 遵循随机原则。,62,统计学检验结果的解释: P0.05或P0.01 获得的比较组间有关描述差异或关联强度由机遇 所产生的概率为0.05或0.01,拒绝无效假设; 否定无效假设,产生的专业结论有可能是错误的 概率0.05或0.01。 P0.05 获得的比较组间有关描述差异或关联强度由机遇 所产生的概率0.05,接受无效假

20、设; 未达到统计学显著性可能是样本数量太小所致。,63,二、确定偏倚对所获研究结果的影响 遇到P0.05时: 不应该盲目乐观,首先检查结果是否存在各种偏倚。 若存在严重的选择性偏倚 结果很难再校正,应重新设计 如实报告此结果指出其受选择偏倚影响的程度 同时不宜将此结果外推到总体人群。,64,若存在测量偏倚 并知道测量误差的方向和大小(如病例诊断定 义、暴露因素指标或疗效评价指标测量方法的 敏感性和特异性)时,可对观察结果进行定量 调整; 若预备试验中未对该项研究中所采用方法的信 度和效度做过估计,则调整无法进行; 指标若有时点性时,则无法通过重复测量来校 正不准的结果。,65,若存在混杂偏倚 采用统计方法加以调整,去除混杂效应的影 响,但必须对混杂因子在将要比较的两组( 病例组和对照组、暴露组和非暴露组、实验 组和对照组)中的分布情况有客观的如实的 测量,否则无法调整混杂因子产生偏倚的影 响。 如果所获结果确实不受偏倚影响,则存在因 果关系的可能性。,66,(2) 当样本的结果经统计学检验 P0.05 时: 不要盲目悲观,同样应按上述原则和步骤进行分析。 因上述偏倚可以使一原本存在因果关系的客观事实,在统计学检验时没有统计学显著意义。 如找不出偏倚的影响,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论