课件:病例对照研究1.ppt_第1页
课件:病例对照研究1.ppt_第2页
课件:病例对照研究1.ppt_第3页
课件:病例对照研究1.ppt_第4页
课件:病例对照研究1.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

病例对照研究 case-control study 河北医科大学公共卫生学院 流行病学与统计学教研室 牟振云,医学科研的分类,第一节 概述 一、概念 选定一组欲研究疾病的病例(病例组)和一组没有该疾病的人(对照组),比较两组在发病前可能与该病有关的因素或特征的有无、频率或计量水平(比较暴露率或暴露水平),以检验因素或特征与疾病的关系及关联程度。,暴露因素,暴露因素也叫做变量variable 研究者所关心的因素、特征、或状态即为暴露因素。 它可以是有害的,也可以是有益的,病例对照研究资料整理表,病例组暴露率=a/m1 对照组暴露率=b/m0,二、病例对照研究原理,三、病例对照研究的分类,按设计分类: 1、病例对照不匹配:即成组比较,成组比较法,要求对照人数应多于或等于病例人数。,2、病例对照匹配: (1)频数匹配(frequency matching)要求配比的因素所占的比例,两组一致,可理解为构成一致。 (2)个体配比(individual matching)以个体为单位匹配 3、衍生类型,匹配的目的:排除匹配因素对研究结果的干扰。提高病例组与对照组的可比性。 一般性别、年龄等是常用的匹配因素。其他因素是否能作为匹配因素应慎重考虑。 否则会导致匹配过度。,匹配过度:就是把非混杂因素而可能是危险因素的因素进行了匹配,导致该因素不能分析。,3、病例对照研究的衍生类型,(1).巢式病例对照研究(nested case-control study) (2).病例-队列研究(case-cohort study) (3).单纯病例研究(case only study) (4).病例交叉研究 (case-crossover design)。 (5).病例-时间-对照设计 (case-time-control design)。,四、病例对照研究的用途,1、探索疾病可疑的危险因素。 2、深入检验某个或某几个病因假设。 3、评价防治措施的效果。 4、用于疾病预后因素的比较。,五、实例,最早的病例对照研究见于1843年Guy向伦敦统计学会所做的报告,该报告分析了职业暴露和肺结核发生的关系,Schreck和Lenowitz(1947)的阴茎癌与包皮环切术和性卫生的关系; Sartwell(1947)对于输血与肝炎的研究; Doll和Hill(1950)对于吸烟与肺癌的研究。,60年代以后,病例对照研究方法日趋完善,应用日趋普遍。 孕妇服用反应停与婴儿短肢畸形的关系, 母亲吸烟与先天性畸形的关系, 早产儿吸入高浓度氧与晶体后纤维组织增生症的关系, 女性经期使用月经棉与中毒性休克综合征, 口服避孕药与心肌梗死的关系, 小剂量电离辐射与白血病的关系, 母亲怀孕早期服用雌激素与少女阴道腺癌的关系等等。,第二节 病例对照研究的设计与实施,一、提出病因假设,根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设,二、明确研究目的、选择合适的研究类型,广泛探索病因,采用不匹配或频数匹配 罕见病采用个体匹配 1:R的匹配法,R值不宜超过4,三、病例和对照的选择,病例与对照选择的基本原则有两个: 代表性(病例代表总体的病例;对照能代表产生病例的总体); 可比性(两组主要特征方面无明显差异)。,(一)病例的选择 (一)病例的选择,(一)病例的选择 1、疾病的规定 公认的统一标准 自定标准 尽量选择新病例(新病例、现患病例、死亡病例),2、对病例的其他规定 如年龄、性别、民族等,(二)对照的选择,1、来源 (1)同一个或多个医疗机构中诊断的其他病例; (2)病例的邻居或所在的同一个居委会、住宅区的非该病病例或者健康人; (3)社会团体中的非该病病例或健康人; (4)社区人口中的非病例或健康人群; ( 5)病例的配偶、同胞、亲戚、同学或者同事等等;,2、条件: (1) 未患此病的人(可以是其它疾病); (2) 不能有共同危险因素的疾病病人; (3) 除研究因素外其它条件一致; (4) 来自同一人群。 匹配:不宜超出4,四、样本含量的估计,(一)影响样本含量的因素 病例组的暴露率(P1 ) 对照组暴露率(P0 ) 优势比(odds ratio, OR) 值 把握度1-,四、样本含量的估计,(二)方法 公式法: 近似公式:,四、样本含量的估计,(三)举例 为研究西安市肺癌与吸烟的关系,欲进行一次病例对照研究。已知西安市普通人群中吸烟率 P0为30%,OR为5.0,为0.05,把握度为0.90 、值查表,Z为1.64, Z为1.28,四、样本含量的估计,代入公式得: 病例组与对照组,各需28人 代入近似公式计算,所得结果与原公式接近,五、研究因素的确定与调查表,(一)研究因素的确定 1、变量的选定 2、变量的定义 3、变量的测量 (二)调查表,定义 也称“调查问卷”,通过把拟收集的数据项目用 恰当的措词构成一系列问题的答卷,是资料收集的最主要工具 内容 调查表的名称、编号 一般项目:姓名、性别、民族等 研究项目:研究变量,疾病史、吸烟史等 结尾部分:调查员签名、调查日期等,五、资料来源与收集(调查表),六、资料的收集,1、询问 2、自填问卷 3、查看记录 4、测量 5、现场观看,七、质量控质,调查员的培训 标准化 监督与审查 调查质量的评估,(一)资料整理 原始资料的核查,保证完整可靠。 资料的分组、归纳、编码、输机。,八、资料的整理与分析,(二)资料分析,1 描述性统计 2 均衡性检验 3 统计性推断 a 整理成为统计表格 b 显著性检验(计算暴露于疾病有无联系) c 计算联系强度 d 计算可信区间,1、描述性统计,描术研究对象的一般特征:研究对象人数及各种特征的构成、如性别、年龄、职业、疾病类型的分布等. 2、均衡性检验:比较两组某些基本特征是否相似或齐同.目的是检验病例组与对照组是否有可比性。只有两组非研究因素均衡的情况下才能说明暴露率的差异与发病有关,3 统计性推断,(1)不匹配不分层 1)整理成2*2四格表,2)显著性检验,3) 联系强度 比值比(odds ratio,OR),比值比(OR),指病例组暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,OR1 表明危险度增加,暴露因素损害人体健康。 OR1暴露因素保护人体健康。 OR=1 ?,4)计算OR的可信区间,OR计算可信区间有两种办法: 卡方求值法、自然对数转换法。 一般我们使用95%的可信区间。 卡方法: 上限=ORU、下限=ORL,举例 成组资料(不分层、不配对),关于一项口服避孕药(OC)与心肌梗死(MI)的病例对照研究:,第一步 描述性统计 描术研究对象的一般特征 均衡性检验,第二步 统计推断, 1) 首先整理成四格表。 2) 显著性检验,2 =7.70。 本例2=7.706.63,P0.01。 3) 计算暴露于疾病的关联强度OR,OR=ad/bc=2.20。,4) 计算OR可信区间:OR95%CI =1.263.84, 因此有理由认为口服避孕药是心肌梗死的危险因素。 第三步 估计混杂因素的作用,根据病因推断原则作出结论。,(2)分层资料分析,食管癌发病因素的研究,95%的可信区间是在2.183.78之间,例 :食管癌发病因素的研究,食管癌发病因素的研究,1. 2 检验 四格表的专用公式,M-H法公式,食管癌发病因素的研究,其中E() 为a的期望值;V()为a的方差,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR,2计算OR与计算OR的可信区间 Miettinen法的OR可信限: 结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信区间是在2.183.78之间,食管癌发病因素的研究,例:在资料886例食管癌病人与对照中有586例饮酒 2 =31.9, OR=2.29 因此饮酒与食管癌有联系,而生活中饮酒与吸烟关系密切,所以饮酒可能是混杂因素 分层分析统计学估计其作用大小,食管癌发病因素的研究,1.按饮酒与否进行分层,按饮酒与否分层分析食管癌与吸烟的关系,饮酒者中吸烟的OR (2.98)稍高于不分层时OR(2.87) 不饮酒者中吸烟的OR(1.67)较低 表明饮酒是混杂因素,加强吸烟的作用,食管癌发病因素的研究,.进行同质检验 消除饮酒与否的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作同质检验(即两层的OR接近,说明两个资料同质,可用Woolf的同质检验) 两组人群OR值没有明显差别,用统计学方法消除混杂作用影响,求合并OR值, 有显著差异,不宜再计算合并OR值,需要计算标化比值比 本例同质检验的结果无显著差异,食管癌发病因素的研究,3.计算合并2 与OR 值 合并 合并,食管癌发病因素的研究,表7 食管癌与吸烟关系的病例对照整理表,食管癌发病因素的研究,提示 合并2与合并OR较未调整的2 (55.5)与OR(2.87)为低,但吸烟与食管癌之间仍有统计学意义 饮酒是吸烟与食管癌之间的混杂因素, 能加强吸烟的作用,1、整理成1:1配对资料四格表,1:1配对资料的分析,2.2 检验,3.OR计算,X2=(b-c)2/(b+c),2.2 检验,3.OR计算,4.计算OR95%可信区间 OR 95%C.I.= 5.得出结论:有无联系,联系强度。,例:食管癌发病因素的男性研究资料,93对男性食管癌与对照的吸烟史,2.2 检验,3.OR计算,.4、计算OR95%可信区间 OR 95%C.I.= 5、得出结论:有无联系,联系强度。 表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍,95%的可信区间是在1.8410.08之间,第三节 偏倚及其控制,一、 选择偏倚 二、信息偏倚 三、混杂偏倚,一、 选择偏倚 1、概念 由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差。,2、种类 入院率偏倚 现患病例-新发病例偏倚 检出征侯偏倚 时间效应偏倚,入院率偏倚 概念 也叫Berkson偏倚,当利用医院病人作为病例和对照时,对照是医院的某一部分病人不是全体目标人群的一个随机样本,病例只是该医院或某些医院的特定病例不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异 控制 合理地选择病例与对照 从总体人群中选择所有或绝大多数符合诊断标准的病例 从各医院中选取病例,从多病种中选择对照,不同人群骨和运动器官与呼吸道疾病之间关系的OR值,举例:在一般人群中和住院病人中研究骨和运动器官疾病与呼吸道疾病之间的关系,由于研究来源的不同,OR值不同,(Sacket BJ,1979),现患病例-新发病例偏倚 概念 又称奈曼偏倚,如果调查对象选自现患病例,即存活病例,可能得到更多的信息,但是其中很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用;另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差 控制 调查时明确规定纳入标准为新发病例,检出征侯偏倚 概念 也称暴露偏倚,病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产生的系统误差 举例 1975年Ziel所做的妇女服用复方雌激素与子宫内膜癌关系的病例对照研究:服用复方雌激素的妇女因导致阴道出血而就医,故被发现有早期子宫内膜癌的机会增多,从而得出复方雌激素与子宫内膜癌有关联的错误结论(服用者79%为早期,未服用者中只有58%,说明偏移存在),控制 在收集病例中同时包括早、中、晚期病人。,时间效应偏倚 概念 对于肿瘤、冠心病等慢性疾病,从开始暴露于危险因素到出现病变往往经历一个较长的时间过程,因此那些暴露后即将发生病变的人、已发生早期病变而不能检出的人、或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此而产生了结论的误差 控制 尽量采用敏感的疾病早期检查技术 开展观察期充分长的纵向调查,二、信息偏倚 1、概念 在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差。 2、 种类 回忆偏倚 调查偏倚,回忆偏倚 概念 病例对照研究主要是调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造成结论的系统误差。 原因 与调查时间和事件发生的时间间隔长短、事件的重要性、被调查者的构成以及询问技术有关。 控制 选择不易为人们所忘记的重要指标做调查 重视问卷的提问方式和调查技术。,调查偏倚 来源 调查对象 调查者 原因 病例与对照的调查环境与条件不同、调查技术、调查质量不高或差错,以及仪器设备的问题。 控制 采用客观指征 认真做好调查技术培训 采取复查等方法做好质量控制 检查条件尽量一致 使用的检查仪器应精良,三、混杂偏倚( confounding bias) 概念 研究某个因素与某种疾病的关联时,由于某个既与疾病有关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。 混杂因素也称为混杂因子或外来因素(extraneous factor),是指与研究因素和研究事件(疾病)均有联系而不能分开,如果在进行比较的人群中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论