病例对照研究郑全庆流行病与卫生统计学教研室.ppt_第1页
病例对照研究郑全庆流行病与卫生统计学教研室.ppt_第2页
病例对照研究郑全庆流行病与卫生统计学教研室.ppt_第3页
病例对照研究郑全庆流行病与卫生统计学教研室.ppt_第4页
病例对照研究郑全庆流行病与卫生统计学教研室.ppt_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

病例对照研究 郑全庆 流行病与卫生统计学教研室,分析性研究 (analytical epidemiology ),病例对照研究(case-control study)和队列研究(cohort study)均属于分析性的研究 。,病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾性研究方式。,分析性流行病学常使用的术语 暴露(exposure) 是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。这些因素、特征或状态即为暴露因素。暴露因素也叫研究变量(variable)。 暴露因素可以是机体的特征,也可以是体外的;可以是先天的、人体固有的,也可以是后天获得的。它可以是有害的,也可以是有益的。,危险因素:是指当此因素存在时能造成人群发病率上升的内外环境因素。 保护因素:是指当此因素存在时能造成人群发病率下降的内外环境因素。,分析性流行病学常使用的术语,病例对照研究的定义:,比较患某病的人与未患该病的对照者暴露于某个可能的危险因素的差异,从而确定这种因素与该病之间是否存在联系及联系程度的研究。,病例对照研究基本原理,病例对照研究是以一组患有某种疾病的人(病例)和一组或几组未患这种疾病的人(对照)作为研究对象,调查他们过去对某个或某些可以病因的暴露情况(有无或暴露剂量),通过对病例组和对照组有关暴露情况的比较,推断研究因素(暴露)作为病因的可能性。,源人群,收集数据,统计学检验,统计学关联,探索和检验病因假说,基本原理,病例和对照的选择,特定疾病的病人 未患该病的人,特 点,是一种回顾性研究 是一种从“果”到“因”的研究 设有对照组,病例对照研究设计,病例对照研究资料整理表,OR:(a/c)/(b/d)=ad/bc,病例对照研究的用途,1.广泛地探索疾病的可疑危险因素。 2.深入检验某个或某几个病因假说。 3.为前瞻性队列研究提供明确的病因线索,( 年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系) 研究背景 研究步骤 研究结果,实例,研究背景,美国波士顿Vincent纪念医院妇产科医生Herbst发现,19661969年收治7例阴道腺癌患者,均为15岁22岁女青年。通常阴道癌仅占女性生殖系统癌的2%,阴道腺癌仅占阴道癌的5%10%,非常罕见,而这7例全是腺癌;过去年龄均大于25岁,而这7例全在15岁22岁之间,Herbst对阴道腺癌危险因素进行探索 7例病人加上另一个医院的例阴道腺癌患者作为病例组 每个病人配4个对照,共32个对照 用标准调查表对病例、对照与她们的母亲进行了调查研究,经统计学处理后的主要结果见表,研究步骤,表 阴道腺癌病例与对照的母亲主要暴露因素的比较,研究结果,研究结果,在比较的因素中,只有三个因素有显著差别 母亲怀孕期间使用过己烯雌酚激素治疗 (P0.00001) 母亲以前流产史(P0.01) 此次怀孕阴道出血史(P0.05) 因有后两个因素存在才使用己烯雌酚治疗 做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加,(一)病例与对照不匹配 (二)病例与对照匹配,病例对照研究的类型,(一)病例与对照不匹配,又称成组比较法,按与病例组可比的原则,选择一定数量的对照。,(二)病例与对照匹配,1、什么是匹配,匹配(matching)或称配比:要求对照在某些因素或特征上与病例保持一致。 匹配:是一种常用的选择对照的方法。,2、为什么匹配,提高研究效率, 表现为每个研究对象提供的信息量增加。 控制混杂因素的作用,当然分层分析也可以控制混杂因素,3、怎样匹配,频数匹配(frequency matching):匹配的因素在对照组和病例组所占的比例一致,即是匹配因素的分布相同。它是整体的匹配。比如某项研究中按性别匹配,病例组男女各半,则对照组也应如此。 个体匹配(pair matching):以病例和对照的个体为单位进行匹配。有1:1,1:2,1:3,1:R匹配。 两者的区别主要是匹配的单位不同。,关于何时运用频数匹配和个体匹配,应主要根据研究目的,所需样本量,匹配因素的性质,研究现场实际情况综合考虑。 研究罕见病,病例少,多用个体匹配。 按照年龄,匹配,多考虑用频数匹配。 按照特定混杂因素多用个体匹配。 注意以上只是惯常的思维,并不绝对。具体情况具体分析。,匹配因素必须选择那些明确(clearly)能引起混杂作用的因子。 年龄,性别,常被用于匹配。,4、匹配中的问题,匹配过头 把不必要的项目列入匹配会造成匹配过头。 增加了选择对照的难度,降低了研究效率。 使病例与对照尽量一致,就可能徒然丢失信息。,一、提出假设 二、拟订研究计划 1、选择适宜的对照形式 2、病例与对照的来源与选择 3、样本含量的估计 4、研究因素 三、实施研究计划 四、分析、写出研究报告,病例对照研究的步骤,提出假设 根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设,明确研究目的,选择适宜的对照形式 原则 广泛探索病因,采用不匹配或频数匹配 罕见病采用个体匹配 1:R的匹配法,R值不宜超过4 形式 成组比较法 匹配法,病例与对照的选择 进行病例对照研究时,病例组与对照组的正确选择是该研究成败的关键。 基本原则 代表性 病例能代表总体的病例 对照能代表产生病例的总体人群或源人群 可比性 两组主要特征方面无明显差异,病例的选择,要求 诊断可靠,尽量使用金标准 病例内外部特征的限制 内部患病部位、病理类型。 外部年龄、性别、种族。 病例类型的选择 新发、现患、死亡。,病例的选择,来源 总体人群中的全部病例或者随机样本人群中的全部病例 医院住院或门诊的病例,对照的选择,要求 候选对象必须来自产生病例的总体,即来自同一人群; 未患此病的人(可以是其它疾病);对照一旦发生所研究的疾病便成为病例组的研究对象 不能有共同危险因素的疾病病人; 除研究因素外其它条件一致; 来源 研究的总体人群或抽样人群中具有代表性的 非病例 医院中患有其他疾病的病人 亲属、邻居、同事、同学等,样本大小的估计,1、有关的影响因素: (1)、研究因素在对照组中的暴露率; (2)、估计该因素引起相对危险度; (3)、希望达到的精确度; (4)、希望达到的检验把握度; (5)、是单侧还是双侧检验; 2、估计的方法: 样本只是一个估计值,过大、过小都不好。,(一)有关参数 病例组的暴露率(P1 )和对照组暴露(P0 ) 优势比(odds ratio, OR) 值 把握度1-,计算应用下列公式: 非匹配设计的样本量计算,Z与 Z 分别为与及值对应的标准正态分布分位数,p0与p1分别为对照组及病例组估计的某因素暴露史的比例。,正态分布的分位数表 Z(单侧检验) Z(双侧检验) 或 Z(单侧和双侧) 0.001 3.090 3.290 0.002 2.878 3.090 0.005 2.576 2.807 0.010 2.326 2.576 0.020 2.058 2.326 0.025 1.960 2.242 0.050 1.645 1.960 0.100 1.282 1.645 0.200 0.842 1.282 ,例如在一次吸烟与肺癌关系的研究中,估计对照组有20吸烟史,OR值约为2,要求=0.05,=0.1,求样本大小N?,用公式求: p1=(20.2)/(1-0.2+20.2)=0.333 q0=1-0.2=0.8 q1=1-0.3333=0.6667 p =(0.2+0.3333)/2=0.2667 q =1-0.2667=0.7333 Z=1.96,Z=1.282 代入公式 (1.96 20.26670.733+1.282 0.20.8+0.33330.6667)2 N = (0.3333 - 0.2)2 = 228.9 即每组约需230人。,11配对设计的样本量计算 m为病例与对照暴露情况不一致的对子数 M总对子数,研究口服避孕药与先天性心脏病的关系,设=0.05;=0.1, 对照组暴露比例为p0=0.3, 估计的OR=2;则p=2/3、m=90; p1=0.46; p0=0.3 M=186,研究因素的选择,(一)变量(暴露因素)的选定:一项病例对照研究可用来研究多个暴露因素与疾病之间联系。但是,研究的暴露因素也不是愈多愈好,所以要精心选择、仔细设计暴露因素。与研究目的有关的变量决不可少,且应当将变量尽量分解、分细。如:吸烟 (二)变量的规定:每项变量要有明确的定义,尽可能地采用国际或国内统一的标准,以便交流和比较。 如:吸烟的定义 (三)变量的测量:1.定量指标;2.定性指标。尽可能定量。此外,变量的测量尽可能采用客观的手段。如询问疾病史时还要查阅病历、档案等。,例: 吸烟史 你吸烟吗?否 是 (如答是,请回答问 题2) 你过去吸烟吗? 是 否 (如答否, 请回答饮酒史) 2. 你多大年纪开始吸烟 岁, 共吸烟多 少年 年?戒烟时间 年 月 戒烟原因 3. 你一般平均每天吸多少支烟?() 40支以上 20支以上 , 10支以上 10支以下 , 只是偶尔吸 .,资料来源与收集 1、资料来源 2、调查的含义及实施时遵循的原则 3、调查表,1 资料来源 医院病案记录,疾病登记报告等摘录 检测病人的标本或病人的环境获得 对病例或对照的询问调查中取得,2、调查的含义及实施时遵循的原则 含义 是信息传达、接受和反映的过程,是属于行为科学的范畴 ,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题 原则 调查表的设计需要各专家参加讨论 调查员要经过严格的培训 调查员手册 监督与审查,3、调查表 定义 也称“调查问卷”,通过把拟收集的数据项目用 恰当的措词构成一系列问题的答卷,是资料收集的最主要工具 内容 调查表的名称、编号 一般项目:姓名、性别、民族等 研究项目:研究变量,疾病史、吸烟史等 结尾部分:调查员签名、调查日期等,资料整理与分析,描述性分析 推断性统计分析 推论因素与疾病关联,数据资料的整理和分析,(一)资料的整理 1.原始资料的再核查,目的是纠正错误或补救不足,保证资料完整性。 2.资料的分组、归纳、编码、输入计算机。 (二)资料的分析 1.描述性统计: (1)描述研究对象的一般特征(年龄、性别、疾病类型等) (2)均衡性检验:比较病例组和对照组在研究因素以外其它主要特征有否可比性。两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关。 2.推断性统计 (1)病例组与对照组的暴露率有无统计学差异。 (2)暴露与疾病的关联强度。,描述性分析,1、描述研究对象的一般特征:研究对象人数及各种特征的构成、如性别、年龄、职业、疾病类型的分布等. 2、均衡性检验:比较两组某些基本特征是否相似或齐同. 目的是检验病例组与对照组是否有可比性。,推断性统计分析,成组(非配比)资料的分析,非匹配和频率匹配设计资料可以整理为:,(1)显著性检验 2检验 检验研究因素与疾病之间有否统计学联系? 可用传统的四格表公式 也可用antel-Haenszel (M-H)方法 (2)计算联系强度 OR值及可信区间 估计研究因素与疾病之间联系强度,(1)显著性检验,判断暴露与疾病是否有统计学联系,一般采用2检验 P0.05,说明两组暴露率差异有统计学意义。,联系强度大小及方向 经假设检验,若病例组和对照组之间在暴露因素上的差别有统计学意义,需进一步估计联系强度的大小及方向,常用的指标是比值比。 比值比(OR)计算与可信限的估计及意义 比值比OR:病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,OR值的95%可信区间,(2)计算联系强度,1. 相对危险度 (relative risk, RR) RR = P1/P0 表示暴露阳性者发病危险是暴露阴性者的几倍。 2. 比值比,优势比 (odds ratio, OR) OR = a d / b c,计算暴露与疾病关联的强度 暴露与疾病的关联强度用相对危险度(relative risk, RR)表示,即暴露组发病率(或死亡率)与非暴露组发病率(或死亡率)之比。 在病例对照研究中,由于a / n1 和c / n0不能代表暴露组和非暴露组的发病率或死亡率,所以不能直接计算相对危险度。在病例对照研究中,如果所研究疾病的发病率较低 ( 5%), 可用比值比 (odd ratio, OR) 来估计相对危险度。,OR特点 优势比反映暴露者患某种疾病的危险性较无暴露者高的程度 如果能满足2个条件 所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表性好 OR RR,OR值: 1.当OR=1时,表示暴露因素与疾病之间无联系。 2.当OR1时,表示暴露因素与疾病之间存在“正”的暴露与疾病联系,暴露因素是一种危险因素,或有害因素。疾病与暴露联系愈密切,比值比的数值愈大。 3.当OR1时,说明存在“负”的暴露与疾病联系,暴露因素是一种保护性因素,或有益因素。 OR值可信区间除了有助于估计变异范围的大小外,还有助于检验OR值的判断意义,如区间包含1,则暴露与疾病无关联,其意义与统计学假设检验差异无显著性相同。,OR值意义,95%的可信范围是在2.183.78之间,例 :食管癌发病因素的研究,1. 2 检验 四格表的专用公式,M-H法公式,其中E() 为a的期望值;V()为a的方差,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR,2.OR计算与可信限的估计及其意义 Miettinen法的OR可信限: 结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间,不匹配的分层资料分析,分层分析是将可疑混杂因素进行分层,排除其干扰。按照各层特征的人群进行暴露于疾病关联的分析(计算各层OR值)。 如果各层的OR值齐性,则可计算总的OR值(合并OR值ORMH)。,混杂因素作用的估计与分层分析 分层分析的方法识别混杂因素 计算合并OR与2值,混杂因素具备的条件,1、是该疾病的危险因素之一 2、与所研究的因素有联系 3、不是所研究的因素与疾病之间发病机制的中间环节,如何判断可疑的混杂因素并是否需要调整 cOR(粗的、未调整的OR) ORi (第i层的OR) 、视cOR ORi的比值而定。 cOR ORi接近,可以不作调整。 、混杂因素分布的差异有无显著性。,分层分析,分层分析的目的是排除混杂因素的干扰。分层就是把研究人群按其特征分为不同层次然后分别分析各层中暴露与疾病的关联性。 年龄 例:肺癌 年龄可能是混杂因素 吸烟 混杂因素:是指与研究因素和研究疾病均有关。若在比较人群组中分布不均,可以歪曲因素与疾病之间真正联系的因素。,分层分析的步骤如下,(1)按归纳表整理资料,先不分层,计算X2和OR; (2)按估计的混杂因素分层,并计算各层Xi2和ORi (3)判断分层因素与研究因素和疾病的关系; (4)计算X2MN , ORMN和95%CI ; (5)判断分层因素是否为混杂因素: OR(分层前) ORMH 无混杂存在。 OR(分层前)ORMH 正相关。 OR(分层前)ORMH 负相关。,口服避孕药()与心机梗死的病例对照研究结果 服 未服 合计 对照 合计 cOR.19,口服避孕药()与心机梗死的病例对照研究结果 表例 按年龄分层后的结果 =40岁 (+) (-) 合计 (+) (-) 合计 21 26 47 18 88 106 对照 17 59 76 7 95 102 合计 38 85 123 25 183 208 OR12.80 OR22.78 cOR/ OR1=0.78 cOR/ OR2 =0.78,调整混杂因素的方法(分层分析),按可疑因素的特征分成不同的层次 在每一层内分别分析疾病与暴露的联系 比较分层前与分层后的差异(按cOR ORi的大小) 判断被分层的可疑因素是否存在混杂 存在混杂 调整,调整混杂因素的方法(分层分析),Mantel-Haenszel氏法 ORMH=(aidi/ti)/(bici/ti) 参表例,ORMH=.79 cOR.19 计算总的卡方值和OR值的95%可信区间,分层资料Mantel-Haenszel,计算Mantel-Haenszel卡方值,E(ai) = m1in1i / ti,分层分析实例,如何控制混杂因素 实验设计阶段:匹配 资料分析阶段:分层分析, 多因素logistic回归,剂量反应关系分析,趋 势 检 验 计 算 表 研究因素水平 合计 Y1 Y2 Y3 Yi 病例 A1 A2 A3 Ai N1 对照 B1 B2 B3 Bi N2 合计 M1 M2 M3 Mi T,扩展卡方检验计算公式 2= (AiYi)- E( AY)2 / V(AY) E(AY) = (N1/T) (MiYi) V(AY) = (N1N2) T (MiYi2) ( MiYi)2 / T2(T-1),1:1配对资料的分析 匹配资料是由病例与对照结合成对子,列成表的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数,表 1:1配对研究中疾病与暴露的关系,应用McNemar公式计算卡方值: ORc / b OR的 95可信区间计算用Miettinen法。,公式,例:食管癌发病因素的男性研究资料 93对男性食管癌与对照的吸烟史,95%的可信范围是在1.8410.08之间,表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍,95%的可信范围是在1.8410.08之间,病因分值,暴露病因分值(EFe)也称归因危险度百分比(attributable risk percent, ARP, 或AR%) AR%是指暴露者中由该暴露所致的危险性,占其总危险性的百分比例;或即在暴露人群的总发病率中,由该暴露所致发病率占的百分比例 AR% =(Ie-Iu)/Ie 100% 。,AR% = 100%,偏倚:指在全部实验设计、进行及资料分析过程中出现的所有误差。由于这些误差导致对由暴露而引起疾病的危险性的估计错误。,偏倚及其控制,1. 选择偏倚 2.信息偏倚 3.混杂偏倚,偏倚及其防止 一、选择偏倚(Selection Bias) 由于入选的研究对象与未入选的研究对象在某些特征上 存在差异而引起的误差。,一、选择偏倚(Selection Bias) 1、入院率偏倚 (Admiss

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论