流行病学中山_队列研究_第1页
流行病学中山_队列研究_第2页
流行病学中山_队列研究_第3页
流行病学中山_队列研究_第4页
流行病学中山_队列研究_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、队列研究CohortStudy刘丽流行病与卫生统计学系1 学习要点 队列研究的基本原理和定义 队列研究的特点和类型 队列研究样本人群的确定 累计发病率、发病密度的计算和意义 RR、AR、AR%、PAR、PAR%等指标的计算及意义2案例研究3问题1:HBV感染与HCC的因果关系能否确立?如尚不能,应考虑采用何种分析性方法进一步研究?江苏省海门市是原发性肝癌(HCC)高发区,关于海门市的HCC高发危险因素研究已有不少报道。经病例对照研究结果表明,HBV感染与海门市HCC的发生有统计学关联。横断面调查监测生态学研究病例对照研究描述流行病学产生假设分析流行病学检验

2、假设研究方法队列研究临床试验现场试验社区干预项目验证假设实验流行病学理论流行病学4数理法实验法观察法分析性流行病学p 又称:分析性研究p 是在选择的人群中检验疾病病因假设或流行因素的一类方法。p 包括:队列研究、病例对照研究ExposureTimeDiseaseCohort StudyEDCase Control StudyED5第一节队列研究的概念及原理一、基本概念1. 队列Cohort古罗马军团流行病学:有共同经历或共同暴露状态的一群人两种队列类型 出生队列(birth cohort):特定时期内出生的一组人群。 暴露队列:具有共同的经历/暴露、随访一定的时间66根据人群进入队列的时间不同

3、又分为固定队列和动态队列 固定队列( Fixed Cohort )人群都在某一固定时间或一个短时间之内进入队列, 或一组相对稳定或相对大的人群,在随访过程中,队列成员没有无故退出,也不再加入新的成员。动态队列或开放队列( Open cohort )根据是否暴露于某因素确定队列后,原有的队列成员可以不断退出,新的观察对象可以随时加入7固定队列未出现结局 研究开始 研究结束8出现结局动态队列失访 研究结束9 研究开始出现结局2. 队列研究(Cohort Study)将一个范围明确的人群按是否暴露于某可疑因素或暴露程度分为不同的亚组,随访并追踪其各自结局,比较不同亚组之间结局发生率的差异,从而判定暴

4、露因素与结局之间有无因果关联及关联强度大小的一种观察性研究方法。10二、队列研究的原理结局a暴露YaE随访a + bcbN代表性样本目标人群cYc + ddN时间顺序如果暴露与疾病存在病因关系则至少两组的发病率显著不等11注意:区分病例对照研究三、研究目的检验病因假设一因一果、一因多果(吸烟与肺癌、支气管炎、脑卒中)、 多因多果(弗明汉心血管疾病队列研究)评价预防效果蔬菜摄入、体力活动预防结直肠癌发生;戒烟减少吸烟者发 生肺癌的危险。 预防措施是研究对象的自发行为(人群自然实验 population natural experiment)新药的上市后监测 :IV期临床试验(样本量大、观察时间长

5、)研究疾病的自然史:个体、人群的疾病发展过程12案例研究为进一步研究和确立HBV感染与HCC的关系,1992年海门市对血清HBsAg阳性者和癌发病情况进行了为期10年的随访研究。者肝13问题2:队列研究有几种设计类型?此次队列研究属于哪一种类型?四、研究类型根据研究对象进入队列时间及终止观察的时间:1. 前瞻性队列研究(prospective cohort study)2. 历史性队列研究(historical cohort study)3. 双向性队列研究(ambispective cohort study)14三种类型队列研究示意图151. 前瞻性队列研究prospective cohor

6、t studyJ 研究队列的确定是现在(concurrent)J 根据研究对象现在的暴露分组J 需要随访(follow up)J 结局在将来某时刻出现161. 前瞻性队列研究优 点: 时间顺序增强了病因推断的可信度 直接获得暴露与结局资料,结果可信 能获得发病率缺 点: 所需样本量大,花费大,时间长 影响可行性prospective cohort study172. 历史性队列研究 historical cohort study 根据研究开始时研究者掌握的有关研究对象在过去某时点的暴露情况的历史材料做出的分组 不需要随访,研究开始时结局已出现与病例对照研究的区别?18优 点: 短期内完成资料的

7、收集和分析 时间顺序仍是由因到果 省时、省力、出结果快缺 点: 需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或材料 资料积累时未受到研究者的控制,内容上未必符合要求193. 双向性队列研究 ambispective cohort study 研究队列的确定是过去 根据研究对象过去某时刻的暴露情况分组 需要随访 部分结局可能已出现20 优点:是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有上述二类的优点 。 应用:当基本具备进行历史性队列研究的条件下, 如果从暴露到现在的观察时间还不能满足研究的 要求(人时不够,未满足效应期),还需继续前瞻性观察一段时间时,

8、则选用双向性队列研究。案例的队列研究类型?21五、队列研究基本特点 属观察法 设立对照 (分析流行病学的共同特点) 研究方向:从“因”“果” 直接计算发病率,可直接估计暴露效应。*论证病因强度病例对照研究22案例研究为进一步研究和确立HBV感染与HCC的关系,1992年海门市对血清HBsAg阳性者和者肝癌发病情况进行了为期10年的前瞻性队列研究。23问题3:如果由你组织这次研究,你将如何设计与实施?第二节 研究设计与实施具体实施基线调查随访数据整理与分析24结果解释研究设计确定研究目的确定研究因素确定研究结局确定研究现场与人群确定样本量资料的收集与随访方法质量控制方案资料分析方法一、确定研究目

9、的(选题)实用科学性可行性研究病因假说性创新性考核疾病的自发防治效果研究疾病自然史观察暴露因素与多种疾病相关结局的关系25案例:HBV感染作为HCC的危险因素已在大量的描述性研究和病例对照研究中确认,接下来需要队列研究验证。二、确定研究因素主要暴露因素:在描述性研究和病例对照研究的基础上确定。可能影响结局的因素:混杂因素及人口学特征等。因素的测量:性质:定性(quality),定量(quantity)暴露的水平,暴露的时间,暴露的方式。方法:调查,实验室检查,查阅记录如何测量HBV感染?26案例:研究因素是HBV感染,以HBsAg+作为HBV感染指标。三、确定研究结局结局是研究队列中预期结果究

10、的自然终点(natural end)。,是队列研发病、死亡、健康状况和生命质量改变中间结局(血清指标变化)疾病伤害健康状态正面(生命延长)和定性或定量(发病)27案例的结局是HCC死亡v 一次研究可有多个结局慢性支气管炎吸吸烟烟肺癌冠心病结局的测量采用国际或国内通用的标准28四、确定研究现场与研究人群1. 研究现场=可靠性可行性代表性 人口稳定且有代表性 有足够符合条件的研究对象 发病率较高 领导重视、群众支持 医疗条件较好,交通较便利案例的研究现场海门市:HCC高发;人口稠密;领导重视;群众支持;经济发达;医疗卫生条件较好;交通便利292. 研究人群 从目标人群中抽出的具有代表性的人 未患所

11、研究疾病(前瞻性队列研究) 分为暴露组(不同暴露水平的亚组)和对照组302. 1 研究对象选择暴露人群选择特殊暴露人群 罕见的特殊暴露 职业人群:可疑职业暴露因素与疾病/健康;暴露与疾病的历史记录比较可靠真实,适合历史性队列研究职业人群和特殊暴露人群一般不宜进行前瞻性队列研究 一般人群 研究结果可外推至一般人群总体;研究因素和疾病是一般人群中常见的 有组织的人群团体 一般人群的特殊形式;利用组织系统方便收集信息312.2 . 研究对象选择对照人群的选择目的原则比较,更好地分析暴露的作用代表性;可比性:对照人群除未暴露于所研究的因素外,其它各种因素或人群特征(年龄、性别、职业、文化程度等的构成)

12、应尽可能地与暴露人群相同。32 内对照(internal control) :一群研究对象内部;方便;可了解总体的发病率情况 外对照(external control) :一群研究对象外部(职业暴露人群、特殊暴露人群); 可避免暴露组的“污染”;增加工作量 总人口对照(total population control):整个地区现成的发病或死亡统计资料;资料粗糙,可 能含有暴露人群 多重对照(multiple controls) :两种或以上的对照形式;减少一种对照带来的偏倚, 但增加工作量33五、确定样本量计算样本量时需考虑的问题 暴露组与对照组的比例(通常1:1) 失访率在考虑实际样本含量

13、时,要估计可能的失访率,为避免在分析阶段无法计算。一般是按估计样本含量增加10%作为实际样本含量。34影响样本量的因素(发现结局发生率的差异): 一般人群(非暴露组的)所研究疾病的发病或死亡率(P0);P0越接近0.5,样本越大; 暴露组与对照组人病率之差(d=P1-P0);或者相对危险度(RR)估计值(P1=RRP0); 显著性水平; 把握度(1-)。35可用下列公式估计暴露组及非暴露组所需人数2 pq + zp q+ p q )2(zbN =a001 1( p- p )201式中 P1、P0 是暴露组与非暴露组估计的发病(死亡)率p0 + p1q = 1- pq= 1 - pq= 1 -

14、pp =,0 ,1 ,;012如已知非暴露组的估计发病(死亡)率及 RR= RR p0 ,RR 由预试验或查阅文献获得。值,则p1条件:暴露组和对照组样本量相等36例用队列研究探讨孕妇暴露于某药物与婴儿先天性心脏病间的关系已知非暴露孕妇所生婴儿患先天性心脏病发病率(P0)为0.007,估计该药物暴露的RR为2.5,=0.05,=0.1求调查所需样本量故Z=1.96,Z=1.282 , P1=P0RR=0.0175P,=0.123代入公式得N=2310即 暴露组和非暴露组各需2310人注 考虑到失访的可能性,需在此基础上增加10%的样本量最终N=2310*(1+0.1)=254137六、资料的收

15、集和随访暴露资料基线调查人群特征等资料包括:随访结局资料(暴露的变化、失访)381. 暴露资料是否暴露? 暴露的时间? 暴露的程度?暴露的方式?暴露的确定:定量测量 获取暴露资料的途径有以下几个方面:1) 查阅各种常规记录2) 调查询问3) 医学检查4) 环境测量392、研究对象人群特征资料 与结局有关的其它信息:与疾病有关的其它变量在比较组间应该实现均衡 人口学资料:年龄、性别、婚姻状况、文化程度、家庭人口、人口迁移等情况40案例基线资料的收集:血清HBsAg;肝炎史、HCC史、职业、吸烟、饮茶、饮酒、水源类型、主食类型等其他可疑危险因素;年龄、性别等人口学特征资料。结局(outcome)的

16、定义!主要结局- 与暴露相关的主要次要结局- 其他感兴趣的结局或者可以确认主要结局的3.结局资料的收集随访413. 随访(follow-up)(1)目的:确定分母的信息:研究对象是否仍处于观察中确定分子信息:确定研究人群结局的发生相关资料的收集:有关暴露和混杂因素的资料(2) 随访的对象:暴露组和对照组均为随访对象,应等同对待。(3) 随访内容与基线资料一致,但重点是结局变量4243案例中的研究对象,包括HBsAg阳性者和者, 均在1992年进入队列,从1993年到2003年,每年随访一次。观察终点是HCC死亡。(4)随访开始时间及随访间隔 随访开始时间:疾病的最短诱导期和潜伏期 随访间隔:取

17、决于研究结局的变化速度、人力物力等(5)观察终点(end-point)、观察终止 观察终点是观察对象出现了预期的结局; 观察终止是整个研究截止的时间,即可得出结论的时间。决定于潜伏期及暴露与疾病的关联强度。(6)失访(lost to follow up)的问题如果暴露组与未暴露组的失访率相似,失访者与未失访者的结局发生率也相似,则失访将不会产生偏倚。把失访者与未失访者的基线资料中的一些特征加以比较,如差别不大,则可假定结局发生率的差别可能也不大。444.质量控制451) 调查员的选择2) 调查员的培训3) 制定调查员手册4) 监督案例研究46问题5:如何进行资料整理与分析? 1992年在海门市

18、(HCC 高发区, 人口数103万, HCC 标化死亡率30/10万)建立了90236 人的HCC 研究队列, 进行了10 年时间的前瞻性观察, 探讨HBV 感染和HCC 的关系。 1993年起每年随访1次队列成员的生命状况,观察肝癌死亡率;直至2003年终止。 观察终点? 观察终止时间?第三节 资料的整理和分析1. 资料的整理2. 描述统计3. 推断统计: 队列研究原理? 研究因素与疾病是否有关联:结局发生率的计算、比较 关联的强度(暴露的效应):危险度的估计4.最后,根据上述结果和研究中可能存在的问题(偏倚),作出结论和解释。47一、描述统计描述研究对象的组成(代表性)、随访的经过、随访时

19、间、结局的发生情况、失访情况等;对两组的一般情况做均衡性检验(可比性)。如果为了质量控制进行了重复抽样调查,还需要比较重复调查的符合率。48二、率的计算、比较、危险度的分析(推断统计)。(一)、率的计算1、累积发病率(cumulative incidence,CI)定义:某一固定人群中,以某病新发生例数(D)为分子, 以观察开始时总人数(N)为分母,计算累计发病率。前提:固定队列公式:CI= 发病(或死亡)累积人数 / 观察开始时人口数变化范围01报告时必须注明时间长短49二、率的计算、比较、危险度的分析(推断性统计)。固定队列未出现结局 研究开始 研究结束50出现结局队列研究累积发病率资料归

20、纳表(注意区分病例对照研究的资料归纳表)病例非病例合计暴露组非暴露组acbda+bc+d合计a+cb+da+b+c+dHBV感染与HCC关系的队列研究资料归纳整理表病例非病例合计累积发病率()暴露组非暴露组10793871325975511143387589875.255.10合计1466887709023616.25累积发病率=观察期内发病人数/观察期开始人口数51失访 研究结束52 研究开始出现结局A:考虑人时为单位计算。Q:如何合理计算发病率?Q:动态队列计算累计发病率是否合理?A:不合理。每个对象 被观察的时间长短不一。2、发病密度(incidence density, ID)定义:是

21、一定时期内的平均发病率,分子是特定人群在观察期内的新发病例数,分母是该人群的每一成员的观察人时总和。前提:动态队列(人口不稳定,观察人数变动较大)公式:ID= 观察期内发病人数 / 观察人时数变化范围053意义:既说明该人 生的新病例数,又说明该人群的大小和发生这些例数所经历的时间,带有瞬时频率的性质。队列研究发病密度归纳表病例数观察人时发病密度暴露组非暴露组acn1n0a/n1c/=n0合计a+c=m1n1 + n0 =Nm1/N病例数观察人年发病密度(1/10万人年)暴露组非暴露组1079139238.27774.93387780562.0149.58合计1466919800.28159.

22、38发病密度=观察期发病人数/观察人时数54观察人时的概念:Person time, PT人时是将人数和时间结合起来考虑的一种度量单位,是观察人群中全部个体暴露于研究因素的时间总和 时间单位常用年,称人年数(person-years)人时的计算:精确法、近似法、寿命表法55以个人为单位计算暴露人年(精确法):将每一个观察对象的确切观察人时进行相加总和; 适用于样本不大及知道每个研究对象进入和退出队列 的具体时间。5657以人群为单位计算暴露人年(近似法) 用平均人数观察年数 适用于队列进出时间不详、样本大、精确性要求不高的情况如35岁组人年数=(9836+9847)/2+(9847+9857)

23、/2+(9857+9843)/2+(9843+9840)/258用寿命表法计算人年适用条件:样本大并要求有一定的精确度的情况规定:当年进入队列的个人及失访或出现终点结局的个人均作1/2个人年计算计算公式: Lx=Ix+1/2(Nx-Dx-Wx) Ix+1=Ix+Nx-Dx-Wx第1年人时:L1=2903+1/2(123-8-64)=2928.5第2年人时:I2=2903+123-8-64=2954L2=2954+1/2(115-6-76)=2970.5593、标化比(本质是效应指标) 条件:研究对象数目比较少,结局的发生率比较低 原理:以全人口死亡率或者全人口的死因构成做为标准,算出该观察人群

24、的预期(理论),再求观察人群中实际与此预期发病人数之比,即得标化死亡比。 职业流行病学常用。 分类:标化死亡比standardized mortality ratio,SMR标化比例死亡比 standardized proportional mortality ratioSPMR60公式: ai E(ai )SMR研究人群中的实际死亡数(O)按标准人口(或全人口)计算的预期死亡数(E)ai为观察人群i层年龄组的死亡观察值E为(a按i )照标准人口某时间内第层年龄i 组死亡率推算的该年龄组的预期死亡数61求其SMR。本例O=1, E=5001.8=0.9SMR=1/0.9=1.11即某厂该年 2

25、0-24 岁年龄组工人死于某一般人群的 1.11 倍。的危险是6263意义:被研究人群死于(发生)某病的危险性是标准人群的多少倍SMR1 ,说明实际死亡数多于预期死亡数,如果差异显著,提示暴露可能是危险因子。应用:研究人群数量较少,发病率低,不宜计算率。常用于职业流行病学研究,不设专门对照,和全人群比较。(二)两组率差异的统计学检验比较暴露组和非暴露组结局发生率是否有统计学 差异来判断暴露与疾病是否关联。 U检验 直接概率法 二项分布检验 泊松(Poisson)分布检验 c2检验 计分检验(score test)64U检验条件:研究样本量较大,p和1-p都不太小,如np和n(1-p)均大于5,

26、样本率的分布接近正态分布。p1 - p0u =11+pc (1 - pc)()n1n0 p1n1+ p0n0n1+n0c =p对实例中的累积发病率进行检验,u=60.93, P2.5强保护作用中度保护作用弱保护作用无作用轻度中度强作用作用作用(Greenberg,1984)70RR的95% CI计算方法(Woolf 法)Var(lnRR)=1/a+1/b+1/c+1/dln RR 1.96Var(ln RR)lnRR的95%CI=求其反自然对数即为RR的95% CI712、归因危险度(attributable risk, AR)也称率差(rate difference, RD)、特异危险度、超

27、额危险度、绝对危险度。为暴露组的发病(死亡)率与非暴露组的发病(死亡)率之差,表示危险特异地 归因于暴露因素的程度。acAR = I- I=-eoa + bc + d公式:AR = Io (RR -1) 流行病学意义 E与 人群比较,所增加的疾病发生数量 AR值 暴露因素消除后所减少的疾病数量72RR与AR的区别(1/10万人年)RRAR疾病吸烟者非吸烟者50.124.6910.745.43肺癌296.75170.321.7126.43心血管疾病意义 RR AR吸烟对肺癌的病因学意义较大戒烟对心血管疾病的预防效果更大733 归因危险度百分比(ARP)又称病因分值(etiologicfracti

28、on,EFe)。暴露人群中因暴露而增加的发病部分占全部发病的百分比。I e- IoAR%( ARP) = 100%I e公式:AR%( ARP) = RR - 1 100%RRARP表示暴露者的发病有多大百分比可归因于暴露,或消除 暴露后可使发病减少的百分比。74吸烟者与非吸烟者死于不同疾病的RR与AR疾病吸烟者非吸烟者RRAR1/10万人年1/10万人年1/10万人年肺癌心血管疾病50.124.6910.745.43296.75170.321.7126.3AR% = 50.12 - 4.69 100% = 90.6%50.12说明吸烟者中发生肺癌有90.6%归因于吸烟。戒烟后可使吸烟者肺癌减

29、少90.6%。754. 人群归因危险度 population attributable risk,PAR测量总人群中由于暴露于某因素导致的发病率或死亡率,说明暴露对一个具体人群的的“社会效应”)程度(暴露公式:PAR = I t- I oIt 为全人群某病发病(死亡)率Io 为非暴露组的某病发病(死亡)率意义: 全人群与非暴露人群相比,所增加的疾病发生率的大小 PAR值暴露因素消除后所减少的疾病数量765. 人群归因危险度百分比(PAR%或PEF)总人群中因暴露于某因素所致的发病占人病的百分比,也即说明消除该因素后产生预防该病的效果占多大比重,具有公共卫生学意义,说明暴露的社会效应。- IoPAR% =I t公式: 100%I tPe(RR - 1)PAR% =100%Pe(RR - 1) + 177案例研究结果78 已知Ie=75.25 , 5.10,全人群的PHCC死亡率It=16.25,则: AR=70.15 , AR%=93.2% PAR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论