第四章队列研究.doc_第1页
第四章队列研究.doc_第2页
第四章队列研究.doc_第3页
第四章队列研究.doc_第4页
第四章队列研究.doc_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 队列研究第四章 队列研究队列研究(cohort study),又称为前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)等,目前常用的名称是队列研究。队列研究是分析流行病学研究中的重要方法,它可以直接观察对危险因素的不同暴露状况人群的结局,从而探讨危险因素与所观察结局的关系。与病例对照研究相比,其检验病因假设的效能优于病例对照研究。因此,在病因流行病学研究中应用广泛。第一节 概 述一、概念队列研究是将一个范围明确的人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。这里观察的结局主要是与暴露因子可能有关的结局。暴露(exposure)是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。暴露在不同的研究中有不同的含意,暴露可以是有害的,也可以是有益的,但都是需要重点研究的。队列(cohort)原意是指古罗马军团中的一个分队,流行病学家加以借用,表示一个特定的研究人群组。根据特定条件的不同,流行病学中的队列一般有两种情况:一是指特定时期内出生的一组人群,叫出生队列(birth cohort);另一种是泛指具有某种共同暴露或特征的一组人群,一般即称之为队列或暴露队列,如某个时期进入某工厂工作的一组人群。根据人群进出队列的时间不同,队列又可分为两种:一种叫固定队列(fixed cohort),是指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有无故退出,也不再加入新的成员,即在观察期内保持队列的相对固定。另一种叫动态人群(dynamic population),是相对固定队列而言的,即在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入。如图4-1所示,在所观察的队列人群中,其中A、C、D、E、F组成的队列称为固定队列,而由A、B、C、D、E、F、G、H、I、J、K组成的队列则称为动态人群。危险因素(risk factor),又称为危险因子,泛指能引起某特定结局(outcome)(如疾病)发生,或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素。“O” A“”进入队列;“X”无故退出队列;“O”出现终点结局图4-1 随访队列示意图年KIHDCZ EXB“X” B“O” E“O” F“O” G“X” J2000随访终止1990选定队列开始观察二、基本原理队列研究的基本原理是在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。如果暴露组某结局的发生率明显高于非暴露组,则可推测暴露与结局之间可能存在因果关系。其结构模式见图4-2。在队列研究中,所选研究对象必须是在开始时没有出现研究结局,但有可能出现该结局(如疾病)的人群。暴露组与非暴露组必须有可比性,非暴露组应该是除了未暴露于某因素之外,其余各方面都尽可能与暴露组相同的一组人群。根据队列研究的基本原理可以分析出队列研究的一些基本特点。1) 属于观察法 队列研究中的暴露不是人为给予的,不是随机分配的,而是在研究之前已客观存在的,这是队列研究区别于实验研究的一个重要方面。2) 设立对照组 与病例对照研究相同,队列研究也必须设立对照组以资比较。对照组可与暴露组来自同一人群,也可以来自不同的人群。3) 由“因”及“果” 在队列研究中,一开始(疾病发生之前)就确立了研究对象的暴露状况,而后探求暴露因素与疾病的关系,即先确知其因,再纵向前瞻观察而究其果,这一点与实验研究方法是一致的。4) 能确证暴露与结局的因果联系 由于研究者能切实知道研究对象的暴露状况及随后结局的发生,且结局是发生在确切数目的暴露人群中,所以能据此准确的计算出结局的发生率,估计暴露人群发生某结局的危险程度,因而能判断其因果关系。出现某种结局(疾病) 不出现某种结局 特定人群范围内的研究对象 暴露组暴露状况出现某种结局(疾病) 非暴露组 不出现某种结局前瞻性地收集结局事件发生的资料研究开始图4-2 队列研究的结构模式图三、研究目的1. 检验病因假设 由于队列研究检验病因假设的能力较强,因此深入检验病因假设是队列研究的主要用途和目的。一次队列研究可以只检验一种暴露与一种疾病之间的因果关联(如吸烟与肺癌),也可同时检验一种暴露与多种结果之间的关联(如可同时检验吸烟与肺癌、心脏病、慢性支气管炎等的关联)。2. 评价预防效果 有些暴露有预防某结局发生的效应,即出现预防效果。如大量的蔬菜摄入可预防肠癌的发生,戒烟可减少吸烟者肺癌发生的危险等,这里的预防措施(如蔬菜摄入和戒烟)不是人为给予的,而是研究对象的自发行为。这种现象又被称为“人群的自然实验”。3. 研究疾病自然史 临床上观察疾病的自然史只能观察单个病人从起病到痊愈或死亡的过程;而队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现,这个过程多数伴有各种自然和社会因素的影响,队列研究不但可了解个体疾病的全部自然史,而且可了解全部人群疾病的发展过程。四、研究类型队列研究依据研究对象进入队列时间及终止观察的时间不同,分为前瞻性(prospective)队列研究、历史性(historical)队列研究和双向性(ambispective)队列研究三种。三种队列研究方法示意如图4-3。暴露组回顾性地收集已有的历史资料历史性队列研究非暴露组继续前瞻性收集资料双向性队列研究暴露组非暴露组暴露组前瞻性收集资料前瞻性队列研究现在过去某时点回顾性地收集已有的历史资料非暴露组将来某时点图4-3 队列研究类型示意图(一)前瞻性队列研究研究对象的分组是根据研究开始时(现时)研究对象的暴露状况而定的。此时,研究的结局还没有出现,还需要前瞻观察一段时间才能得到,这样的设计模式称为即时性(concurrent)或前瞻性队列研究。前瞻性队列研究所需观察时间往往很长,由观察者定期随访,这是队列研究的基本形式。在前瞻性队列研究中,由于研究者可以直接获取关于暴露与结局的第一手资料,因而资料的偏倚较小,结果可信;其缺点是所需观察的人群样本很大,观察时间长、花费大,因而影响其可行性。(二)历史性队列研究研究对象的分组是根据研究开始时研究者已掌握的有关研究对象在过去某个时点的暴露状况的历史材料作出的;研究开始时研究的结局已经出现,其资料可从历史资料中获得,不需要前瞻性观察,这样的设计模式称为非即时性(non-concurrent)或历史性队列研究。在历史性队列研究中,虽然研究是现在开始的,但研究对象是在过去某个时点进入队列的;暴露与结局虽然跨时期较长,但资料搜集及分析却可以在较短时期内完成;尽管搜集暴露与结局资料的方法是回顾性的,但究其性质而言仍属前瞻性观察,仍是从因到果的。因此,该法是一种深受欢迎的快速的队列研究方法,具有省时、省力、出结果快的特点。但缺点是因资料积累时未受到研究者的控制,所以内容上未必符合要求。(三)双向性队列研究 也称混和型队列研究,即在历史性队列研究之后,继续前瞻性观察一段时间,它是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有上述二类的优点,且相对地在一定程度上弥补了相互的不足。(四)不同研究类型的选用原则考虑到上述不同类型队列研究的优缺点,因此,在实施队列研究前,应根据具体情况审慎选择。1. 前瞻性队列研究:选择前瞻性队列研究时,应重点考虑:应有明确的检验假设,检验的因素必须找准;所研究疾病的发病率或死亡率应较高,如不低于5;应明确规定暴露因素,并且应有把握获得观察人群的暴露资料;应明确规定结局变量,如发病或死亡,并且要有确定结局的简便而可靠的手段;应有把握获得足够的观察人群,并将其清楚地分成暴露组与非暴露组;大部分观察人群应能被长期随访下去,并取得完整可靠的资料。应有足够的人、财、物力支持该项工作。2. 历史性队列研究:选择历史性队列研究时,除考虑前述的至点外,还应考虑是否有足够数量的完整可靠的在过去某段时间内有关研究对象的暴露和结局的历史记录或档案材料。如医院的病历、个人的医疗档案、及工厂和车间的各种记录等。在具备条件的情况下,历史性队列研究备受关注。3双向性队列研究:当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求,还需继续前瞻性观察一段时间时,则选用双向性队列研究。第二节 研究实例CS2职业中毒引起的精神病、中枢神经系统疾患及多发性神经炎等,早在19世纪末即有报道。20世纪中叶,研究者发现CS2中毒与脑、肾等器官的动脉粥样硬化有关。然而,CS2长期低剂量的暴露与冠心病的关系却一直没有明确结论。20世纪60年代芬兰职业卫生研究所的Hernberg和Tolonen教授所做的5年前瞻性队列研究最后确定了两者之间的因果关系。一、确定研究因素本次确定的研究因素是长期低剂量的CS2的暴露。有关长期低剂量CS2暴露与冠心病的关系自20世纪30年代开始,通过大量的死因回顾调查、现况研究、病例对照研究和历史性队列研究,其研究假设已基本确定,在此基础上,通过前瞻性队列研究进行最后确证。长期低剂量CS2暴露的定义是在有CS2暴露(但不至引起急性中毒)的车间工作至少5年以上。二、确定研究结局由于轻型冠心病的临床表现是非特异性的,利用心电图的轻微改变和轻度心绞痛等症状进行判断也很难精确估计非致死性冠心病的流行率,而用心肌梗塞作为主要研究结局指标则具有精确和特异的特点。为了对结局作出全面评价,作者还同时观察了血压、心电图、心脏大小等指标及心绞痛病史。三、确定研究现场和研究人群Hernberg于1967年开始的有关长期CS2暴露与冠心病关系的历史性队列研究选择的是1942年建立的一个粘纤厂的25至64岁,在1942年至1967年间至少有5年CS2暴露史的所有工人作为暴露组,以芬兰城市普遍男性人群(由于暴露组对象全为男性)为对照组。结果CS2暴露组的冠心病SMR=1.64,P0.002。在此基础上,Tolonen以上述Hernberg选出的所有存活的暴露组成员(343人)为暴露组,以年龄相差不超过3岁,出生地区相同,工种的体力消耗相当为配比条件,在同一城市的造纸厂随机选择了343名男性工人为对照组,开始了为期5年的前瞻性队列研究。四、资料收集基线资料和随访资料的收集均采用查阅档案记录、询问和实验室检查的方法来获得。姓名、性别、年龄、工种及工作年限、吸烟、业余时间的体力活动情况等通过询问获得;用药情况、既往车间CS2的浓度等通过查阅档案记录获得;而血糖、血脂、血清胆固醇水平、血压、心电图、心脏大小、体重及车间CS2浓度的动态变化等,均通过实验检测的方式获得。为了保证资料的可靠性,各种检测仪器均事先校准,采用国际通用的检查方法和判断标准,并贯彻始终。五、资料整理与分析本研究资料的分析以CS2暴露与心肌梗塞发生的关系为中心,首先对可能影响结果的两组的可比性进行分析。虽然在对象选择时已按年龄、出生地及工作的劳动强度进行了配比,在资料分析一开始,又对两组人群每天吸烟量、业余时间体力活动量、体重及用药情况等进行了比较,结果显示两组有良好的可比性。5年间,暴露组发生14例致死性心肌梗塞,11例发生一次心肌梗塞后存活下来,非暴露组总共发生7例心肌梗塞,有4例存活下来。结果提示CS2暴露组发生心肌梗塞的相对危险度为3.57,两组致死性心肌梗塞的发生率和总的心肌梗塞的发生率差异有显著性(表4-1)。另外,CS2导致冠心病可有不同的表现形式,CS2在不同临床类型冠心病的发生中作用程度不同(表4-2)。表4-1 暴露组和对照组的心肌梗塞发生率及相对危险度发病数5年累积发病率(%)RRRR95%可信区间暴露组致死性144.084.691.3416.47(343人)非致死性113.212.740.868.69合计257.293.571.528.37对照组致死性30.87(343人)非致死性41.17合计72.04 (根据Tolonen M,1975 资料改编)表4-2 CS2与不同临床类型冠心病的相对危险度与特异危险度比较相对危险度特异危险度致死性心肌梗塞4.693.21非致死性心肌梗塞2.742.04总心肌梗塞3.575.25心绞痛1.911.6心电图异常1.46.1 (根据Tolonen M,1975 资料改编)为了研究导致心肌梗塞发生的其他影响因素,将两组中所有观察到的32例心肌梗塞病人作为病例组,在原相应组选择没有发生心肌梗塞者作为对照组,进行巢式病例对照研究。结果表明,病例组与对照组在出生地方面无显著性差异;病例组的血脂和血糖均高于对照组,但无统计学意义;病例组的收缩压、舒张压及吸烟者的比例均显著高于对照组,提示这些因素在心肌梗塞发生中有重要作用。六、结论研究结果证实了长期低剂量(2030ppm)CS2暴露与冠心病的关系,据此,芬兰当局于1972年将CS2的车间容许浓度降至10ppm。CS2所致的冠心病,以致死性心肌梗塞表现突出,其他非致死性心肌梗塞、心绞痛及心电图异常等也有不同程度的表现。在队列研究的基础上进行巢式病例对照研究,既可进一步对结果提供支持的证据,同时亦可对相关的影响因素进行全面探讨。第三节 设计与实施一、确定研究因素由于队列研究是一项费时、费力、费钱的研究,且一次只能研究一个因素,因此,队列研究中研究因素的确定是至关重要的。研究因素在队列研究中常称为暴露因素或暴露变量,暴露因素通常是在描述性研究和病例对照研究的基础上确定的。在研究中要考虑如何选择、规定和测量暴露因素。一般应对暴露因素进行定量,除了暴露水平以外,还应考虑暴露的时间,以估计累积暴露剂量。同时还要考虑暴露的方式,如间歇暴露或连续暴露、直接暴露或间接暴露、一次暴露或长期暴露等。暴露的测量应采用敏感、精确、简单和可靠的方法。队列研究除了要确定主要的暴露因素外,还应确定同时需要收集的其他暴露因素资料及背景资料,包括各种可疑的混杂因素及研究对象的人口学特征,以利于对研究结果作深入分析。二、确定研究结局结局变量(outcome variable)也叫结果变量,简称为结局。是指随访观察中将出现的预期结果事件,也即研究者希望追踪观察的事件。结局就是队列研究观察的自然终点,它与观察期的终止不是一个概念。研究结局的确定应全面、具体、客观。结局不仅限于发病、死亡,也有健康状况和生命质量的变化;既可是终极的结果(如发病或死亡),也可是中间结局(如分子或血清的变化);结局变量既可是定性的,也可是定量的,如血清抗体的滴度、尿糖及血脂等。结局变量的测定,应给出明确统一的标准,并在研究的全过程中严格遵守。考虑疾病的诊断标准时要注意一种疾病往往有多种表现,轻型和重型,不典型和典型,急型和慢型等区别。因此,妥善的解决办法是,既按国际或国内统一的标准判断结局,又按自定标准判断,准确记录下其它可疑症状或现象供以后分析。队列研究的优点之一是一次可以同时收集到多种结局资料,研究一因多果的关系,故在队列研究中除确定主要研究结局外,可考虑同时收集多种可能与暴露有关的结局。三、确定研究现场与研究人群(一)研究现场由于队列研究的随访时间长,因此,队列研究的现场选择除要求有足够数量的符合条件的研究对象外,还要求当地的领导重视,群众理解和支持,最好是当地的文化教育水平较高,医疗卫生条件较好,交通较便利。能选择符合这些条件的现场,将使随访调查更加顺利,所获资料将更加可靠。当然,也要考虑现场的代表性。(二)研究人群研究人群包括暴露组和对照组,暴露组中有时还有不同暴露水平的亚组。根据研究目的和研究条件的不同,研究人群的选择有不同的方法。1. 暴露人群的选择 暴露人群即对待研究因素有暴露的人群。根据研究的方便与可能,通常有下列四种选择。(1) 职业人群 如果要研究某种可疑的职业暴露因素与疾病或健康的关系,必须选择相关职业人群作为暴露人群;另外,由于职业人群有关暴露与疾病的历史记录较为全面、真实和可靠,故如果做历史性队列研究,也常选择职业人群为暴露人群。如研究联苯胺的致癌作用,可选择染料厂工人;研究石棉致肺癌的作用,可选择石棉作业工人等。(2) 特殊暴露人群 特殊暴露人群是研究某些罕见的特殊暴露的唯一选择,如选择原子弹爆炸的受害者,接受过放射线治疗的人,以研究射线与白血病的关系。由于对某些职业暴露和某些特殊暴露的危险作用多半不是一开始就认识到的,一旦认识到了,大多都采取了防护措施以减少暴露,所以一般不易进行前瞻性队列研究,而常使用历史性队列研究。(3) 一般人群 即某行政区域或地理区域范围内的全体人群,选择其中暴露于欲研究因素的人做暴露组。在一般人群中选择暴露组,通常考虑两点:不打算观察特殊人群发病的情况,而着眼于一般人群及今后在一般人群中的防治,使研究结果具有普遍意义;所研究的因素和疾病都是一般人群中常见的,不必要或没有特殊人群可寻,特别是在研究一般人群的生活习惯或环境因素时。美国Framingham地区的心脏病研究就是一个很好的例子。医疗或人寿保险的资料可作为选择对象的来源之一。保险资料可看作是一般人群资料的特殊形式,西方国家几乎是人人参加这类保险的,我国随着城镇医疗体制的改革,参加保险的人数与日俱增。保险资料的优点是有详细可靠的医疗与保健记录,有利于追踪观察。(4) 有组织的人群团体 该类人群可看作是一般人群的特殊形式,如医学会会员,工会会员,机关、社会团体、学校或部队成员等。选择这样的人群的主要目的是利用他们的组织系统,便于有效地收集随访资料。而且他们的职业和经历往往是相同的,可增加其可比性。如Doll和Hill选择英国医师会员以研究吸烟与肺癌的关系,就是一个好例子。2、对照人群的选择 设立对照是分析流行病学的基本特征之一,其目的是为了比较,为了更好地分析暴露的作用。因此,选择对照组的基本要求是尽可能保证与暴露组的可比性,即对照人群除未暴露于所研究的因素外,其它各种影响因素或人群特征(年龄、性别、民族、职业、文化程度等)都应尽可能地与暴露组相同,即具有可比性。做到暴露组与对照组有良好的可比性是很不容易的,关键在于选择恰当的对照人群。选择对照人群的常用形式有下列四种:(1) 内对照 即先选择一组研究人群,将其中暴露于所研究因素的对象作为暴露组,其余非暴露者即为非暴露组。也就是说在选定的一群研究对象内部既包含了暴露组,又包含了对照组,不需到另外的人群中去找。这样做的好处是,选取对照比较省事,并可以无误地从总体上了解研究对象的发病率情况。当研究的暴露变量不是定性变量,而是定量变量时,可按暴露剂量分成若干档次,以最低档次暴露的人群为对照组。例如饮用水中的氟,蔬菜中的硝酸盐,人的血压值等,均可以这样做。(2) 特设对照 也称外对照。当选择职业人群或特殊暴露人群作为暴露人群时,往往不能从这些人群中选出对照,而常需在该人群之外去寻找对照组,故名外对照。如以放射科医生为研究射线致病作用的暴露对象时,可以不接触射线或接触射线极少的五官科医生为外对照。选用外对照的优点是随访观察时可免受暴露组的影响,即暴露组的“污染”,缺点是需费力气去另外组织一项人群工作。(3) 总人口对照 这种对照可认为是外对照的一种,但也可看作不设对照,因为它实际上并未与暴露组平行地设立一个对照组,而是利用整个地区的现成的发病或死亡统计资料,即以全人口率为对照。如利用全国的或某省(区)、市、县的统计资料作比较。它的优点是,对比资料容易得到,缺点是资料比较粗糙,往往不十分精确或缺乏欲比较的细目,人群可比性差。另外,对照中可能包含有暴露人群。在实际应用时,并不以暴露组和总人口的发病率直接作比较,而是采用标化比,如标准化死亡率比(SMR),即用暴露组发病或死亡人数与用总人口率算出的期望发病或死亡数字求标化比。在用特殊暴露人群或职业人群做暴露组时,计算标化比更为便捷,且意义明显。比值大于1,说明暴露导致或促进了结局的发生;比值小于1,说明暴露预防或减少了结局的发生;比值等于1,则暴露与疾病没有关系。另外,在利用总人口作对照时,尽量应用与暴露人群在时间、地区及人群构成上相近的总人群为对照,以减少偏倚。(4) 多重对照 或叫多种对照,即用上述两种或两种以上的形式选择的人群同时作对照,以减少只用一种对照所带来的偏倚,增强结果的可靠性。四、确定样本大小(一)计算样本量时需考虑的几个问题1. 抽样方法 队列研究往往需要从实际人群(actual population)中抽取一定数量的样本,而很少将全部符合条件的对象都包括进来。队列研究中抽取样本的方法与现况研究相同。而选择不同的抽样方法,将有不同的样本含量估计方法。2. 暴露组与非暴露组的比例 一般说来,非暴露组的样本含量不宜少于暴露组的样本含量。通常采取等量的做法。如果某一组太少,将会要求总样本增大。3. 队列研究通常要追踪观察相当长一段时间,这期间内研究对象的失访几乎是难免的。因此在计算样本量时,需要预先估计一下失访率,适当扩大样本量,防止在研究的最后阶段因数量不足而影响结果的分析。通常假设失访率为10%,故按计算出来的样本量再加10%做为实际样本量。(二)影响样本含量的几个因素1. 一般人群(对照人群)中所研究疾病的发病率p0 因样本量与p0q0(q0=1-p0)成正比,p0越接近0.5,p0q0值越大,此时样本量也越大。2. 暴露组与对照组人群发病率之差 用p1表示暴露组人群的发病率,用一般人群发病率p0代替对照组人群发病率,d=p1p0为两组人群发病率之差,d值越大,所需样本量越小。如果暴露组人群发病率p1不能获得,可设法取得其相对危险度(RR)的值,由式p1=RRp0可求得p1。3. 要求的显著性水平 即检验假设时的第类错误(假阳性错误)值。要求假阳性错误出现的概率越小,所需样本量越大。通常取=0.05或0.01,取0.01时所需样本量较0.05为大。4. 效力 效力(power)又称把握度(1-),为检验假设时出现第类错误的概率,而1-为检验假设时能够避免假阴性的能力。若要求效力(1-)越大,即值越小,则所需样本量越大。通常取为0.10,有时用0.20。(三)样本含量的计算在暴露组与对照组样本等量的情况下,可用下式计算出各组所需的样本含量。 (式4-1),式中p1与p0分别代表暴露组与对照组的预期发病率,为两个发病率的平均值,q=1-p,Z和Z为标准正态分布下的面积,可查表求得。例如,用队列研究探讨孕妇暴露于某药物与婴儿先天性心脏病之间的联系。已知非暴露孕妇所生婴儿的先天性心脏病发病率(p0)为0.007,估计该药物暴露的RR为2.5,设=0.05(双侧),=0.10,求调查所需的样本量。将上述数据代入式4-1:即暴露组与非暴露组各需2310人。如果考虑失访的可能性,尚需在此基础上增加10%的样本量,即两组各实际需要样本数量为n=2310(1+0.1)=2541人。如果抽样方法不是单纯随机抽样,还需适当增加样本量。另一种获得样本数量的便捷方法是查表法,只要已知、p0和RR四个基本数据,即可从某些参考书的相应附表上查出。五、资料收集与随访(一)基线资料的收集在研究对象选定之后,必需详细收集每个研究对象在研究开始时的基本情况,包括暴露的资料及个体的其他信息,这些资料一般称为基线资料或基线信息(baseline information)。这些信息一方面可作为判定暴露组与非暴露组的依据,也为今后仔细分析影响研究结局的因素提供保证。基线资料一般包括对待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活习惯及家族疾病史等。获取基线资料的方式一般有下列四种:查阅医院、工厂、单位及个人健康保险的记录或档案;访问研究对象或其它能够提供信息的人;对研究对象进行体格检查和实验室检查;环境调查与检测。 (二)随访研究对象的随访是队列研究中一项十分复杂细致,又至关重要的工作,随访的对象、内容、方法、时间、随访者等都直接与研究工作的质量相关,因此,应事先计划、严格实施。1. 随访对象与方法 所有被选定的研究对象,不论是暴露组或对照组都应采用相同的方法同等地进行随访,并坚持追踪到观察终止期。有时还须对失访者进行补访。未能追访到的,应尽量了解其原因,以便进行失访原因分析。同时可比较失访者与继续观察者的基线资料,以估计有无产生偏差。随访方法包括对研究对象的直接面对面访问、电话访问、自填问卷、定期体检,环境与疾病的监测、医院医疗与工作单位的出勤记录的收集等。随访方法的确定应根据随访内容、随访对象、及投入研究的人力、物力等条件来考虑。应该强调的是,对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。2. 随访内容 一般与基线资料内容一致,但次处收集的重点是结局变量,其具体项目视研究目的与研究设计而不同。将各种随访内容制成调查表在随访中使用,并贯彻始终。有关暴露状况的资料也要不断收集,以便及时了解其变化。3. 观察终点 观察终点(end-point)就是指研究对象出现了预期的结果,达到了这个观察终点,就不再对该研究对象继续随访。这里强调的是出现预期结果,如观察的预期结果是冠心病,但某对象患了高血压,不应视为该人已达观察终点,而应继续当作对象进行追踪。如果某对象猝死于脑卒中,尽管已不能对其随访,但仍不作为到达终点对待,而应当看作是一种失访,在资料分析时作失访处理。一般情况下,观察终点是疾病或死亡,但也可是某些指标的变化,如血清抗体的出现,尿糖转阳及血脂升高等,根据研究的要求不同而不同。对观察终点的判断应在设计中订出明确的标准,规定明确的判断方法,这种规定自始至终不能改变,即使是实际医疗工作中已有所改变,但在本研究中也不能改变,以免造成疾病错分的误差。发现终点的方法要敏感、可靠、简单、易被接受。3. 观察的终止时间:观察终止时间是指整个研究工作截止的时间,也即预期可以得到结果的时间,终止时间直接决定了观察期的长短,而观察期长短是以暴露因素作用于人体至产生疾病结局的时间,即潜隐期为依据的,另外,还应考虑所需的观察人年数。要在不失这个原则的基础上尽量缩短观察期,以节约人力、物力,减少失访。观察时间过短,可能得不出预期的结果;但追踪时间越长,失访率越高,消耗越大,结果可能也受影响。4. 随访的间隔 如果观察时间较短,在观察终止时一次搜集资料即可。但如果观察时间较长,则需多次随访,其随访间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。一般慢性病的随访间隔期可定为12年。如Framingham心血管病的随访研究每二年随访一次,历时24年。5. 随访者 根据随访内容的不同,调查员可以是普通的询问调查者,也可以是实验室的技术人员,临床医生等,但随访调查员必须认真进行培训。研究者可以参加随访,但最好是不亲自参与,因为研究者随访易于带来主观的偏倚,而不知情的局外人士反而能够获取更客观的信息。如果采用盲法设计,更根本不能由研究者自己进行追踪。六、质量控制队列研究费时、费力、消耗大,加强实施过程,特别是资料收集过程中的质量控制显得特别重要,一般的质量控制措施包括下列几点:1. 调查员的选择:调查员应有严谨的工作作风和科学态度,诚实可靠是调查员应具备的基本品质。一般认为,具有高中或大学毕业文化程度的30-40岁的女性是较好的人选。另外,调查员的年龄、性别、种族、语言、社会经济地位等最好与研究对象相匹配,应具有调查所需的专业知识。2. 调查员培训:调查员的工作作风、科学态度、调查技巧与技术,临床医生和实验技术人员的经验等都将直接影响调查结果的真实性和可靠性。因此,在资料收集前,应对所有参加调查者进行严格的培训,掌握统一的方法和技巧,并要进行考核。3. 制定调查员手册:由于队列研究所涉及的调查员多,跨时长,因此编一本调查员手册,内列全部操作程序,注意事项及调查问卷的完整说明等是十分必要的。4. 监督:常规的监督措施包括:由另一名调查员作抽样重复调查;人工或用计算机及时进行数值检查或逻辑检错;定期观察每个调查员的工作;对不同调查员所收集的变量分布进行比较;对变量的时间趋势进行分析;在访谈时使用录音机录音等。应注意将监督结果及时反馈给调查员。第四节 资料的整理与分析随访结束以后,首先应对资料进行审查,了解资料的正确性与完整性。对有明显错误的资料应进行重新调查修正,或剔除;对不完整的资料要设法补齐。在此基础上,先对资料做描述性统计,即描述研究对象的组成及人口学特征、随访时间及失访情况等,分析两组的可比性及资料的可靠性;然后才作推断性分析,分析两组率的差异,推断暴露的效应及其大小。一、基本整理模式根据统计分析的要求,队列研究的资料一般整理成表4-3的模式。表4-3 队列研究资料归纳整理表病例非病例合计发病率暴露组aba+b=n1a/n1非暴露组cdc+d=n0c/n0合计a+c=m1b+d=m0a+b+c+d=t式中a/n1和c/n0分别为暴露组的发病率和非暴露组的发病率,是统计分析的关键指标。二、人时的计算队列研究由于跨时间较长,观察对象经常处于动态之中,队列内对象被观察的时间可能很不一致,因此以人为单位计算率就不合理。较合理的办法是加入时间因素,以人时来计算观察对象的暴露经历。在对队列研究资料进行分析之前,应计算不同组(暴露与非暴露组、不同年龄组,不同性别组等)的观察人时数,常用的人时单位是人年,常用的人年计算方法有下列三种。1. 以个人为单位计算暴露人年(精确法) 该法结果精确,但很费时间,如样本不太大时,可用此法计算。以某研究中的三个研究对象为例说明其计算方法(见表4-4和4-5)表4-4 3例研究对象的出生日期与进出研究时间编号出生日期进入研究时间退出研究时间11947.04.221986.08.201997.10.15(失访)21955.05.101981.12.121994.01.02(出现终点结局)31962.12.131990.03.022001.02.02(观察结束时仍健在)表4-5 3例研究对象的人年计算年龄组(岁)对象11947年4月22日出生对象21955年5月10日出生对象31962年12月13日出生暴露人年2581.12.1285.05.09共3年4个月27天合3.41人年90.03.0292.12.12共2年9个月10天合2.78人年6.193085.05.1090.05.09共5人年92.12.1397.12.12共5人年10.003586.08.2087.04.21共8个月合0.67人年90.05.1094.01.02共3年7个月22天合3.65人年97.12.1301.02.02共3年1个月20天合3.14人年7.464087.04.2292.04.21共5人年5.004592.04.2297.04.21共5人年5.005097.04.2297.10.15共5个月24天合0.48人年0.48合计88.08.2097.10.15共11.15人年81.12.1294.01.02共12.06人年90.03.0201.02.02共10.92人年34.13从表4-5结果可知,虽然总的观察对象只有3名,且进出研究对象的时间不一,但其观察经历可合并成一个总的统一的人时单位,即34.13人年。2. 用近似法计算暴露人年:如果不知道每个队列成员进入与退出队列的具体时间(精确到天),就不能用上述方法直接计算暴露人年数;如果研究样本太大,也不能用上法计算;另外,如果对暴露人年计算的精确性要求不高时,也没有必要应用精确法计算;此时,都可应用近似法计算暴露人年,即用平均人数乘以观察年数得到总人年数,平均人数一般取相邻两年的年初人口的平均数或年中人口数。该法计算简单,但精确性较差。假设某队列研究从1996年8月10日开始,开始观察人数为30054人,至2000年2月10日结束,结束时的人数为30023人,资料详列于表4-5,以说明其计算方法。表中35岁年龄组的人年数=(9836+9847)2+(9847+9857)2+(9857+9843)2+(9843+9840)26/12=34464(人年),余类推。表4-6 近似人年计算法年龄(岁)观察人数观察人年数1996.8.101997.8.101998.8.101999.8.102000.2.103598369847985798439840344644512593125681257812566125624400855647625763676437623762126714合计30054300513007830032300231051863. 用寿命表法计算人年 当观察对象人数较多,难以用精确法计算暴露人年,但又要求有一定的精度时,可利用简易寿命表的方法。该法计算简单,并有一定的精确度。常用的计算方法是规定观察当年内进入队列的个人均作个人年计算,失访或出现终点结局的个人也作个人年计算。其观察人年数计算式如下: (式4.2) (式4.3)式中Lx为x时间内的暴露人年数,Ix为x时间开始时的观察人数,Nx为x时间内进入队列的人数,Dx为x时间内出现终点结局的人数,Wx为x时间内失访的人数。试以表4-7的资料为例,说明其计算方法。表4-7 寿命表法计算人年实例观察时间(第x年)年初人数(Ix)年内进入人数Nx年内发病人数Dx年内失访人数Wx暴露人年数Lx129031238642928.5229541156762970.532987429182994.543002358342998.55299507182982.5合计3814874.5第一年的暴露人年数为=2903+(123-8-64)/2=2928.5人年=2903+123-8-64=2954L2=2954+(115-6-76)/2=2970.5人年依次类推,合计得14874.5人年三、率的计算结局事件的发生率的计算是队列研究资料分析的关键,根据观察资料的特点,可选择计算不同的指标。(一)常用指标1. 累积发病率(cumulative incidence) 当研究人群的数量比较多,人口比较稳定,资料比较整齐的时候,无论其发病强度大小和观察时间长短,均可用观察开始时的人口数作分母,以整个观察期内的发病(或死亡)人数为分子,计算某病的累积发病率。累积发病率的量值变化范围为01,其流行病学意义有赖于对累积时间长度的说明。2. 发病密度(incidence density)如果队列研究观察的时间比较长,就很难做到研究人口的稳定。如研究对象进入队列的时间可能先后不一;在观察截止前,可能由于迁移它处,其它原因死亡或其它原因退出,造成各种失访;研究对象出现终点结局的时间不同等原因均可造成每个对象被观察的时间不一样。如果观察期间为10年,而有的对象可能只被观察了3年、5年、7年或几年几个月不等,因此资料变得很不整齐。此时以总人数为单位计算发病(死亡)率是不合理的,因为提早退出研究者若能坚持到随访期结束,则仍有发病可能。此时需以观察人时为分母计算发病率,用人时为单位计算出来的率带有瞬时频率性质称为发病密度。最常用的人时单位是人年,以此求出人年发病(死亡)率。发病密度的量值变化范围是从0到无穷大。3. 标化比 当研究对象数目较少,结局事件的发生率比较低时,无论观察的时间长或短,都不宜直接计算率,而是以全人口发病(死亡)率做为标准,算出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观察人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比。最常用的指标为标化死亡比(standardized mortality ratio, SMR),这一指标在职业病流行病学研究中常用。标化比实际上不是率,而是以全人口的发病(死亡)率做为对照组而计算出来的比,是一个率的替代指标。例如某厂30-40岁组工人有500名,某年内有2人死于肺癌,已知该年全人口30-40岁组肺癌的死亡率2,求其SMR。 (式4-4)已知O=2,E=5002=1即某厂30-40岁年龄组工人死于肺癌的危险达到相应一般人群的2倍。如果某单位的历年人口资料不能得到,而仅有死亡人数、原因、日期和年龄,则可改算标化比例死亡比(standardized proportional mortality ratio, SPMR)。其计算方法是以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。例如某厂某年30-40岁年龄组工人死亡总数为100人,其中因肺癌死亡5人,全人口中该年30-40岁组肺癌死亡占全死因死亡的比例为2.2%,则即某厂30-40岁年龄组肺癌死亡的危险为一般人群的2.27倍。(二)显著性检验由于队列研究多为抽样研究,当发现两组率有差别时,首先要考虑抽样误差的可能,进行统计学显著性检验。1. U检验:当研究样本量较大,p和1-p都不太小,如np和n(1-p)均大于5时,样本率的频数分布近似正态分布,此时可应用正态分布的原理来检验率的差异是否有显著性,即用U检验法来检验暴露组与对照组之间率的差异。 (式4-5)式中P1为暴露组的率,P0为对照组的率,为暴露组观察人数,为对照组的观察人数,Pc为合并样本率,其中X1和X0分别为暴露组和对照组结局事件的发生数。求出u值后,查u界值表得P值,按所取的检验水准即可作出判断。2. 其他检验方法:如果率比较低,样本较小时,可改用直接概率法、二项分布检验或泊松(Poisson)分布检验;率差的显著性检验可以利用大家熟悉的四格表资料的卡方检验;对SMR或SPMR的检验,实际是所得结果值偏离1的检验,其检验方法可用X2检验或计分检验(score test),详细方法可参阅有关书籍。四、效应的估计队列研究的最大优点就在于它可以直接计算出研究对象的结局的发生率,因而也就能够直接计算出暴露组与对照组之间的率比和率差,即相对危险度RR(relative risk)与归因危险度AR(attributable risk),从而可直接准确地评价暴露的效应。1. 相对危险度(RR) RR也叫危险比(risk ratio)或率比(rate ratio),是反映暴露与发病(死亡)关联强度的最有用的指标, (式4-6)式中Ie和Io分别代表暴露组和非暴露组的率。RR表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。表4-8列出了一个常用的判断标准。表4-8 相对危险度与关联的强度RR关联的强度0.91.01.01.1 无0.70.81.21.4弱0.40.61.52.9中0.10.33.09.9强0.110很强 (Monson RA,1980)式4-6算出的相对危险度是RR的一个点估计值,是一个样本值。若要估计数值的总体范围,应考虑到抽样误差的存在,需计算其可信区间,通常用95%可信区间。计算相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论