流行病学研究设计.ppt_第1页
流行病学研究设计.ppt_第2页
流行病学研究设计.ppt_第3页
流行病学研究设计.ppt_第4页
流行病学研究设计.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,流行病学研究设计,2,原则与策略,流行病学研究设计的原则和策略,就是在保证整个研究切实可行的前提下尽可能减少这两类误差,以达到准确的目的。减少随机误差以提高研究的精确性(precision)减少偏倚以提高研究的有效性(validity),3,原则与策略,提高研究的精确性随机误差主要来源于对研究对象的选择过程,这种随机误差被称为抽样误差或抽样变异。增加样本含量提高统计效率指在不增加样本含量的情况下,通过细致的研究设计而从研究对象获取尽可能多的统计信息。,4,原则与策略,提高研究的有效性尽可能减少在研究过程中可能产生的各类偏倚。,5,原则与策略,保证研究的可行性在研究的设计阶段就应充分考虑研究的可行性,包括研究人员的组成,是否拥有必要的仪器设备,经费是否充足,对研究实施过程中可能遇到的种种困难是否有解决的办法等。一个好的研究设计应是在保证研究切实可行的前提下,获得尽可能高的精确性和真实性。,6,流行病学研究设计类型,实验研究(experimentalstudy)准实验研究(quasi-experimentalstudy)观察性研究(observationalstudy),7,流行病学研究设计类型,实验研究实验室实验实验室实验用于检验病因假设并估计即时的生物学和行为的作用。实验对象往往有高度选择性,很少能代表一般人群,8,流行病学研究设计类型,临床试验往往局限于高度选择的人群,如确诊病例或其他志愿者。这种实验在流行病学中的应用已有悠久的历史。临床试验主要用于检验治疗或预防措施的效果。,9,流行病学研究设计类型,社区干预历时较长,一般需进行个月以上。它是在某一自然人群(社区)中开展针对某危险因素的一级预防。常用以测定改变某种个人行为、生物学特征或某环境条件后可能获得的收益。社区干预的结果可供卫生规划及决策参考。,10,流行病学研究设计类型,准实验研究临床或实验室研究实验对象自愿参加某实验组,例如接受饮食指导而改变饮食习惯,以控制轻度高血压,并与未接受饮食指导(未改变饮食习惯)组相比较。,11,流行病学研究设计类型,规划或策略研究:相当于没有随机分组的社区试验。它可评价干预的结果,以决定是否需作相应的规划或策略的变更。还可发现开展措施后没有预见到的问题、措施失败或成功的原因,并分析干预的成本效益,12,流行病学研究设计类型,观察性研究描述性研究与分析性研究,13,流行病学研究设计类型,基本设计均以个体作为分析单位横断面研究(cross-sectionalstudy)亦称患病率调查病例对照研究(case-controlstudy)病例对照研究中常用配对方法。队列研究(cohortstudy):亦称前瞻性研究或定群研究。研究开始时所有的人都无病,但有可能成为病例或死亡。,14,流行病学研究设计类型,杂交设计杂交设计包括结合两种基本设计、重复使用一种基本设计或将基本设计与非观察性设计相结合等多种形式。,15,流行病学研究设计类型,巢式病例对照研究(nestedcase-controlstudy):是杂交设计中最重要的类型,结合了队列研究和病例对照研究。在研究开始规定一个基本人群或队列,当时不考虑研究因素的情况。随访一段时期,检出了所有的新病例。比较新病例与同人群的非病例以往及目前研究因素的水平。非病例组或由人群中随机抽样或按新病例情况配对。基本人群可以是固定的,犹如队列研究,亦可以是动态的。,16,流行病学研究设计类型,病例交叉研究(case-crossoverstudy):可认为是配对病例对照研究的一个特例。用于估计某种暴露因子(如喝咖啡)对在随后的效应期内(如疾病发作前一个小时)发生某种罕见的、急性发作性疾病(如心肌梗塞)的短时效应。所有的研究对象均为新发现的该病病例,以自身作为对照,比较病例在疾病发作前短时期(如一小时)内的暴露与其既往(如上周同一时间或上一年度)对同一因素的暴露史。,17,流行病学研究设计类型,随访患病率研究(follow-upprevalencestudy):此种研究结合了队列设计和横断面设计,但两者的基本设计均未全部保留。常用于设计时未被观察者考虑到的、可能由研究因素所致的疾病。,18,流行病学研究设计类型,重复调查(repeatedsurvey):指在同一动态人群中,间隔数年重复进行两个或更多的横断面调查。每次获得个体的研究因素水平及现患疾病情况,但只随访人群,而不是随防个人。重复调查往往用于了解人群健康状况的变化,明确这些变动趋势与各研究因素的关系。,19,流行病学研究设计类型,调查随访研究(surveyfollow-upstudy):此研究结合了横断面设计和队列设计。首先,横断面研究靶人群的一个随机样本,接着对该人群中未患该病的、但仍有发病风险的人作队列研究。因而观察者可估计同一靶人群的患病率及发病率。,20,流行病学研究设计类型,重复随访研究(repeatedfollow-upstudy):亦称重复测量研究。为有两个或更多连续随访期的前向设计,这种设计以队列研究为主。其总随访期可分成二三个亚期。一般有次或次以上的检查或访问,间隔数月至数年,收集全体参加者有关研究因素和疾病的资料,因而可估计不同暴露组在各亚期的发病率。这对研究因素改变与疾病关系的研究特别有用,可探索病因和呈现长短不一的疾病自然史,并可观察两种疾病的关系。,21,流行病学研究设计类型,干预随访研究(interventionfollow-upstudy):将一个队列设计与一个非观察性设计的全部或部分相结合,每种都有一个不同结局。开始为一固定队列,可以随机亦可不随机地给予研究因素或措施,并随访两个相继的时期。一般第一个随访时期较短(几分钟至几天),以估计急性生物学副作用或行为副作用;第二个随访期较长,以估计长期或慢性影响。该类研究可以检验急性反应与慢性健康影响的关系,还能检验引起短期生物学副作用或行为副作用的机制。,22,流行病学研究设计类型,不完全设计不完全设计指缺少一个或几个有关因素信息的研究。生态研究(ecologicstudy):亦称集聚研究或描述研究。分析单位是组而不是个体。生态研究包括发病、患病或死亡资料,但死亡资料用得最多。,23,流行病学研究设计类型,()生态比较研究(ecologiccomparisonstudy):单纯比较各组(一般大于或等于10组)在某一时点暴露与疾病的频率。“生态学谬误(ecologicfallacy)”指群体中两个生态学上变量的相关与该人群中这两个变量的关系显著不同。()生态趋势研究(ecologictime-trendstudy),24,流行病学研究设计类型,比例研究(proportionalstudy):此研究只有对病例的观察,而非病例的有关研究因素情况不明。可看作是横断面调查的一种特殊类型,收集某人群中死亡病例或某研究因素的资料,比较总死亡中死于此疾病者的此研究因素的水平。或作为病例对照研究中的一种特殊类型,比较不同疾病患者暴露于此研究因素的水平。,25,流行病学研究设计类型,空间时间集研究(space-timeclusterstudy)空间集为病例在不同地区上的不均匀分布,往往认为提示了疾病的传染关系或环境病因。时间集为病例在不同时间的不均匀分布。时间集的研究可以证实疾病在人群中的长期变化,证实和观察疾病的局部流行,证实周期性、不完全的时间趋势。,26,流行病学研究设计类型,家庭集研究(familyclusterstudy):是不直接观察研究因素,而在家庭中检查疾病发生情况的设计,目的是定量阐明遗传因素在病理过程中的作用。没有一个疾病是完全由遗传因素或完全由环境因素造成的,家庭集研究不是将疾病分成遗传及非遗传的两类,而是证实导致疾病在人群中呈特殊分布的某基因和环境的交互作用。,27,流行病学研究设计类型,()家庭聚集性研究(familialaggregationstudy):是一种特殊类型的队列或横断面设计,不需收集研究因素的信息。在选择对象及分析资料时,将对象按家庭分为若干个单位(一般大于或等于10)。这种研究可获取发病率或患病率的资料,其目的是了解疾病在家庭中以及不同家庭间的变化。不同家庭间的变异愈大,表示家庭聚集性愈大。家庭聚集可以因遗传,亦可因共同环境而形成。,28,流行病学研究设计类型,()双生子研究(twinstudy):更能证实遗传病因的作用。将所有双生子分成同卵双生子或异卵双生子,并了解他们疾病的一致性或不一致性。同卵双生子较异卵双生子疾病的一致率高,提示病因中有遗传的成分。但两类双生子的一致率差别有统计学意义并不能完全排除环境因素的影响。,29,流行病学研究设计类型,()家系研究(pedigreestudy):在一个或多个(至少包括三代)大家庭中研究疾病。其目的是证实某些疾病的遗传机制,并将他们每个人的表型分类。家系研究提供较多的遗传信息,对定量特征(如血压)的研究或表型易受环境影响者,如某些肿瘤和精神障碍尤为有用。,30,流行病学调查表,调查表是流行病学工作者收集资料的主要手段。调查表设计的目的与原则是保证所获得的信息的准确性与可靠性。准确性是指用调查表从研究对象所获取的信息资料的真实程度,可靠性是指在相同条件下,同一调查表重复用于同一研究对象,获取相同结果的程度。,31,流行病学调查表,调查表的种类不同的调查方式需要不同设计方式的调查表。常见的流行病学调查手段有信访调查、面访调查和电话访问调查。面访调查使用得最多,随着我国的社会进步和经济发展,通过电话访问进行调查会逐渐受到重视。,32,流行病学调查表,信访调查表是通过邮局邮寄或直接送达研究对象,由研究对象自行填写的一种问卷,因此信访调查表内容应简单明了,便于调查对象理解和应答。信访调查的优点是简便易行,节约经费和时间。缺点是易存在被误解或被忽略不答的问题。采用信访调查,许多人往往不返回调查表,应答率很低,易导致偏倚。在城市中信访调查一次仅约70%回答,二次、三次才能达到80-90%回答率。一般说来,应答者多为受过良好教育者或对调查内容比较感兴趣者。,33,流行病学调查表,面访调查表面访是流行病学研究获得信息的常用形式,可获得较高的应答率,但较信访与电话访问费时、费力。对一些涉及个人隐私的敏感问题如有关个人吸毒或性行为的问题,面对面的访问难以获得真实的答案。,34,流行病学调查表,电话访问调查表电话访问是采用电话询问调查表内容获得研究所需信息的一种方法。当调查员与调查对象间存在着交通上和预约时间上的不便时,采用电话访问较为理想。电话访问的一个特点是可减少调查者与调查对象面面相对,这一点在城市调查尤为重要,35,流行病学调查表,调查表的内容与结构调查项目调查表中的项目要精选,需要的项目一个也不可少,不需要的项目不应出现。项目的定义要明确,使人不易误解,尽量做到不用说明或少加说明也能标准统一。如疾病的诊断,化验指标的正常与异常等的界限都应该明确规定,不可模棱两可。,36,流行病学调查表,问题的类型通常有两种设计:一是封闭式,即针对某一问题同时列出两个或多个固定的答案供调查时选择填写。优点是简单明了,记录整理方便。缺点是有时所提供的固定答案不能概括所有实际答案,而如果提供的固定答案太多,又会增加调查时确切判定的困难。,37,流行病学调查表,另一是开放式,适用于较复杂的情况。它不限制答案的范围,让调查对象尽情应答。优点是可以补充固定选择答案的不足,有时可发现一些超出预料的有启发性的问题。缺点是容易离题,标准化程度低,整理分析困难。,38,流行病学调查表,调查表的基本结构包括调查表的名称、编号、一般项目如姓名、性别、出生日期、出生地、民族等、调查研究项目如疾病史、职业暴露史、家族遗传史等、结束部分如调查员签字、调查日期等。,39,流行病学调查表,调查表的格式可分为一览表和一人一表式,一览表每张可填写多个观察单位,适用于项目较少的调查。一人一表式每张只填一个观察单位,适用于调查项目较多时。调查表的填写应力求简单清楚,多用选择、填空以及简单的符号或数字,少用文字回答。必要时应编制填写说明。,40,流行病学调查表,调查表设计中应注意的问题调查问题的多少应根据具体的研究目的,设置适当的问题数量。设计的问题过少,可能不足以得到所需信息,而设计问题过多,可能会导致研究对象反感,导致在最初几个问题之后,出现漏答和不准确答案。,41,流行病学调查表,调查问题的顺序许多调查表往往以比较轻松的问题开始询问,可能的话,以研究对象感兴趣的问题开头。敏感的问题一般跟在相关的但不太敏感的问题之后。这样一方面可以通过比较轻松的问题在调查员与调查对象之间建立一种互信关系,另一方面避免因问题敏感而使调查对象不能很好合作。,42,流行病学调查表,调查问题的用语调查表的类型确定后,调查员在拟定调查问题时,调查用语问题特别重要,应使用调查对象熟悉和容易理解的词语,在一些特殊人群中对某些现象常有特定的惯用语,需要通过深入访谈或预调查获得。,43,流行病学调查表,调查问题的设计调查表所用的问题应尽量明确且简洁明了。如果一个问题过于复杂,将很难得到满意的应答。此外,在设计可供选择的答案时,应避免区间划分上的重叠。,44,流行病学调查表,调查持续时间每份调查所需的时间与调查表设计的问题是密切相关的。一般情况下,面访30-90分钟;电话访问10-30分钟;信访10-20分钟,在实践中是可以被调查员和研究对象接受的。时间太长,研究对象难以坚持到访问结束,且随着访问时间的延长,调查员和调查对象的注意力难以集中,应答的质量会有明显下降。,45,流行病学调查表,一份理想的调查表往往要经过预调查或在正式调查过程中反复予以修改而得到的。,46,应答率对研究结果的影响,应答率(responserate)是流行病学和公共卫生研究的一个重要组成部分,是对研究的有效性和推广的重要测量及对其进行初步判断的尺码或准绳,特别对以人群为基础的研究显得尤其重要。,47,应答率对研究结果的影响,高的应答率不仅可以降低每个应答者的成本,获得研究所需的足够样本,而且可减少无应答偏倚的程度和概率。低的应答率不仅会降低统计检验效率,更重要的是能给研究的结果带来偏倚,影响研究结果的有效性和泛化。,48,应答率对研究结果的影响,应答率也可以有助于杂志的编辑和读者了解研究结果中可能含有的无应答偏倚的程度。但通常由于对无应答者的信息知之甚少,无应答偏倚在评估流行学调查结果时经常被忽略。,49,应答率对研究结果的影响,“应答率”一词被普遍使用和经常用作判断流行病学研究方法的适当性或充分性。但还没有一个标准的应答率定义。Kviz(1977)对应答率下了一个较为正式的定义:应答率是合格的参加者在某项研究中所选择的全部合格对象中所占的比例。,50,应答率对研究结果的影响,完成率指的是某项研究中所选择的全部对象中合格参加者所占的比例合作率指的是某项研究所选择的全部对象中所能联系到的合格者中,参加者所占的比例联系率指的是某项研究所选择的全部对象中,在调查过程能联系到者所占的比例。,51,应答率对研究结果的影响,这些不同是因为抽样设计有误和不是所有被选择的对象都是真正合格并能参加研究的,或是合格但拒绝参加,或在调查过程中无法找到研究对象。,52,应答率对研究结果的影响,应答率的计算从上面可知,要计算应答率,必须对抽样人群有一个明确的定义,如果没有这样的定义,就没有评判所选择的研究对象是否合格的标准。类似地,只有样本中所有成员的合格性被确知时,才能计算出一个有效的应答率。参与者或合作者是否合格通常是知道的,但是无应答者是否合格也许是不知道的。,53,应答率对研究结果的影响,某些研究要求在选择研究对象之前,先随机选择家庭,再在被选取的家庭中选择研究对象,对这样的研究计算应答率就更困难了。这是因为如果最初的反应者拒绝提供任何有关家庭成员的组成信息,便不可能去确定该家庭中是否含有合格的反应者。,54,应答率对研究结果的影响,在这些研究中,最后计算的“应答率”是家庭同意提供有关选择反应者信息的比例与被选择反应者完全参加的比例的乘积(最少只有在拒绝提供家庭成员组成信息的家庭中,含有一个合格应答者的比例和不拒绝提供信息的家庭中的比例相同时,这个计算的“应答率”才是真正的应答率)。,55,应答率对研究结果的影响,应答率=完成率=合作率=联系率=,56,应答率对研究结果的影响,I:合格的完全参与者人数;P:合格的部分参与者人数;R:合格的拒绝参与者人数(包括生病不能参与的人);NE:能联系到但不符合研究标准的人数;NC:无法联系到的人数(研究对象选定后,不能与该人联系了解其是否合格);NCE:假定无法联系到但合格的人数。,57,应答率对研究结果的影响,在上述应答率的计算公式中,NCE的确定是非常困难的,这是因为无应答者的合格性是难以确定。但是我们通常可以假设所有无应答者都是合格的或所有无应答者都不是合格的来计算可能的应答率范围。这种方法也许比只计算其中一种好。另外,如果有些参加者只部分参与(即只收集到部分信息),我们可以分别计算主要有意义的项目(变量)的应答率,这也许比只计算总的应答率来得好。,58,应答率对研究结果的影响,无应答与应答的某些特征无应答者的一些特征是明显不同于应答者的。无应答者一般更可能是年老者和教育程度低者,家庭主妇、个体户、无职业者的无应答率也高于受雇用(有职业)的人,比较关心健康的人应答率高于比较不关心健康的人。,59,表4-1无应答者与应答者的特征比较,a无应答者与该特征的联系方式是基于一个或二个显著联系的研究结果;b无应答者与该特征的联系方式各研究报道不一致。,60,应答率对研究结果的影响,无应答与偏倚由于无应答者与应答者的某些特征不同,使得只有应答者的样本不能很好有效地代表靶人群,这也许会导致几种对流行病学者来说很重要的偏倚:1)在研究的开始,对疾病的患病率或健康状态的估计中产生偏倚;2)在估计暴露的特征中产生偏倚;3)在随访研究中对疾病发病率和死亡率的估计产生偏倚;4)在估计RR和OR中产生偏倚。这种偏倚的程度依赖于任一研究中的无应答率和无应答者跟应答者两者在有意义特征上的差别。,61,应答率对研究结果的影响,表4-2靶人群疾病与危险因素的抽样及应答率情况,62,应答率对研究结果的影响,在病例对照研究中,可以用下列表达式来表示应答者的粗ORR和靶人群粗ORP之间的关系:,63,应答率对研究结果的影响,如果Pa、Pb、Pc和Pd已知,则靶人群的ORP可以由应答者的ORR求得,以及可以对无应答偏倚的程度进行评估。从上式也可知,给定危险因素状态下,如果有病者和没病者的应答率是相同的(即:Pa=Pb和Pc=Pd),则在具有不同危险因素的状态下,应答率的不同不会对ORR产生偏倚。类似地,给定疾病状态下,如果有危险因素者和没有者的应答率是相同的(即:Pa=Pc和Pb=Pd),则不同疾病状态的应答率不同也不会对ORR产生偏倚。,64,应答率对研究结果的影响,例如在CriquiMH和AustinM等以人群为基础的心血管疾病研究中,合格的研究对象为6155人,有82.1%的人参加了问卷调查和提供了血液样本。问卷调查的主要内容包括6个心血管病的危险因素(心脏病发作家族史、中风、糖尿病、个人高血脂史、高血压和吸烟)和4种疾病(心脏病发作、心力衰竭、中风和糖尿病)。研究后使用同样的问卷以电话访谈的方式对没有参加者进调查,没有参加者中有60%的接受了电话调查。,65,应答率对研究结果的影响,这样可以对Pa、Pb、Pc和Pd进行估算,进而由上面的表达式和ORR计算每个危险因素疾病的ORP。PaPd/PbPc的值在0.65-1.63之间,也就是说,ORR的偏倚幅度达到了-35%至63%。这样即使在总应答率高达82.1%的研究,在某些OR中也能观察到明显的偏倚。,66,应答率对研究结果的影响,在队列研究中,假设有1000人中年男性无病的靶人群,其中200人具有一危险因素(如高胆固醇),其它800人没有这一个危险因素,在随访10年后,10%或100人发病(如冠心病),其它900人没有发病,其RR=(表4-3),结合表2作说明,当Pa=Pb=Pc=Pd=总应率时,应答样本才是靶人群的一个无偏代表样本。例如,表4-4为应答率为75%的靶人群的准确代表性应答人群,其Pa=Pb=Pc=Pd=75%,RR仍为2.67,没有发生改变。,67,表4-3靶人群表4-4准确代表的应答人群,68,应答率对研究结果的影响,失访是无应答的另一种表现形式,在这里我们将最初的无应答和以后的失访所造成的偏倚总称为无应答偏倚。,69,应答率对研究结果的影响,1)纯危险因素无应答偏倚(Pureriskfactornonrespondentbias):应答率在危险因素的分类上不同,但在给定每个危险因素的分类,在发病与不发病上其应答率是相同的,即:PaPc和PbPd但Pa=Pb和Pc=Pd。这种应答率的不同不会对RR的估计产生偏倚,但会改变队列研究中的疾病的发病率和死亡率(当然是RR不等于1)。,70,应答率对研究结果的影响,例如:当有危险因素的应答率为80%,即Pa=Pb=80%,没有危险因素的应答率Pc=Pd=60%时,其RR估计值为2.67,没有发生变化,但发病为10.6%,发生了改变(表4-5),表4-5产生纯危险因素无应答偏倚的应答人群,71,应答率对研究结果的影响,2)纯疾病无应答偏倚(Purediseasenonrespondentbias):应答率在疾病的分类上不同,但在给定每个疾病状态,在具有与不具体某危险因素上其应答率是相同的,即:PaPb和PcPd但Pa=Pc和Pb=Pd。这种不同的应答率会对RR的估计产生偏倚(当然是RR不等于1)。,72,应答率对研究结果的影响,例如:当有80%最终发病的人应答,而没有发病的只60%应答,即Pa=Pc=80%和Pb=Pd=60%(表4-6)时,其RR估计值为2.56,低于靶人群的2.67,同时发病率12.9%,高于靶人群的10%。表4-6产生纯疾病无应答偏倚的应答人群,73,应答率对研究结果的影响,3)联合无应答偏倚(Combinednonrespondentbias):当应答人群不能准确代表靶人群时,联合无应答偏倚将以不同于纯危险因素和纯疾病应答偏倚产生的方式发生,即当:和;和;和;和时,联合无应答偏倚就会发生。,74,应答率对研究结果的影响,但它对研究结果产生的偏倚比前面两种来得复杂多,它可以改变研究结果的RR值(如表4-7),但非充分的,即联合无应答偏倚不一定改变RR的值,例如,在暴露组和非暴露组疾病的发病率都因联合无应答偏倚减少一半时,研究结果RR是不改变的(表4-8)。,75,表4-7产生联合无应答偏倚的应答人群Pa=90%,Pb=60%,Pc=40%,Pd=70%RR=6.162.67发病率=8.90%10%表4-8产生联合无应答偏倚但不改变RR值的应答人群Pa=40%,Pb=90%,Pc=35%,Pd=72.84%RR=2.67发病率=5.14%10%,76,应答率对研究结果的影响,另外联合无应答偏倚是独立于危险因素的出现率和随访后的发病率,即使应答样本的危险因素的出现率和疾病的发病率与靶人群相同,联合无应答偏倚也能够发生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论