第四章5.6.分析性研究(O)讲解_第1页
第四章5.6.分析性研究(O)讲解_第2页
第四章5.6.分析性研究(O)讲解_第3页
第四章5.6.分析性研究(O)讲解_第4页
第四章5.6.分析性研究(O)讲解_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分析性研究天津医学高等专科学校预防医学教研室分析性研究,又称分析流行病学。它是用来验证病因假设的流行病学方法。分析性研究可分为两类,即:病例对照研究和队列研究。一病例对照研究(一)基本原理:病例对照研究的基本原理是:根据研究对象是否患有某种疾病分组,然后,观察并比较病例组和对照组(非病例)对某种可疑因素的暴露情况有无差别,从而推断暴露因素与疾病的发生是否有联系。1.病例的选择与来源:(1)病例的选择:选择病例的原则为:①诊断正确;应制定明确的诊断标准,并尽量采用国际通用的或国内统一的诊断标准,以便于与他人的研究进行比较。②尽量选择新发病例,以控制回忆偏倚,从而提高病例的样本代表性;通常,新发病例对暴露因素的回忆较为真切,故其提供的信息较为准确、可靠;而现患病例则可能提供不准确的信息;死亡病例,主要由家属提供信息,故准确性更差;(2)病例的来源:①以社区为基础的病例来源;即:来自某社区(地区)总体人群中的全部病例或来自该总体随机样本中的全部病例。这些病例可以是普查或抽样调查发现的病例,也可以是社区疾病监测资料中报告的病例。②以医院为基础的病例来源;即:来自一家或几家医院在某一时期内住院或门诊的全部病例。虽然这些病例的样本代表性,不如以社区为基础的病例来源,容易产生选择偏倚;但由于实施方便,可由临床医师在医院内完成,并且,医院病人比较合作,资料容易得到,且比较可靠,因此,此种病例的来源,更为常用。2.对照的选择与来源:(1)对照的选择:选择对照的原则为:①对照应来自于产生病例的人群,并能代表产生病例的人群;②对照应具有和病例一致的某些特征(如年龄、性别等混杂因素),以减少混杂偏倚,从而使其与病例具有可比性;③对照不能患有与所研究疾病有共同已知病因的疾病;否则,也会产生混杂偏倚。(2)对照的来源:①医院中患有其他疾病的病人;这是实际工作中最常用的对照。因易选择,易合作。但其样本代表性较差。②社区人口中的非病例或健康人群;此种对照的样本代表性较好,即能代表产生病例的总体人群或源人群。③病例的配偶、同胞、亲属、邻居、同事、同学等;其中,邻居对照,可能有助于控制社会经济地位的混杂作用;同胞对照,可能有助于控制早期环境影响和遗传因素的混杂作用等。3.病例与对照的比较方法:包括:匹配(配对)比较法和成组比较法。通常,匹配法比成组法的统计学检验效率高。通常,匹配的因素不宜过多。匹配因素过多,主要有两个弊病,即:(1)对照不好找;一部分病例可能因难以找到合适的对照而被放弃,从而可影响病例样本的代表性。(2)容易发生匹配过度;造成病例组与对照组之间暴露率的差异变小或消失,从而可能会掩盖或低估暴露与疾病的关系。4.样本含量的估计:病例对照研究的样本大小,主要与以下4个因素有关:①研究因素在对照组中的暴露率(P0);②相对危险度(RR)或比值比(OR);但在病例对照研究中,不能计算相对危险度(RR),只能计算其近似值---比值比(OR)。5.资料的收集方法:包括:查阅现有记录资料(如:医院病案记录、疾病登记报告等)、访问、体检和实验室检查等,其中,以访问最为常用。访问是由调查员按照统一的调查表进行的调查。病例对照研究的信息取得主要靠调查表,并且,病例和对照应使用统一的调查表。6.设计调查表(或问卷):(1)调查表(或问卷)的一般结构:调查表(或问卷)通常包括4个部分:①说明部分:这部分主要说明调查目的,以取得调查对象的合作。②填写说明:即:为使调查对象能正确理解、填写和回答调查项目中的各种问题所作的说明。③核查项目:(或备查项目)核查项目是与调查目的和调查对象无关的调查质量控制项目。如:调查员姓名、调查日期、复核结果和某种问题的未调查原因等。它是为了便于核查、补填和更正错误而设置的,旨在保证调查项目填写的完整和准确。④调查项目:以人为观察对象的调查项目,主要包括以下内容:a.背景资料:如:调查对象的姓名、住址、单位、电话等。b.人口学项目:如:年龄、性别、民族、婚姻状况、文化程度和职业等。这些项目在调查研究中,常可成为可影响调查结果的非处理因素(或混杂因素),因此,在对调查资料进行统计分析时,常需用一些统计学方法,来消除各种混杂因素对研究结果的影响。c.研究项目:研究项目是调查表的核心内容。它是根据研究目的和调查指标所确定的、必须进行调查的项目。在对调查资料进行统计分析时,即根据研究项目中的数据计算统计指标。在调查项目中,研究项目和人口学项目均为可用于统计分析的项目。(2)问题的形式:在调查表中,问题的基本形式有提问和陈述两种。提问:即直接提出问题,并由调查对象回答。陈述:即陈述某一观点,然后由调查对象表达对这一陈述的态度。根据问题答案的形式,问题可分为开放式问题和封闭式问题两种。开放式问题,即对问题的答案不加任何限制,由调查对象自由回答的问题(如:填空和问答题);封闭式问题,即将问题的答案,限制在列于问题后面的两个或多个固定答案中,由调查对象用“是与否”或单项、多项选择的形式进行回答的问题(如:选择题)。(3)问题设计的一般原则:①尽量避免使用医学术语;以免调查对象因为不理解医学术语的含义,而无法回答问题。②避免词义混淆;即对语义模糊的一些词语,如:经常、偶尔、普遍、大概等,应给出本次调查的确切定义或标准;③避免双重问题;把两个不同的问题。合并在一个问题中,即所谓的双重问题。④避免诱导或强制;所谓诱导或强制,是指研究者有意或无意地引导调查对象向某一方向回答问题。⑤问题应适合全部调查对象;如:“您的孩子几岁了?”这一问题,就不可能适合全部调查对象。因为有的调查对象可能还没有结婚或结婚后还没有要孩子,因此对这些调查对象来说,就无法回答“孩子几岁了?”这样的问题。(二)病例对照研究的资料分析:病例对照研究的目的,就是通过对某种(或某些)可疑因素在病例组和对照组中的暴露情况进行比较,从而判断暴露因素与疾病之间是否有联系,以及联系强度的大小。一般可通过X²检验,判断暴露因素与疾病之间是否有联系;可通过计算比值比(OR),判断暴露因素与疾病之间联系强度的大小。1.成组设计的数据分析:(1)用X²检验,判断暴露因素与疾病之间是否有联系;①成组设计的病例对照研究的资料整理表为:

暴露病例对照合计有aba+b无cdc+d合计a+cb+dn暴露率a/(a+c)b/(b+d)-其中,如果暴露不分级,则可将研究数据归纳为四格表;如果暴露分级,则可将研究数据归纳为行×列表(R×C表)。②通常,用X²检验的四格表校正公式计算X²值;即:X²=(│ad-bc│-n/2)2n(a+b)(c+d)(a+c)(b+d)(2)用比值比(OR),判断暴露因素与疾病之间联系强度的大小;通常,可用相对危险度(RR)和比值比(OR)等指标,来判断暴露因素与疾病之间联系强度的大小。所谓相对危险度(RR),即:暴露人群的发病率(Ie)与非暴露人群的发病率(Iu)之比;其计算公式为:RR=Ie/Iu由于依据病例对照研究的资料,不能计算发病率,故也不能计算相对危险度(RR);因此,在病例对照研究中,常用比值比(OR)来反映暴露与疾病联系强度的大小。比值比(OR)即:病例组中暴露与非暴露的比值(a/c)与对照组中暴露与非暴露的比值(b/d)之比;其计算公式为:OR=ad/bc通常,比值比(OR)的含义,与相对危险度(RR)的含义相同,即:OR/RR=1,表明暴露与疾病无联系;OR/RR>1,表明暴露与疾病为正联系,说明暴露因素是疾病的危险因素;OR/RR<1,表明暴露与疾病为负联系,说明暴露因素是疾病的预防因子;OR/RR越接近于1,暴露与疾病的联系强度越小;OR/RR越远离于1,暴露与疾病的联系强度越大。由于OR值是通过一组样本调查所得到的点值估计,其与总体之间存在抽样误差,故还应估计总体OR值的可信区间;(通常为95%的可信区间)计算OR值可信区间的公式为:OR1±Uα/(X2)½如上例,OR值的95%可信区间为:即:该OR值(2.87)的95%可信区间为2.18~3.78;也即:按95%可信度(概率)估计,吸烟者患食管癌的危险性,高于不吸烟者的倍数,在2.18~3.78之间。OR1±Uα/(X2)½=2.871±1.96/(55.54)½=2.18~3.782.配对设计的数据分析:(1)用X²检验,判断暴露与疾病是否有联系;①配对设计病例对照研究的资料整理表为配对四格表,即:病例对照合计对子数暴露非暴露暴露aba+b非暴露cdc+d合计对子数a+cb+dn配对资料的统计分析,要以每一个对子(病例-对照)作为基本分析单位,不能把对子拆开作组间比较。②用配对四格表X²检验的校正公式计算X²值;即:X²=(│b-c│-1)2b+c(2)用比值比(OR),判断暴露因素与疾病之间联系强度的大小;配对四格表资料比值比(OR)的计算公式为:

OR=b/c

(3)计算OR值的95%可信区间;(三)常见偏倚及其控制:

偏倚是指:在流行病学研究中发生的系统误差。一般可将偏倚分为三类,即:选择偏倚、信息偏倚和混杂偏倚。1.选择偏倚:选择偏倚是由于所选择的研究对象不能代表总体人群而产生的系统误差。最常见的选择偏倚是入院率偏倚(伯克森偏倚),它是在选择医院病人作为病例与对照时,由于各种疾病病人的入院率不同(入院率低,对总体的代表性差),并且,病例与对照都不是总体人群中的随机样本,从而造成的偏倚。2.信息偏倚:信息偏倚是由于调查方法、仪器、人员等方面的问题,导致所收集到的信息资料与真实情况不符而产生的系统误差。常见的信息偏倚主要有:回忆偏倚、调查员偏倚等。控制信息偏倚的方法主要有:尽量采用客观指标、校正仪器、规范调查方法和收集资料的程序、对调查员进行培训、采用“盲法”收集资料、完善调查的质量控制方法(如:复查)等。3.混杂偏倚:混杂偏倚是由于混杂因素对研究结果的影响而产生的系统误差。混杂因素是与所研究的暴露因素和所研究的疾病均有关的、可能会掩盖或夸大暴露与疾病之间联系的非处理因素。(如:年龄、性别、工龄等)(四)病例对照研究的优缺点:1.优点:①所需样本量小,病例易获取,因此,工作量不大,所需的人力、物力也较少;②研究周期短,可以较快获得结果;③可以同时探讨多种因素与一种疾病的关系,故特别适合多病因疾病的病因研究;④特别适用于少见病(罕见病)的病因研究,常常是少见病(罕见病)病因研究的唯一选择;⑤容易进行,并可由临床医生在医院内完成,故为最常用的分析流行病学方法。2.缺点:①选择研究对象时,难以避免选择偏倚(因病例与对照都不是总体人群中的随机样本),故样本对总体的代表性难以保证;②获取既往信息时,难以避免回忆偏倚(属信息偏倚),故暴露测量(如:吸烟量)往往不够精确、可靠;③不能计算发病率和相对危险度(RR),只能计算比值比(OR);④结果的可靠性不如队列研究。二队列研究(定群研究、随访研究)(一)基本原理:队列研究的基本原理是:将研究对象按是否暴露于某种可疑因素分组,然后,观察并比较暴露组和非暴露组(对照组)的发病情况(发病率或死亡率),从而推断暴露因素与疾病的发生是否有联系。队列研究是从研究对象尚未患病或死亡时开始,经长时间随访,观察暴露者和非暴露者未来的发病或死亡频数是否有差别,是从“因”推“果”的研究方法,故又称前瞻性研究。队列研究的结果,也可作为判断暴露与疾病是否具有因果关系的依据。队列研究的目的主要是:①检验病因假设;即:验证某种暴露因素对某种疾病发病率或死亡率的影响,同时,队列研究也可观察某种暴露因素对人群健康的多方面影响。例如:观察吸烟与肺癌关系的队列研究,也可同时观察吸烟对人群其他疾病或健康状态的影响。队列研究可在病例对照研究初步找出病因线索的基础上,进一步检验和证实病因。②描述疾病的自然史;即:描述疾病的自然发展过程,包括:易感期、潜伏期(病例发生期)、临床前期、临床期到结局的全过程。(结局:即研究对象出现的结果)1.暴露人群的选择:(1)特殊暴露人群:即对某因素有高度暴露水平的人群(如:职业暴露人群等)。(2)一般人群:即在某地区的全部人口中,选择暴露于所研究因素的人群作为研究对象。这种暴露人群的样本代表性好,但并不常用,因为样本量大,工作量大,较难进行追踪观察等。(3)有组织的人群团体:如:医学会会员、工会会员、参加保险的人员、某些群众组织或专业团体成员等。因为这样的人群,便于随访观察,失访率较低(有利于减少失访偏倚),且易合作,故又称为便于随访的人群。2.非暴露人群(或对照人群)的选择:选择对照组的目的,是为了与暴露组进行比较,因此,要注意对照组与暴露组的可比性;即要求:对照人群除未暴露于所研究因素外,其他各种因素或人群特征(如:年龄、性别、职业、文化程度等)应尽量与暴露人群相同,以消除混杂因素的影响。队列研究的对照形式主要有:(1)内对照:即:暴露组与非暴露组(对照组)均来自同一研究人群。即在产生暴露队列的同一人群中,选择非暴露队列作为对照。队列研究应尽量选用内对照,因为它与暴露人群的可比性好(因在同一人群中),且易于选择,故内对照是最理想的对照。(2)外对照:即暴露组与非暴露组(对照组)来自不同的研究人群。外对照通常是在特殊暴露人群(如:职业人群)之外,另设的对照组。(3)一般人群对照:即:将暴露组与全人群(对照)作比较。由于一般人群的发病率或死亡率比较稳定,且容易得到,因此,用一般人群作对照,比较省时省力。(4)多重对照:即:同时设二个或二个以上的对照组。3.样本含量的估计:队列研究的样本含量,主要取决于以下4个因素:①非暴露人群或全人群中所研究疾病的发病率(Pu);②暴露人群中所研究疾病的发病率(Pe);③第一类错误(假阳性错误)的概率(α);④第二类错误(假阴性错误)的概率(β)和把握度(1–β)。把握度(1–β),即:能够拒绝无效假设(H0)的概率,或能够发现疾病与病因之间确实存在关系的概率,或有多大把握能发现疾病与病因之间的关系;例如:当把握度(1–β)为0.9时,则表明有90%的把握,能发现疾病与病因之间的关系。一般可通过查表法或公式计算,求得队列研究中的样本含量。(略)4.资料的收集方法:队列研究主要收集三方面的资料:(1)基线资料:基线资料,也称本底资料,即:有关研究对象与暴露因素在研究开始时的有关资料。其内容包括:①研究对象的筛选;即应在研究对象中排除已患所研究疾病的人员。例如:研究肥胖与高血压的关系时,应通过测定血压,将研究对象中已患高血压的人员剔除。②记录研究对象的有关情况;如:人口学特征(年龄、性别、民族、职业、婚姻状况、文化程度等)、饮食习惯、生活方式、居住条件、既往病史、现患疾病、体检结果、家庭情况与家庭成员患病史等。③详细调查暴露因素的量与暴露方式;暴露或未暴露,是队列研究分组的依据。对暴露的测量,应尽量采用客观方法(客观指标);如:污染物的测定值,各种生理、病理指标的测定值等。与生活习惯或生活方式有关的暴露因子(如:吸烟、膳食、体力活动等),可通过访问加以定量;例如:研究吸烟与冠心病的关系时,必须详细调查研究对象吸烟的数量、种类、方式、吸烟开始的时间等。(2)随访资料:即对研究对象进行跟踪观察(随访)所获得的资料。随访时间的长短,主要取决于暴露与疾病的联系强度和疾病潜伏期的长短,即:暴露因素的作用越强,随访的时间越短;潜伏期越长,随访的时间越长。①随访的目的:随访主要有3个目的,即:a.确定研究对象是否仍处于观察之中,即确定分母的信息(发病率或死亡率之分母)。b.确定研究人群中的结局事件,即确定分子的信息(发病率或死亡率之分子)。c.进一步收集有关暴露因素和混杂因素的资料,以备分析时用。另外,还应尽量避免失访。②随访的方法:a.直接法:即通过对研究对象的调查,直接获取信息的随访方法。包括:访问研究对象或其他能提供信息的人、定期家访、电话询问、信函调查、体格检查和实验室检查等。b.间接法:即通过医学记录或档案间接获取信息的随访方法。医学记录或档案包括:医院病历、死亡登记、疾病报告卡、人事档案、保险档案和劳保资料等。随访时,为减少失访,可单用一种方法,也可两种方法兼用。(3)结局资料:(或终点资料)结局(或终点)是指:研究者预期的、研究对象出现的结果(或研究对象出现了预期的结果)。通常,研究的目的不同,其研究的结局或终点也不同;例如:研究疾病的病因时,其研究的结局或终点,是所研究疾病的发生或死亡;进行预后研究时,其研究的结局或终点,则是所研究疾病的痊愈、死亡或致残等;结局(或终点)是随访的停止时间;例如:如规定发生冠心病或肺癌死亡为终点,则患了其他疾病(如:糖尿病)就不应视为已达终点,故还应继续随访;(4)队列研究资料的来源:①查阅现存纪录;如:出生、死亡登记、人口普查资料、疾病监测资料、医院病历、尸检报告、户籍登记和人事档案等。②调查询问(访问);即由调查员直接访问研究对象,并填写调查表收集资料的方法。这是收集资料的主要方式。应答率较高。③医学检查资料;如:各种体格检查和实验室检查资料等。④环境监测资料;如:环境中各种暴露因素的监测资料等。(二)队列研究的资料分析:队列研究的目的,是通过比较暴露组与非暴露组的发病率或死亡率,来判断暴露因素与疾病(或死亡)之间是否有联系,以及联系强度的大小。1.率的计算:(1)累计发病率(CI)与累计死亡率(CM):当观察总数的流动性较小,在数量上比较稳定时,可以计算累计发病率(CI)或累计死亡率(CM)。累计发病率(CI)或累计死亡率(CM),即:观察期内某病的新发病例数或死亡病例数(D),与观察期开始时的观察总数(N)之比。即:CI(或CM)=D/N(2)发病密度(ID):当观察总数的流动性较大,在数量上不稳定时,则应计算发病密度(ID)。因为前瞻性研究的随访观察时间很长,由于失访、死亡(死于其他疾病)、迁移、中途退出(超龄者退出某年龄组)、中途加入(低龄、适龄者进入某年龄组)等原因,可造成观察总数(分母N)的变动,因而对流动性较大的人群,不宜计算累积发病率(CI),而只能计算发病密度(ID)。发病密度(ID),即:观察期内某病的新发病例数或死亡病例数(D),与观察期内的人时数(PT)之比。即:ID=D/PT所谓“人时数”(PT),即观察人数与随访时间的乘积。其中,时间的单位可以是:年、月、日、时等,但最常用的是年。如:对1个研究对象,观察了1个月,计为1人-月;观察了1年,计为1人-年;观察了5年,计为5人-年等。这种以人-时数为分母计算的发病密度(ID),又称为人-时发病率(或人-时死亡率)。2.用X²检验,判断暴露与疾病是否有联系:队列研究的资料整理表为:病例非病例合计发病率暴露组aba+ba/(a+b)非暴露组cdc+dc/(c+d)合计a+cb+dn-与病例对照研究不同的是,队列研究可以计算暴露组和非暴露组的发病率;即:暴露组的发病率为:a/(a+b)

非暴露组的发病率为:c/(c+d)若经X²检验证实,暴露组与非暴露组发病率的差别有显著性意义,则说明暴露与疾病有联系,且很可能是因果联系。3.判断联系强度的指标:在队列研究中,判断联系强度的指标主要有:相对危险度(RR);归因危险度(AR);人群归因危险度(PAR)等。

(1)相对危险度(RR):(危险比、率比)即:暴露人群的发病率或死亡率(Ie),与非暴露人群的发病率或死亡率(Iu)之比。由于队列研究可以计算暴露人群和非暴露人群的发病率或死亡率,故也可以计算相对危险度(RR)。RR=IeIu=a/(a+b)c/(c+d)即:(2)归因危险度(AR):(又称:特异危险度、绝对危险度、超额危险度或率差)即:暴露组的发病率或死亡率(Ie),与非暴露组的发病率或死亡率(Iu)之差。即:AR=Ie

–Iu=a/(a+b)–c/(c+d)归因危险度(AR)表示:在暴露者中,完全由暴露因素所致的发病率或死亡率(即可归因于暴露的发病率或死亡率);或由于暴露而增加或减少的发病率或死亡率的大小。另外,当RR相等时,可通过AR判断暴露与疾病之间联系强度的大小;例如:当Ie与Iu之比,为0.02/0.01和0.00002/0.00001时,RR均为2,但前者的AR=0.01=1%;后者的AR=0.00001=1/10万;说明前者因暴露而增加的发病率或死亡率,比后者要大。AR与RR的区别是:RR说明:暴露者患某种疾病的危险性,是非暴露者的多少倍;而AR则说明:暴露者患某种疾病的危险性,比非暴露者大多少。(3)归因危险度百分比(AR%):即:在暴露组中,可归因于暴露的发病率或死亡率(Ie–Iu),占暴露组发病率或死亡率(Ie)或占全部病因的百分比。

(Ie–Iu)即:AR%=×100%

Ie

(3)人群归因危险度(PAR)与人群归因危险度百分比(PAR%):人群归因危险度(PAR),即:全人群某病的发病率或死亡率(It),与非暴露人群该病的发病率或死亡率(Iu)之差;即:

PAR=It–Iu人群归因危险度百分比(PAR%),即:在人群中,暴露于某因素所致的发病率或死亡率(It–Iu=PAR),占全人群发病率或死亡率(It)的百分比;即:PAR%=(It–Iu)/It×100%此外,暴露因素在人群中的暴露率(Pe)和暴露的相对危险度(RR),也可影响人群归因危险度百分比(PAR%)的大小;

Pe(RR–1)即:PAR%=×100%Pe(RR–1)+1PAR%可说明:人群中某病的发病率或死亡率,可归因于某暴露因素的比例;或:在完全控制暴露因素后,可能使人群中某病的发病率或死亡率下降的程度(百分比)。[此即暴露的社会效应]例如:有关吸烟与心血管疾病的前瞻性研究(队列研究)发现,吸烟者的RR为1.7,而人群中吸烟的比例(暴露率Pe)为55%;则:

Pe(RR-1)0.55(1.7-1)PAR%=×100%=×100%=27.8%Pe(RR-1)+10.55

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论