




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
现场调查资料的分析方法经过现场资料收集、整理阶段后,即进入现场调查资料的分析阶段。现场调查资料的分析方法在设计阶段就应该有一个全面的分析计划,本章将围绕不同的资料类型,详细阐述现场调查资料的分析方法。第一节 现场调查资料的分析计划和步骤一、分析方法的选择原则 进行现场调查资料的分析时,选择恰当的现场调查资料分析方法非常重要。如果分析方法选择不当,将会得到错误的结果。选择现场调查资料的分析方法应当遵循以下原则:1、明确现场调查的类型不同的现场调查类型,如横断面调查研究、生态学调查研究、病例对照调查研究、队列调查研究、现场流行病学试验等,其分析方法均不相同。因此,在进行现场调查资料的分析时,应明确现场调查的类型。2、 2、分析研究资料是否存在混杂偏倚混杂偏倚往往会对结果产生不良的影响,如果资料存在混杂偏倚,则应进行分层分析。3、 3、分析方法由浅入深对现场调查资料的分析,应首先选择简单的统计分析方法。如先进行描述性统计,然后选择恰当的显著性检验方法。先进行单因素分析,然后进行多因素分析等。二、分析的计划和步骤现场调查前必须有一个周密的调查计划,即使是爆发性调查,也不能盲目入手,因为只有在合理的调查设计下,才能得到可靠的现场数据,进行相关的分析。本章因只涉及现场调查资料的分析方法,故此仅论述现场调查资料的分析步骤。(一)资料的整理原始数据往往是不能直接进行分析的,根据现场调查的设计类型和目的,将资料整理成所需要的形式。整理过程包括:1、原始调查表格的整理、核对 重新找到调查对象核实漏填、误填项目,删除缺项太多的调查表格。调查表格的设计、调查员的培训非常重要。2、现场调查资料数据库的建立和资料输入 根据样本大小可选择合适的软件建立数据库,资料输入时最好设计能自我纠错的功能,资料输入需要恰当的编码。(二)描述性统计描述调查对象的一般特征,如计算不同年龄、性别、职业、疾病类型的构成比,计算疾病发病频率指标、患病频率指标、死亡频率指标等等。(三)推断性统计推断性统计主要是计算相关的指标,如比值比、发病率等,并进行假设检验。假设检验的方法既有单因素分析方法,也有多因素分析方法。如2检验、回归分析等。根据资料的类型,还可选择分层分析。第二节 描述性现场调查研究资料的分析 一、调查研究资料的种类描述性现场调查资料包括现况调查资料、筛检资料、生态学资料。其中现况调查资料主要指普查资料和抽样调查资料。普查资料是调查某一人群的所有成员,抽样调查是根据统计学随机抽样的原理,对某一人群中有代表性的部分进行调查,并通过样本信息推断总体。筛检是现场流行病学调查常用的方法,对早期发现和早期诊断病人具有重要的意义,筛检的评价方法与临床诊断试验具有相似之处,而通过筛检得到的资料分析方法则与现况调查资料的分析方法类似,只是因为资料获取的途径不一,所以在具体分析上有一些差异。生态学研究资料比较特殊,因为其研究观察单位是群体而不是个体,是根据研究人群的某些信息来测量目标人群的暴露和疾病或健康状态的关系,生态学研究存在混杂因素难以控制、容易发生生态学谬误等缺点,故进行生态学推断时常常难以深入。二、调查资料的分析方法描述性现场调查资料的分析方法相对简单、易行。主要是分析研究对象的基本特征,计算不同人群的各种比率,也可进行不同人群的统计学检验。(一)现况调查资料的分析1、现况调查资料的特点普查资料的特点有:数量大;资料的质量难以保证;核对工作很困难,所以普查的前期工作至关重要,根据普查资料可分析疾病的三间分布特征。抽样调查资料的特点是样本数量较普查少;不同的抽样方法抽样误差大小不同。抽样调查资料利用了统计学原理与方法,通过样本信息推断总体特征,节约了大量人力、物力与财力, 2、资料分析方法和步骤 (1) 原始资料的检查、核对与计算机输入 现况调查一般样本量都比较大,调查项目多,容易出现各种差错,所以分析前必须先做资料的审核与整理。资料的检查、核对工作往往需要人工进行,如审查资料的完整性、准确性,填补缺漏项,纠正错误项等。剔除不合格调查表时应持慎重态度。原始资料检查、核对完毕后就进行计算机输入。在计算机输入之前,应该根据原始资料的信息容量建立数据库,可选择Visual Foxpro、Visual Basic、Epi等软件,如果数据容量不大,也可选择Excel或直接利用统计分析软件包建立数据集。数据库结构的设计必须便于统计分析。(2) 对疾病或健康状况按明确规定的标准分组归类,可利用计算机直接输出分组分类的表格,在SAS等统计软件中都有相关的程序完成这项功能。(3) 计算相关指标根据不同的人口学特征,计算不同时间、不同地区或其他相关特征人群的疾病发病率、患病率和死亡率等,了解疾病在三间分布和其他特征上的基本情况,结合患病率或感染率的差异分析影响分布的因素,提供病因学研究的线索及干预效果评价的基线资料。根据抽样调查所得的患病率或发病率等,可计算可信区间来估计总体率所在的90%或95%的范围。现况调查还可以获得人群中某种危险因素的暴露情况或具有某种行为的现状,可计算相应因素的暴露率。分析行为因素与疾病发生或死亡之间的联系、环境因素与疾病发生或死亡的关联等。 (4) 进行不同因素不同指标的统计学检验; 运用统计学方法计算疾病在三间分布和其他特征上的差异是否有显著性意义,还可进一步分析某种分布特征与其他因素的关联强度。经常采用的统计学方法如卡方检验、相关回归分析等。现况研究的分析比较简单,此处不作叙述。(二)筛检资料的分析筛检资料一般具有如下特点:资料常来源于某一疾病的高危人群;计算的发病率、患病率等不能外推至一般人群;获取的资料有助于早期发现和早期诊断病人。筛检资料的分析方法、步骤与现况调查基本相同,只是结果的外推具有局限性,筛检试验的评价见第三章。 (三)生态学研究的资料分析1、生态学研究资料的特点是资料以群体为观察、分析单位;分析结果可能会产生生态学谬误。生态学研究资料分析方法1)生态学研究利用的资料经常是常规资料或现成的数据库资料,一般采用生态比较研究和生态趋势研究,应用统计学的比较、分析即可达到研究的目的,如相关与回归分析、图示法等。2)对于多组比较研究设计的资料,可采用的分析方法有:(1) 直线回归与相关分析以各组因素的平均暴露水平作为自变量,以疾病的发生频率作为因变量进行回归分析,拟合直线回归方程。 (5-1) 式中为疾病y的预测值,x为平均暴露水平,为y轴上的截距,为生态学回归系数。 生态学相关系数r的计算公式是: (5-2)式中和分别为x与y的方差。相关系数的大小和符号反映了暴露与疾病联系的强度和联系的方向,说明暴露水平改变一个单位,疾病发生的频率是否也成比例的增加或减少。(2) 计算相对危险度和人群归因危险度百分比 (5-3) (5-4)P为人群中研究因素的暴露比例。(四)实例分析与评价实例5-1:某研究组调查了36个地区的肺癌死亡率与大气飘尘污染的关系,资料如表5-1,试利用生态学研究的方法进行分析。 (1) 图示法 从表5-1中可以看出,随着地区飘尘浓度的升高,年龄标化肺癌死亡率有增高的趋势。从生态学研究的角度看,飘尘与肺癌的发生可能存在某种联系。 (2) 回归与相关分析 以飘尘浓度作为自变量,年龄标化肺癌死亡率作为因变量,配合直线回归方程:, 表5-1 36个地区飘尘浓度与年龄标化肺癌死亡率地区编号年龄标化肺癌死亡率(1/10万)飘尘浓度(毫克/立方米)地区编号年龄标化肺癌死亡率(1/10万)飘尘浓度(毫克/立方米)111.820.231514.800.34214.900.291618.450.68316.740.541715.800.59414.400.571816.750.57521.010.881922.040.87616.740.542017.760.57714.400.562114.560.61811.750.202211.050.19919.200.832319.560.871017.760.582415.560.541115.800.612516.850.601218.420.622619.100.811315.810.642715.590.631417.790.392816.410.49回归模型的假设检验(F=68.07, P0.0001)结果表明飘尘浓度与肺癌之间存在直线回归关系。生态学相关系数:(P0.80,说明飘尘浓度与肺癌之间存在较强的联系,飘尘浓度可能是这些地区肺癌死亡的原因之一。 相对危险度的估计: 相对危险度的估计值为1.87,说明飘尘浓度为1毫克/立方米的地区,肺癌死亡危险是飘尘浓度为0地区的1.87倍。 生态学研究的结果可为病因探索提供佐证,上述结果提示大气中飘尘污染可能是肺癌发病的原因,如需要进一步验证病因,则还应进行其他深入的研究。第三节 分析性现场调查研究资料的分析一、分析性研究资料的种类与特点分析性研究资料主要包括病例对照研究资料和队列研究资料。病例对照研究资料的特点是回顾性资料、产生偏倚的可能性较大。队列研究资料属前瞻性,没有回忆性偏倚,但存在失访偏倚,与病例对照研究相比偏倚较少。队列研究可直接计算发病率、相对危险度等。二、分析性现场调查研究资料的分析方法与步骤(一) 病例对照研究资料分析方法和步骤1、研究资料的描述性统计描述研究对象一般特征,如性别、年龄、职业、出生地、居住地、疾病类型的分布等。另外,应简单描述病例对照研究资料的概况、特点,包括病例及对照的来源、选择方法,病例组占总研究例数的比例,调查工作的质量,无应答者的比例,回忆内容的可信程度等方面。频数匹配时应描述匹配因素的频数比例。2、均衡性检验比较病例组和对照组的某些基本特征(主要指可能会影响结果的混杂因素,如性别、年龄、职业等)是否相似或齐同,检验病例组与对照组的可比性。对确有统计学显著差异的因素,在分析时应考虑到它对研究因素可能产生的影响。 3、不同类型病例对照研究资料的分析病例对照研究资料有多种形式,如按混杂因素分层的资料、不分层的资料;配对资料、未配对资料;1:1配对资料、1:m配对资料;将暴露分等级的资料等。(1)未配对未分层资料的分析未配对未分层资料有时又称为成组设计或完全随机设计的资料,是病例对照研究中最简单的一种形式。1)资料的表格整理及OR的计算:每个暴露因素可整理成如表5-2 所示。 表5-2 病例对照研究资料的一般模式归纳表组别有暴露史无暴露史合计病例acA+c对照bDb+d合计a+bc+da+b+c+d根据表中数据计算比值比(odds ratio,OR),有时又译成比数比、优势比、交叉乘积比,英文缩写为OR。比值比表示疾病与暴露之间联系强度的指标。比值(odds)是指事物发生的可能性与不发生的可能性之比。病例对照研究中病例组的暴露比值是: (5-5)对照组的暴露比为: (5-6)病例组的暴露比值与对照组的暴露比值之比称为比值比。病例对照研究比值比的计算公式为: (5-7)比值比的含义与相对危险度相同,表示暴露组的疾病危险度为未暴露组的多少倍。相对危险度的本质为率比或危险比,是暴露组与非暴露组发病率之比。但病例对照研究不能计算发病率,所以病例对照研究中只能用OR来估计相对危险度的大小。从理论上讲,相对危险度。如果调查的疾病发病率低,而调查人数又较多时,则公式中的a与c可忽略不计,得出近似公式:因此,如果病例与对照都是相应总体中有代表性的样本,且疾病发病率不高,是一种罕见病,则比值比是相对危险度的极好近似值。从表5-3和表5-4 可看出疾病率、OR、RR之间的变化关系,一般当疾病率小于5%时,OR与RR越来越接近。OR1,表示疾病的危险度增加;OR1.96,P2.58,P3.08,P3.84,故P0.05,在=0.05的水准上拒绝H0,接受H1,即心绞痛与近期使用口服避孕药之间存在相关性。(2)不匹配分层资料为了控制混杂因素以及分析混杂效应,常需对资料按可疑混杂因素分层后再进行分析。如把研究对象根据某特征分成不同层次,如性别分为男女,年龄分为不同年龄段等层,然后分别分析各层中暴露与疾病的关联。1)资料的表格整理形式表5-6 未匹配分层病例对照研究资料归纳表暴露特征i 层合计病例对照有aibiN1i无cidiN0i合计M1iM2iTi注:i表示第i层2)OR值的计算对分层资料进行OR值分析,需计算各层的OR值和总的OR值。各层间的OR值计算方法与前述相同,利用各层的整理表格数据即可。总OR值的计算则视层间的OR值而定,如果层间的OR值比较接近,说明层间的资料是同质的(可用Woolf的齐性检验法、Mantel-Haenszel 法进行检验),则可计算总的OR值。 Mantel-Haenszel 法: (5-16) Woolf(logit)法 (5-17)式中Wi为各层的权重,即 (5-18)如果层间的数据比较小,且有出现0的现象,则在计算Wi时,相应的ai、bi、ci、di可以加0.5校正。 3)显著性检验采用Mantel-Haenszel法计算卡方值 (5-19) 或 (5-20) (5-21) (5-22)4)总OR值可信区间/的计算 Woolf 法(,) (5-23)式中的方差(根号内的部份)即累计权重的平方根,如式(5-18)所示。对式(5-.23)取反对数后,即可得到总OR值的可信限。 Miettinen法95%可信限计算公式见式5-135) 分层资料的齐性检验分层资料是否同质,须进行各层OR的齐性检验。凡是各层间的性别、年龄构成很不一致或各层间的比值比相差很大,提示分层资料之间可能是异质的(non homogeneous),如果统计学检验验证各层间非同质,这时用以上公式计算和值就没有意义。OR值的齐性检验方法可参见有关书籍。6)计算标准化OR当分层资料各层间的OR相差较大时,经检验证实存在异质性,或者虽然没有达到统计学的显著性,但异质性的可能性很大时,不宜计算总的OR值和卡方值。此时,可以计算每层的OR,并将每一层看做性质完全不同的总体,或根据暴露、未暴露对象控制变量的分布,将各层OR进行加权计算标化的OR,还可以通过计算标准化死亡比(standard mortality ratio,SMR)或标准化率比(standard rate ratio,SRR),用以说明暴露组与非暴露组死亡率或发病率的比值。 (5-24) (5-25)SMR是对病例组有暴露史进行标准化,SRR是对病例组无暴露史者进行标化。7)实例分析与评价为了研究饮酒与食管癌的关系,现对200名病例和775名对照进行研究,并整理成如表5-7的按年龄分层的表格,试分析饮酒与食管癌的关系。 表5-7 饮酒与食管癌的病例对照研究年龄组层数饮酒史病例对照ORi2534i=1有1a19b1_无0c1106d13544i=2有4a226b25.05无5c2164d24554i=3有25a329b35.67无21c3138d35564i=4有42a427b46.36无34c4139d46574i=5有19a518b52.58无36c588d575i=6有5a60b6_无8c631d6 各层的OR计算如表中所示: 计算总的OR: 为调整后的OR,简称aOR(adjusted OR)。如果不进行分层,则根据原始总数据计算的粗比值比为: 显著性检验 =85.010自由度DF=1,P0.001将资料按可疑混杂因素年龄进行分层,经过Mantel-Haenszel法调整后计算总OR值为5.158,Mantel-Haenszel法卡方检验显示差别有非常显著的意义,说明饮酒与食管癌有联系。如果未分层,则计算的粗OR值(crude OR,简称cOR)为5.64,年龄在其中起到了正混杂作用,混杂效应约为0.482(5.64-5.158=0.482)。也可以用下式来反映混杂程度:,说明经过调整后得到的aOR较cOR减小了。cOR对aOR来说高估了9.36%(1-109.36%=9.36%),也即由于年龄的混杂作用,使饮酒与否与食管癌的关联得到了增强。OR可信区间的计算OR95%CI=(3)分级暴露资料 病例对照研究中,为了增强判断暴露与疾病之间的因果关系,将危险因素分等级,如吸烟以每日吸烟支数来分级,饮酒以克或毫升分等级,日光照射以小时、天来分等级等。此时,需作趋势检验,分析疾病与暴露是否有剂量反应关系。1)分级暴露资料表格的整理表5-8 病例对照分级暴露资料归纳表组别暴露水平分级合计01234病例aia0(=c)a1a2a3a4n1对照bib0(=d)b2b2B3B4n0合计mim0m1m2m3m4N注: 表中a0、b0分别相当于四格表的c和d,即不同暴露水平的分级与无暴露史或最低水平的暴露比较。2) 检验(趋势性检验) 进行趋势性检验的公式为: (5-26) (5-27) (5-28) (5-29) (5-30)自由度DF=1为暴露剂量的等级值。如是数值变量资料,评分的原则是与分组间隔相适应。如是分类变量资料,评分的原则是1,2,3,。3)计算各分级的OR值一般以没有暴露或最低水平的暴露为参照,计算各级相对于最低水平的OR值,计算方法同式5-7。4)实例分析与评价为研究妇女妊娠期吸烟与胎儿发生先天性畸形的关系,某调查组调查了1369名病例及2968名对照。资料整理如下,试分析吸烟与先天性畸形间有无联系。表5-9 妊娠期吸烟与先天性畸形的病例对照研究吸烟量(支/天)病例对照合计ORi0889198828771.001101824266080.9611202034206231.08213055861411.43304048881.86合计1369(mi)2968(m0)4337(N)1.10 各级OR值的计算如表中所示以吸烟量为0支/天的组作为参照组,第二级(吸烟量110支/天)的OR值计算如下:其他各级计算如此类推。 趋势卡方检验暴露因素吸烟量是按支/天来分级的,故根据分组间隔,分别给予评分0,5,15,25,35。将表5-9中资料代入公式计算得:自由度DF=1,故P,故P0.05,则可认为孕期X线照射与儿童白血病的发生有关。 OR的计算OR=c/b=14/5=2.80 OR可信区间的计算 即( 1.057.44)。OR值为2.8,说明孕期X线照射导致儿童发生白血病的危险性是无X线照射的2.8倍。 (5)1:2匹配病例对照研究1) 1:2配比资料的表格整理形式 表5-12 1:2匹配简化法资料归纳表病例对照是否暴露于危险因素暴露abc未暴露def2) 卡方检验 (5-34)式中b的期望值为: b的方差为: c的期望值为: c的方差为:3) OR值及OR可信区间的计算 (5-35) OR95%可信区间的计算仍然采用Miettinen法,见式(5-13)。4)实例分析与评价某研究组为了研究吸烟与肺癌的关系,采用1:2匹配的病例对照研究,数据如表5-13,试进行分析。 表5-13 吸烟与肺癌的关系病例对照暴露史吸烟31(a)42(b)17(c)未吸烟11(d)23(e)12(f) 显著性检验b的期望值为: b的方差为: c的期望值为: c的方差为:自由度DF=1,故P0.05,可认为吸烟与肺癌的发病有关系。 OR的计算 OR可信区间的计算 利用7.13公式计算 即( 1.082.66 )。OR值为1.69,说明吸烟导致肺癌的危险性是不吸烟的1.69倍,其95%的可信区间为(1.082.66)。(5)多因素分析随着计算机的发展和现代统计软件的不断更新完善,多因素分析在病例对照研究中的应用已经越来越广泛,如Logistic回归、Cox回归、对数线性回归等方法。具体过程可参考相关文献。(二)队列研究资料的分析队列研究结束后,一般应该先做描述性分析,按年龄、性别、职业等将研究对象分组,并分别计算各研究组在随访期疾病的发病率和死亡率,比较暴露组与非暴露组的差别。分析比较的方法有很多,如计算发病率、率差、相对危险度,分析暴露组暴露于某种可疑危险因素后被研究疾病发病或死亡增加的倍数;通过剂量反应分析揭示暴露强度与疾病的关系;建立各种回归模型,如logistic回归模型、二项分布回归模型、泊松回归模型等。1、率的计算根据研究对象数量的多少,研究人口稳定程度、疾病发病的强度大小和观察时间长短,可分别采取不同的方法来计算率。对稳定人群,队列研究资料整理的表格如下:表5-14 固定队列研究资料整理表暴露史发病人数未发病人数合计发生率或发病率有AbN1ai/ N1无CdN0ci/N0合计M1M0TMi/T(1)累积发病率(cumulative incidence rate) 当研究人群的数量比较多,人口比较稳定,资料比较整齐的时候,无论其发病强度大小和观察时间长短,均可用固定人口作分母来计算。累积发病(死亡)率是一段观察期内发病的频率,反映发病(或死亡)的可能性大小,具有发病概率的意义。研究对象无失访时,累积发病率等于观察期内新发病例数除以期初总观察例数;研究对象有失访时,可用校正人口计算,或用Kaplan-Meier法和寿病表法估计。(2)发病密度(incidence density, ID) 队列研究对象可以在不同时期加入随访人群,另外也可能由于迁移、其它原因死亡或其它原因退出造成各种失访,如果观察的时间比较长,就很难做到人口的稳定。因此以总研究对象的数量为单位计算发病率或死亡率是不合理的,而需采取更合理的计算方式。人时(person time)的概念就是顺应这种要求而产生的。用人时为单位计算出的率带有瞬时频率的性质,与累积发病(死亡)率相区别而称为发病密度。人时的时间单位可以是年、月、日、时等,通常用年,即人年(person-year)为单位计算发病(死亡)率。计算人年的方法将在后面详述。表5-15 动态队列研究资料整理表暴露史发病人数 暴露人年发生率或发病率有an1ai/ n1无bn0bi/n0合计a+b=m1n1 +n0=Nmi/N 人时合理考虑了因研究对象观察时间不同而对结果造成的不同效应,但在动态队列中,由于随访期内整个队列变化较大,除了需考虑新加入对象对观察结果的影响外,还必须将已发病或死亡及由于各种原因退出研究的对象从疾病危及人群(persons at risk)排除,此时应以疾病危及人时(person-time at risk)来衡量所研究疾病的发病率,计算发病密度的公式是: (5-36) 另外,研究对象的暴露并非是一成不变的,研究期内的不同时段可能会有不同的暴露,对暴露人时的准确计算已经引起越来越多的流行病学专家的关注。例如职业暴露往往是从对象被雇佣日开始算起,而与暴露有关的作用往往需要几年的诱导期,怎样定义暴露产生作用的起点将对结果有很大的影响。有关这方面的争论仍需要继续探讨。(3)率的标准化 疾病发病或死亡率是队列研究最基本的测量指标。根据上述(1)或(2)定义得到的发病率称之为总的粗发病率。粗率反映的是研究人群实际的疾病频率。但是由于暴露组与对照组人群经常存在年龄构成差别,以致于不能直接比较粗率,而必须用已校正年龄因素的标准化率或标准化比。率的标化有直接法和间接法,具体过程可参见相关的统计学书籍。应用间接法可得到标准化比值,通常称为标化发病比或标化死亡比(SMR,standardized morbidity ratio 或standardized mortality ratio),即用标准年龄发病率或死亡率计算暴露组(或对照组)期望发病数或死亡数,然后用实际观察数除以估算到的期望数。当研究对象数量较少,发病率较低时,无论观察时间的长短,都不宜计算率,SMR就比较适合。另外,SMR还有计算时不需要暴露者的年龄、与暴露人群各层次中的率无关,受随机误差影响相对较少等优点。该指标是统计学上较稳定的指标,但在应用时需要谨慎。不同暴露组的SMR不能直接互相比较,而且也不能推断暴露效应的大小。有时历年人口资料不容易得到,而仅有死亡数字、日期和年龄,则可算出标化比例死亡比(standardized proportional mortality ratio,SPMR)。其计算方法与SMR相似,只是以全人口中某病因死亡占全死因死亡的比例乘以该人群实际死亡数而获得预期死亡数。2、人时的计算 人时是将观察人数与时间相结合的一种度量单位。它是研究对象中每个个体暴露于某种因素的时间单位的总和。人时单位可以是人月、人周或人年,在慢性病研究中最常用的是人年。人年考虑了每个对象的实际暴露年数。理论上,10人观察10年为100人年,观察20年为200人年。在实际应用中,人年计算比较复杂,除需考虑每一个体进入和退出因素外,还需按照随访日历年计算其不断变动的年龄,以便获得按随访日历年和年龄划分的总人年数。人年计算方法包括精确法、寿命表法、近似法等。如果样本含量不大,可以个人为单位逐个计算其暴露人年,这种方法比较准确,人工计算较费时,现在已经有专用于人年计算的计算机软件,如PYRS、OCMAP等,精确法计算已变得相当简单。近似法在时间的计算上较为粗略,如果研究对象人数较多、观察期较长、有截尾数据时,利用寿命表法计算人年较为合适。(1) 稳定人群暴露人年的计算对于稳定人群,可直接利用人时的定义计算: (5-37)式中EY表示暴露人年,N表示随访人数,t表示随访年数。当研究对象迁移、随访期间失访或不合作、死亡等,N应该进行校正。此类观察对象以0.5人年计算,如果是同年进入、同年失访、其他原因发病或死亡而退出研究者,按0.25人年计算。(2) 动态人群暴露人年的计算寿命表法是一种对动态人群计算暴露人年的方法,当年进入队列的人按0.5人年计算,失访或出现终点结局的也按0.5人年计算。计算公式如下:Lx= Ix1/2(NxDxWx) (5-38)Ix+1=IxNxDxWx (5-39) 式中Lx为X时间内的暴露人年数,Ix为X时间开始时的人数,Nx为X时间内进入队列的人数,Dx为X时间内出现终点结局的人数,Wx为X时间内失访的人数。寿命表计算暴露人年如表5-20所示。 表5-16 寿命表法计算人年数观察时间(年)年初人数年内进入人数年内发病人数年内失访人数暴露人年数(X)(Ix)(Nx)(Dx)(Wx)(Lx)11245565291256.021267353181274.031281286251279.541278285211279.051280159691248.561217518861167.57111812891073.08102801185935.0合 计499512.53、显著性检验一般对队列研究进行率的差别显著性检验通常是指人年率。可用卡方检验方法比较暴露组发病(死亡)率和对照组的发病(死亡)率差异有无显著性,若两组的率差异有显著性,再进行联系强度的测量。4、暴露与疾病关联强度的分析(1) 相对危险度(relative risk,RR)及其可信区间的计算相对危险度有时也称为危险比(risk ratio)或率比(rate ratio)。相对危险度是暴露组的发病率与非暴露组的发病率之比。 (5-40)式中表示暴露组的累积发病率或发病密度,表示非暴露组的累积发病率或发病密度。相对危险度表示暴露于某危险因素的人群中疾病的发病或死亡危险是未暴露于该危险因素的人群中发病或死亡危险的多少倍。相对危险度越大,表明某危险因素的致病作用越强,是衡量某危险因素与发生疾病结局之间关联强度的指标。用Woolf法计算相对危险度RR的可信区间,方法如下:的95%可信区间=求其反对数即可得95%可信区间。(2) 归因危险度(attributable risk,AR)及其可信区间的计算 归因危险度是指暴露组发病率与对照组发病率之差,反映暴露因素引起的发病率的改变量,因此又称之为超额发病率(excess incidence rate),也称作率差(rate difference,RD)、特异危险度。因为一般情况下,暴露组的发病率总是高于非暴露组,可认为两组率的差异应该特异性地归因于所研究的暴露因素,也即这部分超额的发病率或死亡率是由于危险因素引起的。 (5-41) AR的95%的可信区间表示为: AR和相对危险度RR比较,二者均为表示联系强度的指标,彼此关系密切,但表示的意义有所不同。RR说明暴露因素对个体增加发生危险的倍数,而AR是针对人群的。如果对暴露于该危险因素的人群采取干预措施,消除或减少该危险因素的暴露,则特异危险度为降低的发病或死亡危险。如表5-17所示,吸烟者与非吸烟者相对于肺癌的RR值为10.8,心血管疾病的RR为1.7,说明就个体而言吸烟者患肺癌的危险比患心血管疾病的危险大得多,但从人群角度看,吸烟者与非吸烟者相对于肺癌的AR为43.84,心血管病的AR为125.13,说明在人群中吸烟引起心血管疾病的危害要比肺癌大得多。因此,RR具有病因学的意义,而AR更具有疾病预防与公共卫生的意义。 表5-17 吸烟者与非吸烟者不同疾病时的RR与AR疾病吸烟者非吸烟者RRAR(1/10万人年)(1/10万人年)(1/10万人年)肺癌48.334.4910.843.84心血管疾病294.67169.541.7125.13(3) 归因危险度百分比的计算(attributable risk percent,AR%) 归因危险度百分比又称为病因分值(etiologic fraction,EF)指暴露人群中归因于暴露的发病与死亡占全部病因的百分比。 (5-42)(4) 人群归因危险度(population attributable risk,PAR)与人群归因危险度百分比(population attributable risk percent,PARP或PAR%)的计算 人群归因危险度指全人群中暴露因素所引起的发病率增高部分。 (5-43) (5-44 )表示人群某时期某病的累积发病率或发病密度,表示未暴露于某危险因素的人群中同时期该病的累积发病率或发病密
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年苏州工业园区服务外包职业学院辅导员考试真题
- 2025年冰水转化密度试题
- 地理(湖北专用)2025年中考考前押题最后一卷
- 中国式现代化背景下城乡融合发展的内在需求
- 通过信息化手段提升民主管理的透明度
- 锋与天气教学设计
- 2025至2030年中国电动自行车弹簧行业投资前景及策略咨询报告
- 2025至2030年中国珍珠岩保温板行业投资前景及策略咨询报告
- 2025至2030年中国燃烧热测定实验装置行业投资前景及策略咨询报告
- 小学教师师德建设论文(5篇)
- 《中华民族一家亲-同心共筑中国梦》队会课件
- TCAICC 001-2024 张家界莓茶质量等级评价
- 安徽省铜陵市义安区2023-2024学年七年级下学期期末生物题(无答案)
- 2024结肠锯齿状病变诊断及治疗进展
- 【保险营销策略探究文献综述6900字】
- 航空公司客户价值分析数据挖掘设计
- 2024年全国能源行业供热技能竞赛考试题库大全-中(判断题)
- 沥青混凝土路面安全技术交底
- 梨园助手:全年病虫害防治历
- JBT 8473-2014 仪表阀组标准规范
- 【编制说明】电力电缆通道用防火隔板及槽盒技术规范
评论
0/150
提交评论