




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
杨西林,天津医科大学流行病和生物统计系
病例对照研究
CaseControlStudiesCasecontrolstudyisalsocalledparisonStudy,Case-ReferentStudyandRetrospectiveStudythataddressrelationshipsbetweenexposureanddisease.Comparingwithcohortstudies,casecontrolstudiesaretime-andlabor-saving,cheapandquickinobtainingtheresults.
Thismethodissuitabletoexploreriskfactorsofdisease,occasionally,effectsoftreatmentandsideeffectsofdrugs,andsoon.
本章要点:1.病例对照研究的基本原理、概念2.病例对照研究的实施3.病例对照研究资料分析4.病例对照研究常见的偏倚及其控制5.病例对照研究的优缺点病例—对照研究的实例口服避孕药——心肌梗塞低剂量电离辐射——白血病体力活动少——冠心病糖精——膀胱癌月经棉——经期中毒性休克综合症接触石棉——间皮瘤反应停——海豹肢毛蚶——甲型病毒性肝炎1843年Guy向统计学会报告-最早病例对照研究分析职业暴露与肺结核发生的关系1844年Louis的著作最早出现病例对照研究的概念1926年LaneClaypon
报告生殖因素与乳腺癌关系的研究研究简史In1843,Guyreportedastatisticalassociation-theearliestcasecontrolstudyanalyzingtherelationshipbetweenTB&occupationalexposureIn1844,Louis’conceptofCaseControlStudyappearedforfirsttime.In1926,LaneClayponreportedarelationshipbetweenreproductionfactors&breastcancer
1947年Schreck和Lenowitz包皮环切,性卫生与阴茎癌的关系1947年Hartwell输血与肝炎关系1950年Doll和Hill吸烟与肺癌的关系In1947,Schreck&Lenowitz:
Peritomy,sexhealthandcarcinomaofpenisIn1947,Hartwell:TransfusionandhepatitisIn1950,Doll&Hill:Smokingandlungcaner二战后应用广泛孕妇服用反应停与婴儿短肢畸形母亲吸烟与先天性畸形早产儿吸入高浓度氧与晶体后纤维组织增生症经期使用月经棉与中毒性休克综合征小剂量电离辐射与白血病母亲早孕期服用雌激素与少女阴道腺癌等之间的关系60年代以来方法逐步完善病例对照研究
Case-ControlStudy
也称回顾性研究(RetrospectiveStudy)第一节基本原理1.定义
选定患某病病例和未患该病的对照,分别调查其既往暴露于某个(或某些)危险因子的情况及程度,以判断暴露危险因子与某病有无关联及其关联程度大小的一种观察研究方法。一、定义及有关概念基本原理病例对照研究示意图2.有关概念(1)暴露:是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。这些因素、特征或状态即暴露因素。暴露因素可以是先天的,如性别、血型、遗传指标等,也可以是后天获得的,如职业、身长、体重、接触过某些化学物质或物理因素、进食某种食品饮料或药物等。暴露因素可以是有害的,也可以是有益的。当为前者时称危险因素,为后者时称保护因素。暴露因素也叫研究变量(variable)。(2)危险因素:能使人群发病率升高的因素。(3)保护因素:能使人群发病率降低的因素。3.病例对照研究的适用情况疾病较少见而暴露较常见,如肺癌与吸烟的关系。当暴露与疾病均罕见,如暴露引起发病的可能性较高时。如肝癌与氯乙稀关系的研究。对一些潜伏期长慢性病,如肿瘤、心脑血管疾病等。二、基本原理病例对照未暴露暴露未暴露acbd(1)a/(a+c)=b/(b+d)暴露因素与疾病无关(2)a/(a+c)>b/(b+d)暴露因素为疾病危险因素(3)a/(a+c)<b/(b+d)暴露因素为疾病保护因素回顾性暴露三、特点1.属于观察法2.设立对照组3.观察方向由“果”及“因”4.不能确实证明暴露与疾病的因果关系。四、应用Applications1.广泛地探索疾病或事件的可疑危险因素2.初步检验某个或某几个病因假说3.为进一步前瞻性研究提供依据ExtensivelyexploringpossibleriskfactorsTestingoneorseveralhypothesesleadingtothediseaseProvidedataforcohortstudiesinthefuture4、治疗方法或药物有害作用的研究5、疾病预后因素的研究6、诊断试验、防治措施
的效果的评价4.Investigatingsideeffects
ofapproveddrugs5.Identifyingpredictive
factorsofprognosis6.Evaluatingadiagnostic
testandprevention
measuresforadisease按研究目的分类按病例、对照的来源分类按是否匹配分类衍生的研究类型BasedonpurposesBasedonsourcesofcaseandcontrolBasedonuseofmatchingornotNewlyderivedtypesofstudies
第二节病例对照研究的种类一、按研究目的分类
Basedonpurposes1.探索性病例对照研究
(Exploringcasecontrolstudies)2.验证性病例对照研究
(Validatingcasecontrolstudies)
二、按病例、对照的来源分类
Basedonsourcesofcasesandcontrols医院基础上的病例对照研究:病例和对照均来事先确定的自医院或诊所社区基础上的病例对照研究:病例和对照均来自于事先界定的目标人群社区Hospital-basedcase-controlcasesandcontrolsareselectedfromapre-determinedgroupofhospitalsorclinicsPopulation-basedcase-controlcasesandcontrolsareselecteddirectlyfromana-prioridefinedtargetpopulation匹配:即要求对照组在某些因素或特性上与病例组保持相同。匹配的目的:排除匹配因素对研究结果的干扰。一般与疾病及所怀疑的病因因素都有联系的因素,可能是混杂因素,可选为匹配因素。所选的匹配变量的作用不能评价,因此欲分析其作用的变量不能匹配,否则会导致匹配过头。三、按病例与对照匹配与否分类:Basedonmatching
匹配过头:就是把非混杂因素而可能是危险因素的因素进行了匹配,导致该因素不能分析。匹配的优点(1)增加流行病学效率。(2)排除非研究因素的影响。匹配的缺点(1)选择对象复杂。(2)需匹配因素多时,难以决定合适的匹配因素。(3)有时可导致匹配过头。匹配(Matching)定性指标
(qualitativeindicator)匹配matching定量指标
(QuantitativeIndicator)(1)53岁years(50~59岁组)50~59岁53岁533岁匹配
(matching)定量指标
(QuantitativeIndicator)(2)
匹配法注意事项
慎重选择匹配因素可疑病因不作为匹配因素比例一般为1:1,最多不超过1:4避免“匹配过度”NotesformatchingCarefullyselectmatchingfactorsSuspectedcausescanNOTbeusedasmatchingfactorsGenerally,theratioformatchingis1:1,andnomorethan1:4Avoidingovermatching
匹配的种类:1.成组匹配:就是要求对照组匹配因素所占比例与病例组一致。2.个体匹配:以每一病例为单位,选择在某些特征或变量方面与病例一致的一个或几个对照,组成计数和分析的单位。
Concept:Matchingpairs
1、病例与对照不匹配Caseandcontrolnotmatching病例组Casegroup对照组Controlg目标人群Targetpopulation
患病人群Patientpopulation未患病人群Non-patientpopulation=<1、病例与对照不匹配从设计所规定病例和对照人群中,分别抽取一定量的研究对象对照组人数≥病例组人数选择对照没有特殊规定1.Caseandcontrolareunmatchedrespectivelysamplingcasesandcontrolsfromtargetpopulationcontrolgroup≥casegrouptherenospecialrulesforcontrol
2、病例与对照匹配
Matchedcasecontrolstudy
匹配/配比要求:对照在某些因素或特征上与病例保持一致目的:对两组进行比较时排除匹配因素的干扰
分类频数匹配个体匹配MatchingRequirement:controlsaresimilartothecasesinregardtocertaincharacteristicssuchasage,sexandracePurpose:toeliminatetheinterferenceofmatchedfactorsTypingfrequencymatchingIndividualmatching
频数匹配(成组匹配)匹配因素所占的比例在对照组与病例组一致
个体匹配给每一个病例选择一个或几个对照,配成对或配成伍,例如年龄相同Frequencymatching(Groupmatching)ProportionofmatchedfactorisaccordanceincaseandcontrolgroupIndividualmatchingcontrolsselectedindividuallyforeachcasebymatchingVariable/se.g.sameage病例与对照匹配Matched
1:1个体匹配(individualmatching)某些特征Somecharacteristics配对(pairmatching)目标人群Targetpopulation患病人群Patientpopulation未患病人群Non-patientpopulation病例与对照匹配
Matched1:R个体匹配(1:Rindividualmatching)目标人群Targetpopulation患病人群Patientpopulation未患病人群Non-patientpopulation某些特征Somecharacteristics1:2,1:3…1:R1.巢式病例对照研究(NestedCaseControlStudy)NestedinacohortWhy?2.病例队列研究(Case-CohortStudy)AcommoncontrolgroupatenrollmentOneormorecasegroupsatthestudyend四衍生的病例对照研究类型-13.病例交叉设计(Case-CrossDesign)应用于急性事件,同一病例,比较危险期暴露
(病例)和非危险期暴露(对照)4.病例时间对照设计(Case-Time-Controldesign)由Suissa提出,病例交叉设计应用于病例对照研究5.病例病例研究病例出现某基因型为病例组,没有出现某基因型为病例组如果环境暴露和基因型独立,可按病例对照研究处理。四衍生的病例对照研究类型-2
(-)复习文献,提出假设
查阅现已知的或现已有线索(可能的、可疑的)的危险因素或暴露因素。目前对此问题研究的现况及其进展。对该病病因已了解了些什么,其发展阶段如何?前人研究此问题时所用的方法(包括方法的细节、如病例及对照如何选择等)是什么?目前还有什么问题?根据自己或别人的经验和该病的自然史、已知的影响因素等,在研究之前提出一个病因假设。第三节病例对照研究的实施步骤
(-)复习文献,提出假设
查阅现已知的或现已有线索(可能的、可疑的)的危险因素或暴露因素。目前对此问题研究的现况及其进展。对该病病因已了解了些什么,其发展阶段如何?前人研究此问题时所用的方法(包括方法的细节、如病例及对照如何选择等)是什么?目前还有什么问题?根据自己或别人的经验和该病的自然史、已知的影响因素等,在研究之前提出一个病因假设。(二)明确适宜的研究类型
不匹配或频数匹配:探讨病因线索个体匹配:提高统计效率,适于罕见疾病对照数目:按Pitman效率递增公式:效率=2R/(R+1)1:1时,效率=2×1/(1+1)=11:2时,效率=2×2/(2+1)=1.31:3时,效率=1.51:4时,效率=1.61:4以上,效率增加缓慢,但对照选择难度增加,故≯1:4(三)病例与对照来源的选择
基本原则
代表性
病例能代表总体的病例对照能代表产生病例的总体人群或源人群可比性
两组主要特征方面无明显差异1.病例的选择:病例是指患所研究疾病者。(1)对疾病的规定:诊断标准:应尽量采用国际和国内统一的标准。(2)病例来源:
1)来源于医院:
2)来源于社区(3)对病例其他特征的规定:如性别、年龄、民族等。其目的是控制外部因素,增加可比性。新发病例、现患病例和死亡病例(4)保证病例有关规定的标准,如某级医院诊断等2.对照的选择
对照是指未患所研究疾病者,可以是健康人,也可以是患与所研究疾病病因无关的其他疾病的病人。(1)对照应代表病例的源人群。(2)对照的来源:
1)同一或多个医疗机构中诊断的其他病例;
2)病例的邻居或所在同一居委会、住宅区内的健康人或非该病病例;
3)社区团体人群中的非该病病例或健康人;
4)病例的配偶、同胞、亲戚、同学或同事。
Thesamecatchmentarea(3)选择对照应注意1)对照必须不患所调查的疾病,不是隐性病例,也不是处于潜伏期的病例。2)与病例的病因因素无关或无联系;如肺癌,慢性支气管炎,肺结核均可能与吸烟有关,不能互为对照。3)必须与病例选自同一人群4)选择的方法应事先规定,规定后要严格遵守,不可随意更改。5)对照与病例组除要比较的因素外,其他各方面的特性应尽量一致,即所谓均衡。社区为基础的病例对照医院为基础的病例对照可以较好地确定原人群研究对象可及性好易保证病例对照来源同一人群研究对象易合作对照的暴露反映原人群暴露容易收集暴露社区和医院病例对照研究比较Lancet2005;1429-33对照
1.病例对照研究的对照应当代表那些具有变
成病例的个体;
2.如果被研究疾病和暴露无关,对照与病例
会有相同的暴露;
从已知人群和未知人群选择对照
(四)样本大小和检验效能估计1)影响因素因素在对照组的暴露率(P0),RR或OR,TypeIerror和TypeIIerror2)非匹配或成组匹配计算公式:
病例数
其中,c为对照人数和病例人数比,Z为正态分布分位数,p0和p1病例和对照组的暴露率,
qi=1-pi,
=(p1+cp0)/(1+c),=1-p1=(OR*P0)/(1-p0+OR*p0)样本大小和检验效能估计3)个体匹配计算公式(1:1):病例与对照暴露不一致的对子数为:
研究需要的总对子数为:
M≈m/(p0q1+p1q0)其中,p0和p1分别为目标人群中对照组和病例组某因素的暴露率。,p=OR/(1+OR)样本大小和检验效能估计4)个体匹配计算公式(1:R):病例数为:
研究需要对照数为:
R×
n
50专用软件:PASS11TheStatisticalAnalysisSystem,SAS在线软件
SoftwareforSampleSizeandPowerAnalysis用PASS11估计样本大小和检验效能SummaryStatementsInamatchedcase-controlstudy,theprobabilityofexposureamongsampledcontrolpatientsis0.50000andthecorrelationcoefficientforexposurebetweenmatchedcaseandcontrolpatentsis0.20000.Asampleof320casepatientsisobtained.Foreachcasepatient,amatchingsampleof2controlpatient(s)isalsoobtained.Thissampleof640patientsachieves80%powertodetectanoddsratioof1.52versusthealternativeofequaloddsusingaChi-Squaretestwitha0.05significancelevel.(五)研究因素的选定与测量1.变量的选定:与目的有关的变量不能少,且要细致(吸烟:量、时间、种类、方式、戒烟时间等);无关的项目不能有。
2.变量的规定:明确规定,统一标准(吸烟者:每天吸烟至少一支,持续一年以上者)
3.变量的测量:定性(是、否);半定量(经常、偶尔、不);定量(平均每周几次?平均每次多少?)
4.使变量符合规定:以客观手段与证据为准绳(病情用医疗档案核准;职业史以工厂档案核准;空气、水污染用检测结果核准;吸烟量由亲属核准等)(六)资料的收集
调查问卷;查阅档案;采样化验;实地查看等。第四节资料整理与分析一、资料的整理1.原始资料的核查2.原始资料的分组、归纳或编码输入计算机二、数据的分析1.描述性统计(1)描述研究对象的一般特征(2)均衡性检验描述一般特征对研究对象的一般特征,如病例和对照的性别、年龄、职业、疾病类型等进行描述。均衡性检验检验病例组和对照组之间除研究因素以外的各种特征是否相同和近似,以考查组间的可比性。2.推断性统计
检验病例与对照组暴露率有无差异—Χ2检验推断某因素对疾病效应的大小—RR、OR表示依据资料类型不同有不同的推断性统计方法。
不匹配或成组匹配资料资料个体匹配资料,ConditionalLogistic...分层分析(Stratifiedanalysis)多因素分析基本原理病例对照研究示意图
病例对照研究中表示联系强度的指标
比值比(比数比;优势比;交叉乘积比;OddsRatio;OR):
病例组暴露比值与对照组暴露比值之比。
病例组暴露比值:
对照组暴露比值:
比值比:
OR取值为0~∞,OR>1为“正”关联,说明发病危险度增大;OR<1为“负”关联,说明发病危险度减少。
OR≈RR的条件:1)良好的代表性
2)人群疾病频率较低(<5%)暴露疾病.
病例对照合计
+a
b
a+b=n1
-c
d
c+d=n0合计a+c=m1
b+d=m0
t
暴露疾病.
病例非病例合计
+a
b
a+b=n1
-c
d
c+d=n0合计a+c=m1
b+d=m0
t
OR与RR之关系病例对照研究资料队列研究资料病例对照研究无法计算RR比值比(OR):
OR=ad/bc
又称优势比,交叉乘积比,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值OR95%可信区间:OR95%C.I.=当人群疾病频率很低时,可将RR计算公式中a/(a+b)和c/(c+d)中分母的a、c忽略不计,即:a+b→b;
c+d→d;则:
因此,OR≈RR的条件:1)良好的代表性
2)人群疾病频率较低(<5%)4)得出结论:有无联系,联系强度。相对危险度(RR)与关联强度
(MonsonRA,1980)
RR(OR)关联强度
0.9~1.01.0~1.1无
0.7~0.81.2~1.4弱
0.4~0.61.5~2.9中等
0.1~0.33.0~9.9强
<0.1>10很强OR数值范围对暴露与疾病关联的意义
病例对照研究资料整理表(1)不匹配(或成组)不分层资料的分析
1)将资料整理成四格表LogisticRegression2)暴露率的假设检验:3)计算暴露与疾病的关联强度相对危险度(RR):RR>1RR<1RR=1口服避孕药(OC)与心肌梗死关系的病例对照研究X2=7.70p<0.01OR=2.20OR95%C.I.:1.26-3.84非个体匹配不分层资料
(1)整理表格
表口服避孕药(OC)与心肌梗死(MI)关系
(2)显著性检验
X2=(ad-bc)2T/(a+b)(c+d)(a+c)(b+d)=7.7
X20.01(1)=6.63<7.7P<0.01OC病例对照合计
+39(a)24(b)63(n1)-114(c)154(d)268(n0)合计153(m1)178(m0)331(T)(3)计算并检验联系强度计算OR=ad/bc=2.2
检验(Woolf的logit近似法)
Z值的判定标准:ZP>1.96<0.05>2.58<0.01>3.08<0.01
本例:Z=2.47>2.58P<0.01(4)OR可信区间(confidenceinterval,,CI)
1)Woolf法:本例:Var(lnOR)=0.0826[LnOR+/-1.96…]=ln2.2±1.96×0.2874=1.3218~0.2252OR95%CI=exp(1.3218;0.2252)=1.25~3.75
2)Miettinen法:
本例:
(2)配对资料分析
1:1配对资料分析(1)资料整理
表
外源性雌激素与子宫内膜癌的关系对照病例对子数有暴露史无暴露史有暴露史27(a)3(b)30(a+b)无暴露史29(c)4(d)33(c+d)对子数56(a+c)7(b+d)63(n)(2)卡方检验:McNemar公式
大样本:c2
=(b-c)2/(b+c)
小样本(b+c<40):c2
=(|b-c|-1)2/(b+c)
本例:c2
=(|b-c|-1)2/(b+c)=19.53
P<0.005(3)计算OR值:OR=c/b
(b≠0)本例:OR=9.67
(4)计算OR95%CI:Miettinen法
本例:ORL~ORU=3.56~26.24
要用ConditionalLogisticRegression分析(3)分层资料(StratifiedAnalysis)
1)特点可评价分层因素本身作用及其与暴露之关系离散变量可完全控制分层因素的混杂作用,连续变量取决于分层程度简单易行,一目了然,并帮助正确设计多因素模型缺点是丢失效率,分层太多,层中例数会出现“零”
2)资料整理表5-6病例对照研究分层资料整理表暴露特征第i层的发病情况合计病例对照
+aibin1i-cidin0i
合计m1im0iti
表口服避孕药与心机梗死关系病例对照研究按年龄分层分析(3)计算各层OR:
OR1=(21×59)/(26×17)=2.80OR2=(18×95)/(88×7)=2.78
可见两层OR值均较不分层时大。
<40岁
≥40岁.
服OC未服OC合计服OC未服OC合计
病例21(a1)26(b1)47(m11)18(a2)88(b2)106(m12)对照17(c1)59(d1)76(m01)7(c2)95(d2)102(m02)合计38(n11)85(n01)123(T1)25(n12)183(n02)208(T2)分层OR值的齐性检验(Woolf法)1、计算各层ORi、lnORi、Var(lnORi)、wi:
Var(lnORi)=1/a+1/b+1/c+1/d
wi
=1/Var(lnORi)
2、进行c2检验:
n为层数;自由度为n-1
表OR齐性检验资料整理表计算总OR的:
ORw=e1.0266=2.7915计算总OR的标准误:计算总OR95%CI:ORw95%CI=e1.0266-1.96×0.3055~e1.0266+1.96×0.3055=1.5339~5.080层次ORi
lnORiVar(lnORi)wi
12.81.02961/21+1/26+1/17+1/59=0.16186.180522.781.02251/18+1/88+1/7+1/95=0.22044.5366做c2检验:
c20.01(1)=6.63<7.5621P<0.01结论:各层间的OR值差异显著,说明两个资料不同质,总OR值不能说明年龄、口服避孕药及心肌梗死的关系。因此计算总OR值无意义。进一步分析非暴露组年龄与MI及对照组年龄与OC之关系
表5-8年龄与MI之关联
OR=0.48;c2=7.27
说明年龄与心肌梗死有联系(小年龄有保护作用)。∵年龄不是OC和MI的中间环节
表5-8年龄与OC之关联
OR=3.91;c2=8.89
说明年龄与口服避孕药也有联系。∴年龄是研究OC与MI关系时的混杂因素
<40岁≥40岁MI2688对照5995
<40岁≥40岁OC177对照5995(4)计算总OR值:Mantel-Haenszel公式:
本例:ORMH=2.79
(5)计算总c2值:Mantel-Haenszel公式:
其中I为总层数,i为第几层
本例=11.79自由度=1P<0.01(6)估计总OR值95%CI
(7)计算标准化OR值:各层间OR值相差很大时,计算标准化死亡比(standardmortalityratio,SMR)或标准化率比(standardrateratio,SRR),来说明暴露组与非暴
露组死亡率或发病率之比值。
分层分析的过程总结每层OR
异质齐性检验标化OR
同质总ORMH
OR不等对照组混杂因素粗分析分层分析与疾病之关系(OR、c2)是否混杂
OR相等对照组混杂因素与研究因素之关系
结论混杂方向及大小?(3)分级暴露资料
(1)资料整理表
男性每日的吸烟支数与肺癌之关系c2=43.15n=3P<0.001
(R×C表卡方检验)
暴露每日吸烟支数.
水平(Xi)0(X0)~1(X1)~5(X2)~15(Xt)~合计病例ai
2(a0=c)33(a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养鱼合作协议书合同
- 甲方解除租赁合同协议书
- 生产安全承包合同协议书
- 餐饮食材配送合同协议书
- 关注女性健康,提升生命质量课件
- 终止合同协议书条件
- 护考培训开班宣教
- 合同诈骗协议书
- 企业厨师合同协议书范本
- 住家保姆合同协议书
- GB∕T 37370-2019 中国常见色色名和色度特性
- 冀教英语六年级下册作文范文
- Continual Improvement持续改进程序(中英文)
- 10x2000对称式三辊卷板机设计机械毕业设计论文
- RCA应用于给药错误事情的分析结果汇报
- 申论答题纸-方格纸模板A4-可打印
- 土石方测量方案完整版
- 律师事务所劳动合同范本2(律师助理和实习律师参照适用
- 施工单位动火申请书内容
- 焊条电弧焊基础知识二
- 不锈钢板墙面施工工艺
评论
0/150
提交评论