版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、王王 辉辉 公共卫公共卫生学院生学院流行病与卫生统计学系流行病与卫生统计学系流行病学流行病学调查资料分析时的调查资料分析时的质量控制质量控制主要内容:主要内容:n数据录入常用软件数据录入常用软件n常用研究设计的统计学分析思路、方法常用研究设计的统计学分析思路、方法和指标和指标n偏倚的测量偏倚的测量决定验证假设所需的资料决定验证假设所需的资料为得到所需资料,设计调查表和资料整理表为得到所需资料,设计调查表和资料整理表收集资料收集资料数据录入和整理资料数据录入和整理资料描述性分析:病例计数、频数分布、构成比、率描述性分析:病例计数、频数分布、构成比、率联系的测定:四格表、显著性检验、可信区间计算联
2、系的测定:四格表、显著性检验、可信区间计算分层分析:评价混杂因素和效应修正作用分层分析:评价混杂因素和效应修正作用必要时作多因素分析必要时作多因素分析必要时进一步深入分析必要时进一步深入分析合理解释结果合理解释结果 , 评价因果关系评价因果关系产生假设产生假设流行病学调查资料分析步骤流行病学调查资料分析步骤流行病学资料录入和分析常用软件流行病学资料录入和分析常用软件资料的整理 n规定变量的取值方法规定变量的取值方法n如:男性如:男性1 1,女性,女性2 2,缺失,缺失9 9n录入资料时有章可循,正确地处理不可接受数值录入资料时有章可循,正确地处理不可接受数值n审查审查 n可与录入同步(可与录入
3、同步( EpidataEpidata )n质量控制质量控制 :范围核对范围核对 逻辑核对逻辑核对 n及时纠正数据错误及时纠正数据错误n不能因调查结果不在取值范围而将数据随意改动不能因调查结果不在取值范围而将数据随意改动n现场审查,列出病例一览表现场审查,列出病例一览表数据录入和管理常见软件数据录入和管理常见软件面对所收集的大量的原始资料,研究者必须对原始资料建立数据库、录入数据,并保证数据能真实反映资料所收集的信息,因此这些工作都需要数据管理软件来实现。各种软件操作方式不同,个人使用习惯不同,因人而异选择不同的软件。EpiDataEpiData建立数据库数据录入数据库管理数据库输出与输入数据统
4、计分析数据统计分析当数据录入和管理软件把所有收集的流行病学信息资料进行整理后,就进入流行病学研究的另外一个重要环节,即对资料进行分析处理,并对分析结果做出符合专业领域的合理解释。资料分析策略的制定 n为实际资料分析提供纲领和指南为实际资料分析提供纲领和指南n草拟资料整理表草拟资料整理表又称预期分析表(又称预期分析表(一系列一系列)n可按逻辑顺序可按逻辑顺序n可可由简单到复杂由简单到复杂n可可由描述由描述到到分析分析资料整理表n资料描述整理表资料描述整理表n1类:临床特征描述类:临床特征描述n2类:三间分布描述类:三间分布描述n分析性研究整理表分析性研究整理表n3类:类:22表表(因素和疾病之间
5、联系的基本表因素和疾病之间联系的基本表)n4类:分层分析表类:分层分析表(混杂因素、效应修正混杂因素、效应修正)n5类:剂量反应关系类:剂量反应关系n6类:配比病例对照研究类:配比病例对照研究整理表举例Kawasaki综合征调查资料整理表整理表整理表A 川崎病临床症状频数分布川崎病临床症状频数分布 整理表整理表B 川崎病严重并发症病人频数分布川崎病严重并发症病人频数分布 整理表整理表C 川崎病病例特征川崎病病例特征 整理表整理表D 川崎病病人家庭收入川崎病病人家庭收入整理表整理表E 川崎病病例地区分布川崎病病例地区分布整理表整理表F 川崎病病例发病时间分布川崎病病例发病时间分布 整理表整理表G
6、 川崎病与既往病史关系的病例对照研究川崎病与既往病史关系的病例对照研究 整理表整理表H 川崎病与地毯清洁剂关系的病例对照研究川崎病与地毯清洁剂关系的病例对照研究整理表整理表I 川崎病与家庭收入关系的病例对照研究川崎病与家庭收入关系的病例对照研究 一、描述性研究一、描述性研究描描述性研究述性研究n现况研究现况研究(横断面研究)(横断面研究)n生态学研究生态学研究n历史常规资料的收集和分析历史常规资料的收集和分析n随访监测研究随访监测研究现况研究现况研究 又称横断面研究(又称横断面研究(cross-sectional study),根据研究的人群范围或调查方),根据研究的人群范围或调查方式不同可分
7、为式不同可分为:n普查普查n抽样调查抽样调查n个案调查个案调查n追踪调查追踪调查n公共卫生监测公共卫生监测(一)普查数据统计分析思路和方法(一)普查数据统计分析思路和方法1统计应调查人数、实际调查人数,描述漏查率和应答率。统计应调查人数、实际调查人数,描述漏查率和应答率。2描述调查对象的社会人口学特征,如性别、年龄、民族等描述调查对象的社会人口学特征,如性别、年龄、民族等基本构成。计数资料采用构成比(百分比)描述,计量资料采基本构成。计数资料采用构成比(百分比)描述,计量资料采用均数用均数标准差描述。标准差描述。3统计调查人群的总体指标,根据数据类型,分别描述总体统计调查人群的总体指标,根据数
8、据类型,分别描述总体的患病率、感染率等频率指标,或总体计量数据的集中和离散的患病率、感染率等频率指标,或总体计量数据的集中和离散趋势指标(均数趋势指标(均数标准差、百分位数等)。标准差、百分位数等)。4按社会人口学特征或暴露与否分组,统计、描述疾病和健按社会人口学特征或暴露与否分组,统计、描述疾病和健康状态相关频率指标;或按疾病有无描述暴露的构成比;并进康状态相关频率指标;或按疾病有无描述暴露的构成比;并进行分层和对比分析。行分层和对比分析。(二)抽样调查数据统计分析思路和方法二)抽样调查数据统计分析思路和方法统计分析步骤:统计分析步骤:1. 一般描述一般描述2. 统计描述统计描述3. 关联分
9、析关联分析1一般描述一般描述 包括抽样方法、设计样本量、调查样本量、应包括抽样方法、设计样本量、调查样本量、应答率和样本人群的社会人口学特征等。答率和样本人群的社会人口学特征等。(二)抽样调查数据统计分析思路和方法二)抽样调查数据统计分析思路和方法2统计描述统计描述(1)计算有关统计指标,包括患病率、感染率、暴露率等)计算有关统计指标,包括患病率、感染率、暴露率等频率指标及其频率指标及其95%的可信区间,计量资料的均数、标准差的可信区间,计量资料的均数、标准差或百分位数等。或百分位数等。(2)结合频率指标,通过图表或文字,按时间、地区和人)结合频率指标,通过图表或文字,按时间、地区和人群描述疾
10、病或健康状态的分布。可先按某个因素分层描述,群描述疾病或健康状态的分布。可先按某个因素分层描述,再按多个因素综合描述,如按时间地区、地区人群、时再按多个因素综合描述,如按时间地区、地区人群、时间人群等不同分层方法进行描述。间人群等不同分层方法进行描述。(二)抽样调查数据统计分析思路和方法二)抽样调查数据统计分析思路和方法3关联分析关联分析 对暴露和疾病的关系可作初步的关联分析,如对暴露和疾病的关系可作初步的关联分析,如:n计量资料的比较采用计量资料的比较采用t检验或方差分析(检验或方差分析(ANOVA)n率的比较采用率的比较采用2检验或检验或u检验。检验。n也可选择适当的自变量和因变量进行多因
11、素分析,也可选择适当的自变量和因变量进行多因素分析,多重线性回归分析多重线性回归分析或或Logistic回归分析。回归分析。(三)生态学研究数据统计分析思路和方法(三)生态学研究数据统计分析思路和方法n通常采用比较、分析等常用的统计学处理技术。通常采用比较、分析等常用的统计学处理技术。在描述研究因素与疾病或健康状况的关系时,通在描述研究因素与疾病或健康状况的关系时,通常以图示法直观表述。常以图示法直观表述。驱虫药与脑炎的因果关系驱虫药与脑炎的因果关系 (三)生态学研究数据统计分析思路和方法(三)生态学研究数据统计分析思路和方法多组比较资料的分析,则包括:多组比较资料的分析,则包括:1直线回归分
12、析直线回归分析 将各群体研究因素的平均暴露水平作为自变量,将各群体研究因素的平均暴露水平作为自变量,以疾病的频率作为应变量,通过计算生态学相关系以疾病的频率作为应变量,通过计算生态学相关系数和回归系数,进行相关回归分析。由于在生态学数和回归系数,进行相关回归分析。由于在生态学研究中,一般可获得发病率,故可计算。研究中,一般可获得发病率,故可计算。2危险度分析危险度分析 计算相对危险度、归因危险度和人群归因危险计算相对危险度、归因危险度和人群归因危险度百分比。度百分比。二、二、 分析性研究分析性研究(一)病例对照研究数据统计分析思路和方法(一)病例对照研究数据统计分析思路和方法n描述性分析描述性
13、分析n推断性分析推断性分析1描述性分析描述性分析(1)一般性描述)一般性描述 首先描述病例和对照的来源、样本例数、匹配首先描述病例和对照的来源、样本例数、匹配比例等,然后描述研究对象的一般特征,如性别、比例等,然后描述研究对象的一般特征,如性别、年龄、职业、出生地、居住地、疾病类型等。年龄、职业、出生地、居住地、疾病类型等。1描述性分析描述性分析(2)均衡性检验)均衡性检验 比较病例组与对照组研究因素以外的某些特征比较病例组与对照组研究因素以外的某些特征构成是否齐同,检验其可比性。构成是否齐同,检验其可比性。n计量指标的比较(如两组平均年龄的比较)可采用计量指标的比较(如两组平均年龄的比较)可
14、采用t检检验、验、ANOVA;n计数指标的比较(如两组性别构成比较)可采用计数指标的比较(如两组性别构成比较)可采用2检检验。验。n对有统计学显著差异的因素,在分析时应考虑它对主对有统计学显著差异的因素,在分析时应考虑它对主要关联因素的影响。要关联因素的影响。2推断性分析推断性分析(1)成组设计病例对照研究资料的分析)成组设计病例对照研究资料的分析 比较病例组和对照组之间研究因素暴比较病例组和对照组之间研究因素暴露比例的差异,推断暴露和疾病之间是否露比例的差异,推断暴露和疾病之间是否存在统计学关联(存在统计学关联(2检验),计算关联强检验),计算关联强度(度(OR)及其)及其95的可信区间。的
15、可信区间。病例对照研究的资料整理表2推断性分析推断性分析(2)成组设计分层资料的分析)成组设计分层资料的分析 分层分析是把研究人群(暴露与未暴露人群分层分析是把研究人群(暴露与未暴露人群或者病例与对照)根据某些特征和因素分为不同或者病例与对照)根据某些特征和因素分为不同层(如按性别分为两层),然后分别分析各层中层(如按性别分为两层),然后分别分析各层中暴露与疾病的关联。暴露与疾病的关联。2推断性分析推断性分析(2)成组设计分层资料的分析)成组设计分层资料的分析 如果各层如果各层OR值接近,异质性检验无统计学意值接近,异质性检验无统计学意义,则可通过义,则可通过Mantal-haenszel方法
16、计算方法计算2MH,并计算控制混杂因素(分层因素)影响后暴露和并计算控制混杂因素(分层因素)影响后暴露和疾病之间真实的关联强度疾病之间真实的关联强度ORMH及其及其95可信区间可信区间。表57n按年龄分层 计算OR值两层的OR均较不分层的OR(2.20)大。进一步分析 年龄对MI的关系按OC与MI的关系列表计算 2=7.70, RR=2.20可见OC与MI有联系2推断性分析推断性分析(2)成组设计分层资料的分析)成组设计分层资料的分析 如果各层如果各层OR值相差较大,异质性检验有统值相差较大,异质性检验有统计学意义,则不宜采用计学意义,则不宜采用Mantal-haenszel方法方法合并,可通
17、过计算标准化死亡比(合并,可通过计算标准化死亡比(standard mortality ratio,SMR)或标准化率比)或标准化率比(standard rate ratio,SRR),评价控制混),评价控制混杂因素影响后暴露和疾病的真实关联强度(具体杂因素影响后暴露和疾病的真实关联强度(具体原理和计算方法参见相关专业书籍)原理和计算方法参见相关专业书籍)2推断性分析推断性分析(3)成组设计分级暴露资料的分析)成组设计分级暴露资料的分析 若能获得某暴露因素在不同暴露水平若能获得某暴露因素在不同暴露水平的资料,计算不同暴露等级的的资料,计算不同暴露等级的OR值,并作值,并作趋势性趋势性2检验,分
18、析疾病和暴露的剂量反检验,分析疾病和暴露的剂量反应关系(应关系(dose-response relationship),),以增加因果关系推断的依据。以增加因果关系推断的依据。2推断性分析推断性分析(4)1:1配对和配对和1:M配比设计资配比设计资料的分析料的分析 1:1配对和配对和1:M配比设计病例对照配比设计病例对照研究资料的分析方法与成组设计资料研究资料的分析方法与成组设计资料的分析方法不同。的分析方法不同。cbcb22) 1(bcOR 2推断性分析推断性分析(5)多因素分析)多因素分析 在病例对照研究中往往需要同时研究多在病例对照研究中往往需要同时研究多个因素的作用,如果仅应用一般分层
19、分析方个因素的作用,如果仅应用一般分层分析方法同时对若干因素加以控制,计算复杂且受法同时对若干因素加以控制,计算复杂且受样本量的限制。随着多因素分析软件的出现,样本量的限制。随着多因素分析软件的出现,可比较容易地分析多个因素与疾病的联系、可比较容易地分析多个因素与疾病的联系、联系程度以及各因素之间的相互关系。目前联系程度以及各因素之间的相互关系。目前经常使用的有条件和非条件经常使用的有条件和非条件Logistic回归模回归模型。型。2推断性分析推断性分析(6)交互作用与效应修饰的分析)交互作用与效应修饰的分析 交互作用主要表现为暴露与疾病的联系由于受交互作用主要表现为暴露与疾病的联系由于受某个
20、因素的作用而改变,这因素称为某个因素的作用而改变,这因素称为效应修饰因素效应修饰因素(effect modifier),其所产生的影响为,其所产生的影响为效应修饰效应修饰(effect modification)。2推断性分析推断性分析(6)交互作用与效应修饰的分析)交互作用与效应修饰的分析 在病例对照研究中,评价交互作用最常用的方在病例对照研究中,评价交互作用最常用的方法是按某一因素分层后,再看各层的法是按某一因素分层后,再看各层的OR是否相同,是否相同,一般需检验各层一般需检验各层OR是否同质。是否同质。 通常可以用多元回归分析的方法来评价交互作通常可以用多元回归分析的方法来评价交互作用,
21、如果某个代表交互作用的回归系数具有显著性,用,如果某个代表交互作用的回归系数具有显著性,就认为该系数所代表的几个因素之间存在交互作用。就认为该系数所代表的几个因素之间存在交互作用。常用的有常用的有Logistic回归回归、Cox模型模型和和对数直线模型对数直线模型等。等。(二)队列研究数据统计分析思路和(二)队列研究数据统计分析思路和过程过程1. 描述性分析描述性分析2. 推断性分析推断性分析3. 标化比的计算标化比的计算1. 描述性分析描述性分析(1)一般性描述)一般性描述 描述研究对象的组成、社会人口学特征、随访描述研究对象的组成、社会人口学特征、随访经过、随访时间、结局的发生和失访情况等
22、。经过、随访时间、结局的发生和失访情况等。1. 描述性分析描述性分析(2)均衡性检验)均衡性检验 比较各组研究因素以外的某些特征构成是否齐同,检验其可比较各组研究因素以外的某些特征构成是否齐同,检验其可比性;对各组的失访率也要进行比较。比性;对各组的失访率也要进行比较。n计量指标的比较采用计量指标的比较采用t检验、检验、ANOVA;n计数指标的比较采用计数指标的比较采用2检验或检验或u检验。检验。n对差异有统计学意义的因素,在分析时应考虑它对暴露和对差异有统计学意义的因素,在分析时应考虑它对暴露和疾病关系的影响。疾病关系的影响。1. 描述性分析描述性分析(3)队列发病率或死亡率的计算)队列发病
23、率或死亡率的计算 根据研究人群的稳定程度,队列通常分为固定根据研究人群的稳定程度,队列通常分为固定队列(队列(fixed cohort)和开放队列()和开放队列(open cohort),两种队列人群发病率或死亡率的计算指),两种队列人群发病率或死亡率的计算指标不同。但通常都要计算累计发病率或发病密度。标不同。但通常都要计算累计发病率或发病密度。2. 推断性分析推断性分析 比较暴露组和对照组(或多组)之间比较暴露组和对照组(或多组)之间发病率或死亡率的差异,推断暴露和疾病发病率或死亡率的差异,推断暴露和疾病之间是否存在统计学关联。之间是否存在统计学关联。n符合正态分布或近似状态分布,可进行两符
24、合正态分布或近似状态分布,可进行两个率差别的个率差别的u检验;检验;n样本较小、发病率较低时,可用直接概率样本较小、发病率较低时,可用直接概率法、二项分布或法、二项分布或Poisson分布检验;分布检验;n样本稍大和发病率稍大时,可用四格表样本稍大和发病率稍大时,可用四格表2检验。检验。队列研究的资料整理表2. 推断性分析推断性分析n再分组或分层计算关联强度相对危险度再分组或分层计算关联强度相对危险度(relative risk,RR)和)和95的可信区间,的可信区间,以及危险度指标。危险度指标包括以及危险度指标。危险度指标包括:n归因危险度(归因危险度(AR)n归因危险度百分比(归因危险度百
25、分比(ARP)n人群归因危险度(人群归因危险度(PAR)n人群归因危险度百分比(人群归因危险度百分比(PARP)3. 标化比的计算标化比的计算n当研究对象人数较少或死亡(发病)率较低时不宜计当研究对象人数较少或死亡(发病)率较低时不宜计算率,此时可以全人口的死亡(发病)率作为标准,算率,此时可以全人口的死亡(发病)率作为标准,计算该观察人群的预期死亡(发病)人数,然后计算计算该观察人群的预期死亡(发病)人数,然后计算实际死亡(发病)数与预期数之比,即为实际死亡(发病)数与预期数之比,即为标化死亡标化死亡(发病)比(发病)比(standardized mortality ratio,SMR)13. 17180)亡数(按全人口计算的预期死)(研究人群中观察死亡数EOSMR3. 标化比的计算标化比的计算n当未能获得人群历年的人口资料,而仅有死亡当未能获得人群历年的人口资料,而仅有死亡人数、日期和年龄,则可计算人数、日期和年龄,则可计算标化比例死亡比标化比例死亡比(standardized proportional mortality ratio,SPMR),即以全人口中某病因死亡占,即以全人口中某病因死亡占全死因死亡的比例乘以该人群实际死亡数而获全死因死亡的比例乘以该人群实际死亡数而获得预期死亡数,然后计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电子邮件使用守则说明
- 2026年郑州工业技师学院招聘工作人员13名备考题库附答案详解(轻巧夺冠)
- 2026青岛颐杰鸿利科技有限公司招聘备考题库含答案详解(a卷)
- 2026南京银行上海分行长期社会招聘备考题库及答案详解(基础+提升)
- 2026年牡丹江穆棱市特聘农技员招募8人备考题库附答案详解(培优)
- 2026海南陵水黎族自治县招聘教师28人备考题库(第一号)附答案详解(研优卷)
- 2026江西九江市武宁县总医院妇幼保健院院区编外人员招聘2人备考题库(含答案详解)
- 2026漳州供销集团市场化选聘部门经理2人备考题库及答案详解(全优)
- 2026福建南平建阳区童游街道社区卫生服务中心招聘编外工作人员的1人备考题库含答案详解(突破训练)
- 2026遵义医科大学第二附属医院第十四届贵州人才博览会引才3人工作备考题库及答案详解(基础+提升)
- 2026年上海市徐汇区初三语文二模试卷及答案(详解版)
- 2026贵州黔晟投资有限公司第一批社会招聘8人建设考试备考试题及答案解析
- (正式版)DB32∕T 2940-2016 《鲜食玉米品种 苏玉糯11》
- 视频监控系统监理实施细则
- (2025年)宁波市江北区辅警考试题《公安基础知识》综合能力试题库附答案
- 安宁疗护评价与考核制度
- 内科主治医师神经内科学考试历年真题章节题库及答案
- 损害管制课件
- 新22J01 工程做法图集
- 清创缝合-课件
- 安全隐患排查整改台账
评论
0/150
提交评论