流行病学数据统计分析策略 ppt课件_第1页
流行病学数据统计分析策略 ppt课件_第2页
流行病学数据统计分析策略 ppt课件_第3页
流行病学数据统计分析策略 ppt课件_第4页
流行病学数据统计分析策略 ppt课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

流行病学数据统计分析策略* 2主要内容n 概述n 专题研究的数据分析n 常规收集的流行病学数据的分析 * 3第一节 概述n 流行病学研究与流行病学数据n 流行病学数据分析的目的n 流行病学数据中的变量分类n 流行病学数据分析的内容* 4一、流行病学研究与流行病学数据n 狭义的 流行病学数据 ( epidemiological data) 指任何来自针对明确研究目的而开展特定流行病学研究所收集的资料。n 广义的流行病学数据还包括出于其他目的和用途而收集的、可以用来定量地探索疾病健康或医疗卫生服务其他问题的资料。n 即一切可为流行病学所用的数据。 目前的临床大数据是个宝库。* 5二、流行病学数据分析的目的n 流行病学数据分析是 针对明确研究问题、具有明确目的 、采用特定方法对流行病学数据进行统计整理、统计描述、统计推断和总结。n 流行病学研究的问题涉及疾病分布、病因与危险因素、诊断、预防和治疗效果评价等。n 数据分析的根本是正确地回答有意义的问题,而不是统计学数字游戏。* 6流行病学数据分析的目的n 估计有关统计学指标,如相对危险度;n 估计该统计学指标的可信区间;n 控制可能的混杂因素;n 分析剂量反应关系;n 分析可能的效应修饰因子;n 分析可能存在的偏倚。* 7三、流行病学数据中的变量分类 n 典型的流行病学研究中变量可根据其用途分为五类:n 暴露变量:因,自变量,可以有多个n 结局变量:果,因变量,是数据分析的核心n 混杂因素:需要控制n 效应修饰因素:需要描述n 其他变量:* 8按统计学分类n 定性:二分类和多分类(无序多分类)n 定量:在多数流行病学研究中被转化为分类变量n 半定量(分级,有序多分类)n 同一个研究中,因变量和自变量的关系应该是固定的、不能互换。但在不同的研究中,一个变量在这个研究中可能是果,在另一个研究中也可能是因。例如,高血压可能是遗传的结果,血压也可能是心脑血管事件的原因。* 9四、流行病学数据分析的内容 n 描述研究对象的数量变动;n 变量分类和数据整理;n 描述和比较组间基线资料;n 估计结局事件发生频率;n 估计效应大小及其可信区间;n 识别和控制混杂;n 识别和测量效应修饰作用;n 识别和测量剂量反应关系;n 其他分析。 * 10第二节 流行病学专题研究的数据分析一、描述研究对象的数量变动数据分析的第一步须对研究对象数量随时间的变动进行描述,这是判断选择偏倚是否存在及其大小的主要依据;对选样、抽样和筛选都应交代原则和方法;对退出和失访都应记录数量和原因 。* 11* 12二、流行病学变量的分类与数据转换n 转换目的: 习惯、专业考量、模型限制n 转换类型:定量转定性或分级,定性转定量n 转换常用原则:借鉴既往同类研究的分级方法;按照通用的分级标准,如年龄可按国际通用的婴儿、幼儿、青少年、青年、中年、老年的年龄切点来分级;把研究人群分成每组人数均等的 35组等。 * 13三、描述基线资料n 基线资料就是有关研究对象代表性和混杂因素的信息资料。n 基线资料描述的基本目的:一是交待研究对象的特征,提供其代表人群的信息,据此判断结果的外推人群和外推性;二是评估暴露组和非暴露组之间混杂因素的可比性,检查存在混杂的可能性。n 描述基线资料时,通常在总体描述基础上,对暴露组和非暴露组还要分别进行描述。 * 14四、结局事件发生的频率n 一般要求用率表示,如发病率。发病率由三个因素决定:观察时间、可能发病的总人数和实际发病人数。n 一般情况下,发病率的分子是在一定时间内发病的总人数。n 分母则因研究设计不同而异。当发病率较低,且每个人的观察时间长短基本一致,可用研究开始时该组人数作分母计算发病率,叫做累积发病率( cumulative incidence)。当结局事件发生率较高(如晚期癌症治疗试验中的死亡)或每个人的观察时间相差较大时,这时可用人时数(如人年数, person-years)做分母计算发病率,称作人时发病率( person-time incidence rate或发病密度( incidence density), * 15五、估计效应值n 效应就是暴露或治疗对结局作用或影响的大小,多用暴露组与非暴露组或治疗组与对照组间发病率的差别来表达。* 16* 17六、估计效应可信区间n 由于随机误差,各效应指标的点估计不能代表效应的真实值,可信区间( Confidence Interval, CI)可用来表达由随机误差引起的效应估计值的不确定性。实践中一般采用 95%可信区间,可以将其理解为真实效应值有 95%的可能在这个区间之内。若效应指标的点估计值为 X,标准误为 SE,该效应指标的 95可信区间: 95 CI X1.96SE,其中,( X1.96SE)为其下限,( X 1.96SE)为其上限。 * 18七、识别和控制混杂n 混杂是由于同一个研究里暴露对某疾病的作用与其他病因的作用交织在一起导致暴露效应估计上的误差。n 混杂必须同时具备三个条件:其一,是疾病确定的病因或危险因素;其二,不是暴露和疾病间的中间因素;其三,可疑的混杂因素在暴露组和非暴露组的分布不均衡。如性别可能就是吸烟与肺癌关系中的一个混杂因素。* 19n 混杂的控制就是控制混杂的第三个条件,办法有:n 设计阶段有三种方法:限制、匹配和随机分组;n 数据分析阶段也有三种方法:直接标化法、分层分析和多元回归分析。 * 20八、交互作用n 交互作用不同于混杂。混杂是粗效应值估计时的一种偏倚,需要控制和消除;交互作用是效应大小随第三因素暴露强度或剂量变化而变化的现象。 n 区别交互作用和混杂的方法是一致性检验。如果层间差异无显著性( P0.05),说明不存在交互作用,这时可按混杂处理,可以用一个加权平均效应值来表达,如果平均效应值与粗效应值一致,说明无混杂。 * 21交互作用模型及其相对性决策应基于相加模型* 22九、识别和测量剂量反应关系n 识别和测量剂量反应关系的分析方法主要有分层分析和回归分析。 * 23第三节 常规收集的流行病学数据的分析常规数据分析的特殊性有三点:n 第一,对研究问题的设定和对分析结果真实性的评估;n 第二,由于没有预先设定研究问题,可研究的问题取决于资料内容和性质;n 第三,设计框架不清楚或不完善,存在多种偏倚,结果真实性较差或不确定。n 本节将以医院的病人资料为例,说明常规数据分析的目的、方法、步骤和注意事项。 * 24一、常规数据的特征(一)数据的时间框架和分类n 时间框架指数据的时间特征,主要分为随访数据(队列数据)和非随访数据(现况数据)。n 现况数据主要探索病人现况、服务状况和诊断准确性,偶尔用于初步探索病因、疗效和不良反应。 队列数据可用于大多数临床问题的探索 。* 25(二)变量的特征和分类n 按照临床特征可将常规数据中的变量分为治疗措施、诊断结果、病因 /危险因素、预后因素、结局、服务相关因素(如药价、医疗保险等)。n 变量决定可能的研究问题 。例如,数据中无治疗信息,则无法研究疗效和副作用;无诊断结果,则无从研究诊断准确性。无结局信息,则不能研究疗效、预后因素、危险因素。* 26二、形成研究问题n 根据数据的变量特征,可以初步形成可研究问题的范围。n 欲进行诊断准确性研究,数据库里必须有检查结果和疾病诊断信息。n 研究副作用,基线资料中必须有治疗信息,随访资料中须有副作用的信息。n 评估疗效,基线资料中须有治疗的信息,随访资料中须有结局信息。n 研究危险因素,基线资料中须有可疑病因的信息,随访资料中须有有关疾病的信息。n 对研究者最大的挑战不是如何进行分析,而是如何形成研究问题? * 27三、常规数据 “研究设计 ”的缺陷* 28n 研究设计最重要的三个因素是时间、人群和变量。 时间因素包括时点还是时间段,如何定义起始时间、时间走向、变量间的时间关系;人群因素包括人群特征,选择过程,及比较组的形成;变量因素包括测量指标、何时测量、测量的准确性。 n 通过比较常规数据收集的 “设计框架 ”和最佳研究设计,可以发现常规数据的设计缺陷,判断可能引起的偏倚。 在时间、人群和变量特征上与最佳设计的差异,就是常规数据的缺陷所在, 也是偏倚可能出现的地方。n 主要缺陷是非随机 ,失访或变量缺失。 * 29四、估计相应的指标n 根据研究目的以及最佳研究设计,就能够确定需要估计的指标。n 现况研究中,只需要估计有关变量的均数和百分数;n 评估治疗效果时,主要估计治疗对结局作用的大小;n 评估诊断的准确性,主要估计灵敏度和特异度;n 研究副

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论