流行病学数据统计分析策略ppt课件

上传人：石*** IP属地：广东上传时间：2020-04-21 格式：PPT 页数：40 大小：210KB 积分：18 举报 版权申诉

已阅读5页，还剩35页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 流行病学数据统计分析策略 2020 4 21 2 主要内容概述专题研究的数据分析常规收集的流行病学数据的分析 2020 4 21 3 第一节概述流行病学研究与流行病学数据流行病学数据分析的目的流行病学数据中的变量分类流行病学数据分析的内容 2020 4 21 4 一流行病学研究与流行病学数据狭义的流行病学数据 epidemiologicaldata 指任何来自针对明确研究目的而开展特定流行病学研究所收集的资料广义的流行病学数据还包括出于其他目的和用途而收集的可以用来定量地探索疾病健康或医疗卫生服务其他问题的资料即一切可为流行病学所用的数据目前的临床大数据是个宝库 2020 4 21 5 二流行病学数据分析的目的流行病学数据分析是针对明确研究问题具有明确目的采用特定方法对流行病学数据进行统计整理统计描述统计推断和总结流行病学研究的问题涉及疾病分布病因与危险因素诊断预防和治疗效果评价等数据分析的根本是正确地回答有意义的问题而不是统计学数字游戏 2020 4 21 6 流行病学数据分析的目的估计有关统计学指标如相对危险度估计该统计学指标的可信区间控制可能的混杂因素分析剂量反应关系分析可能的效应修饰因子分析可能存在的偏倚 2020 4 21 7 三流行病学数据中的变量分类典型的流行病学研究中变量可根据其用途分为五类暴露变量因自变量可以有多个结局变量果因变量是数据分析的核心混杂因素需要控制效应修饰因素需要描述其他变量 2020 4 21 8 按统计学分类定性二分类和多分类无序多分类定量在多数流行病学研究中被转化为分类变量半定量分级有序多分类同一个研究中因变量和自变量的关系应该是固定的不能互换但在不同的研究中一个变量在这个研究中可能是果在另一个研究中也可能是因例如高血压可能是遗传的结果血压也可能是心脑血管事件的原因 2020 4 21 9 四流行病学数据分析的内容描述研究对象的数量变动变量分类和数据整理描述和比较组间基线资料估计结局事件发生频率估计效应大小及其可信区间识别和控制混杂识别和测量效应修饰作用识别和测量剂量反应关系其他分析 2020 4 21 10 第二节流行病学专题研究的数据分析一描述研究对象的数量变动数据分析的第一步须对研究对象数量随时间的变动进行描述这是判断选择偏倚是否存在及其大小的主要依据对选样抽样和筛选都应交代原则和方法对退出和失访都应记录数量和原因 2020 4 21 11 2020 4 21 12 二流行病学变量的分类与数据转换转换目的习惯专业考量模型限制转换类型定量转定性或分级定性转定量转换常用原则借鉴既往同类研究的分级方法按照通用的分级标准如年龄可按国际通用的婴儿幼儿青少年青年中年老年的年龄切点来分级把研究人群分成每组人数均等的3 5组等 2020 4 21 13 三描述基线资料基线资料就是有关研究对象代表性和混杂因素的信息资料基线资料描述的基本目的一是交待研究对象的特征提供其代表人群的信息据此判断结果的外推人群和外推性二是评估暴露组和非暴露组之间混杂因素的可比性检查存在混杂的可能性描述基线资料时通常在总体描述基础上对暴露组和非暴露组还要分别进行描述 2020 4 21 14 四结局事件发生的频率一般要求用率表示如发病率发病率由三个因素决定观察时间可能发病的总人数和实际发病人数一般情况下发病率的分子是在一定时间内发病的总人数分母则因研究设计不同而异当发病率较低且每个人的观察时间长短基本一致可用研究开始时该组人数作分母计算发病率叫做累积发病率 cumulativeincidence 当结局事件发生率较高如晚期癌症治疗试验中的死亡或每个人的观察时间相差较大时这时可用人时数如人年数 person years 做分母计算发病率称作人时发病率 person timeincidencerate或发病密度 incidencedensity 2020 4 21 15 五估计效应值效应就是暴露或治疗对结局作用或影响的大小多用暴露组与非暴露组或治疗组与对照组间发病率的差别来表达 2020 4 21 16 2020 4 21 17 六估计效应可信区间由于随机误差各效应指标的点估计不能代表效应的真实值可信区间 ConfidenceInterval CI 可用来表达由随机误差引起的效应估计值的不确定性实践中一般采用95 可信区间可以将其理解为真实效应值有95 的可能在这个区间之内若效应指标的点估计值为X 标准误为SE 该效应指标的95 可信区间 95 CI X 1 96SE 其中 X 1 96SE 为其下限 X 1 96SE 为其上限 2020 4 21 18 七识别和控制混杂混杂是由于同一个研究里暴露对某疾病的作用与其他病因的作用交织在一起导致暴露效应估计上的误差混杂必须同时具备三个条件其一是疾病确定的病因或危险因素其二不是暴露和疾病间的中间因素其三可疑的混杂因素在暴露组和非暴露组的分布不均衡如性别可能就是吸烟与肺癌关系中的一个混杂因素 2020 4 21 19 混杂的控制就是控制混杂的第三个条件办法有设计阶段有三种方法限制匹配和随机分组数据分析阶段也有三种方法直接标化法分层分析和多元回归分析 2020 4 21 20 八交互作用交互作用不同于混杂混杂是粗效应值估计时的一种偏倚需要控制和消除交互作用是效应大小随第三因素暴露强度或剂量变化而变化的现象区别交互作用和混杂的方法是一致性检验如果层间差异无显著性 P 0 05 说明不存在交互作用这时可按混杂处理可以用一个加权平均效应值来表达如果平均效应值与粗效应值一致说明无混杂 2020 4 21 21 交互作用模型及其相对性决策应基于相加模型 2020 4 21 22 九识别和测量剂量反应关系识别和测量剂量反应关系的分析方法主要有分层分析和回归分析 2020 4 21 23 第三节常规收集的流行病学数据的分析常规数据分析的特殊性有三点第一对研究问题的设定和对分析结果真实性的评估第二由于没有预先设定研究问题可研究的问题取决于资料内容和性质第三设计框架不清楚或不完善存在多种偏倚结果真实性较差或不确定本节将以医院的病人资料为例说明常规数据分析的目的方法步骤和注意事项 2020 4 21 24 一常规数据的特征一数据的时间框架和分类时间框架指数据的时间特征主要分为随访数据队列数据和非随访数据现况数据现况数据主要探索病人现况服务状况和诊断准确性偶尔用于初步探索病因疗效和不良反应队列数据可用于大多数临床问题的探索 2020 4 21 25 二变量的特征和分类按照临床特征可将常规数据中的变量分为治疗措施诊断结果病因危险因素预后因素结局服务相关因素如药价医疗保险等变量决定可能的研究问题例如数据中无治疗信息则无法研究疗效和副作用无诊断结果则无从研究诊断准确性无结局信息则不能研究疗效预后因素危险因素 2020 4 21 26 二形成研究问题根据数据的变量特征可以初步形成可研究问题的范围欲进行诊断准确性研究数据库里必须有检查结果和疾病诊断信息研究副作用基线资料中必须有治疗信息随访资料中须有副作用的信息评估疗效基线资料中须有治疗的信息随访资料中须有结局信息研究危险因素基线资料中须有可疑病因的信息随访资料中须有有关疾病的信息对研究者最大的挑战不是如何进行分析而是如何形成研究问题 2020 4 21 27 三常规数据研究设计的缺陷 2020 4 21 28 研究设计最重要的三个因素是时间人群和变量时间因素包括时点还是时间段如何定义起始时间时间走向变量间的时间关系人群因素包括人群特征选择过程及比较组的形成变量因素包括测量指标何时测量测量的准确性通过比较常规数据收集的设计框架和最佳研究设计可以发现常规数据的设计缺陷判断可能引起的偏倚在时间人群和变量特征上与最佳设计的差异就是常规数据的缺陷所在也是偏倚可能出现的地方主要缺陷是非随机失访或变量缺失 2020 4 21 29 四估计相应的指标根据研究目的以及最佳研究设计就能够确定需要估计的指标现况研究中只需要估计有关变量的均数和百分数评估治疗效果时主要估计治疗对结局作用的大小评估诊断的准确性主要估计灵敏度和特异度研究副作用主要估计治疗对不良结局的作用大小值 2020 4 21 30 常规数据分析的具体步骤分析数据的时间框架和变量的特征提出可探索的问题确定最终研究的问题与最佳研究设计比较检查数据的研究设计缺陷估计必要的指标及其可信区间与其它必要的分析分析数据中可能存在的其他偏倚例如选择偏倚信息偏倚和混杂偏倚综合设计缺陷偏倚和结果对研究问题做出结论 2020 4 21 31 五评估数据中的偏倚分析常规数据时针对偏倚需考虑以下问题设计框架中是否具有病因或治疗结局和混杂因素的信息结局的测量是否发生在病因或治疗发生后的一段时间内是否存在选择偏倚数据代表性及失访率等是否存在信息偏倚是否存在混杂偏倚有关混杂因素的基线信息是否完整 2020 4 21 32 一评估数据中的选择偏倚很多数据的代表性很差或总体不明病人还经过了检验检查的选择最严重的选择偏倚是选择性随访和失访大多数病人缺乏结局资料可能是我国医院常规数据中最大的问题之一 2020 4 21 33 二评估数据中的信息偏倚数据的准确性和可靠性取决于医疗机构水平的高低另一个常见问题是数据质量不一致原因包括同一个医院不同时期使用的检查仪器试剂方法和标准不同检验员的水平不同随访时间不足也可能造成测量误差 2020 4 21 34 三评估数据中的混杂偏倚由于利用常规资料的研究多属于探索性研究并不确定哪些因素是混杂因素即使混杂因素已知常规数据中常缺乏混杂因素的信息导致无法控制混杂因素即使收集了混杂因素的数据可能信息质量不好致使混杂的控制不彻底 2020 4 21 35 六常规资料的利用诊断方法准确性的评估急性病住院病人的转归和预后围产期和新生儿问题的研究急诊问题的研究罕见疾病的病因和转归研究疾病危险因素初探药物毒副作用的研究某类病人特征的观察有关服务和用药的研究 2020 4 21 36 由于常规数据的局限性其分析目的主要是发现新问题提出新假设很少用来验证和确定研究假设不适用于已得到广泛研究的存在高质量证据的基本定论的问题 2020 4 21 37 提高使用效果的措施利用部分常规数据再依据研究问题收集少量新数据可以扩展常规数据的研究用途尤其在诊断准确性研究病因和副作用的病例对照研究罕见病的转归和预后研究领域扩大数据来源例如一个科室或医院的病人可能代表性差失访率高如果汇总一个大城市所有医院的数据将会大大增加代表性降低失访率电子病历使跨医院和地区临床数据的合并成为可能同时利用多个不同性质的常规数据例如死亡作为观察结局时可以同时利用一个地区或全国的死亡登记资料 2020 4 21 38 针对研究的问题尽可能对病人重要的容易准确测量的结局如死亡脑卒中进行

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

流行病学数据统计分析策略ppt课件

文档简介

温馨提示

最新文档

评论

流行病学数据统计分析策略ppt课件

文档简介

温馨提示

最新文档

评论

相关文档