版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章队列研究9.1研究设计概述9.2常见的分析方法9.3队列研究的R语言实现及示例9.4练习案例9.5小结
9.1研究设计概述9.1研究设计概述9.1.1概念队列研究是一种由因及果的分析流行病学研究方法,也被称作前瞻性研究、随访研究和纵向研究等。是在某一特定人群中,根据目前或过去某个时期是否暴露于某个待研究的因素对研究对象进行分组,或按不同的暴露水平将研究对象分成不同的亚组,随访观察各组人群待研究结局的发生情况,通过比较各组结局的发生率,从而判定暴露因素与结局的因果关系。通常用于疾病风险因素和预后因素的研究,亦可用于评估预防、筛查和治疗措施的效果。9.1.2特点队列研究本质上是观察性研究,其暴露因素不是研究者人为给予或随机分配的,而是研究人群自然暴露于待研究的暴露因素,在非干预情况下产生研究结局。研究中设置了对照组,研究对象是按照有无暴露或暴露的程度进行分组,以非暴露组或低水平暴露组作为对照组进行比较。队列研究在时间上是前瞻性的,由因及果。因果时间顺序明确,加之偏倚较少,检验暴露与结局因果关联的能力较强。9.1研究设计概述9.1.3分类依据研究对象进入队列和终止观察的时间,队列研究可分为前瞻性队列研究、历史性队列研究和双向性队列研究三种类型。1.前瞻性队列研究是队列研究的基本形式,研究开始时结局尚未出现,需通过长期随访观察以获取结局信息,具有内部效度高、时间跨度长、证据说服力强等特点。研究人员需收集受试者的基线信息,并定期进行随访调查和疾病诊断,从而评估发病率、死亡率等指标。具有内部效度高、时间跨度长、证据说服力强等特点。9.1研究设计概述9.1.3分类2.历史性队列研究在研究开始时结局已经发生,研究者利用研究对象的历史资料评估既往暴露情况并进行分组,无需前瞻性观察。相比前瞻性队列研究,回顾性队列研究具有时间和资源成本较低的优势,但其内部效度受自我报告数据限制,研究结果说服力相对较弱。3.双向性队列研究结合历史性队列研究与前瞻性队列研究的特点,在利用历史资料的基础上继续前瞻性随访,从而兼具两者优点并弥补各自不足。9.1研究设计概述9.2常见的分析方法9.2常见的分析方法9.2.1生存资料生存资料同时考虑结局事件是否发生以及出现结局所经历的时间,其生存时间通常指从研究起点(如入组、发病、确诊或治疗开始)到结局事件(如疾病发生、痊愈、死亡或复发)的时间长度。生存时间的度量单位可为年、月、日、小时等,通常不服从正态分布,且临床研究中很难获得全部研究对象的完全生存时间数据。生存资料课可分为完全数据(随访期间观察到预期结局,生存时间为起点至结局的时间)和删失数据(未能观察到结局,确切生存时间未知),删失数据还可以进一步划分为左侧删失、右侧删失和区间删失数据,其中本章讨论的方法主要针对右侧删失数据。9.2.2生存分析生存分析是处理生存资料的常用统计分析方法,结合结局事件是否出现和出现时间进行分析,以探究疾病的发展规律和影响因素,包括Kaplan-Meier分析、Cox比例风险模型等。1.Kaplan-Meier分析是一种广泛用于生存分析的非参数方法,用于评估一组人的生存或疾病自由(即不发生疾病)时间。在队列研究中,Kaplan-Meier分析通常用于估计特定事件(如死亡或疾病)发生的概率。该方法考虑了数据中存在随访时间缺失的可能,可以在有缺失的情况下计算生存率。Kaplan-Meier曲线是一种可视化生存过程的方法,可以在不同时间点上对生存率进行估计,通过对该曲线进行观察,可以研究某一特定因素或暴露对生存的影响。9.2常见的分析方法2.Cox比例风险模型Cox比例风险模型是一种半参数生存分析方法,以结局事件和生存时间为因变量,可同时评估多个因素对生存时间的影响,其核心公式如下:式中
在时间t,给定的危险因素X下,该事件发生的风险;为基准风险函数,β为回归系数,通过模型可计算风险比,其意义为:当HR=1时,代表研究因素对生存时间无影响;当HR>1时,代表风险增加,研究因素使生存时间减少;当HR<1时,代表风险降低,研究因素使生存时间增加。9.2常见的分析方法9.3队列研究的R语言实现及示例9.3队列研究的R语言实现及示例9.3.1生存资料示例survival程序包主要集成了生存分析的核心函数,包括生存分析中对象的定义函数、Kaplan-Meier/Aalen-Johansen曲线、Cox模型及参数加速失效时间模型等。以R语言survival程序包自带的lung数据集为例该数据集来自美国中北部癌症治疗小组的晚期肺癌患者研究,用于评估日常活动能力对生存时间的影响。数据包含生存时间、生存状态、年龄、性别、活动表现评分、体重下降等临床变量。通过加载生存分析包、查阅数据说明、预览前几行等基础操作,可借助该数据集演示生存曲线估计、组间比较、Cox回归等分析方法(演示)。9.3.2使用R语言进行生存分析R语言中最常用的是survival程序包,而survminer程序包则可用于对分析结果进行可视化展示。1.Kaplan-Meier分析在分析前,可先根据变量含义调整数据类型,然后通过基本函数获取各变量的描述性统计信息,也可借助专门的程序包直接生成描述性统计表(演示)。构建生存函数以估计总体生存概率,并绘制所有研究对象的Kaplan‑Meier生存曲线,展示不同时间点的生存概率(演示)。按分组变量分别估计各组的生存概率,并绘制分组的生存曲线,比较不同组别的生存过程(演示)。采用Log‑rank检验比较两组或多组生存曲线之间的差异,这是最常用的方法(演示)。9.3队列研究的R语言实现及示例2.Cox比例风险模型使用Cox回归构建单因素和多因素模型,可调整多个协变量(演示)。通过模型整体检验(似然比、Wald、log‑rank)判断显著性;查看各变量的偏回归系数(正系数增加风险)和风险比;连续变量可通过转换单位获取特定增量效应(演示)。采用逐步回归等方法根据信息准则筛选变量,并结合专业知识确定最终模型(演示)。对最终模型进行检验,包括比例风险假定检验(通过残差图判断风险比是否随时间恒定)、影响点/值检验(判断是否有离群值影响结果)、非线性检验(判断变量与生存风险是否为线性关系,必要时进行变量转换)(演示)。9.3队列研究的R语言实现及示例3.时间依赖Cox模型时间依赖Cox模型用于处理协变量对生存结局的影响随时间变化的情形(即不满足比例风险假定),分为时依系数模型和时依协变量模型两种扩展形式。时依系数模型中,协变量取值不随时间变化,但其回归系数随时间改变,可通过按时间区间分层(如对时间轴分段)的方式实现建模(演示)。时依协变量模型中,协变量取值本身随时间变化,需将原始横向数据转换为纵向数据,并用时间起点、终点定义生存对象来建立模型(演示)。9.3队列研究的R语言实现及示例4.竞争风险模型竞争风险指研究对象在出现目标结局事件的同时还可能发生其他结局事件,这些事件会阻止或降低目标事件的发生概率,形成“竞争”关系。若简单地将竞争事件视为右删失并使用传统的Kaplan-Meier法或Cox模型,会导致对目标事件发生概率的估计产生偏差,因为不同结局事件之间存在相关性。竞争风险模型采用累积风险函数来估计结局事件的累积发生概率,能在考虑竞争事件的情况下分析影响因素对目标事件的作用,弥补传统生存分析的不足,广泛应用于临床试验和流行病学调查。竞争风险数据可分为两类:经典竞争风险(各结局事件互斥,某一事件发生会阻止其他事件发生)和半式竞争风险(其他事件发生会改变目标事件的发生概率,即状态转移风险)(演示)。9.3队列研究的R语言实现及示例9.4练习案例9.4练习案例9.4.1练习案例一使用survival程序包自带的gbsg数据集分析影响乳腺癌患者预后的因素。该数据集包含1984-1989年由德国乳腺癌研究组(GermanBreastCancerStudyGroup,GBSG)进行的720例淋巴结阳性乳腺癌患者试验的记录,保留了686例患者预后变量的完整数据。请以该数据集为例,结合本章R语言相关分析方法,使用Kaplan-Meier分析及Cox回归模型进行生存分析,探讨各因素与乳腺癌预后之间的关系。
9.4练习案例9.4.2练习案例二现生成一个模拟数据集CDdata来评估某地区老年人群血管疾病短期风险的性别差异。该数据集有200名研究对象,共包含10个变量,分别为研究对象的年龄、性别、是否患糖尿病、高血压(1=正常血压,2=一级高血压,3=二级高血压,4=三级高血压)、BMI(1=正常,2=超重)、总胆固醇(<5.17mmol/L,5.17~6.21mmol/L,≥6.21mmol/L)、高密度脂蛋白胆固醇(<0.91mmol/L为1,0.91~1.55mmol/L为2,≥1.55mmol/L为3)、随访时间ftime和随访结局status(0=删失,1=心血管疾病复发或因心血管疾病死亡,2=死于非心血管疾病)为结局变量。请以该数据集为例,结合本章R语言相关分析方法,建立合适的模型进行分析:①探讨不同性别心血管疾病复发或因心血管疾病死亡的差异;②进行多因素分析。
9.5小结9.5小结本章节主要介绍了队列研究的基本原理、研究类型和数据分析方法。队列研究通过比较暴露组和非暴露组之间结局发生率的差异,从而判定暴露因素与结局之间有无关联及其关联程度。队列研究分为前瞻性、历史性和双向性三种类型。队列研究常用生存分析,R语言survival包中的函数可进行传统生存分析、比例风险假定检验及Log‑rank检验。针对一些特殊情形,可使用相关函数构建时间固定Cox模型或竞争风险模型。9.5小结本章重要函数函数所属程序包作用主要用法surfit()survival构建生存函数Surv(time,event),survfit(formula)ggsurvplot()survminer绘制生存函数ggsurvplot(fit,data,fun)survdiff()survival对生存函数进行Log-rank检验survdiff(formula,data,subset,na.action,rho=0,timefix=TRUE)coxph()survivalCox生存分析coxph(formula,data,method)cox.zph()survival检验PH假定cox.zph(fit)ggcoxzph()survivalPH假定图形诊断ggcoxzph(cox.zph(fit))ggcoxdiagnostics()survminerPH假定图形诊断ggcoxdiagnostics(fit,type=)survSplit()survival构建时间分层回归Cox回归survSplit(formula,data,subset,na.action=na.pass,cut,start="tstart",id,zero=0,episode,end="tstop",event="
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自然保护区巡护监测员QC管理水平考核试卷含答案
- 2026上海财经大学滴水湖高级金融学院非教学科研序列人员招聘1人(院聘)笔试备考试题及答案解析
- 木地板制造工安全培训效果测试考核试卷含答案
- 2026重庆璧山高新区现代工业发展促进中心招聘聘用制高层次人才1人考试备考题库及答案解析
- 2026年及未来5年市场数据中国腰果酚行业市场全景监测及投资策略研究报告
- 2026西北工业大学自动化学院赵天云团队招聘3人(陕西)考试参考题库及答案解析
- 2026青海省医疗卫生机构面向社会招聘编制内医疗卫生人员515人考试备考题库及答案解析
- 2026年吉州区城市环境卫生服务中心第一批面向社会公开招聘编外工作人员【14人】考试模拟试题及答案解析
- 2026四川达州市通川区人民医院招聘4人笔试模拟试题及答案解析
- 就业指导教师津贴方案
- 2026年高中入团笔试题
- 国家安全青春同行
- 2025四川九州电子科技股份有限公司招聘人力资源管理岗测试笔试历年参考题库附带答案详解
- 《民用航空危险品运输管理规定》考试题库150题(含答案)
- 铝方通吊顶施工技术措施方案
- DB63-T 1143-2012 青海省受损砌体结构安全性鉴定实施导则
- 运动损伤的预防、治疗与恢复
- 2024-2025学年浙江省杭州市西湖区十三中教育集团八年级下学期期中检测道德与法治试卷
- 机械设备维修成本控制措施
- 《贵州省普通国省干线公路养护科学决策指南》
- 《广东省既有建(构)筑物加固 改造工程成本取费导则》
评论
0/150
提交评论