版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第10章病例对照研究10.1概述10.2
常见的研究设计类型10.3示例实践10.4练习案例10.5小结10.1概述10.1.1概念病例对照研究(case-controlstudy)是以当前已经确诊患有某种特定疾病的一组病人作为病例组,以不患有该种特定疾病但具有可比性的一组个体作为对照组,回顾性地搜集研究对象既往各种可能的危险因素的暴露史,通过比较病例组与对照组各危险因素暴露比例的差异,判断暴露因素和疾病之间是否存在关联,以及关联的强度,从而达到探索和检验病因假说的目的。病例对照研究是一种由果(结局)溯因(暴露)的分析性流行病学研究方法,主要用于探索疾病病因、危险因素、健康相关事件的影响因素、检验病因假说等。病例对照研究的基本原理是按照研究对象的疾病状态进行分组(病例组和对照组),通过面访询问、实验室检查或复查病史等方法收集研究对象既往的暴露情况(演示)。10.1概述10.1.2特点病例对照研究是由因溯果的,根据研究结局将人群按照是否患病进行分组;病例对照研究可以分析多种暴露因素和一种疾病的关系;病例对照研究容易引入回忆偏倚和选择偏倚,但更节省人力、财力、物力,且适合罕见病、潜伏期长的疾病研究。10.1.3研究框架主要包括设计和实施两个阶段。设计阶段主要包括:定义源人群、明确病例纳入和排除标准、选择对照和样本量估计等;而实施阶段主要是根据前期研究设计,按照规定收集暴露因素和疾病的信息,进行资料整理、分析,最终得出结论。10.1概述在数据分析阶段,根据病例组某因素的暴露比值(odds病例)与对照组该因素暴露比值(odds对照)之比,计算得到比值比(oddsratio,OR),比较病例组和对照组所研究因素暴露比例的差异,分析暴露因素与疾病之间是否存在关联以及关联的强度(演示)。10.1概述10.2常见的研究设计类型病例对照研究包括多种设计类型。在实际工作中通常根据选择对照是否有某些限制将病例对照研究分为非匹配病例对照研究和匹配(matching)病例对照研究。随着流行病学研究的不断发展,在传统的病例对照研究基础上,发展和延伸出了多种病例对照研究类型,如巢式病例对照研究(nestedcase-controlstudy)、病例-队列研究(case-cohortstudy)和病例交叉研究(case-crossoverstudy)等。10.2常见的研究设计类型10.2.1非匹配病例对照研究非匹配病例对照研究对于对照组的选择一般无无任何限制和要求。对照组人数一般应等于或多于病例组人数(演示)。10.2.2匹配病例对照研究
常用的匹配方法与数据结构1.频数匹配频数匹配(frequencymatching),又称成组匹配(categorymatching),是指对照组与病例组在匹配因素的分布上一致或接近(演示)。对MatchIt程序包中提供的数据集lalonde(评估该就业培训计划对个体就业收入的影响)进行频数匹配,以展示频数匹配病例对照研究的数据形式(演示)。10.2常见的研究设计类型2.个体匹配个体匹配(individualmatching)是指以个体为单位,根据某些变量或特征,将病例与1个或N个对照进行匹配,使病例和对照在某些变量或特征方面相同或者接近。在个体匹配中可通过精确匹配(exactmatching)为病例选择对照(演示)。匹配病例对照研究可以使匹配因素在病例组和对照组之间尽量保持均衡,消除或减少匹配因素对研究结果的干扰。在匹配病例对照研究中,对照的选择非常重要,不仅关乎数据分析方法的选择,还关系到研究效能的大小。通过匹配可提高研究效率,但会导致研究者无法估计匹配变量对研究结果的可能影响,也会增加选择对照的难度。因此,选择合适的匹配方法十分重要。10.2常见的研究设计类型
匹配的常见问题在病例对照研究中将病例和对照根据不必要的因素进行匹配,企图使该因素在病例组和对照组间尽量保持一致时,可能会丢失匹配因素的信息,增加工作难度,结果反而降低研究效率,这种情况称为过度匹配(overmatching)。在一般情况下,性别、年龄之外的因素在匹配时应谨慎,以防止过度匹配,徒增研究费用和工作难度。10.2常见的研究设计类型10.2.3常见的衍生设计类型
巢式病例对照研究1.原理巢式病例对照研究是基于队列研究的病例对照研究。在队列随访过程中,把出现某种结局的病例作为病例组,并根据病例发病时间,在该队列尚未出现某种结局的个体中随机匹配一个或多个对照,组成对照组。对纳入病例组和对照组的研究对象相关资料及生物标本进行收集与检测,最后按病例对照研究(主要是匹配病例对照研究)的分析方法进行统计分析和推论,以探讨暴露因素与疾病之间的关联。2.适用情景巢式病例对照研究适用于队列人群较大、研究结局发生率较低、资料获取或生物标本检测较为复杂或者昂贵的研究情景。10.2常见的研究设计类型
病例-队列研究
1.原理病例-队列研究是病例对照研究和队列研究相结合的另一种形式。其病例组与对照组均源自一个队列。在研究开始时,根据研究目的确定合适的人群作为病例-队列研究的全队列,在全队列中按一定比例随机抽样,选出一个有代表性的样本(子队列)作为对照组;基线时的每个队列成员都有同等的机会被抽作为对照,而无须考虑每个个体贡献给该队列的人数。对全队列进行随访,在随访观察结束时,以全队列中出现的所研究疾病的全部病例作为病例组,与上述对照组进行比较,以判断暴露因素与疾病之间的关联。若子队列中的研究对象在后续随访过程中出现某种结局,该部分研究对象将会被同时视为病例组和对照组,用于后续数据分析。2.适用情景该研究的适用范围与巢式病例对照研究相似,尤其适合利用一个队列实施对一系列健康结局的研究(演示)。10.2常见的研究设计类型
病例交叉研究1.原理病例交叉研究是以发生待研究结局(某疾病或事件)的个体作为研究对象,比较同一研究对象在结局发生时(或前)某特定时间段内(危险期)的暴露情况与未发生该结局的某段时间(对照期)的暴露情况,从而估计暴露因素与结局的关联。对照期的选择是该研究设计的关键环节,目前的常用方法包括单向病例交叉研究和双向病例交叉研究。2.适用情景病例交叉设计主要应用于短暂暴露导致突发事件(如心肌梗死、脑出血等)的风险发生短暂变化时的情形(演示)。10.2常见的研究设计类型10.3示例实践10.3.1非匹配病例对照研究本节通过体力活动与慢性肾病关联研究示例介绍病例对照研究的分析方法和R语言实现。该研究纳入10000名研究对象,其中慢性肾病病例组1000名,对照组9000名。数据集共有16个变量,包括编号、性别(男性/女性)、民族(汉族/其他)、年龄(65~69/70~74/75~79/80岁及以上)、身体质量指数(低体重/正常/超重/肥胖)、教育状况(高中及以下/高中以上/未知)、吸烟状况(从不/现在/以前)、饮酒状况(从不/不嗜酒/嗜酒)、体力活动(从不/每周<1次/每周≥1次/每天)、工作状况(是/否)、药物A(是/否)、药物B(是/否)、高血压(是/否)、糖尿病(是/否)、高脂血症(是/否)、慢性肾病(是/否)等。10.3示例实践加载需要用到的R语言程序包。该数据集中除了编号为数值型变量,其余均为分类变量。对于分类变量,首先要设置对照组。结合前述summary()得到的信息,这里选择将每个分类变量中人数最多的一组作为对照组,可以通过在factor()中设置levels来实现。需要注意的是,在设置levels时,应将对照组写在最前面,即“levels=c("对照组","其他组")”(演示)。除了使用summary(),还可以通过tableone程序包中的CreateTableOne()直接输出描述性分析表”(演示)。10.3示例实践若要进一步探讨体力活动与慢性肾病之间的关联,则设置自变量为“体力活动”,因变量为“慢性肾病”;其他变量为拟纳入分析的混杂因素。由于因变量“慢性肾病”是一个二分类变量(是/否),因此当探讨一系列连续型变量和/或分类变量和一个二分类变量之间的关联时,logistic回归模型是一个非常有用的统计方法。在R语言中可通过glm()实现。该函数的基本形式为:glm(formula,family=family(link=function),data)在logistic回归模型中,概率分布(family)设置为“binomial”,相应的连接函数(function)设置为“logit”。因此logistic回归模型的代码基本形式为:glm(formula,family=binomial(link="logit"),data)(演示)10.3示例实践从Coefficients最后一栏Pr(>|z|)可以看出,民族、吸烟状况、工作状况、药物A等变量对模型的贡献不显著(p>0.05)。可以进一步采用逐步回归法来筛选变量,对模型fit1进行优化。该步骤可以通过stats程序包中的step()或MASS程序包中的stepAIC()实现(演示)。经过筛选,模型fit2剔除了民族、工作状况和药物A。上述分析尝试了两个模型fit1和fit2,下一步需要比较两个模型的拟合效果。对于两个嵌套模型(fit2中的自变量是fit1中自变量的一个子集),可以用似然比检验(likelihoodratiotest,LRT)进行比较,通过R语言自带的stats程序包中的anova()实现,test选择卡方检验(演示)。10.3示例实践可以看出,模型比较结果的卡方值不显著(p=0.4542),表明删减变量后的模型fit2和纳入所有变量的模型fit1拟合效果无显著差异。因此可以根据更简单、变量更少的模型fit2对结果进行解释。此外,还可通过赤池信息量准则(akaikeinformationcriterion,AIC)来比较模型的拟合效果,通过stats程序包中的AIC()实现(演示)。可以看出,模型fit2的AIC值较小。一般来说,在其他条件不变的情况下,AIC值越小的模型,其拟合效果越好。因此,在该案例中更倾向于用模型fit2对结果进行解释。与glm()连用的函数中可用coefficients()或coef()列出拟合模型中各变量的回归系数。10.3示例实践根据上述logistic回归模型结果,将回归系数取指数来得到OR,可通过exp()实现(演示)。此外,使用confint()可以获取回归系数的置信区间(confidenceinterval,CI),默认为95%,并使用exp()取指数(演示)。10.3.2频数匹配病例对照研究既往相关文献提示,性别和年龄是体力活动与慢性肾病关联的常见混杂因素。从前述表10.5可知,在慢性肾病患者和非慢性肾病患者中,性别和年龄的分布存在显著差别(p<0.05),病例组和对照组中协变量的不均衡分布可能影响关联的估计,因此这些变量被纳入作为匹配变量。下面按性别和年龄进行1∶2频数匹配。10.3示例实践在R语言中,KODAMA程序包中的frequency_matching()可用于实现频数匹配,其用法为:frequency_matching(data,label,times,seed)(演示)频数匹配后,查看病例组和对照组中匹配变量的分布是否存在差别(演示)。频数匹配后,1000名慢性肾病患者构成病例组,2000名非慢性肾病者构成对照组,性别、年龄在病例组和对照组间的分布没有显著差别(p>0.05)。下面采用匹配后的数据拟合模型,以探究体力活动对慢性肾病的影响(演示)。10.3示例实践10.3.3个体匹配病例对照研究在匹配的病例对照研究中,除了前述的频数匹配,个体匹配是另一种常见的配对方法。与频数匹配不同,个体匹配是以病例组和对照组中每个研究个体为单位进行匹配的。根据每个个体匹配的对照个数(1~r)不同,可分为1∶1、1∶2、1∶3、…、1∶r匹配。个体匹配可以实现匹配后研究对象的不同个体特征相近或相似,与非匹配和频数匹配相比,可以实现精确控制病例组和对照组间匹配因素对结果的干扰,使对照组在这些因素或特征上与病例组更均衡、可比。
传统的匹配方法在匹配的病例对照研究中,除了前述的频数匹配,个体匹配是另一种常见的配对方法。与频数匹配不同,个体匹配是以病例组和对照组中每个研究个体为单位进行匹配的(演示)。检验个体匹配后的病例组和对照组间变量的分布是否存在统计学差异(演示)。10.3示例实践经个体1∶2匹配后,病例组和对照组中各变量间的分布相近,差异不具有统计学意义。通过采用survival程序包中的clogit()实现,该函数的基本形式为:clogit(formula,data,weights,subset,na.action,method=c("exact","approximate","efron","breslow"),...)在以上函数模型中必须设置的要素包括formula和data,weights、subset、na.action和method为非必须设置的要素。其中,formula为构建的模型,需要在strata中设置对应的“编号”;data为分析数据集;weights表示权重;subset表示子集,可用于指定子集数据;若na.action=TURE,则不包括data中含有空值的观测,若na.action=FLASE,则不剔除data中含有空值的观测;method可设置在条件似然中使用精确的计算方法(exact)或其中一个近似值(approximate)(演示)。10.3示例实践
倾向性评分匹配法传统的匹配方法为精准匹配病例组和对照组间分布不均衡的因素或特征,操作简单易行。当需要匹配的变量过多或要求的配对比例(1∶r)过高时,传统精准的匹配会导致病例无法匹配到足够的对照。倾向性评分匹配(propensityscorematching,PSM)。PSM是指在一定协变量条件下,一个观察对象接受某种暴露/处理因素的可能性,它是一个0到1范围内连续分布的概率值。其基本原理是用一个分值,即倾向评分值的(PS值)来代替多个协变量,根据计算得出的PS分值,并采用匹配的方法来均衡各组间协变量的差异,最终估计处理效应。即通过将与PS相同或相近的研究对象在不同的组间进行匹配,使组间各特征变量的分布趋于均衡,对观察性研究中的混杂因素进行类似随机化的均衡处理,从而削弱或抵消组间混杂因素的不均衡性对研究结果的干扰。10.3示例实践PSM中的方法包括最邻近匹配(nearestneighbormatching)、卡钳匹配(calipermatching)和全局最优匹配等,其中最为常用的方法是最邻近匹配和卡钳匹配。最邻近匹配首先利用logistic回归模型计算PS值,并根据分组变量将病例组与对照组区分开,然后对病例组个体随机排序,从中选出第一个个体,并与对照组中全部个体的PS值进行比较,找出对照组中PS值相同或相近的个体进行配对,若对照组中有两个或两个以上与病例组个体的PS值相同,则随机选取。配对成功的个体从数据中剔除,对下一个个体重复如上步骤,直到病例组中每个个体都完成匹配。卡钳匹配则是在最邻近匹配集的基础上,计算两个个体间倾向性评分差值,并设定倾向性评分差值在某一范围(称为卡钳值,caliper)内。根据倾向性评分差值,首先删除两组PS值之差在卡钳值范围外的配对个体,得到不同精度的匹配集,然后计算协变量之间的均衡性及样本不平衡性,并将结果进行汇总。10.3示例实践在R语言中,PSM可采用MatchIt包中matchit()实现,具体形式为(演示):matchit(formula,data,method,distance,caliper,ratio,...)
其中,formula为构建的模型,以结局变量为因变量,匹配的变量作为自变量;data为分析数据集;method可用于指定PSM的方法(如最邻近匹配、卡钳匹配和全局最优匹配等);distance可用于设置要使用的距离测量参数;caliper可用于设置卡钳值;ratio可用于设置PSM配对比。为了充分考虑混杂因素对关联估计的影响,本部分采用PSM进行个体模糊匹配,尽可能纳入更多的协变量(包括性别、年龄、民族、身体质量指数、教育状况和工作状况)(演示)。PSM后病例组和对照组间变量分布情况(演示)。拟合模型进行统计分析(演示)。当拟探讨的变量为连续型数值时,除了采用上述分析方法估计关联,也可以使用base程序包中cut()根据一定的标准将连续型变量转换为多分类变量,以开展分类分析;还可采用stats程序包中spline(),并结合predict()或termplot()绘制暴露-反应关系曲线。10.3示例实践10.4练习案例以下模拟数据集有3500名研究对象,其中病例组1500名,对照组2000名。该数据集共有12个变量,包括研究对象的编号、年龄、性别、药物使用、高血压、糖尿病、高脂血病、吸烟状况、民族(汉族/其他)、教育状况(高中及以上/高中以下/未知)、工作状况、心血管疾病等。数据结构如表10.11所示。请以该数据集为例,结合本章内容,从非匹配病例对照研究、频数匹配病例对照研究和个体匹配病例对照研究3种不同的研究设计角度出发,探讨高脂血症与心血管疾病之间的关联性。10.4练习案例10.5小结本章介绍了病例对照研究的基本原理、研究类型和数据分析方法。病例对照研究通过比较病例组与对照组中危险因素暴露比例的差异,探究暴露和疾病之间的关联。R语言是进行数据分析的高效工具,可开展数据描述、匹配、模型拟合、模型优化、结果读取和结果输出等多项操作。使用summary()和CreateTableOne()等可实现数据的描述性分析。病例对照的匹配实现方法多种多样,可通过自编写函数或使用已有程序包中的函数帮助实现,如使用frequency_matching()进行频数匹配、使用matchit()进行倾向性评分匹配。对于模型拟合,非匹配病例对照研究和频数匹配病例对照研究可使用glm()实现,个体病例对照研究可使用clogit()实现。模型优化可通过stepAIC()使用逐步回归法进行,并通过anova()和AIC()等比较不同模型的拟合效果。结果读取可通过coefficients()、coef()、confint()等函数进行。10.5小结本章重要函数函数所属程序包作用主要用法CreateTableOne()tableone数据总结CreateTableOne(vars,factorVars,strata,data)frequency_matching()KODAMA频数匹配frequency_matching(data,label,times,seed)matchit()MatchIt倾向性评分匹配matchit(formula,data,method,distance,caliper,ratio)match.data()MatchIt获取倾向性评分匹配后的数据集match.data(object)glm()stats模型拟合glm(formula,family=binomial(link="logit"),data)clogit()survival模型拟合clogit(formula,data,weights,subset,na.action,method=c("exact","approximate","efron","breslow"))stepAIC()MASS实现逐步回归法stepAIC(object,direction=c("both","backward","forward"))anova()stats模型比较anova(object)AIC()stats得到模型的AICAIC(object)coefficients、coef()stats得到回归系数coefficients(object)、coef(object)confint()stats得到回归系数的置信区间confint(object)10.5小结谢谢第11章随机对照试验11.1研究设计概述11.2常见的研究设计类型11.3示例实践11.4
练习案例
11.5小结11.1研究设计概述第11章随机对照试验11.1.1随机对照试验的定义随机对照试验(randomizedcontrolledtrial,RCT)是一种常用的流行病学研究设计,是评估医学干预效果的金标准。在RCT中,研究对象被随机分配到不同组中,每组施加不同的干预措施,并通过适当时间的随访观察,比较组间重要临床结局发生频率的差别,以定量估计不同干预措施的作用或效果的差别。除了对照和随机分组,RCT通常还会采取分组隐匿、安慰剂、盲法来提高依从性和随访率。RCT是目前在人群中验证医学干预措施效果最严谨、最可靠的流行病学方法之一。第11章随机对照试验11.1.1随机对照试验的定义病例对照研究和队列研究等观察性研究只能观察自然或研究对象自身选择形成的暴露对健康的影响,如暴露与非暴露,以及暴露程度,非研究者可以干预,组间差异造成的混杂是其天然缺陷。RCT最大的特点就是研究者采用特定的方式,即随机化,将研究对象分成两组或多组,该方式形成的比较组之间的背景因素可达到均衡分布,彼此几乎完全可比,解决了队列研究和病例对照研究中的混杂问题。虽然在研究因果关系方面,RCT的科学性高于队列研究的。但由于伦理限制,RCT不能用来研究疾病的危险因素;研究者不能按照自己的意愿给研究对象施加对健康可能有害的因素,因此RCT只能用来检验有益于健康的因素或措施对人体的作用。11.1.2随机对照试验的设计原理和原则RCT的设计有3个基本原则:随机化、对照和盲法。1.随机化RCT的随机化是指采用特殊手段,使总体或样本中每个个体发生某事件的概率均等。在临床研究中,随机化主要应用在抽样和分组两个环节中。即在选取样本和将受试者分组时,为防止来自研究者和被研究者两方面主观因素的干扰,避免结果失真而采用随机化。随机分配保证了研究组之间的均衡、可比,特别是采用分层随机分配。随机分组(randomallocation或randomization):指所有受试者具有相同的概率被分配到试验组或对照组,分组不受研究者、实施者和受试者好恶的影响。随机分组可以采用抽签、掷硬币、抛骰子等方法,更科学、更可靠的是使用随机数字进行分组。第11章随机对照试验11.1.2随机对照试验的设计原理和原则1.随机化随机分组有以下几种方式:完全随机分组:完全随机又称简单随机(simplerandomization),是指以事先设定的分组概率将受试者分配到各处理组。区组随机化(blockedrandomization):在分配研究对象时,先将研究对象分装在一个个区组格子中,再进行随机分配,并且需要保证每个格子中试验组和对照组的受试者数量完全相等。分层随机化(stratifiedrandomization):如果RCT受某种因素影响特别大,如干预措施与年龄、性别均有交互,则此时可以用分层随机化。具体做法为首先将研究对象按性别分层,然后在各性别层内继续按年龄分层。此时在各层内实行完全随机分组或区组随机化。第11章随机对照试验11.1.2随机对照试验的设计原理和原则1.随机化随机化也有一些缺点:在随机分配过程中,为了保证组间的均衡,往往将研究对象限于符合条件的患者,因而可能导致研究对象代表性降低,使研究结果的推广范围受到限制;随机分配往往需要累积到一定数量的研究对象后才能实施,增加了临床研究的难度;随机分配可能违背研究对象的个人意愿,存在医德问题。第11章随机对照试验11.1.2随机对照试验的设计原理和原则2.对照RCT的对照原则是指在临床研究过程中,设立条件类似、诊断标准一致的可供相互比较的组别。设置对照的意义主要在于,除了处理因素,还有很多因素可能影响临床结局:个体临床表现(疾病严重程度、进展等)、霍桑效应(受试者因为成为研究中被关注的对象而产生一种正向心理,这种效应与他们接受的干预措施的特异性作用无关)、安慰剂效应(某些研究对象仅使用安慰剂,因为医药依赖也可能表现出病情好转的现象)、回归现象(极端临床特征有向均数接近的倾向),以及潜在未知因素的影响。设置对照的主要目的是消除非处理因素的干扰,区分试验性和非试验性效应,减少或消除试验误差。第11章随机对照试验11.1.2随机对照试验的设计原理和原则2.对照对照组设置的一般原则如下:评估治疗效果:无治疗对照和安慰剂对照;研究量效关系:同一药物的不同剂量;确定最佳给药方式:同一药物的不同给药方式;新药的联合作用:试验组常规药物加新药,对照组常规药物加安慰剂;确定两药疗效是否相当及其优劣:互为对照。第11章随机对照试验11.1.2随机对照试验的设计原理和原则3.盲法盲法:是指在临床研究过程中,指标的观测、数据的收集和结论的形成等均在不知道研究对象所在的组别,以及不知晓所接受的是何种措施的前提下进行。盲法保证了对每个研究对象的诊断、疗效或预后等作出准确、可靠的测量与评价,否则将出现测量偏倚,导致研究结果失真。RCT常用的盲法可分为单盲,双盲和三盲。单盲是指只有研究者知道关于受试者的分组及所施加的处理因素情况,因此可以减少受试对象主观因素对研究结果的影响。双盲是指受试者和试验执行者均不知道分组情况及干预措施。双盲设计可以有效避免受试者和试验执行者主观因素对试验结果的影响,尤其当一些主观指标作为评价指标时。但双盲设计不适用于危重患者及有特殊副作用的药物。在双盲的基础上,对数据监察和统计分析人员也设盲,称为三盲。三盲可以避免由于数据监察和统计分析人员基于分组情况对数据进行选择性取舍。第11章随机对照试验11.1.3随机对照试验统计分析要点1.意向性治疗意向性治疗(intentiontotreat,ITT):指所有经过随机化分组的病人,不管其是否依从计划的治疗过程,均应按照所分配到的处理组进行随访、评价和分析。因为这样维持了随机化的结果,符合随机的原则。保持初始的随机化,其目的是防止偏性,并为统计学检验提供了可靠的基础,但在实际工作中实施有些困难。例如,随机化分组后发现病人不符合主要入组标准,病人一次也没用过试验药物,或者在随机化分组后再无任何信息,那么将这些病例纳入分析也是不合理的。第11章随机对照试验11.1.3随机对照试验统计分析要点2.数据集全分析集(fullanalysisset):指尽量符合ITT原则的一组理想受试者,通过在所有随机化受试者中,以最少且合理的方式剔除个别受试者后形成的数据集。符合方案集(perprotocolset):又叫合格病例集或可评价病例集,是全分析集的一个子集,这些受试者对方案具有较好的依从性。安全性评价集(safetyset):指所有随机化后至少接受一次治疗的受试者集。第11章随机对照试验11.1.3随机对照试验统计分析要点3.缺失值处理新药临床试验中,在选择全分析集进行统计分析时,对主要变量缺失值的估计,常将最近一个时点所观察到的结果结转到当前(lastobservationcarryforward,LOCF),且以全分析集所得结论为主,当符合方案集的结论与全分析集的结论一致时,可以增强试验结果的可信度。但此时无论是全分析集还是符合方案集,当缺失不是完全随机时,所得结论都是有偏的。新药临床试验之所以采用这两种数据集是因为其结论常偏于保守。第11章随机对照试验11.2常见的研究设计类型11.2.1大型随机对照试验大型RCT与一般试验研究的主要区别在于样本量的大小。这种研究往往需要多中心的合作。由于样本量大,涉及研究单位多,因此费用昂贵且操作复杂。大型RCT只适合用来评估疗效不是很大的干预措施,效果很明显的干预措施不需要大规模实验。大型RCT也常用来比较两个效果相当的治疗方法,即等效性试验(equivalencetrial)。第11章随机对照试验11.2.2单人重复交叉试验单人重复交叉试验就是只有1个人的试验:以自身作为对照,多次交替接受不同治疗的试验研究,每一时段的治疗都可以采取随机方式决定。单人试验主要适用于病情比较稳定或不可治愈的慢性病,或是经常发作的疾病,如抑郁症。第11章随机对照试验11.2.3序贯试验序贯试验(sequentialtrial)与一般试验的区别是样本量不确定,即随着研究对象的增加,不断检查并比较组间的差异,直到组间出现一定的区别或无明显区别时停止研究。停止研究的条件需要预先确定并严格执行。序贯试验设计可以减少不必要的受试者,节省资源。但由于不断进行中间分析(intermittentanalysis),因此组间差别可能由假阳性导致,需要控制第一类错误发生率。第11章随机对照试验11.2.4交叉试验大部分RCT属于平行设计,即受试者自始至终只接受一种干预措施。如果在试验不同阶段,受试者交替接受另外一组的干预措施,则称为交叉试验(cross-overtrial)。交叉可以是1次,也可以是多次。交叉试验类似于多个单人重复交叉试验的总和,多用于对药物效果的初步评估。交叉试验由于自身对照消除了很多个体不变的混杂因素,但交叉试验主要存在两个问题:时间效应(periodeffect):即使治疗未起任何作用,但病人在不同阶段的病情可能也是不一样的,先后严格意义上不可比,因此差异可能不是由治疗引起的;滞留效应(carryovereffect):即当治疗有效时,前一个阶段的治疗可能延迟到后一个阶段的治疗时段,这样不同时段的病人还是不可比的。第11章随机对照试验11.2.5析因试验析因试验(factorialtrial)可用于研究药物间的交互作用。最简单的析因试验为2×2析因试验,需要设计4个比较组:A药、B药、AB联合、无A无B的对照(U组),这4组的分配应按照随机化原则。与U相比,可以获得3个率差,即RDA、RDB、RDAB,分别代表A药的单独作用、B药的单独作用和AB的联合作用。如果RDAB=RDA+RDB,则说明A药和B药无交互作用;如果RDAB>RDA+RDB,则说明A药和B药有协同作用,反之则说明两药有拮抗作用。第11章随机对照试验11.3示例实践11.3.1R语言与随机对照试验
自R语言诞生以来,其被学术界、政府机构和药企广泛应用于临床试验的设计与分析中。目前已经有一系列为临床试验编写的R语言程序包,可在cran.r-project网站查看。使用R语言进行临床试验分析的指导文件可以从r-project网站获得。第11章随机对照试验11.3.2随机分组1.完全随机分组假设有100名受试者或1000名受试者,按照简单随机的原则将其分为两组,每组50人或500人,重复1000次简单随机抽样,并绘制每次随机分配干预组人数占比的直方图(演示)。2.区组随机化假设有480名受试者,设置区组长度为8,进行区组随机化,要求最终两组人数相等(演示)。3.分层随机化假设有480人,其中男性240人,女性240人,将他们随机分配到两组,要求各组男性、女性的数目一致。首先将男性和女性分开,然后对240人分别进行区组随机化,就会得到分层区组随机化的结果,确保各组男性、女性的数目一致(演示)。第11章随机对照试验11.3.3临床试验样本量计算
1.连续型终点大多数临床试验的目的是比较两个处理组,如新药和安慰剂对终点的影响。如果主要终点是连续型,希望调查新药是否比安慰剂更有效,则建立假设检验:
(演示)。n.ttest():在实际情况中可能遇到两组方差不等且需要设计非1∶1的试验,此时可以使用samplesize程序包中的该函数,该函数可以通过不同的参数来考虑方差不齐、非1∶1、配对设计等情况(演示)。n.wilcox.ord():用于非参数检验(演示)。如果两组以2:1的样本量进行试验,则需要设置参数k(两组样本量的比值),并将fraction指定为unbalanced(演示)。如果方差不等,则可以设置variance为unequal,并分别指定sd(演示)。第11章随机对照试验11.3.3临床试验样本量计算
2.比例型终点如果主要终点是二分类,希望调查干预后的比例是否有所变化,则可以建立以下假设检验:
(演示)。p.test():可设置统计功效、显著性水平,以及两组的比例计算需要的样本量(演示)。nBinomial():gsDesign程序包中,可用于计算二项事件率的优效性或非劣效性检验的样本量(演示)。3.生存分析许多临床试验会定期随访,感兴趣的终点变成发生结局的时间。使用gsDesign程序包中的nSurvival()可以计算生存分析所需要的样本量(演示)。第11章随机对照试验11.3.4统计分析方法
简单比较1.连续型终点虽然临床试验往往有多个治疗组,但感兴趣的问题通常以组间两两比较来表示。例如,两个剂量(D1、D2)组和安慰剂(P)组的临床试验可能以每个剂量的有效性,以及增加剂量是否更有效为目标,这可以通过三组两两比较来实现。如果一项临床试验只包括两个治疗组,则研究目的为两个组的单一比较。常用分析方法:t检验、单因素方差分析、多因素方差分析第11章随机对照试验11.3.4统计分析方法
简单比较1.连续型终点t检验:观察的临床试验终点连续且服从正态分布,则可以用t检验比较两个处理组的均值。其中,如果两个处理组的方差相等,则使用标准t检验;如果方差不等,则使用Welch检验。值得注意的是,R语言中t.test()的默认var.equal=FALSE。如果检验两组方差相等,则需要明确var.equal=TRUE。对于非正态数据,建议使用Mann-WhitneyU或Wilcoxon非参数检验,对应R语言中的wilcox.test()。当t检验的任何假设均不成立时,可以使用bootstrap法进行比较。通过替换数据进行迭代重采样,以生成重采样分布,并使用重采样分布评估显著性水平(演示)。第11章随机对照试验11.3.4统计分析方法
简单比较1.连续型终点单因素方差分析:当涉及两个及以上处理组的比较时,可以使用ANOVA的F检验。对应R语言中的aov(),简单两两比较会增大I类错误率,因此需要调整多重比较,文献中常用Tukey-HSD检验调整,对应R语言中的TukeyHSD()(演示)。多因素方差分析:单因素方差分析可以扩展到多因素的。例如,双因素方差分析还可以探索因素间是否存在交互作用(演示)。第11章随机对照试验11.3.4统计分析方法
简单比较2.分类型终点临床大多数类型的终点:发生或未发生、患病或未患病。Pearson’s卡方检验是常用于列联表数据分析的统计方法,对应R语言中的chisq.test()和prop.test()(演示)。第11章随机对照试验11.3.4统计分析方法
有协变量的比较1.连续型终点基于协方差分析(analysisofcovariance,ANCOVA),使用高血压临床试验数据分析连续型终点的数据(演示)。构建全模型(包含所有主效应与交互项),然后使用逐步回归法,根据AIC选择最佳模型(演示)。2.分类型终点基于Logistic回归作为分类型终点分析(演示)。当模型过度离散时,可使用Pearson残差估计离散参数(演示)。3.计数型终点计数型终点可采用泊松回归、准泊松回归、负二项回归模型进行分析。第11章随机对照试验11.3.4统计分析方法
生存分析临床试验的关键结局可能在观察一段时间后才会出现。包含时间信息的数据相比只包含发生或不发生的结局信息增加了时间信息,需要特殊的统计分析方法。事件发生的时间是正值,且往往右偏。此外还存在只知道某一时间点该患者的信息,之后的事件信息丢失的情况,需要特殊的方法来处理此类数据。基于Kaplan-Meier估计、Cox比例风险模型、参数模型使用2期乳腺癌患者临床试验数据作为右删失结局分析的示例(演示)。第11章随机对照试验11.4练习案例1.练习案例1拟开展一项随机对照试验,以探究男性和女性每天摄入的能量是否存在差别。先前收集的临床数据显示,男性平均每天摄入2350.2千卡,标准差为258千卡;女性每天平均摄入1872.4千卡,标准差为420千卡。试计算拟开展的随机对照试验所需的样本量。2.练习案例2一项随机对照试验在10名患者中使用克矽平进行硅沉着病治疗,治疗前后患者血红蛋白的含量如表11.1所示,问:治疗前后血红蛋白含量有无变化。3.练习案例3基于“第11章-随机对照试验-exampledata”数据集,比较分子靶向治疗MTA和常规CT疗法对癌症进展的影响。第11章随机对照试验11.5小结本章介绍了RCT的定义、研究设计类型、常见随机化方法、样本量计算方式,以及统计分析方法。RCT作为医学研究的金标准,在严格按照随机化、对照、双盲的原则下可以很好地平衡各处理组之间的差异。如果研究设计严谨(如采用分组隐匿、双盲等),且实施过程中严格进行质控,那么即便是最简单的统计方法也有助于得到可靠的分析结果。如果各组的资料分布很均衡,那么可以使用t检验进行分析。R语言可以实现从研究设计(样本量计算)到数据分析。对于样本量计算,建议学习samplesize程序包和pwr程序包中的相关函数,可以解决大部分样本量计算问题。此外可以根据实际情况设置一系列参数来选择最优的样本量。对于数据分析,依据终点类型的不同,从横断面的简单比较到纵向的生存分析,以及重复测量数据等统计方法,均可应用于RCT。大型临床试验往往是多中心研究,涉及效应合并的问题,依据异质性检验结果可以选择固定效应模型(异质性较小)或随机效应模型(异质性较大)进行效应合并。本章思维导图详见线上资源,重要函数如表11.2所示。第11章随机对照试验第11章随机对照试验本章重要函数谢谢第12章筛检试验和诊断试验12.1概述12.2诊断试验的评价12.3示例实践12.4小结12.1概述12.1概述12.1.1概念筛检试验(screeningtest)是一种运用快速、简便的手段,在表面健康的人群中找出可能患病或具有患病风险的个体的方法,包括调查问卷、体格检查、实验室检查等。诊断试验(diagnostictest)是指借助一定的医学手段和方法对患者或筛检阳性者进行临床诊断,以确定或排除某种疾病的试验方法。广义的诊断试验包括临床上各种实验室检查(如生化、血液学、病毒学、细菌学、病理学等检查)、仪器诊断(如心电图、内镜检查、影像学检查等),以及通过询问病史、体检等获得临床资料的过程。12.1.2筛检试验和诊断试验的区别筛检试验和诊断试验的目的、目标人群、结果判定和后续处理等都不相同,在使用时应加以区别。筛检试验和诊断试验的区别如表12.1所示。由于筛检试验和诊断试验在设计与评价方面基本一致,因此本章将以诊断试验为主进行介绍。12.1概述12.1.3类型
单一诊断试验单一诊断试验是指用一种试验方法来诊断疾病,并且将这种试验方法与标准诊断方法进行比较,常用于评价一种新试验的诊断效能。例如,临床上肺癌的标准诊断方法是组织穿刺活检,但穿刺为有创检查,会对患者造成一定损伤。假设有一种新的影像学扫描诊断方法,现需要评价该方法的诊断效能,则可采用单一诊断试验,将新方法与传统的组织穿刺活检进行诊断结果的比较,评价该影像学扫描诊断方法的诊断效能。12.1概述12.1.3类型
联合诊断试验一个理想的诊断试验应同时具有较高的灵敏度(发现患者的能力)和特异度(排除患者的能力),但在现实中往往很难达到这一要求。因此,在实施诊断试验时,可采用两种或两种以上的试验诊断同一研究对象,根据每个试验的结果,综合判断最终的试验结果,这种方式称为联合诊断试验。根据联合的方式,分为串联试验和并联试验。12.1概述12.1.3类型1.串联试验串联试验(serialtest)又称系列试验,是指多个诊断试验按一定的顺序相连,初诊结果为阳性方能进入下一轮诊断试验,只有全部试验结果均为阳性才判定为阳性;若其中有一个试验结果为阴性,则最终的试验结果将判定为阴性。串联试验可以提高特异度,但会使灵敏度降低。因此,初诊时尽可能选择灵敏度较高的方法,第二轮诊断时尽量选择特异度较高的方法。2.并联试验并联试验(paralleltest)又称平行试验,是指多个诊断试验同时平行开展,任何一项试验结果为阳性即可判定为阳性;当全部试验结果均为阴性时,才能判定为阴性。并联试验可以提高整体诊断试验的灵敏度,但会使特异度降低。12.1概述12.1.3类型12.1概述12.1.4诊断试验的设计实施一个诊断试验,一般会经过以下4个步骤:确定标准诊断方法、选择研究对象、确定诊断临界值、确定评价指标和方法。1.确定标准诊断方法标准诊断方法又被称为金标准(goldstandard),是目前医学界公认的诊断某种疾病最客观、可靠的诊断方法。使用标准诊断方法能够准确区分患者和非患者。标准诊断方法主要包括病理学诊断(组织活检和尸体解剖)、病原学诊断、外科手术探查、特殊的影像学诊断(如冠心病诊断采用的冠状动脉造影),以及缺乏特异性诊断方法但医学领域权威发布的综合诊断标准等。确定标准诊断方法是诊断试验评价的关键环节。只有准确区分患者和非患者,才能对诊断试验进行客观评价。12.1概述12.1.4诊断试验的设计2.选择研究对象诊断试验的研究对象分为两组:一组是由标准诊断方法确诊为“有病”的病例组,另一组是经标准诊断方法证实为“无病”的对照组。研究对象应具有良好的代表性,因此在选择研究对象时应注意以下两点。(1)要选择能代表该疾病患者的总体,应包含目标疾病各临床时期和不同类型的病例,如典型和不典型的,早、中、晚期的,轻型和重型的,以及有无并发症和有无治疗史的病例。(2)应使用标准诊断方法证实无目标疾病的其他病例,特别是容易与目标疾病混淆的病例,以此评价该诊断试验的鉴别诊断价值。对照组要与病例组有可比性,特别是在年龄、性别和某些重要的生理状态等方面的可比性。12.1概述12.1.4诊断试验的设计3.确定诊断临界值诊断临界值是指定义诊断试验判定为阳性或阴性的截断值。许多诊断试验所采用的指标为实验室检测所得的连续型指标,因此要选择恰当的临界值来判定正常和异常,这将对诊断试验的真实性产生明显的影响。目前诊断试验常用的确定临界值的方法包括平均数加减2倍标准差、百分位数法、临床判断法和受试者工作特征(receiveroperatingcharacteristic,ROC)曲线等。4.确定评价指标和方法诊断试验的评价内容主要包括真实性、可靠性和收益。12.1概述12.2.1真实性真实性(validity)又称准确度(accuracy)或效度,是指诊断试验所获得的测量值与实际值的符合程度。在评价诊断试验的真实性前,首先需要确定对比的标准,即金标准。对同一批研究对象同步应用金标准和待评价的诊断试验进行检测,根据金标准的诊断结果将研究对象分为患者和非患者,结合待评价试验的检测结果,会出现4种情况:金标准确诊为患者,待评价的诊断试验确认为阳性(真阳性,truepositive,TP;A)或阴性(假阴性,falsenegative,FN;C);金标准确诊为非患者,待评价的诊断试验确认为阳性(假阳性,falsepositive,FP;B)或阴性(真阴性,truenegative,TN;D),诊断试验评价四格表如表12.3所示。12.2诊断试验的评价12.2.1真实性1.灵敏度与假阴性率灵敏度(sensitivity)又称真阳性率,是指实际有病且被诊断试验正确判断为有病的百分比,即真阳性数占患者总数的百分比。灵敏度反映了诊断试验发现患者的能力,见下式。
假阴性率(falsenegativerate)又称漏诊率,是指实际有病但被诊断试验错误判断为无病的百分比,即假阴性数占患者总数的百分比,见下式。灵敏度与假阴性率互补,即灵敏度越高,假阴性率越低;反之亦然。12.2诊断试验的评价
12.2.1真实性2.特异度和假阳性率特异度(specificity)又称真阴性率,是指实际无病且被诊断试验正确判断为无病的百分比,即真阴性数占非患者总数的百分比。特异度反映了该诊断试验排除非患者的能力,见下式。
假阳性率(falsepositiverate)又称误诊率,是指实际无病但被诊断试验错误判断为有病的百分比,即假阳性数占非患者总数的百分比,见下式。特异度与假阳性率互补,即特异度越高,假阳性率越低;反之亦然。12.2诊断试验的评价
12.2诊断试验的评价
12.2.1真实性5.似然比(1).阳性似然比阳性似然比(positivelikelihoodratio,+LR)是诊断试验结果为阳性时实际患病与不患病机会的比,见下式。阳性似然比越大,诊断价值越高。(2).阴性似然比阴性似然比(negativelikelihoodratio,-LR)是诊断试验结果为阴性时实际患病与不患病机会的比,见下式。阴性似然比越小,诊断试验结果阴性时为真阴性的可能性就越大,诊断价值也就越高。
12.2诊断试验的评价
12.2.2可靠性可靠性(reliability)又称信度、精确度(precision)或可重复性(repeatability),是指在相同条件下用某测量工具(如诊断试验)重复测量同一受试者时获得相同结果的稳定程度。评价诊断试验可靠性的方法和指标如下。1.标准差和变异系数当诊断试验结果是连续型变量时,可用标准差和变异系数来表示可靠性。标准差和变异系数的值越小,表示可重复性越好,精密度越高;反之,可重复性就越差,精密度越低。变异系数的计算见下式。12.2诊断试验的评价
12.2.2可靠性2.符合率当诊断试验结果是分类变量时,可通过计算同一批研究对象两次诊断试验结果均为阳性与均为阴性的人数之和占所有受检人数的比例,得到符合率,符合率的计算见下式。符合率可用于比较两个医师诊断同一组患者,或者同一个医师两次诊断同一组患者的结果。两次诊断试验评价结果四格表如表12.4所示。12.2诊断试验的评价
12.2.2可靠性3.Kappa值Kappa值用于评价两种试验方法或同一方法两次试验结果的一致性,它是分析不同操作者对同一试验结果,或者同一操作者在不同时间测量的结果一致性强度指标。Kappa值的取值范围为-1~1,如Kappa值小于0,说明由机遇所致的一致性大于观察到的一致性;Kappa值等于0,说明观察到的一致性完全由机遇所致;Kappa值等于-1,说明两结果完全不一致。再如Kappa值大于0,说明观察到的一致性大于机遇所致的一致性;Kappa值等于1,说明两结果完全一致。小于0说明一致性强度弱,0~0.20说明一致性强度轻,0.21~0.40说明一致性强度尚好,0.41~0.60说明一致性强度中度,0.61~0.80说明一致性强度高度,0.81~1说明一致性强度最强。Kappa值的计算见下式。12.2诊断试验的评价
12.2.3收益收益(yield)又称收获量,是指经诊断后能使多少原来未发现的患者得到诊断治疗。诊断试验需要根据在人群中应用的效果进行诊断试验收益的评价,包括预测值、诊断出的新病例数、患者的预后状况和卫生经济学评价等多方面。本节主要介绍预测值,该指标可反映应用诊断结果,以估计受检者患病和不患病可能性的大小。根据诊断得到的阳性结果与阴性结果分别称为阳性预测值和阴性预测值。1.阳性预测值阳性预测值(positivepredictivevalue,PPV)是指诊断试验阳性者中患目标疾病的可能性。12.2诊断试验的评价
12.2.3收益2.阴性预测值阴性预测值(negativepredictivevalue,NPV)是指诊断试验阴性者中不患目标疾病的可能性。3.预测值和患病率有关预测值与受检人群目标疾病患病率(P)的高低密切相关。阳性预测值、阴性预测值与患病率、灵敏度和特异度的关系可用以下公式表示,分别见下面两个式子。12.2诊断试验的评价
12.2.3收益当患病率一定时,诊断试验的灵敏度越高,阴性预测值越高,阳性预测值越低;诊断试验的特异度越高,阳性预测值越高,阴性预测值越低。当灵敏度和特异度一定(诊断试验确定)时,患病率越高,阳性预测值越高,阴性预测值越低。12.2.4诊断临界值的确定诊断临界值(testingthreshold)又称分界值、截断点、临界点,是指划分诊断试验结果正常与异常的标准。对于结果为连续型变量的诊断试验,需要选择一个正常与异常的诊断临界值。诊断临界值的确定是否恰当,将对诊断试验的真实性产生明显的影响。12.2诊断试验的评价12.2.4诊断临界值的确定诊断试验中确定临界值的常用方法包括:①使用平均数加减标准差作为正常值范围;②当诊断试验测定值呈偏态分布或分布类型不确定时,可采用百分位数法设定正常与异常的临界值;③根据临床观察与实践确定诊断临界值;④根据实际情况通过诊断试验的灵敏度和特异度来确定,可利用受试者工作者特征(ReceiverOperatingCharacteristic,ROC)曲线帮助判断。以下对ROC曲线法进行介绍。ROC曲线是以灵敏度(真阳性率)为纵坐标,1-特异度(假阳性率)为横坐标作图所得的曲线,可以反映灵敏度与特异度的关系,常用该曲线来决定最佳的诊断临界值。诊断试验的ROC曲线如图12.1所示,曲线上的任意一点均代表某项诊断试验的特定阳性标准值相对应的灵敏度和1-特异度对子。12.2诊断试验的评价12.2.4诊断临界值的确定随着灵敏度的上升,1-特异度的值增加,即特异度下降;反之特异度上升。将最接近ROC曲线左上角的那一点设定为最佳临界点,可同时满足诊断试验的灵敏度和特异度最优。ROC曲线法是评价诊断试验的一种全面、准确、有效的方法,并可用于比较两种或多种诊断试验的诊断价值。12.2诊断试验的评价12.2.4诊断临界值的确定除了直观比较法,还可以计算ROC曲线下面积(areaundercurve,AUC)。AUC反映诊断试验价值的大小,面积越大,越接近1.0,诊断的真实性就越高;越接近0.5,诊断的真实性就越低;当等于0.5时,则无诊断价值。当需要比较两种或两种以上诊断试验的诊断价值时,可将需要比较的诊断试验的ROC曲线绘制在同一坐标系中,以直观地判断优劣。曲线顶点与纵坐标顶点最接近者,为最好的诊断试验。我们也可以分别计算各诊断试验的AUC,数值更大的诊断试验更优。12.2诊断试验的评价12.3示例实践本节将诊断试验根据资料类型进行分类,结合示例展示如何对诊断试验进行多方面的评价,包括真实性、可靠性和预测值。诊断试验的评价可借助R语言中的cutpointr、pROC等程序包来实现(演示)。12.3示例实践本章主要介绍了筛检试验和诊断试验的基本原理、研究设计、评价指标与方法。诊断试验通过比较待评价的诊断方法和标准试验方法来判断阳性患者人数的差异,并利用灵敏度、特异度等一系列评价指标和ROC曲线来评价试验性能。使用base程序包中的summary()等函数可以对诊断试验数据进行描述性分析,通过cutpointr程序包可以计算真实性、可靠性和预测值等指标,pROC程序包提供的roc()等函数可用于绘制ROC曲线、计算AUC及确定最佳临界值,结合多因素Logistic回归模型,可支持多指标联合诊断。本章思维导图详见线上资源,本章重要函数如表12.5所示。12.4小结12.4小结函数所属包作用主要用法sensitivity()cutpointr计算灵敏度sensitivity(tp,fn,...)fnr()cutpointr计算假阴性率fnr(tp,fn,...)specificity()cutpointr计算特异度specificity(fp,tn,...)fpr()cutpointr计算假阳性率fpr(fp,tn,...)youden()cutpointr计算约登指数youden(tp,fp,tn,fn,...)plr()cutpointr计算阳性似然比plr(tp,fp,tn,fn,...)nlr()cutpointr计算阴性似然比nlr(tp,fp,tn,fn,...)accuracy()cutpointr计算符合率accuracy(tp,fp,tn,fn,...)cohens_kappa()cutpointr计算Kappa值cohens_kappa(tp,fp,tn,fn,...)ppv()cutpointr计算阳性预测值ppv(tp,fp,tn,fn,...)npv()cutpointr计算阴性预测值npv(tp,fp,tn,fn,...)roc()pROC拟合ROC曲线roc(data,x,class,pos_class,neg_class,direction,silent)glm()stats拟合logistic模型glm(formula,data,family=binomial(link="logit"),...)roc.test()pROC比较两个ROC曲线下面积是否有统计学差异roc.test(roc1,roc2,...)
本章重要函数谢谢第13章缺失值处理13.1概述13.2示例实践13.3练习案例13.4小结13.1概述13.1概述在实际流行病学研究和统计工作中,数据缺失极为普遍,几乎所有领域的数据分析都会面临这个问题。数据缺失可能有多种原因导致,包括人为因素、技术问题、调查方法、主观选择等。因此,了解和处理缺失数据是数据分析中不可忽视的重要问题。13.1.1缺失数据的普遍性在调查研究中,参与者可能未完整回答问卷或拒绝回答某些问题,导致样本不完整。在医学研究中,患者可能在某些事件点缺失检测结果或无法完成整个研究过程,导致数据不完整,进而影响治疗效果和疾病预后的评估。在社会科学中,参与者可能因各种原因选择不回答某些敏感问题,或在追踪调查中与参与者失去联系导致数据缺失。13.1概述13.1.2处理缺失数据的重要性准确性和可靠性。缺失数据可能导致分析结果存在偏差,降低研究的可靠性。处理缺失数据可以提高分析的准确性,并提供更可靠的结论。样本量和统计功效。数据缺失会使可用的样本量减少,从而降低统计功效和结果的可靠性。适当处理缺失数据可以最大限度地利用数据,并提高分析的统计功效。潜在信息损失。缺失数据可能包含对研究结果产生重要影响的信息。忽略缺失数据可能会丧失潜在的有价值的信息,影响对现象的全面理解。因此,在数据分析中,处理缺失数据是至关重要的一步。了解数据缺失的原因、缺失数据的类型和机制,并选择适当的处理方法,可以帮助提高数据分析的准确性和可靠性,从而得到更有意义的研究结果。13.1概述13.1.3数据缺失的原因了解数据缺失的原因至关重要。首先,有助于评估数据质量,判断缺失是否具有系统性及与研究结果相关,从而确定数据的可靠性和有效性。其次,了解数据缺失的原因有助于选择适当的处理方法(如删除、插补或使用专门的缺失数据模型),减少对分析结果的影响。此外,有助于判断结果和推断的准确性,可以进行敏感性分析,评估不同假设下结果的稳健性。最后,清晰记录和报告缺失原因,可提高研究的完整性与可重复性,其他研究人员可以更好地理解和评估研究可靠性,并采取适当的处理方法。13.1概述13.1.3数据缺失的原因常见的数据缺失原因包括:(1)非回应或拒绝参与:因时间、兴趣、隐私等因素拒绝回答或参与;(2)人为错误或录入问题:操作失误、疏忽或误解问题;(3)技术故障或设备问题:传感器故障、网络中断、设备损坏等;(4)主观选择或遗漏:因隐私、尴尬、记忆等因素有意跳过或遗漏;(5)样本选择偏差:特定群体更易缺失,引入选择偏差,影响结果可靠性;(6)自然灾害或不可预见事件:设备损坏、数据丢失或研究中断等。13.1概述13.1.4缺失数据的类型1.完全随机缺失完全随机缺失(missingcompletelyatrandom,MCAR):缺失是完全随机的,与其他变量或缺失值变量本身无关。缺失数据的发生是随机的,不会使数据分析结果产生偏差。例如,在调查中,部分参与者未回答年龄、性别、收入等问题,若缺失与个人特征或问题内容无关,则属于完全随机缺失。13.1概述13.1.4缺失数据的类型2.随机缺失随机缺失(missingatrandom,MAR):变量值缺失与其他变量有关,但与缺失变量值本身无关。缺失的概率可能与其他变量的观测值有关,但与缺失变量值本身无关。在这种情况下,缺失数据的发生也是随机的,可能会造成数据分析结果产生偏差。例如,一项健康调查中,参与者未提供体重数据但提供了身高和血压,且体重缺失与观测到的身高、血压相关;但只要体重缺失在体重变量上的分布是随机的(不局限于特定体重人群),则属于随机缺失。13.1概述13.1.4缺失数据的类型3.非随机缺失非随机缺失(missingnotatrandom,MNAR):如果缺失数据不属于MCAR或MAR,那么这种缺失类型属于非随机缺失。这种类型缺失值的分布是有偏的。例如,一项家庭收入调查中,高收入家庭更倾向于不透露具体收入,而低收入家庭则更愿意提供。这种缺失与收入变量本身有关,存在明显的分布偏倚。大部分处理缺失数据的方法都是假定数据类型属于MCAR或MAR的,研究者可以忽略缺失数据的生成机制,并且在进行适当的数据处理之后可以直接进行统计分析和建模。13.1概述13.1.5常见的缺失数据处理方法(1)删除缺失值:最简单的处理方法是直接删除含缺失值的样本或变量,适用于缺失较少或影响较小的情况。但可能导致样本减少或信息丢失,需谨慎使用。(2)简单插补缺失值:通过估计或推断填补缺失数据,常用方法包括均值插补、中位数插补、回归插补等。这些方法利用已有数据预测缺失值,但可能存在估计误差。(3)使用专门的缺失数据模型:适用于缺失数据存在特定模式或机制时。例如多重插补(MI),通过预测均值匹配(PMM)、线性回归(连续变量)或logistic回归(分类变量)等方法,生成多个完整插补数据集,模拟缺失值的不确定性,再合并分析结果,以获得更准确可靠的估计。13.1概述13.1.5常见的缺失数据处理方法(4)分析时考虑缺失数据的影响:不直接处理缺失值,而在分析过程中加以考虑。例如,使用完全数据的子样本进行分析,或采用自助重采样法(bootstrap)估计结果的不确定性。(5)敏感性分析:在不同缺失数据处理方法或假设下进行分析,评估结果的稳健性。通过对比不同处理方式下的结果差异,可判断缺失数据对分析结论的影响程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省2026年春考《自动控制类》专业知识模拟试题(含答案解析)
- 2023-2024学年河北沧州献县一中高一下学期6月月考英语试题及答案
- 单招护理专业职业规划书
- 装配式建筑构件生产质量计划
- 消防安全隐患排查与整改指南课件
- 防坠床护理措施
- 2026年淮南市第二人民医院公开招聘22名工作人员笔试备考题库及答案解析
- 针灸推拿制度
- 2026内蒙古呼伦贝尔市林草执法人员招聘35人考试参考题库及答案解析
- 2026中国水利水电出版社有限公司招聘1人笔试参考题库及答案解析
- 乳恒牙龋齿充填治疗
- 汽车吊维保记录
- 废旧电力线路回收协议书
- 2023年北京大学强基计划数学试题真题答案解析(精校打印版)
- Unit 2 Healthy Lifestyle Reading and Thinking 教学设计 -2023-2024学年高中英语人教版 (2019)选择性必修第三册
- 旋挖成孔灌注桩施工技术规程DBJ-T15-236-2021
- DL-T5493-2014电力工程基桩检测技术规程
- DL-T1475-2015电力安全工器具配置与存放技术要求
- 【灭菌含乳品企业燕塘食品的应收账款风险控制问题研究(10000字论文)】
- (高清版)TDT 1031.6-2011 土地复垦方案编制规程 第6部分:建设项目
- 翻译理论与实践(课件)
评论
0/150
提交评论