R语言的流行病学应用 课件 第14章 功效分析_第1页
R语言的流行病学应用 课件 第14章 功效分析_第2页
R语言的流行病学应用 课件 第14章 功效分析_第3页
R语言的流行病学应用 课件 第14章 功效分析_第4页
R语言的流行病学应用 课件 第14章 功效分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第14章功效分析14.1功效分析简介14.2不同统计方法的功效分析14.3练习案例14.4小结14.5深入阅读14.1功效分析简介14.1功效分析简介14.1.1引言在统计学中,功效(power)是指在给定显著性水平和样本量的条件下,研究能够检测到真实效应的概率。换句话说,功效表示研究具有发现真实效应的能力。在功效分析中,研究者通过计算统计功效来评估研究设计的有效性和可行性,其大小通常以百分比表示,范围从0%到100%,功效值意味着研究能够检测到真实效应的概率。通常研究者希望研究的功效越高越好。较高的功效意味着研究设计能够更敏感地检测到真实效应,提供更可靠的结果。然而,实际上功效值的选择是一个平衡问题。较高的功效通常需要更大的样本量,这可能会增加研究的成本和时间。进行功效分析时,研究者需要指定所关注的真实效应的大小,并确定显著性水平(通常为0.05或0.01)以及所需的功效水平。根据这些参数,可以计算出所需的样本量,以确保研究具有足够的功效来检测到所关注的效应。14.1功效分析简介14.1.2功效分析的意义功效分析可以帮助研究者评估流行病研究设计的有效性和可行性,以及确定所需的样本量和统计功效。通过使用功效分析,研究者能够更好地规划和执行流行病学研究,从而为我们了解疾病的传播方式、风险因素和干预措施的效果提供更准确的信息。通过功效分析,可以确定流行病研究所需的样本大小,以确保研究具有足够的统计能力来检测到预期的效应大小。适当的样本大小可以降低因样本过小而导致的假阴性或假阳性结果的风险。通过进行功效分析,研究人员可以评估研究的可行性,有助于决定研究的实施方式,如确定研究期限、数据采集的频率以及所需的研究资源。通过计算统计功效,可以确定研究结果的可靠性和可信度。当功效分析显示研究具有较高的功效时,研究结果更加可靠,并且能够支持相应的结论和推断。14.1功效分析简介14.1.3假设检验的两类错误和功效分析的关键要素1.两类错误第Ⅰ类错误指的是,原假设为真,但我们错误地拒绝了原假设。具体来说,在原假设H0为真的情况下,我们得到了低于显著性水平α的p值,从而错误地拒绝了原假设。这种错误出现的概率即为α。第Ⅱ类错误指的是,原假设为假,但我们错误地接受了原假设。具体来说,在原假设H0为假的情况下,我们得到了高于显著性水平α的p值,从而错误地接受了原假设。这种错误出现的概率即为β。2.功效分析的基本思想在控制随机误差概率(一般控制第Ⅰ类错误率α在0.05左右)的前提下,通过事先规定第Ⅱ类错误率β的大小(一般控制在0.1左右),反推出需要的最小样本量n。换句话讲,功效分析是在给定样本大小和显著性水平下检测到真实效应的概率。14.1功效分析简介3.功效分析的关键要素显著性水平(significancelevel):是指在统计假设检验中所采用的拒绝零假设的临界值。通常使用的显著性水平是0.05或0.01,表示研究者愿意接受的拒绝零假设的错误概率,这是不犯第Ⅰ类错误的临界值。较低的显著性水平意味着研究者要求更高的证据才能拒绝零假设。效应量(effectsize):指研究者感兴趣的变量或因素在不同条件下产生的差异或影响的大小。效应量大小通常通过统计指标来衡量,例如差异的均值、比率、风险比等。研究者需要根据先前的研究或理论假设对效应大小进行估计,以便进行功效分析。统计功效(1-β):是指在给定显著性水平和样本量的条件下,研究能够检测到真实效应的概率。从假设检验的角度讲就是不犯第Ⅱ类错误的概率,较高的统计功效意味着研究设计更能够敏感地检测到真实效应,提供更可靠的结果。通常以百分比形式表示,范围从0到100。样本量(samplesize):是指研究中所需的参与者数量。适当的样本量是确保研究具有足够统计功效的关键。通过功效分析,研究者可以确定所需的样本量,以确保能够检测到所关注的效应。14.1功效分析简介14.1.4效应量效应量用于量化研究者关心的变量或因素在不同条件下产生的差异或影响的程度。这个概念扮演着至关重要的角色,因为它能够帮助研究者测量研究中关注的现象、关联或差异的大小。功效分析的根本目标在于评估研究设计是否足够敏感,以探测到所关心的效应。为了确保研究具备足够的统计功效,研究者需要深入思考效应的大小,并确定所需的样本量。效应大小表示组间或条件间均值差异的标准化度量,即差异相对于变异的大小。在功效分析中,通常使用三个常见的效应大小指标:小效应、中等效应和大效应。这些指标依据标准化均值差异(Cohen’sd)来判断效应的程度。按照Cohen的定义,小效应通常对应Cohen’sd约为0.2左右的效应大小,中等效应大约为0.5,而大效应则大约为0.8或更高。14.1功效分析简介14.1.5

功效分析的一般步骤首先,确定研究中的显著性水平α,这代表我们能够容忍的犯第Ⅰ类错误的概率,通常以0.05为标准。其次,需要估计自变量对因变量的效应大小。这个估计可以依据先前的实验结果、调查数据或者相关文献,效应越大,所需的样本量就越小。接下来,假设一个可获得的样本量n,初步选择一个实际可行的最大值。在给定α、效应值和样本量的情况下,使用统计学公式或相应的统计软件(如R语言)来计算该参数组合下的统计功效(1-β,其中β表示第Ⅱ类错误率)。然后,确定最优的参数组合,使得在可行样本量下功效达到最大。这一步需要仔细权衡显著性水平、效应值和样本量的关系,以确保在研究中能够探测到真实的效应。最后,按照确定的参数组合进行研究设计和样本采集。提前进行功效分析可以避免因样本量不足而引发的第Ⅱ类错误,同时确保研究结果的可靠性和科学性。14.1功效分析简介14.1.6

使用R语言执行功效分析简述进行功效分析时,通常使用统计方法来计算所需的样本大小。这通常涉及选择适当的统计检验方法,指定期望的效应大小和显著性水平,然后基于这些信息计算出所需的样本大小。常见的方法包括使用公式、模拟研究或使用专门的功效分析软件来进行计算。R语言中的pwr程序包是一个用于功效分析和样本量计算的统计软件包。它提供了一系列函数和工具,可以帮助我们评估研究设计的功效,并确定所需的样本量。pwr程序包中的函数可以用于不同类型的功效分析,包括均值差异、相关性、比例差异、方差分析等。这些函数提供了计算所需样本量的方法,并允许研究者根据所关注的效应大小、显著性水平和统计功效等参数进行设置。14.2不同统计方法的功效分析14.2不同统计方法的功效分析14.2.1定量资料统计方法的功效分析1.常见定量资料统计方法t检验:适用于比较两组定量资料的均值是否存在显著差异。常见的应用场景包括比较两个样本的平均值、评估某个处理对实验结果的影响等。t’检验:适用于满足正态性但方差不齐的定量资料。t’检验是对独立样本t检验的改进,通过对方差进行修正来解决方差不齐的问题。方差分析:适用于比较多组定量资料的均值是否存在显著差异。方差分析可用于比较多个样本或多个处理组之间的平均值差异。秩和检验:适用于非正态分布的定量资料或小样本的情况。秩和检验是一种非参数检验方法,不依赖于数据的分布情况,适用于比较两组或多组定量资料的中位数是否存在显著差异。14.2不同统计方法的功效分析14.2.1定量资料统计方法的功效分析2.t检验的功效分析执行t检验的功效分析,可以直接使用R语言基础包提供的函数power.t.test()。这是R语言中安装后自带的一个函数,用于进行单样本或两样本t检验的功效分析(演示)。以power开头的功效分析函数存在以下几个主要缺点:①无法直接使用效应量作为参数进行计算。②计算过程不够透明和灵活。③只能计算出给定参数下的样本量n。④功效分析结果没有可视化的方法。⑤功效分析功能相对独立且有限。使用pwr程序包的函数进行功效分析更为先进,可以很好弥补这些缺陷(演示)。14.2不同统计方法的功效分析14.2.1定量资料统计方法的功效分析3.方差分析的功效分析方差分析的功效分析主要通过pwr.anova.test()执行(演示)。对于两因素的方差分析或者非平衡设计的方差分析,可以参考pwr程序包。4.非参数检验的功效分析常见的非参数秩和检验包括Wilcoxon符号秩检验、Mann-WhitneyU检验、Kruskal-Wallis检验,它们分别是单样本t检验,独立样本t检验以及方差分析等参数检验方法在相关条件不满足时的替代非参数方法。考虑它们功效分析需要的样本量时,一般需在原参数方法的功效分析计算的样本量基础上增加15%。14.2不同统计方法的功效分析14.2.2定性资料统计方法的功效分析1.单样本比例的功效分析先用pwr程序包的ES.h()估算效应量,再使用pwr.p.test()执行功效分析(演示)。2.两样本比例的功效分析使用ES.h()估计效应量,再用pwr.2p.test()使用前述得到的效应量执行功效分析(演示)。3.卡方检验的功效分析卡方分布可以进行提供数据是否来自某已知分布的拟合优度检验,也可以检验两个分类变量的关联。使用pwr.chisq.test()执行功效分析(演示)。14.2不同统计方法的功效分析14.2.3相关分析和回归分析中的功效分析1.相关分析的功效分析对于线性相关分析,效应量就是相关系数的大小。使用cor()评估效应大小,再使用pwr.r.test()执行功效分析(演示)。2.线性回归的功效分析考虑线性回归的功效分析时,我们需要关注线性回归模型中效应量,该效应量是回归模型中决定系数的平方根。使用r_squared提取决定系数,再使用pwr程序包中的pwr.f2.test()执行功效分析(演示)。pwr.f2.test()不仅只针对普通线性模型,也适用于广义线性模型的功效分析。14.3练习案例14.3练习案例14.3.1练习案例1假设我们有意比较两组员工的工作满意度。第一组员工采用弹性工作时间安排,而第二组员工则采用固定工作时间。我们已知第一组员工的平均满意度评分比第二组高10分,且两组的标准偏差均为20分。在显著性水平为0.05的情况下,若我们希望在0.8的功效水平下检测到这种差异,那么我们需要多大的样本量呢?14.3.2练习案例2一项临床研究想评估一种新开发的抗过敏药物的疗效。根据先前研究,该药物可使降低患者过敏症状评分的效应量约为0.35。研究人员计划选取过敏患者,给予新药物治疗6周后测量过敏症状评分。希望在两侧检验下功效0.8,显著性水平为0.05的情况下评估治疗效果。如何估计该项研究需要多少样本呢?14.3练习案例14.3.3练习案例3拟比较三种不同学习方法对考试成绩的影响。如果考虑为3组均衡设计,预估效应量为0.2,现在考虑不同的样本容量对应的不同的功效。14.3.4练习案例4假设一家公司估计其实施健康计划的员工健康状况良好率为0.65,而行业平均良好率为0.80。他们希望在显著性水平为0.05的情况下,能有85%的概率检验出差异,至少需要调查多少员工?14.3练习案例14.3.5练习案例5假设一项研究旨在比较两所不同学校学生肥胖率是否相同。研究选取了学校A和学校B两所学校,学校A预估的肥胖率为0.15,学校B的肥胖率预估为0.25。在显著性水平为0.05的情况下,至少需要抽检多少样本,才能有90%的概率检验出两学校的差异?14.3.6

练习案例6假设一项流行病学研究旨在调查某地不同饮酒习惯与肝病的关联性。研究人员在此地随机选择受试者,并记录了他们的饮酒习惯(高饮酒量或低饮酒量)和是否患有肝病(是或否)。以往研究表明这个关联的效应较低(假定效应量w=0.1),请问招募多少受试者才能在显著性水平为0.05的情况下,以80%的概率检验出饮酒习惯与肝病的关联性?14.3练习案例14.3.7练习案例7假设一项流行病学研究旨在探讨某地成年人运动频率与心率变异性(HRV)之间的关联性。研究人员随机选择了一组参与者,并记录了他们的每周运动频率(次/周)和心率变异性(ms)。为探索此地运动频率与心率变异性关联的效应大小,作为预调查,随机抽查此地10人的记录如下。试根据抽查结果评估,招募多少受试者才能在显著性水平为0.05的情况下,以80%的概率检验出运动频率与心率变异性之间的关联性。>id<-1:10>exercise_frequency<-c(2,5,3,6,7,1,4,6,5,3)#运动频率>hrv<-c(55.1,60.3,58.6,62.4,59.2,50.7,63.1,57.8,56.9,54.3)#心率变异性14.4小结14.4小结功效分析是统计学中一项重要的技术,用于评估实验结果的可信度和影响力。通过功效分析,研究人员能够确定实验是否具有足够的统计功效,即能否检测到真实效应的可能性。功效分析的关键概念之一是“功效”,它指的是在给定显著性水平下,能够检测到实验效应的能力。通常,研究者希望实验有足够的功效,以便在实验中观察到真实的效应,而不是将效应错误地归因于随机变异。功效的大小受到样本大小、效应大小和显著性水平的影响。因此,进行功效分析是为了确定在给定这些因素的情况下,实验是否具有足够的能力观察到真实的效应。在功效分析中,定性变量和定量变量的处理方法略有不同。对于定性变量,常用卡方检验或Fisher精确检验进行功效分析。而对于定量变量,常用t检验、方差分析或线性回归等方法进行功效分析。功效分析是统计学中一项关键的技术,它帮助研究人员评估实验结果的可信度,并确保实验具有足够的统计功效。使用pwr程序包等工具,研究人员可以执行定性变量和定量变量相关功效分析,为实验设计和计划提供有力支持。14.4小结函数所属包作用主要用法power.t.teststatst检验的功效计算power.t.test(n,delta,sd,sig.level,power,type,alternative,strict,tol)p.teststats比例差异的检验功效计算p.test(n,p1,p2,sig.level,power,alternative,strict,tol)power.anova.teststats方差分析的功效计算power.anova.test(groups,n,between.var,within.var,sig.level,power)power.chisq.teststats卡方检验的功效计算power.chisq.test(n,w,df,sig.level,power)pwr.t.testpwrt检验的功效计算pwr.t.test(n,d,sig.level,power,type,alternative)pwr.anova.testpwr方差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论