非诊断医疗器械统计学指导原则[精品.ppt_第1页
非诊断医疗器械统计学指导原则[精品.ppt_第2页
非诊断医疗器械统计学指导原则[精品.ppt_第3页
非诊断医疗器械统计学指导原则[精品.ppt_第4页
非诊断医疗器械统计学指导原则[精品.ppt_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非诊断医疗器械统计学指导原则 Center for Devices and Radiological Health, FDA1996 李 卫 数据管理与统计分析室 阜外心血管病医院 引言 包含大量不同种类的产品(诊断/非诊断) - 诊断检验(血糖、胆固醇检测仪) - 监测(呼吸、心跳监测仪) - 治疗器械(眼外科激光仪、心脏除颤仪、冠脉支架) - 测量器械(核磁共振成像MRI、超频骨密度测量仪) - 代替身体某一失效部分的植入器械 (人造髋关节、膝关节、乳房假体、人工心脏瓣膜) 医疗器械法规制定 FDA-Center for Device and Radiological Health (CDRH) 目录 FDA非诊断医疗器械(植入体内、治疗器 械)统计学指导原则(通用) 非诊断医疗器械临床研究统计学指导原 则个案 非诊断医疗器械统计学指导原则(通用) 引言 有效的科学证据 临床试验设计 A. 试验目的 B. 预试验或可行性研究 C. 标识和选择变量 D. 研究人群 E. 对照人群 F. 分配治疗的方法 G. 试验设计类型 H. 盲法 I. 试验地点和研究者 J. 样本量和检验效能(把握度) 非诊断医疗器械统计学指导原则(通用) 研究方案 临床试验实施 A.试验监查 B.基线评估 C.干预 D.随访 E.数据的收集和确认 临床试验分析 A.提出假设 B.假设与统计检验 C.合并 D.病人的权利与义务 引言 收集和评价可靠的临床数据是很多医疗器械器收集和评价可靠的临床数据是很多医疗器械器 获得批准的基础获得批准的基础 该指导原则保证临床试验数据能够从科学和法该指导原则保证临床试验数据能够从科学和法 规角度来解释规角度来解释 一个好的医疗器械临床试验的目的是能够提供一个好的医疗器械临床试验的目的是能够提供 最客观的安全性和有效性评价最客观的安全性和有效性评价 在器械临床试验中干扰客观性的任何决定都要在器械临床试验中干扰客观性的任何决定都要 付出代价(以审评过程中的延迟或不通过为代付出代价(以审评过程中的延迟或不通过为代 价)价) 引言 本文从统计角度为临床试验过程提供了一个更本文从统计角度为临床试验过程提供了一个更 全面的实施办法全面的实施办法 其目的是讨论医疗器械临床试验中的一些重要其目的是讨论医疗器械临床试验中的一些重要 问题问题 它对试验的每一步骤进行解释它对试验的每一步骤进行解释 并且讨论了为什么这些步骤会合成一体成为临并且讨论了为什么这些步骤会合成一体成为临 床试验床试验 以及如果在研究中没有它们,将会遇到什么问以及如果在研究中没有它们,将会遇到什么问 题题 有效的科学证据 生产厂商也许会提交任何证据,使审评部门确生产厂商也许会提交任何证据,使审评部门确 信他们器械的安全性和有效性信他们器械的安全性和有效性 而审评部门应要求进行具有良好对照的临床试而审评部门应要求进行具有良好对照的临床试 验,来提供所需要的、合理的医疗器械安全性验,来提供所需要的、合理的医疗器械安全性 和有效性保证和有效性保证 需要注意的是在审评部门没有对已知器械作特需要注意的是在审评部门没有对已知器械作特 殊的统计分析要求时殊的统计分析要求时 研究中所有的统计分析都应该适合分析的目的研究中所有的统计分析都应该适合分析的目的 ,且要有全程证明文件,且要有全程证明文件 临床试验设计 临床试验临床试验: : 是在人体进行的、比较干预和对照疗效是在人体进行的、比较干预和对照疗效 的的前瞻性前瞻性研究(研究(Friedman et al., 1985Friedman et al., 1985) 干预的含义很广泛,包括干预的含义很广泛,包括“ “预防、诊断、或治疗药物预防、诊断、或治疗药物 ,医疗器械,以及治疗措施等等,医疗器械,以及治疗措施等等 Hill(1967)Hill(1967)给出的,给出的,“ “临床试验是一个精心设计的、临床试验是一个精心设计的、 符合伦理学原则的实验,其目的是回答某些精确设符合伦理学原则的实验,其目的是回答某些精确设 计的问题计的问题” ” 临床试验是在人体的伦理学试验,因此需要知情同临床试验是在人体的伦理学试验,因此需要知情同 意书和伦理委员会意书和伦理委员会(IRB/IEC)(IRB/IEC)的批准的批准 临床研究的类型 现在 临床试验 (clinical trial) 干预 前瞻性 (prospective) 回顾性 (retrospective) 历史性观察队列 (His. Obs. Cohort) 前瞻性观察队列(His. Obs. Cohort) 病例对照 (case-control) 横断面(cross-sectional) 将来 过去纵向 (longitudinal) 临床试验设计 一个好的临床试验设计对照组,或将已知的或一个好的临床试验设计对照组,或将已知的或 可疑的偏倚及其它可能的错误降到最低可疑的偏倚及其它可能的错误降到最低 以便可以清楚、客观的评价医疗器械的疗效以便可以清楚、客观的评价医疗器械的疗效 当研究者、研究人群或研究过程出现系统偏差当研究者、研究人群或研究过程出现系统偏差 ,从而不能准确测量一个变量的时候,偏倚就,从而不能准确测量一个变量的时候,偏倚就 出现了出现了 试验目的(研究的问题) 一个有效且效率高的临床实验的设计应有一个一个有效且效率高的临床实验的设计应有一个 清楚、准确的目的清楚、准确的目的 通常研究目的由一个研究问题所提出,包括器通常研究目的由一个研究问题所提出,包括器 械的适应症械的适应症 这个研究问题的设立需要极端的小心和特异性这个研究问题的设立需要极端的小心和特异性 “ “我的器械是否安全有效?我的器械是否安全有效?” ” 之类的问题太一之类的问题太一 般化了,没有任何意义。般化了,没有任何意义。 问题必须限于有效地评价一种特定的干预类型 什么是恰当的途径去评价在目标条件和人群中的什么是恰当的途径去评价在目标条件和人群中的 有效性?有效性? 该器械有什么特殊的安全考虑?该器械有什么特殊的安全考虑? 该器械是否和其它器械一样有效还是更有效?该器械是否和其它器械一样有效还是更有效? 如果是这样,它是一样安全还是更安全?如果是这样,它是一样安全还是更安全? 对这种器械的安全性和有效性的评价是否局限于对这种器械的安全性和有效性的评价是否局限于 某一特定的亚组人群?某一特定的亚组人群? 测量安全性和有效性的最好的临床方法是什么?测量安全性和有效性的最好的临床方法是什么? 对临床试验的指征进行标识 例如,如果一种新型器械被用来治疗一种进行性例如,如果一种新型器械被用来治疗一种进行性 的不断恶化的眼科疾病的不断恶化的眼科疾病 但针对这种疾病目前还存在另外一种已被认可的但针对这种疾病目前还存在另外一种已被认可的 器械,在这种情况下怎样来界定疗效?器械,在这种情况下怎样来界定疗效? 这种新器械能否延缓或阻止恶化?这种新器械能否延缓或阻止恶化? 如果可以,能否恢复以前失去的功能?如果可以,能否恢复以前失去的功能? 能否缓解疼痛或不适感?能否缓解疼痛或不适感? 是否与已被认可的器械做过比较?是否与已被认可的器械做过比较? 是否在某种用途上与已被认可的器械一样有效还是否在某种用途上与已被认可的器械一样有效还 是效果更好?是效果更好? 是否有更少的不良反应?是否有更少的不良反应? 试验设计时,应考虑的问题 不仅需要明确的研究目的不仅需要明确的研究目的 合适的终点或结局变量合适的终点或结局变量 对照人群的选择对照人群的选择 可能用到的假设类型可能用到的假设类型 以上这些问题必须在方案完成前写好,因为我以上这些问题必须在方案完成前写好,因为我 们必须决定是否可以通过一个设计很好的临床们必须决定是否可以通过一个设计很好的临床 试验来解决所陈述的研究问题试验来解决所陈述的研究问题 预试验或可行性研究 如果一个申办者因为对器械在人群中的应用缺乏 足够的经验而不能回答临床试验的关键问题 那么申办者应该设计一个小样本的人体试验来收 集基本信息 这个小样本试验(通常称为预试验或可行性研究) 的研究目的是确定器械的可能医疗用途、监查潜 在的研究变量、检测试验流程、以及决定潜在的 反应变量的精确度 还可对可能导致偏倚的因素进行有限的评价。预 试验的研究方案应报审评部门 预试验或可行性研究 预试验经常被用来做器械的检验,即:申办者有一 个关于器械用途的好的想法,需要一个小样本的试 验来验证其理论或新技术(进行探索性数据分析 ) 但预试验的范围不能太广 临床试验相关问题包括:器械使用、病人处理和监 控、数据的收集和确认、以及医师的能力和所关心 的问题等等 应关注主要变量的测量,包括可能的结局变量和可 能造成偏倚的影响变量 长期终点的情况,通常不包括在预试验的范围内 标识和选择变量 临床研究的观察中包含两种类型的变量 - 结局变量 - 影响变量 结局变量(应答变量、终点变量或因变量) 定义并且回答研究问题,并且对器械的应用有 直接的影响 应能被直接观察、客观地测量,以便把偏倚和 误差降到最低 标识和选择变量 影响变量(基线变量、诊断(基线变量、诊断/ /混杂因素或自变量)混杂因素或自变量) 可以影响结局变量可以影响结局变量( (使之增高或降低使之增高或降低) )的指标,或的指标,或 者对治疗和结局之间的关系有影响者对治疗和结局之间的关系有影响 影响变量基线水平在治疗和对照组间的不均衡可影响变量基线水平在治疗和对照组间的不均衡可 能导致错误的结论(将结局变量观察的效果不恰能导致错误的结论(将结局变量观察的效果不恰 当的分配给干预所造成)当的分配给干预所造成) 因此,恰当的统计检验方法,可以看出在试验开因此,恰当的统计检验方法,可以看出在试验开 始前两治疗组间变量的基线水平是否已经存在显始前两治疗组间变量的基线水平是否已经存在显 著的不均衡了著的不均衡了 标识和选择变量 在临床试验设计的过程中,应努力寻找在临床试验设计的过程中,应努力寻找 那些可能对结局有影响的变量那些可能对结局有影响的变量 如果试验设计时考虑了这些已知的或可如果试验设计时考虑了这些已知的或可 疑的变量疑的变量 申办者就最大限度的降低了在研究结束申办者就最大限度的降低了在研究结束 时得到虚假结论的可能性时得到虚假结论的可能性 标识和选择变量 一旦研究中包含的变量或因素已经被确定时,一旦研究中包含的变量或因素已经被确定时, 测量方法的选择就变得非常关键了测量方法的选择就变得非常关键了 应采用最能提供信息和尽量客观的方法应采用最能提供信息和尽量客观的方法 定量定量( (连续连续) )变量是物理特征的度量变量是物理特征的度量( (身高、体重身高、体重 等等) ) 中国最大的资料库下载中国最大的资料库下载 定性或分类定性或分类( (离散离散) )变量是对代表整个人群不同变量是对代表整个人群不同 状态的度量状态的度量 ( (生存生存/ /死亡、健康死亡、健康/ /患病、肿瘤分患病、肿瘤分 级等级等) ) 标识和选择变量 定量数据比定性数据包含更多的信息定量数据比定性数据包含更多的信息 并且通常可用更深奥的数学方法和更强有力的并且通常可用更深奥的数学方法和更强有力的 统计分析方法对定量数据进行分析统计分析方法对定量数据进行分析 然而,某些情况下,定性指标是最恰当的,或然而,某些情况下,定性指标是最恰当的,或 是唯一的可比较信息是唯一的可比较信息 有很多强有力的非参数方法可用于这种类型变有很多强有力的非参数方法可用于这种类型变 量的分析(生活质量的评价)量的分析(生活质量的评价) 研究人群 研究人群应是应用医疗器械的目标人群的一个研究人群应是应用医疗器械的目标人群的一个 代表代表子集子集 研究人群应在试验前用严格、明确的入选研究人群应在试验前用严格、明确的入选/ /排除排除 标准进行定义标准进行定义 应由精通本领域的器械研究的临床专家来制订应由精通本领域的器械研究的临床专家来制订 这些标准这些标准 这些入选这些入选/ /排除标准将定义研究人群的特征,并排除标准将定义研究人群的特征,并 且通过这种方式确定医疗器械的用途且通过这种方式确定医疗器械的用途 研究人群 可以将研究人群定义得小一点,以便组成人群的 个体具有同质性 应用定义严格的人群的好处是在临床试验中可以 有一个较小的样本量。即:同质组中反应的变异 度通常比异质组低。而这种变异度的降低(假设 所有其它重要因素不变),将显著降低要观察出 两组间有显著差异时所需要的样本量 它的缺点是由较窄范围的人群研究所得出的结论 较难推广到一般人群上 因此,当临床试验开始前,申办者应与器械审评 部门讨论如何定义研究人群 研究人群 入选/排除标准应包括影响因素对结局变量的评 价,因为这些变量中的一个或更多也许影响器械 的有效性 例如,对某一特定疾病来说,性别也许是影响因 素。那么很自然的应评价性别在器械评价中的作 用,然后确定入选/排除标准、设计的其它方面 以及相应分析方面的考虑等 还应考虑以下的问题: 患者年龄、伴随疾病、治 疗或一般情况(包括基线及以后随访)、疾病的严 重程度以及其它因素等 对照人群 每个评价干预的临床试验都应该是可比的(基线 均衡) 所研究器械的安全性和有效性是通过比较结局变 量在治疗组病人(使用研究器械组)和对照组病人( 另一干预组,包括无干预组)间的差别而得到的 一个科学有效的对照人群应与研究人群在重要的 患者特征和影响因素上是可比的,也就是说,除 了使用的器械不同外,其它方面应尽可能相似 对照的类型 平行对照(最常见见) 对照为另一干预器械(无器械或安慰器械) 将来自同一总总体的受试试者随机地分入各个组组,各 组组受试试者在试验试验 中处处于相同的条件,唯一的不同 点是各个组组所使用的器械不同,如有的是干预预器械 组组,有的是对对照器械组组,最后根据试验结试验结 果作出 统计统计 分析 可以为为干预预器械设设置一个或多个对对照器械 对对照器械的选择应选择应 符合研究方案的要求 平行对照 器械2 器械1 A B 现在 对照的类型 交叉对照:患者接受一个干预(患者接受治疗 的顺序必须事先确定),经过一个洗脱期后, 再接受另一个干预 洗脱期指一个试验期结束、另一个试验期开始 之间的一段时间 两个干预之间时间间隔的确定应基于现有的关 于此种器械可能影响解剖学或生理学过程的知 识,使人体内没有第一次治疗的残余效果,这 种残余效果可能混淆第二次治疗所得到的结果 A B 器械1 器械1 器械2 器械2 交叉对照 洗脱期 对照的类型 历史对照 一组非平行的患有相同疾病或病情的患者,也 接受了器械(或安慰器械)治疗,但与研究人 群接受器械治疗的时间和地点不同 历史对照是最难保证研究人群具有可比性的, 尤其当研究人群与对照人群的时间、地点严重 不同的情况下 历史对照 现在 前瞻性临床试验过去研究 将来 过去 历史对照的不足 医学和营养状况是动态的-卫生学和其它因素 的变化也是如此 病人认知、伴随治疗或其它因素的细微差别 将导致治疗结果的差别 而病人选择、治疗或其它因素的差别可能不 会很容易或恰当的记录下来 历史对照的不足 当与一个时间或地点显著不同的历史对照作对 比时,结果变量的上述差别很可能被错误的归 因于一种新的干预措施(器械的效果) 另外,决定主要研究变量的测量方法是否与目 前研究中所选择的方法类似通常是很困难的或 不可能的 不应该假设测量方法是相当的 历史对照通常比平行对照需要做多得多的工作 来验证与当前研究人群的可比性 分配治疗的方法 将治疗分配给病人时,应将选择偏倚降到最小 当具有一个或更多个重要影响因素的病人更频繁 地出现在某一组时,将出现选择偏倚 例如,如果某病发病率男性比女性高两倍,且某 一组中的男性人数是女性的两倍,而另一组中女 性人数是男性的两倍,那么,在不进行任何治疗 的情况下就已经观察到两组发病率的差别了。此 时如果对某一组分配治疗,发病的疗效就会出现 混杂(由性别效果产生的无法区分的混杂) 分配治疗的方法 因此,必须采取适当步骤,使得各组间已知或可 疑影响因素的不平衡达到最小 最好的抑制选择偏倚的方法是随机 随机过程能够保证将病人分到治疗或对照组的机 会是均等的 如果试验足够大,且具有有限的比较组,则随机 将保证克服影响因素间的不平衡 随机还可以防止由于研究者有意或无意识的行为 导致的组间不可比(如:选择最严重的病人到医 生认为更有效的治疗组) 分配治疗的方法 一般来说,试验用器械应根据生物统计学专业 人员产生的随机分配表进行编码,以达到随机 化的要求 受试者应严格按照试验用器械编号的顺序入组 ,不得随意变动,否则会破坏随机化效果 病人顺序 随机号 1 001 (治疗) 2 002 (治疗) 3 003 (对照) . . . . . . 分配治疗的方法 试验中所用的随机化的方法应在研究方案中说 明,但容易使人预测分组的随机化的细节(如 分段长度等)不应包含在试验方案中 1 001 A 2 002 A 3 003 B 分段长度=4 4 004 B 5 005 A 6 006 B 7 007 A 8 008 B 分配治疗的方法 当试验样本量很小,但有很多组时,简当试验样本量很小,但有很多组时,简 单随机也许不能保证各组内影响因素的单随机也许不能保证各组内影响因素的 均衡均衡 在这种情况下,应采用将影响变量进行在这种情况下,应采用将影响变量进行 分组的分层随机方法分组的分层随机方法( (中心、病史中心、病史) ) 分配治疗的方法 有时也可采用其它的分配治疗的方法,但除非有时也可采用其它的分配治疗的方法,但除非 使用了真正的随机模式,否则很难避免系统的使用了真正的随机模式,否则很难避免系统的 或其它可能的偏倚或其它可能的偏倚 例如:按照某一系统模式将病人分到某一器械例如:按照某一系统模式将病人分到某一器械 治疗组,假如每隔四个病人,这似乎是随机治疗组,假如每隔四个病人,这似乎是随机 然而,这样一种周期性的分配有时可能与病人然而,这样一种周期性的分配有时可能与病人 看医生的周期一致,从而导致治疗组与对照组看医生的周期一致,从而导致治疗组与对照组 入选的不均衡,进而导致选择偏性,因为治疗入选的不均衡,进而导致选择偏性,因为治疗 分配是可以预测的分配是可以预测的 分配治疗的方法 应该经常地监查治疗分配过程,以保证应该经常地监查治疗分配过程,以保证 各组已知或可能影响终点的重要因素间各组已知或可能影响终点的重要因素间 的大致均衡(长期研究)的大致均衡(长期研究) 试验设计 应特别强调的是,由某个研究者造成的 背离研究方案将对试验结果的分析产生 巨大的问题 申办者应保证研究者遵从研究方案 如果有迹象表明,在试验过程中不愿遵 从方案的研究者,不论何种原因都不能 参与临床试验 试验设计平行组设计 平行组设计(最常用的临床试验设计)平行组设计(最常用的临床试验设计) 可为试验器械设置一个或多个对照组可为试验器械设置一个或多个对照组 试验器械也可按照若干种治疗强度分组试验器械也可按照若干种治疗强度分组 对照器械的选择应符合试验方案的要求对照器械的选择应符合试验方案的要求 可分为阳性或阴性对照可分为阳性或阴性对照 阳性对照一般采用符合所选适应症的当前公认的阳性对照一般采用符合所选适应症的当前公认的 有效器械有效器械 阴性对照一般采用安慰器械,但必须符合伦理学阴性对照一般采用安慰器械,但必须符合伦理学 要求要求 平行组设计 器械2 器械1 A B 现在 试验设计交叉设计 交叉设计是按事先设计好的试验次序,在各个时期 对受试者逐一实施各种处理,以比较各处理组间的 差异 最简单的交叉设计是22形式,即:对每个受试者 安排两个试验阶段,分别接受两种不同的器械治疗 第一阶段接受何种器械是随机确定的 第二阶段必须接受与第一阶段不同的另一种器械 每个受试者需经历:准备阶段、第一试验阶段、洗 脱期、第二试验阶段 在两个试验阶段分别观察两种试验用器械的疗效和 安全性 A B 器械1 器械1 器械2 器械2 试验设计交叉设计 洗脱期 试验设计析因设计 当一个医疗器械与一个治疗(如药物治 疗)相比较时,经常使用析因设计的方 法 这种研究设计可回答是医疗器械独自起 作用,还是医疗器械与药物治疗相互影 响,联合产生作用? 本设计的不足之处是实施起来更复杂 药物治疗 器械 治疗 有 无 有 无 A B C D 试验设计析因设计 偏倚研究者偏倚 临床试验中可能出现的三个更严重的偏倚为临床试验中可能出现的三个更严重的偏倚为研研 究者偏倚究者偏倚、评价偏倚评价偏倚及及安慰剂或伪效应安慰剂或伪效应 当一个研究者有意识地或潜意识地喜欢某一组当一个研究者有意识地或潜意识地喜欢某一组 、或研究者知道那一组是治疗组时,就会出现、或研究者知道那一组是治疗组时,就会出现 研究者偏倚研究者偏倚 他他/ /她就会更频繁地关注治疗组,从而使得治她就会更频繁地关注治疗组,从而使得治 疗组与对照组被关注的程度有很大的不同,或疗组与对照组被关注的程度有很大的不同,或 将重病人放在治疗组将重病人放在治疗组 而两组之间的这种差异将严重地影响试验的结而两组之间的这种差异将严重地影响试验的结 果果/ /终点终点 偏倚可评价偏倚 可评价偏性可以是研究者偏性中的一种可评价偏性可以是研究者偏性中的一种 ,在这种偏性中,评价疗效的人可以有,在这种偏性中,评价疗效的人可以有 意或无意地掩盖某一组的弱点,而倾向意或无意地掩盖某一组的弱点,而倾向 于另一组于另一组 主观性研究或生活质量研究,其终点就主观性研究或生活质量研究,其终点就 非常容易受这种偏性的影响非常容易受这种偏性的影响 偏倚安慰剂或伪效应 当病人处于一个非活性治疗模式、但他当病人处于一个非活性治疗模式、但他/ / 她相信自己正在进行有效的治疗并随后她相信自己正在进行有效的治疗并随后 显示或报告有所改善时,安慰剂或伪效显示或报告有所改善时,安慰剂或伪效 应就出现了,这也是一种偏倚应就出现了,这也是一种偏倚 盲法 为了在临床试验的过程中防范这些潜在的偏为了在临床试验的过程中防范这些潜在的偏 性,必须使用盲法性,必须使用盲法 设盲的过程就是给治疗器械编码的过程设盲的过程就是给治疗器械编码的过程 编码表应由不参与临床治疗的人员保存编码表应由不参与临床治疗的人员保存 由于违背盲法所引入的偏性在数据统计分析由于违背盲法所引入的偏性在数据统计分析 时是很难评价的,因此一定要在统计分析完时是很难评价的,因此一定要在统计分析完 成后再接盲成后再接盲 盲法 所需要的设盲程度取决于潜在偏性的强度和严所需要的设盲程度取决于潜在偏性的强度和严 重性重性 单盲:病人不知道自己进入的是治疗组还是对单盲:病人不知道自己进入的是治疗组还是对 照组照组 双盲:病人和研究者都不知道那一组是治疗组双盲:病人和研究者都不知道那一组是治疗组 第三方盲法:主要限制评价者,而病人和研究第三方盲法:主要限制评价者,而病人和研究 者均知道那一组是治疗组(阅读医学影像或实者均知道那一组是治疗组(阅读医学影像或实 验室检测人员验室检测人员 盲法 在对医疗器械进行评价的临床试验中,在对医疗器械进行评价的临床试验中, 很难或不可能盲病人或研究者,因为安很难或不可能盲病人或研究者,因为安 慰剂治疗也许根本就不可行慰剂治疗也许根本就不可行 在这种情况下,研究者必须使用额外的在这种情况下,研究者必须使用额外的 手段使得偏性降到最小手段使得偏性降到最小 例如:疗效评价者不知道病人被分到哪例如:疗效评价者不知道病人被分到哪 一组一组 研究中心和研究者 由于经常要将各中心的研究数据合并由于经常要将各中心的研究数据合并, ,以便达以便达 到所需要的样本量到所需要的样本量 因此因此, ,研究中心和研究者的选择在临床试验中研究中心和研究者的选择在临床试验中 是非常重要的是非常重要的 选择的中心必须有可代表器械适用的目标人群选择的中心必须有可代表器械适用的目标人群 的充足的病人数的充足的病人数 每一个中心必须具备研究方案中所描述的用于每一个中心必须具备研究方案中所描述的用于 治疗病人的设施和手段,并且必须有具有资质治疗病人的设施和手段,并且必须有具有资质 的人员来实施该项临床试验的人员来实施该项临床试验 研究中心和研究者 然而,应该注意,尽管使用了统一的研然而,应该注意,尽管使用了统一的研 究方案,并且研究监查员进了最大的努究方案,并且研究监查员进了最大的努 力,当合并各中心数据时,中心效应还力,当合并各中心数据时,中心效应还 是可能出现的是可能出现的 研究方案中应着重阐述如何排除由于中研究方案中应着重阐述如何排除由于中 心效应所带来的潜在的偏性心效应所带来的潜在的偏性 各中心疗效一致性检验 (协方差分析) F F值值 P P值值 治疗分组治疗分组 2.87 0.09252.87 0.0925 基线血压基线血压 23.12 0 C I (优效) 备择假设 (H1):效应大小 () 不为0 ( 两个治疗疗效相等) = C - I 0 C I = C - I 0 C I (优效) 假设检验步骤 建立无效假设 H0 统计分析,评价p值 决定是否拒绝无效假设H0 p 值 (显著性水平) 拒绝 H0 p 值 (统计上不显著) 没有足够证据拒绝 H0 两类错误 例如,研究问题是例如,研究问题是“ “对于某个疾病对于某个疾病A A,用试验器械治疗后,试,用试验器械治疗后,试 验器械组疗效优于对照组吗?验器械组疗效优于对照组吗?” ” 就此问题,我们产生两个假设:就此问题,我们产生两个假设: 无效假设无效假设Ho:Ho: 治疗组病人治疗后的均值治疗组病人治疗后的均值不优于不优于对照组均值对照组均值 备择假设备择假设HaHa:治疗组病人治疗后的均值:治疗组病人治疗后的均值优于优于对照组均值对照组均值 当将样本得出的结论推断到总体时,可能会犯两类决策错误当将样本得出的结论推断到总体时,可能会犯两类决策错误 1 1)如果样本显示器械治疗组疗效优于对照组(拒绝)如果样本显示器械治疗组疗效优于对照组(拒绝HoHo),), 而人群中没有发现两组疗效有差异时,就犯而人群中没有发现两组疗效有差异时,就犯I I类类错误(错误( 错误,假阳性错误,假阳性) 2 2)如果样本显示两组疗效间无差异(即接受)如果样本显示两组疗效间无差异(即接受HoHo),而实际),而实际 上,器械治疗组疗效确实优于对照组时,就犯了上,器械治疗组疗效确实优于对照组时,就犯了IIII类类错错 误(误( 错误,假阴性错误,假阴性) 两类错误 大多数情况下和都是预先指定的,以 估计犯I类或II类错误的严重性 按照惯例,的值一般设为0.05,也就是 当零假设正确时而错误的将其拒绝的可 能性为二十分之一(5%) 的值取决于所做试验的需要 统计效能(把握度) 统计效能(把握度):power = 1- 将差异正确检出的能力 优效性试验:即值可以大一些,但一定 不能大于0.20 统计效能(把握度) 等效性等效性( (非劣效性非劣效性) )试验:试验:应在可行的范应在可行的范 围内把围内把 定得尽可能的小(定得尽可能的小(powerpower尽可能尽可能 大)大) - - 两组器械确实无差异两组器械确实无差异 - - 检验效能不够检验效能不够 “ “等效等效” ” 假设下,假设下, 的值通常取的值通常取0.10.1甚至于甚至于 0.050.05(power=90%,95%power=90%,95%) 连续响应变量样本量计算公式 H0: = C - I = 0; (治疗组结果与对照组相同) H1: = C - I 0 对照组标准变异 在显著性水平、统计效能(1-)下,为了检测两 组间的真实差别 ,两组共需要样本量: 不同值下的Z 不同检验效能(1- )下的Z 例 The mean value for strength of femur in rabbit without arthritis (control) is about 97MPa, with a standard deviation () of about 21MPa. A few previous studies have detected a difference (effect size ) of about 17MPa between arthritis rabbits and controls, and other studies have found no significant difference between the strength (outcome) of the arthritis and the control femur. Question: How many cases and controls will be needed, at (two- tailed) = 0.05 , and = 0.10 (power = 90%) , to detect a difference of 17MPa between the two groups? H0: = 0 (no difference in mean strength of the femur in arthritis cases and controls) H1: 0 (there is a difference ) = 21MPa, =17MPa, Z =1.96, Z =1.282=1.282 2N = 4(1.96 +1.282)2N = 4(1.96 +1.282) 2 2 (21)(21) 2 2 /17/172 2 = 64 = 64 ; N = 32N = 32 (, ) 值 离散响应变量样本量计算公式 (优效性检验) 两个独立样本 PC: 对照组率 PI: 治疗组率 :率差 2N = 4(Z + Z )2 P(1-P)/2 其中: 值的确定 率差,由医生确定(有临床意义) 基于以前的数据(临床试验、参考资料) 如果没有可利用的数据,那么就有必要召集一 个医学专家参与的研讨会,以便定出一个合理 的值 无论在上述何种情况下,报审评部门审批时申 办者都应该提供选择某一值的理由 离散响应变量样本量计算公式 (等效性/非劣效性检验) 2N = 4(Z + Z/2 )2 P(1-P)/2 :有临床意义的界值 该值的大小应由临床医生来确定 两个率比较时,界值一般取10% 或取对照组有效率的10% 在没有任何资料的情况下,可根据既往经验推算 审评时,申办办者应应提供选择选择 某一值值的理由 样本量注意事项 临床试验假设检验(优效、等效临床试验假设检验(优效、等效/ /非劣效)应非劣效)应 包含临床有意义的差值(由临床专家确定的具包含临床有意义的差值(由临床专家确定的具 有临床显著意义的结果变量间的差别)有临床显著意义的结果变量间的差别) 因此,对于一个已知的后果变量,变异度越大因此,对于一个已知的后果变量,变异度越大 ,所需要的样本量也就越大,所需要的样本量也就越大( (处于分子位置处于分子位置) ) 类似地,当变异度已知时,要检测的临床差异类似地,当变异度已知时,要检测的临床差异 越小,所需要的样本量就越大越小,所需要的样本量就越大( (处于分母位置处于分母位置) ) PowerPower要尽可能的大(得到阳性结果的保证)要尽可能的大(得到阳性结果的保证) 例 Suppose the annual event rate in control group is Suppose the annual event rate in control group is 20%20%. The investigator hopes that the intervention will . The investigator hopes that the intervention will reduce the annual rate to reduce the annual rate to 15%15%. The study is planned . The study is planned so that each participant will be followed for so that each participant will be followed for 2 2 years. years. Therefore, if the assumption are accurate, Therefore, if the assumption are accurate, approximatelyapproximately 40%40% (P (P C C ) ) of the participants in theof the participants in the control groupcontrol group andand 30%30% (P (P I I ) ) of the participants in theof the participants in the intervention groupintervention group will develop an eventwill develop an event Question:Question: How many cases and controls will be How many cases and controls will be needed, atneeded, at (two-tailed) = 0.05 (two-tailed) = 0.05 , and, and = 0.10 (power = 0.10 (power = 90%)= 90%), to detect a 5% decline in, to detect a 5% decline in annual rateannual rate between the two groups?between the two groups? = (0.4 + 0.3)/2 = 0.35 多终点事件时样本含量的计算 多终点事件(心梗、死亡、脑卒中) 对每一个结果变量轮流计算样本量 选择最大的样本量 有失访或丢失时样本量的调整 设p为失访比例, 样本量增加 1/(1-p) 例: 若:N = 100, p = 20% 则:N* = 1/(1-0.20) N = 125 当没有足够信息时如何估计样本量? 扩大检索范围(检索相关议题、非医学 杂志、以前研究报告、文章) 与其他研究者联系(判断、预测、已知 的未发表相关结果) 进行预试验 合理猜测 方案 每个设计良好的临床试验都应该有一个每个设计良好的临床试验都应该有一个 详尽的方案,即:精确描述如何实施临详尽的方案,即:精确描述如何实施临 床试验、临床数据是如何收集和分析的床试验、临床数据是如何收集和分析的 全面的计划全面的计划 方案应在试验开始前加以确定方案应在试验开始前加以确定 并应包含以下项目并应包含以下项目 方案 1. 试验背景: 旨在完整描述并且概述与研究目的相 关的所有以往科学研究 2. 试验目的: 确定与所研究问题有关的用药指征、 有临床意义的疗效、以及与之关联的结果变量 3. 对试验设计的完整描述:包括设计类型,数据收 集方法,所选择对照的类型,设盲的方法和水平, 样本量计算依据,以及治疗的分配方法(随机、分 层、其它) 方案 4. 对研究人群的完整描述: - 研究地点、研究对象的选择方法(入 选/排除标准) - 患者类型(住院患者还是门诊患者) - 研究对象的相关临床和人口统计学特 征应与目标人群特征及器械的可能用 途(临床应用)相结合来进行探讨 方案 5. 5. 对干预的完整描述:包括治疗频率和持续时对干预的完整描述:包括治疗频率和持续时 间,以及医师所采取的措施和患者的依从性间,以及医师所采取的措施和患者的依从性 6 6每次随访过程和所需随访时间表的完整描述每次随访过程和所需随访时间表的完整描述 :包括每次随访要完成的所有测量,以及要收:包括每次随访要完成的所有测量,以及要收 集的信息。还包括如何处理患者的失访,以及集的信息。还包括如何处理患者的失访,以及 申办者会采取哪些措施来保证失访患者和中途申办者会采取哪些措施来保证失访患者和中途 退出研究患者的健康退出研究患者的健康 7. 7. 对数据收集和分析的详细描述:包括数据收集对数据收集和分析的详细描述:包括数据收集 和确认的方法、数据监查、统计分析方法、以和确认的方法、数据监查、统计分析方法、以 及出现统计学显著的非预期的阳性或阴性结果及出现统计学显著的非预期的阳性或阴性结果 时,如何及为什么提前终止临床试验的特殊准时,如何及为什么提前终止临床试验的特殊准 则则 方案 8. 8. 对以下几点的详尽描述:研究者简历、监对以下几点的详尽描述:研究者简历、监 查方法以及试验的管理技术(试验监查员,政查方法以及试验的管理技术(试验监查员,政 策和数据监查委员会,等等)包括如何对方案策和数据监查委员会,等等)包括如何对方案 进行必要的修改进行必要的修改 9. 9. 对试验中使用的临床术语和其他术语进行对试验中使用的临床术语和其他术语进行 精确定义的清单精确定义的清单 10. 10. 所有的知情同意书以及伦理委员会需要而所有的知情同意书以及伦理委员会需要而 上述没提到的项目上述没提到的项目 临床试验实施 如果设计了一个详细的方案(对试验设计的完如果设计了一个详细的方案(对试验设计的完 整描述、相应的方法学、预期的分析方法),整描述、相应的方法学、预期的分析方法), 那么实施试验就变得容易得多了那么实施试验就变得容易得多了 然而,临床试验中经常会发生一些事先无法预然而,临床试验中经常会发生一些事先无法预 料的问题料的问题 所以非常有必要制订针对偶然事件的计划所以非常有必要制订针对偶然事件的计划 并且要保证能够迅速地执行这些计划并且要保证能够迅速地执行这些计划 临床试验实施 制定应对偶然事件的计划应该非常谨慎,并且制定应对偶然事件的计划应该非常谨慎,并且 应保证研究设计的完整性应保证研究设计的完整性 任何对方案的修改都可能会降低设计的效率任何对方案的修改都可能会降低设计的效率 然而,任何临床试验实施时都不太可能刚好同然而,任何临床试验实施时都不太可能刚好同 先前的设计完全一致先前的设计完全一致 因此,预先估计一些可能发生的问题并制定相因此,预先估计一些可能发生的问题并制定相 应的计划,以便在发生时进行解决是非常明智应的计划,以便在发生时进行解决是非常明智 的的 试验监查 实施临床试验过程中,主要关注点为:确保研 究对象入选、干预的分配、相关变量的测量( 在适当的时间),以及数据记录的准确性与完 整性,就像方案中所描述的一样 这需要试验的申办者以极其严谨的态度密切监 查试验的实施过程 一个指定的试验监查员应当保证方案的顺从性 ,并且能够发现方案存在的潜在缺陷,必要时 对方案进行修改 试验监查 临床试验一般在多个研究中心进行 而且每个研究中心都有一个或多个研究 者参加 因此为了保证试验的完整性,监查员起 着很重要的作用,即:每个中心的每个 研究者均按照统一的方案设计实施试验 试验监查 例如,如果一个或多个研究者认为有必要对方 案进行修改 且该试验没有被密切监查 那么每个研究中心或每个研究者就有可能按照 他/她自己的方式对方案进行修改 这样就可能导致有多少个研究中心或有多少名 研究人员,就有多少种截然不同的方案修改版 ,这将危害到对整个试验结果的汇总 试验监查 如果研究者自始至终地违反方案,那么他所在 中心的数据就不能用来评价申办者器械的安全 性和有效性 为了避免这种可能,申办者应当建立一种机制 以应对可能的方案修改 并任命一名监查员,来确保所有中心和研究者 在适当的时间对方案进行相同的修改 基线评价 不论临床试验是否采用随机的方法,基线观测值 均基于干预前所有患者的值。由于下列原因,应 对所有研究对象的基线信息进行精确定义: - 研究者评价受试者是否合格 - 进行亚组分层(必要的话) - 描述目标人群的特征,或评价试验样本代表 目标人群的代表性 - 干预前的基线体检/实验室测量 基线评价 基线数据的评价有助于标识干预组间必 须均衡的影响因素 - 病人目前的病情 - 伴随用药 - 治疗 - 年龄 - 性别 - 社会经济状况 - 既往病史 基线评价 对基线数据的评价允许选择及采用使潜 在偏倚最小化的方法。例如,对那些已 知会影响结果的影响因素,可在分配干 预时采用分层或均衡分配的方法 如果在试验过程中发现影响结果的影响 因素在两组间不均衡,则在数据分析过 程中就应该使用调整或标化的方法来使 各组间的不均衡达到最小 干预措施 干预的分配和应用都必须严格按照方案来进行 每一过程都必须有一个预先安排好的标准操作 规程(Standard Operating Procedure, SOP) 除了使用的器械不同,治疗组和对照组的操作 规程应尽可能一样 操作流程图 随访 干预后的随访不是简单的安排时间约见 受试者 应该有一个合理的安排以确保随访的受 试者有较好的依从性 即使各组间在随访过程中仅存在中等程 度的偏差,也可导致分析时巨大的偏倚 随访 随访有两个重要特征:完整性和随访期 完整性: 入选试验的受试者完成全部随访的比例 非常重要的是这个比例应尽可能地接近100%, 因为统计效能会随患者的失访而降低 比例小于80%的随访通常被认为是质量很差的试 验,且这些试验通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论