临床试验中的统计学知识

上传人：清*** IP属地：河南上传时间：2020-04-10 格式：DOCX 页数：14 大小：47.34KB 积分：12 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据统计方法与临床试验方案数据统计方法与临床试验方案 5 1 1 统计在新药临床试验中的重要作用统计在新药临床试验中的重要作用医药产品的有效性和安全性最终应当由按照 GCP 原则实施的临床试验来确证在临床试验的设计和分析中统计学家起着必不可少的重要作用 GCP GMP GLP GRP 和 GVP 都与统计有关统计学是一门处理来自群体或个体的大量资料的科学也是处理资料中变异性的科学和艺术其目的在于取得可靠的结果例如一个医生偶然发现一例患偏头痛病人在喝了橙汁以后感觉有所改善但这并不是说从这单一个病例观察就可以认为橙汁是治疗偏头痛的有效方法医生需要统计学资料证明是否有一组病人在服橙汁后报告症状改善者比采用其他治疗后更多又如一个每天吸烟 50 支且嗜酒的人活了 95 岁并健康良好但人们不能相信他的习惯能导致健康和长寿个体对疾病的敏感性变异很大要研究这些问题就应当研究不同生活习惯的人群组的发病率和死亡率也就是说应当进行统计学研究收集数据并用统计图表或简单统计量来描述资料的特征称之为描述性统计但统计学的任务远不止于此统计学可以通过仔细制订试验计划来提高数据质量统计推断方法则是从所研究问题的大量数据中得出结论的主要客观手段应当明白统计学是在收集归类分析和解释大量数据的过程中完成使命的如果在试验设计阶段不考虑统计原则所获结果的统计分析不管做的如何精巧都挽救不了一个设计糟糕的临床研究这是一个必须执行的基本原则表表 8 可能导致临床试验失败的原因可能导致临床试验失败的原因可以控制的因素较难控制的因素研究计划研究计划要解决的问题目标目标人群研究的顺序性研究人员选择试验设计试验设计试验假设随机化盲法试验对象的入选排除标准受试者基线值变异剂量选择终点指标测定样本大小数据分析方法结果的解释操作性变量操作性变量入选速度缓慢中途退出受试者的依从性执行错误执行错误不严格遵循剂量方案入选了不合格受试者试验过程中合并用药测量的变异编码错误在新药研制过程中按科学原则进行的临床试验是评价一种新治疗方法的有效性和安全性的惟一可靠的基础一个临床试验如果不能恰当地评价试验药物的安全性和或效性不能提供关于新药的最好使用方式的充分信息或者提供了误导信息因而不能对药物的研制管理上市和安全有效地使用做出有益贡献那么这就是一个失败的临床试验可能导致临床试验失败的原因很多有些原因是可以控制的有些则是较难控制的其中试验设计对于临床试验的成功与否起着极其重要的作用试验假设阳性对照选择不当随机化及盲法不规范入选排除标准过严或过宽受试者基线值变异大药物剂量选择不当终点指标选择及测定时间不妥样本数太小数据分析方法不恰当都可能导致临床试验失败表 8 GCP 对生物统计学的要求包括四个方面统计学设计统计分析计划临床和统计学报告以及数据处理与临床试验其他专业人员合作的临床试验统计人员的作用和责任是确保在支持新药研制的临床试验中能恰当地应用统计原则 5 1 2 统计学与试验设计统计学与试验设计临床试验按其目的大体可分为验证性 Confirmatory 试验和探索性 ploratory 试验验证性试验是控制良好的试验总是预先定义与试验目的直接有关的关键假设并且在试验完成后对此进行检验验证性试验必须提供疗效和安全性的可靠证据新药临床试验中大部分是确认性试验但一个临床试验常具有验证性和探索性两方面对于每一个支持上市申请的临床试验所有关于设计实施和统计分析的要点应当于试验开始前在试验方案中写明试验方案中的统计学设计包括试验设计样本大小的确定和为避免偏差而采用的技术 5 1 2 1 平行组设计 Parallel design 验证性试验的最常见设计是平行组设计受试者被随机分配到两个或多个组中的一个每个组接受不同的治疗治疗包括一个或几个剂量的研究产品以及一个或多个对照如安慰剂和或阳性对照这种设计最有效其假定比其他设计简单有明确的有效性结果完成研究时间较短但是这种设计需要较大的样本有较大的受试者变异比较复杂试验的某些特点会使结果的分析和解释复杂化如协变量问题在一段时间内的重复多次测定设计因子之间的相互作用违反设计等等 5 1 2 2 交互设计 Crossover design 在交叉设计中每例受试者被随机分配到两个或多个治疗序列中的一个其自身在治疗比较中作为对照这个简单设计的吸引力在于它减少了受试者例数在最简单的 2 x 交叉设计中受试者按随机顺序在两个连续的治疗周期间隔一个洗脱期中分别接受两种治疗这种设计可以扩大到对象在 n 2 个周期接受 n 种不同治疗交叉设计的优点是所需受试者数较小消除了受试者间变异但是除了试验时间较长序列效应和周期效应需作分析以外交叉设计存在许多可能会使其结果无效的问题主要是可能带入延期 Carryover 效应在 2 x 2 设计中由于缺少把握度 power 统计学上不能从治 X 周期相互作用项来鉴别延期效应使用交叉设计时很重要的是避免延期效应要做到这一点在设计时必须对疾病和新药有足够的认识所研究的疾病应当是慢性病且病情稳定药物的作用在治疗周期内应当充分展现洗脱期要足够长以使药物的作用完全消退交叉设计要注意的其他问题还有受试者出组造成的分析和解释的复杂性潜在的延期效应可导致对发生在后一治疗周期的不良事件认定的难度通常 2x2 交叉设计用于证明同一药物两种制剂的生物等效性试验在这一特例中受试者是健康志愿者只要洗脱期足够长延期效应不可能发生但是在试验中仍要在每个治疗周期开始时进行测定没有检测到药物即可确认没有延期效应 5 1 2 3 析因设计 Factorial design 析因设计通过不同的治疗组合可同时评价两个或多个治疗最简单的例子是 2x2 析因设计受试者被随机分配到两种治疗 A B 的 4 种可能组合中的一个 A B AB 无 A 无 B 这一设计在多数情况下系用于检查 A 与 B 的相互作用的特殊目的如果根据主效应计算样本数统计检验可能缺乏把握度检测相互作用如果该设计用来检查 A 和 B 的联合作用特别是一起使用两种治疗时要特别注意样本数的问题析因设计的另一重要用途是确定同时使用治疗 C 和 D 的剂量反应特征设 C 有 m 个剂量水平通常包括零剂量安慰剂治疗 D 有 n 个剂量水平那么完全析因设计包含了 m x n 个治疗组每个接受不同剂量的 C D 组合反应面 response surface 的结果估算有助于鉴别合适的临床使用剂量组合 5 1 2 4 多中心临床试验多中心临床试验是一种实践上可被接受且更加有效地评价新药的方法它的优点是可以在合理的时间内招募足够多的受试者而且多中心临床试验为其研究结论的普遍性提供了良好的基础一个多中心临床试验要成功必须采用同样的试验方案并严格按此实施临床试验需要有尽可能完善的实施临床试验的标准化操作程序 SOP 样本大握度的计算通常是假定各中心所比较的治疗差异是同样数量的无偏差估计多中心试验应当避免各中心招募的受试者人群特征变化过大以及样本量过小的中心以降低治疗效果的不同权重估算的差异每个中心必须有一个主要研究人员负责本中心的研究工作符合设计要求试验前集中对各中心人员进行必要的培训实施试验过程中的质量控制多中心研究中研究人员可能从一个医院入选对象也可能一个研究人员从几个协作医院入选受试者因此试验方案中应该对中心有明确的定义如指研究人员医院或地区多数场合中心以研究人员来限定如果每个中心有相当数量的受试者在分析多中心研究的主要治疗效应时要考虑中心间的均匀性 5 1 3 临床试验中的有关考虑临床试验中的有关考虑 5 1 3 1 避免偏差的技术 l 育法采用盲法技术是为了防止由于对于治疗的了解而引起的有意识和无意识的在实施和评价临床试验中的偏差因此盲法的基本目的是在发生偏差的机会过去之前防止识别接受的是何种治疗单盲试验受试者或研究人员工作人员一方不知道所接受治疗双盲试验受试者和参加临床试验或临床评价的研究人员或申办者方工作人员均不知道也不能识别对象接受了何种治疗的称为双盲试验在试验实施过程中一直保持盲态只有在试验结束完成数据清理数据已达到可以接受水平并且锁定后方可由指定人员揭盲要达到理想的双盲会遇到一些问题如完全不同的治疗手术和药物两种药物剂型不同而改变剂型如胶囊可能会引起药代动力学和或药效动力学特征的改变从而需要确定制剂的生物等效性两种制剂的给药方案可能不同等等在这种情况下可采用双模拟 double dummy 技术即为每一种制剂如 A B 准备一个一模一样的安剂受试者接受 A 活性 B 安慰剂或 A 安慰剂 B 活性但是由于明显的治疗效应某些双盲临床试验仍会遇到问题在这种情况下对研究人员和有关人员加盲可改善盲法即所谓三盲试验 2 随机化随机化为在临床试验中受试者接受某种治疗引入了审慎的机遇成分它为以后的数据分析提供了一个坚实的统计基础随机化所产生的治疗组基线中已知和未知预后因子 Prognostic factor 的分布相仿随机化与盲法相结合会大大有助于避免在指定治时由于可预见性所引起的选择和分配受试者的可能偏差与无限制的随机相比区组随机有两个优点有助于增加治疗组间的可比性尤其是受试者特征随时间可能变化时和保证治疗组有几乎相同的受试者数但要注意区组长度不宜过长也不宜过短过长可能会产生不平衡过短则会使区组末段的分配有可预见性多中心试验的随机化程序应当以中心为单位各个中心有各自的随机表但应该是完整的区组表表 9 影响样本大小的因素影响样本大小的因素因素对样本大小的影响治疗组数目公式计算的是每个组所需要的例数结果变量的测定连续变量或转化为两分变量预期受试者随访时间随访时间长则事件发生率高对给定的所需例数较少备择假设双侧或单侧可检测到的治疗差异必须符合实际差异大则所需例数少所定的类类错误通常取适用于对照治疗已经广泛应用且安全有效试验药物为新药与越小所需例数越多受试者分配比通常取各组例数相同当有其他目的时或为了提高精确度降低方差时取组间例数不等同如 r 个治疗组与一个对照组比较时可取对照组例数为治疗组的 r 1 2 上标倍预期的失访率样本数应根据失访率相应扩大预期的治疗不依从率药物暴露不足或过量受试者医生不遵循设计方案规定例数应增加基线变量的分层程度分层后亚组的受试者数减少多重比较按多个治疗组比较多个终点有一个主要结果多个次要结果样本大小通常按主要变量计算有时对每个结果变量计算所需样本数取最大样本数 5 1 3 2 试验样本量的确定临床试验应当有足够功效把握度检测不同治疗之间的差异样本应当足够大才可以对所提出的问题做出可靠的回答一个临床试验的样本大小是由研究目的反映研究目的的研究假设和由此导出的统计检验所确定的样本量通常是根据试验的主要目的计算的如果样本大小根据其他变量如安全性变量或次要目的计算应当在设计书中有清楚说明并给出理由 1 影响样本大小的因素在计算所需样本量之前下列各项应有明确的定义主要变量试验数据的统计检验零假设和备择假设类和类错误计量数据的差值标准差和参考值计数数据的率下面介绍 3 种常用的计算临床试验样本大小的方法计算所得的是每组所需受试者例数考虑到试验中受试者因不良事件退出的比例实际筛选受试者数还需根据估算的比例增加在计算临床试验样本大小时要考虑的因素和它们的影响简列于表 9 2 样本大小的计算试验的结果变量为定性的两分值变量式中 P1 为对照标准治疗的成功率 P2 为试验治疗的成功率为检测治疗差异的 c2 显著性检验水平通常取 0 05 1 如果差异 P2 P1 存在检测到这种差异的把握度或功效通常又称类错误即当实际上两种治疗同样有效时检测到有显著差异的概率相当于假阳性率通常又称类错误即当差异 P2 P1 确实存在时没有检测到这种差异的概率相当于假阴性率 f 和的函数其常用值列于表 10 表表 10 用于计算所需受试者数公式中的用于计算所需受试者数公式中的 f 值值类错误 0 05 0 1 0 2 0 5 0 1 10 8 8 6 6 2 2 7 0 05 13 0 10 5 7 9 3 8 0 02 15 8 13 0 10 0 5 4 类错误 0 01 17 8 14 9 11 7 6 6 例观察降血胆固醇药预防胆固醇升高者的缺血性心脏病的随机临床试验安慰剂对照根据资料对照组的缺血性心脏病的年发病率为 1 研究希望检测 5 年中用安妥明组的缺血性心脏病发生率比对照组降低 1 3 设定类错误水平分别为 0 01 和 0 1 求所需受试者例数例中由于该研究没有可能重复因此选定的显著性水平比较严格 P 0 01 是必要的对照组缺血性心脏病的年发生率 1 因此 5 年中为 5 即 P1 5 P2 3 3 试验的结果变量为定量连续变量式中 1 对照标准治疗的均值 2 另一治疗的期待均值 s 标准差 f 为和的函数例评价孕妇补充 Vit D 防止婴儿低血钙的临床研究从以前未用药妇女资料中可得血清钙均值为 9 0mg 100ml 标准差为 1 8mg 100ml 选择显著性水平 0 05 1 0 95 考虑被 Vit D 后孕妇血清钙水平提高到 9 5mg 100ml 求所需受试者例数注意以上两个临床试验目的都是希望确证一种治疗试验组明显好于另一种治疗对照生物等效性研究中交叉设计的受试者例数计算我国新药审批办法规定四类新药需进行生物等效性研究生物等效性研究的试验目的是比较一种产品的两种制剂试验制剂和参考制剂的生物利用度并根据吸收速率和吸收程度判断其生物等效性试验的主要假设是两种制剂的平均生物利用度的差异是否有一定把握落在参考制剂均值的 20 范围之内为此目的根据试验药物的性质一般采用交叉设计在某些情况下亦可以采用平行设计如当受试者间变异小于受试者内变异药物有潜在毒性和或消除半衰期长研究人群包括重病人增加受试者例数的花费远低于增加一个治疗周期的费用时可考虑下面介绍生物等效性研究中交叉设计的受试者例数计算并且试验假设为 Ho 生物等效 Ha 生物不等效根据生物等效性的双向单侧统计检验程度每个序列所需受试者数为 CV 由先前的研究或参考资料获得当 0 05 1 0 90 时根据上述公式计算的双单侧检验程度所需受试者例数列于表 11 表表 11 双单侧检验所需受试者例数双单侧检验所需受试者例数 0 05 1 0 90 T R R cv 0 5 10 15 10 10 10 20 70 12 10 14 28 100 14 14 18 36 136 16 16 22 46 178 18 20 28 58 224 20 24 32 70 276 22 28 40 86 334 24 34 46 100 396 26 40 54 118 466 28 44 62 136 540 30 52 70 156 618 32 58 80 178 704 34 66 90 200 794 36 72 100 224 890 38 80 112 250 992 40 90 124 276 1098 5 1 3 3 统计学分析计划根据 ICH 的要求一个临床试验方案中应该有专门的统计段落描述数据的主要统计分析方法随后统计分析计划可写成一个独立的文件它是对试验方案中描述的分析原则的更加技术性和详细的说明包括关于主要变量次要变量和其他数据的详细的可执行的分析程序临床试验结果应当依据方案中规定的分析计划进行分析如果试验方案有所修改应该在报告中说明对于盲法试验在揭盲之后所作的任何变更都要在临床和统计报告中说明变更的理由统计分析计划的内容应包括分析研究的人群疗效与安全性评价的主要变量次要变量统计学方法缺失数据的处理结果的表达亚组分析如果有等 1 分析研究人群所有进入随机化分组的受试者 intent to treat 接受试验药物治疗的所有随机化受试者遵循研究设计方案的受试者 Per protocol 安全性耐受性分析的受试者 2 要比较的治疗组 3 主要变量和次要变量主要变量是临床意义上最重要的变量其与试验的主要目的直接相关一般应该只有一个主要变量如充血性心力衰竭治疗试验中的死亡率高血压治疗试验中的舒张压避孕药临床试验中的妊娠率等对于主要变量在试验设计中应作限定在分析计划中要说明主要变量的测定方法测定时间点是否作数据转换等以及测定程序的有效性次要变量可以是有关主要目的的辅助测定也可以是关于次要目的的测量对次要变量的数目应当限制 4 统计学方法必须阐明统计显著性是采用单侧或是双侧检验特别是采用单侧检验时应充分说明其理由应当说明检验假设和为满足试验主要目的需要估算的治疗效应描述要完成这些任务对于主要变量也包括次要变量所采用的统计方法基本统计模式应有清楚说明只要可能估算治疗效应要以可信区间表示计算可信区间的方法应予以说明使用基线数据以改善精确度或调节潜在的基线数据的差异如采用协方差分析对其目的应有说明此外应该说明主要和次要变量的辅助分析方法以及其他数据的分析方法如安全性数据在统计分析计划中并应列出相应的分析程序 5 缺失数据在临床试验中各种类型的违反方案中途退出试验和数据缺失都可能影响完满的分析在统计分析计划中应该写明发生这些问题时在数据分析中的处置办法 6 结果的表达可采用均数标准差最小值和最大值累积百分率各种图表等只要可能估算治疗效应要以可信区间表示 7 亚组分析列出那些预期会对主要变量有重要影响的协变量和因子考虑为改善精度在分析时如何计算以及如何弥补治疗组之间的不平衡应当特别注意中心和主要变量的基线值的影响在大多数情况下对于亚组或相互作用的分析是探索性的一般应当反映治疗效果总的一致性 8 统计分析计划的修改统计分析计划如有变更应在报告中作出说明包括修改的时间和原因修改的内容陈述负责修改的人或组可供分析数据的性质和内容在盲法试验揭盲之后所作的变更需要在临床和统计报告中描述并说明其合理性对报告中将要讨论的结果的解释所产生的影响要给予说明在揭盲之后就不能再接受下列变更主要变量从领先确定人群中剔除受试者和处理缺失数据的原则临床试验数据分析要点临床试验数据分析要点 5 3 1 分析对象的数据集分析对象的数据集 5 3 1 1 全样本分析全样本分析 Full analysis set 计划治疗原则 intention to treat 是指主要分析应当包括所有进入随机化的遵循这一原则需要对所有随机受试者完成随访得到试验结果由于各种理由这在实际上是难以达到的因此全样本分析是尽可能接近于包括所有随机受试者在分析中保留最初的随机化对于防止偏差和提供安全的统计检验基础很重要在许多场合它提供的对治疗效果的估算很可能反映了以后的实际观察结果从分析中剔除已随机受试者的情况不多包括不符合重要入选标准一次也没有用药随机化后没有任何数据从分析中剔除不符合入选条件受试者必须不致引起偏差入选标准的测定是在随机化之后违反合格标准的检测是完全客观的所有受试者都受到同样的合格性调查各组实行同样的入选标准凡违反者均被排除 5 3 1 2 遵循研究设计对象遵循研究设计对象 Per Protocol Set Per Protocol 对象组有时称之为有效病例有效样本或可评价受试者样本定义为全部分析样本中较好遵循设计书的一个受试者亚组完成预先说明的确定治疗方案暴露得到主要变量的测定数据没有违反包括入选标准在内的重要试验设计从有效受试者组中剔除受试者的精确理由应当在揭盲前就充分限定并有文件记载为得到有效受试者而排除对象的原因和其他一些违反研究设计的问题包括对象分配错误试验中使用了试验方案规定不能用的药物依从性差出组和数据缺失等应当在不同治疗组之间对其类型发生频率和发生时间进行评价 5 3 1 3 不同的分析受试者组的作用不同的分析受试者组的作用在验证性试验中通常进行全样本和有效受试者两种分析这样可以对两者之间的任何差别进行明白的讨论和解释有时候可能需要计划进一步探究结论对于选择分析受试者组的敏感程度两种分析得到基本一致的结论时治疗结果的可信度增加但是要记住需要 quot 有效受试者中排除相当数量受试者会对试验的总有效性留下疑点在优越性 Superiority trial 证明新药比标准对照药物优越试验等效性试验或不差于 non inferiority trial 确证新产品与对照药物相当试验中这两种分析有不同的作用在优越性试验中全样本分析用于主要的分析可以避免有效受试者分析对疗效的过于乐观的估算全样本分析所包括的不依从受试者一般会缩小所估算的治疗作用但是在等效性或不差于试验中使用全样本分析通常是不谨慎的对其意义应当非常仔细考虑 5 3 2 缺失值和线外值包括异常值缺失值和线外值包括异常值缺失值代表临床试验中一个潜在的偏差来源因此在实施临床试验时应当尽最大努力符合试验方案对于数据收集和数据管理的要求对于缺失值并没有通用的处理办法但只要处理方法合理特别是如果处理缺失值方法在试验方案中预先写明则不会影响试验的有效性当缺失值数目较大时要考虑分析结果对于处理缺失值方法的敏感程度线外值包括异常值的统计学定义在某种程度上带有随意性除了统计学判断之外加上医学判断以鉴别一个线外值包括异常值是最可信的方法同样处理线外值包括异常值的程序应当在方案中列出且不可事先就有利于某一个治疗组 5 3 3 数据的类型显著性检验和可信限数据的类型显著性检验和可信限在临床试验中对每个受试者可收集 3 种数据所接受的治疗对治疗的反应 Re sponse 和进入试验时影响预后因子的基线值接受同样治疗的受试者构成统计分疗组对治疗的反应基本上有 3 类定性反应根据预定的评价标准将受试者分为若干类别如高血压治疗的有效无效淋巴细胞瘤化疗的完全缓解部分缓解无变化定量反应当存在一种可靠测定方法时受试者的治疗结果最好采用实际数值如舒张压但最好同时记录其基线值以便评价治疗前后的变化量值到某事件发生的时间如使用避孕药受试者从开始治疗到意外妊娠的时间 5 3 3 1 数据的描述性统计数据的描述性统计在开始分析之前有必要先看一下各组受试者的每个变量观察值的分布频度以对变量有一个感性了解从最大值和最小值也可以发现可能的错误和超范围的值决定某些变量是否需要作某种转换或按某种特定分布作统计分析定性数据需要记录各治疗组的受试者总数和在每个反应类别的受试者数然后转化为比率或百分率或直方图圆图等表示采用 c2 检验 Fisher 精确检验比较所观察到的组间率的差异的程度定量数据计算每个治疗组的平均反应均数几何均数和变化程度标准差以均值标准差直方图累积频数分布图表示在受试者数较小时可以用图表显示每个受试者的确切反应组间比较采用 t 检验 F 检验等当样本值频数图呈偏态分布时用均值描述定量反应不合适可采用中位数四分位数来描述数据的定量水平组间比较可采用非参数方法 5 3 3 2 显著性检验显著性检验显著性检验的真正含义是应用概率理论计算如果两个治疗实际上同样有效时得到所观测到的治疗差异的概率其目的是评价一个治疗真正优于另一个治疗的证据有多强这种证据的强度用概率即 P 值来定量因此 P 值越小治疗差异由于偶然发生的可能性越小在实践中人们常用 P 0 05 P 0 01 P 0 001 表示显著性检验的结果这些水平的选择是完全随意的并没有数学或临床的理由在解释显著性检验时要注意以下几点一个小的 P 值如 P 0 05 并不是一种治疗优越的绝对证明每 20 个真正阴性试验会出现一个假阳性结果 P 0 05 也并不证明两治疗同样有效差异可能实际上存在只是现有数据不足以证明它存在统计显著性并不等同于临床重要性一个 10 万人的试验中 1 的反应率差异在 5 水平是显著的但在一个 20 人的试验中 40 的差异在统计上也是不显著的因此临床的意义必须用差异的大小即可信限来评价双侧检验和单侧检验假设治疗差异可以发生在任一方向时为双侧检验双侧检验的零假设为 a b 备择假设为 a1 b 如果在试验之前就确定治疗 A 不可能差于治疗 B 为单侧检验其零假设为 a b 备择假设为 a b 此时显著性检验评价 A 好于 B 或 A 相当于 B 的证据若结果是 A 比 B 差便归于机遇因为 A 不可能差于 B 结果是单侧检验的 P 值为双侧检验的一半也就是说单侧检验比双侧检验容易拒绝零假设采用单侧检验应该有足够的依据如果试验设计中决定用单侧检验在结果表示时要注意一般统计软件计算的都是双侧检验的 P 值 5 3 3 3 可信限的估算可信限的估算显著性检验只告诉我们一个治疗比另一个好的证据的强度并没有告诉我们好多少因此显著性检验并不是分析的终结还应运用统计估算方法如可信限估算治疗改善的量计算可信限时应注意被分析变量的统计分布标准误和可信限的计算方法应该写明记住必须提供治疗效应大小的统计估算显著性水平和可信区间 100 1 可信区间正态分布估算值可表示为估算值 N 2 SE 估算值 N1 2 SE 差值如呈 t 分布时可表示为 x1 x2 t1 2 SEdiff x1 x2 t1 2 SEdiff 等 5 3 4 对象的基线水平的组间比较对象的基线水平的组间比较对治疗组的疗效评价只有当各组受试者的基线特征具有可比性时才是有效的通常随机化可以提供充分的可比性但是随机化并不能绝对保证可比性有时候组间的基线水平可能会有差异这种差异对治疗比较的影响应当采用其他程序消除 5 3 5 调节显著性和可信限水平调节显著性和可信限水平许多情况都可能产生多重性例如多个终点主要变量如血压记录卧位或坐位的收缩压和舒张压心肌梗死预防试验中的各种原因死亡率和心肌梗死发病率治疗的多重比较几个治疗组间比较或试验药物的几个剂量组及不同时间点的多次测定和中期分析等存在多重性时检验主要假设的次数增加产生 I 类错误的机会就会变大分析数据时可能有必要对五类错误进行控制和调节首先最好能避免或减少多重性的产生如从多个主要变量中鉴别出关键的主要变量如血压记录取卧位舒张压为主要变量心肌梗死预防试验取死亡率为主要变量对反复测定则采用一个综合测量指标如曲线下面积多重比较的常用统计方法有 Bonferroni 方法 Holm 法和 Hochberg 方法 Bonferroni 方法是一个保守的方法对于成对比较它调节 P 值以控制总的 I 类误差率 Hochberg 方法比另两种方法更有效它只需控制最大的 P 值小于显著性水平多个终点的调节用 Bonferroni 方法和 Hochberg 方法 5 3 6 亚组相互作用和协变量亚组相互作用和协变量除了治疗以外主要变量常与其他影响系统相关主要变量可能与协变量如年龄和性别有关或在受试者亚组之间可能存在差异如多中心试验中在不同中心接受治疗在某些情况下调节协变量影响或亚组效应是所计划的分析的一个必要部分要特别注意中心的影响和主要变量的基线测量值的作用不要在主分析中对随机化以后测定的协变量进行调节因为这些测定可能受治疗的影响此外治疗效果本身也可能随亚组或协变量改变疗效可能随年龄而下降或在具有某一特殊预后因子的受试者中增大这类相互作用在某些情况下是可以预见的或具有特殊的意义如老年病学因此一个亚组分析或包括相互作用项的统计模型是所计划的验证性分析的一个部分对于定量反应变量多元回归是最常用的统计调节方法有时也称协方差分析对于定性反应可以应用多元 Lgistic 模型 5 3 7 评价安全性和耐受性评价安全性和耐受性 5 3 7 1 评价范围评价范围一个药物的有用性总是在风险和效益之间的平衡在所有临床试验中安全性和耐受性评价是重要内容之一在临床研究早期阶段这类评价带有探索性仅注意毒性的表达方式在较后阶段则是在大样本对象中更全面地确定药物的安全性和耐受性特征后期的对照临床试验是以一种无偏倚方式揭示任何新的不良反应的重要手段尽管此类试验的把握度有限 5 3 7 2 变量选择和数据收集变量选择和数据收集在临床试验中选择评价药物安全性和耐受性的方法和测定取决于一系列因素药物不良反应的知识药物非临床研究和早期临床试验以及重要的药效学药代动力学特征资料给药方案被研究对象和研究持续时间安全性和耐受性的主要数据通常包括临床化学和血液学的实验室测试如 WBC SGPT 生命指征和体检如血压 ECG 临床不良事件疾病体征和综合症发生严重不良事件和因不良事件中断治疗对于注册是特别重要的数据临床试验中使用共同的不良事件编码词典特别重要这种词典的结构提供了在 3 个不同的水平总结不良事件数据的可能性系统器官分类标准术语 preferred term 和包括术语 included term 通常不良事件按标准术语分类总结相同系统器官分类的标准术语在数据的描述性报告中可以放在一起现在常用的有世界卫生组织的疾病和有关健康问题的国际统计分类 ICD 10 和美国的 COSTART 5 3 7 3 评价的受试者和数据报告评价的受试者和数据报告安全性和耐受性评价中所总结的受试者通常至少曾接受过一个剂量研究药物要尽可能全面地从这些受试者中收集安全性和耐受性变量包括不良事件的种类严重程度开始时间和持续时间以及处理方法和结果评价时要注意所有安全性和耐受性变量所有不良事件不管它们是否与治疗相关都应当报告实验室测定值的单位和正常范围应有明确定义使用的毒性分级标度 toxicity grading scale 应当预先说明通常一个特定不良事件的发生率表示为经历该事件受试者数相对于处于危险的受试者数的率但是根据需要被暴露的受试者数或暴露程度用人年表示可以作为分母不管其目的是为了估算危险度还是在治疗组间进行比较应该在方案中明确定义这在计划长期治疗并预期会有相当比例的治疗中止或死亡时特别重要在这种情况下应当考虑采用生存分析 Survival Analysis 计算不良事件累积率以避免低估危当存在明显的症状或综合征基线噪声时估算不良事件危险度的一个办法是采用治疗引发 treatment emergent 概念只记录与治疗前基线相比时原先没有的不良事件或症状变重的不良事件减少基线噪声的其他办法还有不计轻度的不良事件一个事件在重复随访中观察到才计算不论采用何种方法都须在方案中说明理由 5 3 7 4 安全性的统计评价安全性的统计评价在大多数临床试验中安全性和耐受性结论的陈述多采用描述性统计方法辅以有助于解释的可信区间计算用图可表示治疗组内不良事件的类型计算 P 值有时也是有用的可以评价一个事件的差异或是在大量安全性和耐受性变量中突出值得进一步注意的差别计算 P 值对于总结实验室数据特别有用实验室数据可进行两种分析评价均值的定量分析和计算高于或低于某一个阈值的数目定性分析数据录入及分析的质量控制数据录入及分析的质量控制临床试验中的质量保证 Quality assurance 是指收集处理和分析研究数据的方法和手段目的在于维护和加强数据的可靠性和有效性因此数据管理应当有完善和有效的标准操作程序 SOP 用于数据管理和统计的计算机软件应当可靠质量保证系统的具体内容包括编辑程序检查记录表格数据的准确性和完整性重复实验室测定检查其重视性测定方法的有效性两次输人数据检查发现数据录入过程中可能的错误在多中心试验中对不同中心进行分析检查试验执行中的偏差表表 12 临床试验的质量保证程序临床试验的质量保证程序临床研究

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

临床试验中的统计学知识

文档简介

温馨提示

最新文档

评论

临床试验中的统计学知识

文档简介

温馨提示

最新文档

评论

相关文档