临床医学研究数据管理与统计分析PPT演示幻灯片_第1页
临床医学研究数据管理与统计分析PPT演示幻灯片_第2页
临床医学研究数据管理与统计分析PPT演示幻灯片_第3页
临床医学研究数据管理与统计分析PPT演示幻灯片_第4页
临床医学研究数据管理与统计分析PPT演示幻灯片_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、临床医学研究 数据管理与统计分析,主 讲 人:黄品贤 所在部门:基础医学院预防医学教研室 联系方式: 联系电话:51322156 网 址:,统计分析,临床医学研究的过程,讲座内容,一、临床医学研究的数据管理 二、临床医学研究的统计分析 三、临床数据资料常见的统计分析方法应用问题,4,一、临床医学研究的数据管理,任何医学研究,最重要的是数据来源。,临床数据管理 (Clinical Data Management,CDM),定义:是利用计算机技术、网络技术等对医学研究中获取的及时、可靠、完整和准确的大量数据进行及时填写、医学编码、双人双录、一致性审查、疑问校正、盲态审核、数据转换和锁定等全过程。,

2、临床数据管理 (Clinical data management,CDM),目的:保证临床研究过程的科学严谨,资料收集的真实可靠,资料存放的安全有序;将数据库文件按预先制定的统计分析计划书进行统计分析,最终得到真实、可信的研究结论。 CDM应在设计研究方案与CRF时就体现数据的采集与管理。数据管理贯穿于临床研究的各个环节。,7,在进行临床医学研究之前,必须制定数据管理计划(Data Management Plan,DMP)。 临床数据管理计划包括:CRF的设计、数据库的设计、数据接收与录入、数据核查、数据疑问管理方式、数据存档、数据盲态审核、数据库锁定、数据备份与保存、 数据保密及受试者个人私

3、密性的保护。,临床数据管理 (Clinical data management,CDM),临床数据管理计划,指定一有资格的数据管理员 CRF在数据管理前的检查 详细的编码表 方便记忆的变量名与文件名 按需产生的派生变量 录入数据的自动控制与逻辑检查 CRF中文字信息的处理 缺失数据的处理(主要疗效指标和安全性指标),数据疑问管理方式及日志 每个阶段数据管理的报告 质量控制的细节, 数据管理计划的修改或补充 时间表 数据管理软件与硬件 数据格式的转换 数据管理的中期报告,临床数据管理流程,数据产生的过程,研究者填写CRF表 监察员核查、传递给数据管理单位 根据CRF建立录入程序 双人双份独立录入

4、 核查并产生数据疑问表(DQF) 监察员将DQF交研究者复核并回答 数据库修改并核查 不良事件及合并用药编码 盲态下的数据审核 数据锁定 数据传递(统计分析人员),CRF,临床数据管理相关人员,课题负责人 研究者 监察员 数据管理员 合作研究组织,临床数据管理相关人员,课题负责人:数据质量的最终责任人。 明确研究方案 制定数据质量管理评价程序 制定数据质量管理计划与操作指南 设立稽查部门并进行定期系统性检查 组织培训,临床数据管理相关人员,研究者 确保CRF或其他记录的数据及时、完整与准确 确保CRF上的数据与病历的源数据一致,并必须对其中的任何不同给出解释 研究者可能犯的错误 违反研究方案,

5、如错误的访视时间 源数据录入CRF时错误 实验室仪器人为测量误差 研究者造假,临床数据管理相关人员,监察员 应根据源文档核查CRF上的数据,一旦发现有错误或差异,应通知研究者,以确保所有数据的记录和报告正确和完整。 临床监查中常见问题 知情同意书缺失或签署存在问题 无原始病历或原始病历中无记录(缺失或不全) CRF填写空缺、错误或不规范 不良事件的记录不完整 检验结果不能溯源(实验室数据、心电图、X光片等),临床数据管理相关人员,数据管理员 参与设计CRF 建立和测试逻辑检验程序 对CRF作录入前的检查 对录入数据库进行逻辑检查数据的有效性、一致性、缺失和正常范围等 对发现的问题应及时清理(通

6、过比对或向研究者发放数据质疑表(Query)而得到解决。) 参加临床研究者会议,为研究团队及时提出改善与提高数据质量的有效措施。,合同研究组织(Contract Research Organization,CRO) 国际临床试验数据管理首先要符合“人用药品注册技术要求国际协调会议-临床试验质量管理规范”(ICH-GCP, International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use-Good Clinical Practi

7、ce)的原则性要求。,临床数据管理相关人员,合同研究组织(CRO) ICH-GCP指出课题可以将部分或全部数据管理委托给一个CRO,但是,申报者依然是数据质量和完整性的最终责任人。CRO应当实施质量保证和质量控制。 申报者与CRO需签订有效合同,在合同中需明确双方的责、权、利。申报者必要时应对CRO进行相关的培训,以保证其所提供的服务符合申报者质量标准要求。 申报者需与CRO进行即时有效的管理、沟通和核查,以确保其遵守共同商定的流程的要求。申报者的质量管理计划中必须包括CRO的质量管理信息,同时必须明确流程和期望结果。,临床数据管理相关人员,核查与疑问管理,数据核查计划 数据核查程序 疑问表(

8、Data Query Forms,DQF)的产生 DQF的回答 DQF的返回及处理,监查,数据核查目的,核查人员对CRF表中的各个指标的数值和相互关系根据临床试验方案要求进行核查,对于缺失、逻辑矛盾、有误或不能够确定的数据,以疑问表的形式由临床试验监查员传递给临床试验中心,由研究者对疑问做出回答。,数据核查计划,按CRF页码和各页数据项内容顺序撰写。 数据项核查条件统一描述 数据库的所有数据均需描述核查条件 应描述各数据项的核查范围和发疑问或确认的标准 内容完成相同的页,可合并撰写(如各访视内容) 核查计划传递给申报人,申报人审核并提出修改意见 核查计划签字后方生效,数据核查程序,核查程序是根

9、据数据检查计划,可在SAS 环境下按数据核查计划内容编写的核查程序;也可利用EpiData的Check功能检查;也可通过数据网络输入平台进行核查。 主要检查CRF表中数据缺失、误填、数据逻辑矛盾等问题。 程序核查后人工校对。,数据的差异性检验,原始数据的录入和导出,数据疑问的查找,数据疑问常见类型,补充: 病例报告表中有缺失的项目,或字迹不清楚的数据。 确认: 入选/排除标准的确认: 实验室检查:多中心提供的正常值范围不一致时需要对观察指标进行临床意义的判断。 时间的确认:所填写的时间不在研究时间范围内;或所填写的访视时间不在方案要求的访视时间窗内。 合并用药的确认:填写数据与各访视所填内容有

10、矛盾;使用了方案中明确禁止的药物,药物名称无法编码的。 不良事件的确认:填写数据与各访视所填内容有矛盾;各项之间的逻辑关系有矛盾;判定为严重不良事件。不良事件描述不清楚,无法做编码的。,DQF的提问方式,XXXXX临床研究数据疑问表 编号:QXXX 随机号:XXX 发出日期: 年 月 日 1. X 项数据缺失,请补充。 2. 出生日期: XXXX 年 XX 月 XX 日,请确认。 3. WBC测定值为:11x109/L,临床意义为“正常”,请确认。 4. 访一时间为: XXXX 年 XX 月 XX 日,访二时间为 :XXXX 年 XX 月 XX 日,不在时间窗内,请确认。 5. 不良事件:“X

11、XXX”,为方便编码,请进一步详细描述。 研究者签名: 日期: 年 月 日,DQF的回答,根据问题,查阅原始资料和CRF表所填内容,慎重回答。 如果某一数据的修改,会影响其它数据时,请一并回答。,疑问表修改说明,1.疑问表是由XXXXX大学数据管理中心发出 2.疑问仅是数据管理人员对有关数据存有疑惑而发出的询问,希望研究者给予明确答复 3.数据修改必须以原始数据为依据,不能推论式回答 4.研究者如果认为数据无错误,在相应的方框内划,并签名确认 5.研究者如果认为数据确实有错误,在相应的方框内划,并注明错误形成原因,签名确认 6.疑问表中所列参考值范围如果不符,以化验单上注明的为准 7.如果定性

12、指标在CRF上已编号,例如 1=正常 2=异常无临床意义 3=异常有临床意义 4=未查,回答时使用相应的编号,编码(Coding),为便于统计分析,将研究者填写的合并用药和不良事件根据相应标准进行规范化处理的过程。 不良事件编码 1. 如将上感、感冒等统一编码为上呼吸道感染 2. 如将恶心呕吐拆分编码为“恶心”和“呕吐” 合并用药编码(按药品通用名编码) EPIAO、罗可曼、利血宝和济脉欣等均编码为“红细胞生成素”,患者数据列表 中止试验患者 方案偏离 从疗效分析中剔除的患者 人口统计学数据 依从性和/或药物浓度数据(如果有) 个例疗效反应数据 不良事件列表(每名患者) 按患者列表的个例实验室

13、检查值(管理当局要求时) ICH E3(临床试验报告的结构与内容): Sec.16.2,数据清单和表格(1),患者表格 人口统计学数据的汇总图表 有效性数据的汇总图表 安全性数据的汇总图表 不良事件的描述 死亡、其它严重不良事件以及其它重要的不良事件清单 死亡、其它严重不良事件以及某些其它重要的不良事件叙述 实验室检查异常值清单(每名患者) ICH E3(临床试验报告的结构与内容): Sec.14.1-14.3,数据清单和表格(2),是指在完成数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审核与评判。 参加数据审核会议人员,一般由主要研究者、统计分析员、数据管理员、监查

14、员和申报者组成。,数据的盲态审核,数据管理员:准备一份数据管理报告。 内容:包括数据管理的过程及一般情况介绍、病例入组及完成情况(含脱落病例清单)、判断统计分析人群所涉及的项目及需讨论并解决的问题(入选/排除标准检查、完整性检查、一致性检查、离群值检查、时间窗检查、合并用药检查、不良事件检查等) 若采用盲法,需递交临床研究盲底。,数据的盲态审核,(1)全体参会人员检查总盲底及应急信件,对盲态做出判断。 (2)数据管理员报告数据管理的一般情况及数据库中存在的需要讨论解决的条目。 (3)主要研究者、统计分析人员、数据管理员共同就数据管理员提交的问题进行讨论并做出处理决定。 (4)与会人员讨论并决定

15、统计分析人群。 (5)统计分析计划的修正与定稿。 (6)决定是否锁定数据。 (7)当揭盲条件成立时,具体执行揭盲。 最后签署盲态审核决议,将锁定后的数据交统计分析人员进行统计分析。,数据的盲态审核,数据盲态审核决议,关于数据库的报告,需提供如下信息: 关于数据库结构、域名的详细报告 实验室数据的参考值范围 用于建立、核查数据库的软件清单及简单说明 各阶段数据核查的错误率的详细报告 未解决的质疑数据清单 未在数据库更正的质疑数据或错误的说明 电子版本数据库的存放位置说明,38,二、临床医学研究的统计分析,让你学会用手中的少量数据 对重大问题做出明智的决策,SPSS,医学数据的统计处理涉及到医学专

16、业知识、统计专业知识、处理数据的经验和技巧等,是一门很高超的艺术。 基本要求: 完全、准确、有效地建立统计分析所要求的数据库。 由统计学专业人员与数据管理员负责 忠实于原始数据 恰当选用统计方法 熟练使用统计软件等,二、临床医学研究统计分析,各阶段受试者流程。特别是报告随机分配到各组的人数、接受意向治疗(ITT)的人数、按方案完成治疗(PP)的人数以及对主要结局分析的人数。描述与计划的研究方案偏离的情况和理由。,意向治疗分析,一、受试者流程和分析人群,临床试验有效性分析应包罗所有的随机化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的

17、分析是最好的分析,其结果是每一个随机分配到试验组或对照组的受试者都应该完整地随访,记录研究结果,而不管他们的依从性如何。,ITT原则 (意向治疗原则 Intention-To-Treat Principle),三类统计分析数据集及其关系,三类数据集即: 符合方案数据集(Per-Protocol Set):由完成且符合方案中各项规定的病例构成,简称PPS集 全分析数据集(Full Analysis Set):由符合入组条件并至少做个一次疗效评价的病例构成,简称FAS集或全数据集 安全性数据集(Safety Set):由使用过试验药物并至少做个一次随访且至少有部分安全性数据记录的病例构成,简称SS

18、集,有效性分析,主要疗效指标(primary end points) 次要疗效指标(secondary end points) 同时对FAS数据集和PPS数据集作分析,两组疗效比较的类型,优效(Superiority): 或 “试验组(E)优于对照组(C )” 等效(Equivalence): = 或 “试验组(E)与对照组(C )相当” 非劣效(Non-inferiority ): 或 “试验组(E) 与对照组(C ) 差但不多”,确认试验药物疗效的假设检验方法,*试验药物的效应为T,标准药物的效应为C, 为界值优效性用 ,非劣效性用- ,等效性试验用- 和 。,差异性、等效性、非劣效性和优

19、效性检验,误用:以显著性检验代替非劣效、等效和优效性检验 区别: 差异性检验是和0做比较,即两总体均数是否完全不等,而不管这种差别是否有专业意义; 等效性检验、非劣效性检验和优效性检验是和做比较,即检验在一定允许范围内的是否相等或不等,不仅要检验差别是否存在,而且更关注这种差别是否具有专业意义。,差异性、等效性、非劣效性和优效性检验,在等效性检验、非劣效性检验和优效性检验中的,即认为在一定范围内相等/等效的允许值,也叫等效临界值,一般认为应从专业角度反复论证并结合成本效益加以估计。 根据以往经验,较为公认的值: 如血压可取为0.67kPa(5mmHg) 胆固醇可取为0.52mmol/L(20m

20、g/dl) 白细胞可取为0.5109/(500个/mm3)等 当难以确定时,可酌取试验组均数的1/51/2个标准差,或对照组均数的1/101/5等,在生物利用度的等效性评价中,一般取标准参照品均数的1/5,两组率的等效性检验取对照组样本的1/10 左右。,患者暴露于研究药物的时间 研究时间(天)=(末次随访日期初诊日期)+ 1 治疗时间(天)= 按照患者实际用药天数计算 患者用药依从性=(发药量剩余量)应服药数量100%, 安全性评价指标 生命体征(心率、收缩压、舒张压)、体重、 实验室检查(心电图) 不良事件 ,安全性评价,临床研究中的统计学分析,多因素方差分析(统计设计类型) 协方差分析(

21、随机设计、区组设计) 多元线性回归分析(具体方法;入;出) Logistic回归(具体方法;入;出) 生存分析 1)寿命表法 2)Kaplan-Meier法 3)Log-rank检验 4)Cox比例风险模型 判别分析(具体方法) 聚类分析(具体方法) 主成分分析与因子分析(旋转方法),临床研究中的多因素分析,典型相关分析 对应分析 统计预测 综合评价 综合评分法 综合指数法 层次分析法 TOPSIS法 秩和比法,研究类型 研究对象来源、选择方法【标准:诊断标准(中医、西医)、入选标准、剔除标准,等】 基本原则:随机、对照、重复、盲法;(分组方法:完全随机、配对、配伍、分层随机分组等;非随机化分

22、组。各组样本量应相等或相差不多) 样本含量估计:(参数、参考文献、计算公式、软件) 观察方法及评价标准:(随访:有无失访、失访比例及失访的详细阐述) 、有无“知情同意”) 均衡性检验:如年龄、性别、病情、病程等一般资料的具体分析结果。 实验、试验或调查资料的搜集过程等。 研究中统计分析结果的规范表达。,临床研究设计方案统计表达,三、临床数据资料常见的统计分析方法应用问题,1. 误用t检验分析等级资料,文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验,表4 两组临床主要症状和结肠镜肠粘膜病变评分( ),:与西药组比较,P0.05,组间差异无统计学意义;:与治疗前比较,P0.05,组内

23、差异有统计学意义;:与西药组比较,P0.05,组间差异有统计学意义;,1.误用t检验分析等级资料,疼痛性质 发作次数 持续时间 疼痛程度,辨析: 对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。 分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。 与西药组比较,P0.05,组间差异无统计学意义,不必在备注中表示。 应写出确切的统计量和P值。,1. 误用t检验分析等级资料,2.误用t检验处理重复测量

24、的两因素试验设计,文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成 统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。,辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。 在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。,文题:开胃理脾口服液对脾虚小鼠肠功能的影响。 实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组用大黄水造成脾虚模型。 停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第35组给含10%炭末的不同

25、剂量的开胃理脾口服液,第6组给含10%炭末的开胃理脾丸剂,第7组给含有10%炭末的儿康宁。给药30min后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。,3.多因素非平衡组合设计的统计错误,辨析: (1)实验设计各对比组间混乱。 各剂量组、儿康宁组与空白组是否具有可比性? 不同剂量的口服液、丸剂和儿康宁之间是否具有可比性? (2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。 (3)确切的统计量和P值。,原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。,3

26、.多因素非平衡组合设计的统计错误,改进措施: (1)在分析时将实验拆分为: 组合1:空白组与模型组说明造模成功 组合2:模型组+低剂量组+中剂量组+高剂量组各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较 组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁在相同剂量的情况下,口服液比丸剂和儿康宁都好 (2)第一组采用成组t检验分析。 其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。,3.多因素非平衡组合设计的统计错误,4. 正确处理析因设计定量资料,文题:丹参对骨骼肌缺血再灌注

27、损伤低氧诱导因子一lmRNA表达和血液流变学的影响 设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组)和丹参组各30只,此两组造模后分别取l0、20、40、60、90 min 5个时点进行观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。,n=30,各时点ni=6,辨析: 对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。 表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。 若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次

28、之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。 若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。,4.正确处理析因设计定量资料,5. 误用2 检验分析结果变量为有序变量的资料,某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经RC表2检验,2=53.33 ,P 0.01

29、,认为两组疗效之间的差异有统计学意义。,辨析: 本资料属于单项有序的RC表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用RC的2检验,RC表2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,2值仍为53.33,不会有改变。,确切的统计量P值。,6.误用2检验回答相关性问题,上述资料用2检验得:2 =163.01,P0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。 问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?,表 不同年龄冠状动脉粥样硬化程度的分布,辨析1: 本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。 分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。 分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。 分析两者间是否存在线性变化趋势则应用线性趋势检验。 作者欲考察“两个有序变量之间是否呈相关关系”,而2检验结果是P0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论