2015临床医学研究数据管理与统计分析_第1页
2015临床医学研究数据管理与统计分析_第2页
2015临床医学研究数据管理与统计分析_第3页
2015临床医学研究数据管理与统计分析_第4页
2015临床医学研究数据管理与统计分析_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析临床医学研究的过程发表论文、申请专利等CRFSPSS临床研究撰写统计报告与临床研究报告设计和安排数据管理双人双录监查课题结题第一页,共68页。讲座内容一、临床医学研究的数据管理二、临床医学研究的统计分析三、临床数据资料常见的统计分析方法应用问题第二页,共68页。一、临床医学研究的数据管理任何医学研究,最重要的是数据来源。第三页,共68页。临床数据管理(ClinicalDataManagement,CDM)定义:是利用计算机技术、网络技术等对医学研究中获取的及时、可靠、完整和准确的大量数据进行及时填写、医学编码、双人双录、一致性审查、疑问校正、盲态审核、数据转换和锁定等全过程。数据管理双人双录第四页,共68页。临床数据管理(Clinicaldatamanagement,CDM)目的:保证临床研究过程的科学严谨,资料收集的真实可靠,资料存放的安全有序;将数据库文件按预先制定的统计分析计划书进行统计分析,最终得到真实、可信的研究结论。CDM应在设计研究方案与CRF时就体现数据的采集与管理。数据管理贯穿于临床研究的各个环节。第五页,共68页。

在进行临床医学研究之前,必须制定数据管理计划(DataManagementPlan,DMP)。

临床数据管理计划包括:CRF的设计、数据库的设计、数据接收与录入、数据核查、数据疑问管理方式、数据存档、数据盲态审核、数据库锁定、数据备份与保存、数据保密及受试者个人私密性的保护。临床数据管理(Clinicaldatamanagement,CDM)第六页,共68页。临床数据管理计划指定一有资格的数据管理员CRF在数据管理前的检查详细的编码表方便记忆的变量名与文件名按需产生的派生变量录入数据的自动控制与逻辑检查CRF中文字信息的处理缺失数据的处理(主要疗效指标和安全性指标)数据疑问管理方式及日志每个阶段数据管理的报告质量控制的细节,数据管理计划的修改或补充时间表数据管理软件与硬件数据格式的转换数据管理的中期报告第七页,共68页。临床数据管理流程项目启动管理计划核查计划设计CRF设计数据库数据核查数据接收与录入数据存档管理报告

盲态审核数据库锁定数据备份与保存疑问管理课题中心质量检查第八页,共68页。数据产生的过程研究者填写CRF表监察员核查、传递给数据管理单位根据CRF建立录入程序双人双份独立录入核查并产生数据疑问表(DQF)监察员将DQF交研究者复核并回答数据库修改并核查不良事件及合并用药编码盲态下的数据审核数据锁定数据传递(统计分析人员)CRF第九页,共68页。临床数据管理相关人员课题负责人研究者监察员数据管理员合作研究组织第十页,共68页。临床数据管理相关人员课题负责人:数据质量的最终责任人。明确研究方案制定数据质量管理评价程序制定数据质量管理计划与操作指南设立稽查部门并进行定期系统性检查组织培训第十一页,共68页。临床数据管理相关人员研究者确保CRF或其他记录的数据及时、完整与准确确保CRF上的数据与病历的源数据一致,并必须对其中的任何不同给出解释研究者可能犯的错误违反研究方案,如错误的访视时间源数据录入CRF时错误实验室仪器人为测量误差研究者造假第十二页,共68页。临床数据管理相关人员监察员应根据源文档核查CRF上的数据,一旦发现有错误或差异,应通知研究者,以确保所有数据的记录和报告正确和完整。临床监查中常见问题知情同意书缺失或签署存在问题无原始病历或原始病历中无记录(缺失或不全)CRF填写空缺、错误或不规范不良事件的记录不完整检验结果不能溯源(实验室数据、心电图、X光片等)第十三页,共68页。临床数据管理相关人员数据管理员参与设计CRF建立和测试逻辑检验程序对CRF作录入前的检查对录入数据库进行逻辑检查数据的有效性、一致性、缺失和正常范围等对发现的问题应及时清理(通过比对或向研究者发放数据质疑表(Query)而得到解决。)参加临床研究者会议,为研究团队及时提出改善与提高数据质量的有效措施。第十四页,共68页。合同研究组织(ContractResearchOrganization,CRO)国际临床试验数据管理首先要符合“人用药品注册技术要求国际协调会议-临床试验质量管理规范”(ICH-GCP,InternationalConferenceonHarmonizationofTechnicalRequirementsforRegistrationofPharmaceuticalsforHumanUse-GoodClinicalPractice)的原则性要求。临床数据管理相关人员第十五页,共68页。合同研究组织(CRO)ICH-GCP指出课题可以将部分或全部数据管理委托给一个CRO,但是,申报者依然是数据质量和完整性的最终责任人。CRO应当实施质量保证和质量控制。申报者与CRO需签订有效合同,在合同中需明确双方的责、权、利。申报者必要时应对CRO进行相关的培训,以保证其所提供的服务符合申报者质量标准要求。申报者需与CRO进行即时有效的管理、沟通和核查,以确保其遵守共同商定的流程的要求。申报者的质量管理计划中必须包括CRO的质量管理信息,同时必须明确流程和期望结果。临床数据管理相关人员第十六页,共68页。核查与疑问管理数据核查计划数据核查程序疑问表(DataQueryForms,DQF)的产生DQF的回答DQF的返回及处理监查第十七页,共68页。数据核查目的核查人员对CRF表中的各个指标的数值和相互关系根据临床试验方案要求进行核查,对于缺失、逻辑矛盾、有误或不能够确定的数据,以疑问表的形式由临床试验监查员传递给临床试验中心,由研究者对疑问做出回答。

第十八页,共68页。数据核查计划按CRF页码和各页数据项内容顺序撰写。数据项核查条件统一描述数据库的所有数据均需描述核查条件应描述各数据项的核查范围和发疑问或确认的标准内容完成相同的页,可合并撰写(如各访视内容)核查计划传递给申报人,申报人审核并提出修改意见核查计划签字后方生效第十九页,共68页。数据核查程序核查程序是根据数据检查计划,可在SAS环境下按数据核查计划内容编写的核查程序;也可利用EpiData的Check功能检查;也可通过数据网络输入平台进行核查。主要检查CRF表中数据缺失、误填、数据逻辑矛盾等问题。程序核查后人工校对。第二十页,共68页。第二十一页,共68页。数据的差异性检验第二十二页,共68页。原始数据的录入和导出第二十三页,共68页。数据疑问的查找第二十四页,共68页。数据疑问常见类型补充:病例报告表中有缺失的项目,或字迹不清楚的数据。确认:入选/排除标准的确认:实验室检查:多中心提供的正常值范围不一致时需要对观察指标进行临床意义的判断。时间的确认:所填写的时间不在研究时间范围内;或所填写的访视时间不在方案要求的访视时间窗内。合并用药的确认:填写数据与各访视所填内容有矛盾;使用了方案中明确禁止的药物,药物名称无法编码的。不良事件的确认:填写数据与各访视所填内容有矛盾;各项之间的逻辑关系有矛盾;判定为严重不良事件。不良事件描述不清楚,无法做编码的。第二十五页,共68页。DQF的提问方式

XXXXX临床研究数据疑问表编号:QXXX随机号:XXX发出日期:年月日1.X项数据缺失,请补充。2.出生日期:XXXX年XX月XX日,请确认。3.WBC测定值为:11x109/L,临床意义为“正常”,请确认。4.访一时间为:XXXX年XX月XX日,访二时间为:XXXX年XX月XX日,不在时间窗内,请确认。5.不良事件:“XXXX”,为方便编码,请进一步详细描述。研究者签名:日期:年月日第二十六页,共68页。DQF的回答根据问题,查阅原始资料和CRF表所填内容,慎重回答。如果某一数据的修改,会影响其它数据时,请一并回答。第二十七页,共68页。疑问表修改说明1.疑问表是由XXXXX大学数据管理中心发出2.疑问仅是数据管理人员对有关数据存有疑惑而发出的询问,希望研究者给予明确答复3.数据修改必须以原始数据为依据,不能推论式回答4.研究者如果认为数据无错误,在相应的方框内划"√",并签名确认5.研究者如果认为数据确实有错误,在相应的方框内划"×",并注明错误形成原因,签名确认6.疑问表中所列参考值范围如果不符,以化验单上注明的为准7.如果定性指标在CRF上已编号,例如1=正常2=异常无临床意义3=异常有临床意义4=未查,回答时使用相应的编号

第二十八页,共68页。编码(Coding)为便于统计分析,将研究者填写的合并用药和不良事件根据相应标准进行规范化处理的过程。不良事件编码1.如将上感、感冒等统一编码为上呼吸道感染2.如将恶心呕吐拆分编码为“恶心”和“呕吐”合并用药编码(按药品通用名编码)EPIAO、罗可曼、利血宝和济脉欣等均编码为“红细胞生成素”

第二十九页,共68页。患者数据列表中止试验患者方案偏离从疗效分析中剔除的患者人口统计学数据依从性和/或药物浓度数据(如果有)个例疗效反应数据不良事件列表(每名患者)按患者列表的个例实验室检查值(管理当局要求时)[ICHE3(临床试验报告的结构与内容):Sec.16.2]数据清单和表格(1)第三十页,共68页。患者表格人口统计学数据的汇总图表有效性数据的汇总图表安全性数据的汇总图表不良事件的描述死亡、其它严重不良事件以及其它重要的不良事件清单死亡、其它严重不良事件以及某些其它重要的不良事件叙述实验室检查异常值清单(每名患者)[ICHE3(临床试验报告的结构与内容):Sec.14.1-14.3]数据清单和表格(2)第三十一页,共68页。

是指在完成数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审核与评判。参加数据审核会议人员,一般由主要研究者、统计分析员、数据管理员、监查员和申报者组成。数据的盲态审核第三十二页,共68页。数据管理员:准备一份数据管理报告。内容:包括数据管理的过程及一般情况介绍、病例入组及完成情况(含脱落病例清单)、判断统计分析人群所涉及的项目及需讨论并解决的问题(入选/排除标准检查、完整性检查、一致性检查、离群值检查、时间窗检查、合并用药检查、不良事件检查等)若采用盲法,需递交临床研究盲底。数据的盲态审核第三十三页,共68页。(1)全体参会人员检查总盲底及应急信件,对盲态做出判断。(2)数据管理员报告数据管理的一般情况及数据库中存在的需要讨论解决的条目。(3)主要研究者、统计分析人员、数据管理员共同就数据管理员提交的问题进行讨论并做出处理决定。(4)与会人员讨论并决定统计分析人群。(5)统计分析计划的修正与定稿。(6)决定是否锁定数据。(7)当揭盲条件成立时,具体执行揭盲。

最后签署盲态审核决议,将锁定后的数据交统计分析人员进行统计分析。

数据的盲态审核第三十四页,共68页。数据盲态审核决议第三十五页,共68页。关于数据库的报告需提供如下信息:关于数据库结构、域名的详细报告实验室数据的参考值范围用于建立、核查数据库的软件清单及简单说明各阶段数据核查的错误率的详细报告未解决的质疑数据清单未在数据库更正的质疑数据或错误的说明电子版本数据库的存放位置说明第三十六页,共68页。二、临床医学研究的统计分析让你学会用手中的少量数据对重大问题做出明智的决策SPSS第三十七页,共68页。

医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等,是一门很高超的艺术。基本要求:完全、准确、有效地建立统计分析所要求的数据库。由统计学专业人员与数据管理员负责忠实于原始数据恰当选用统计方法熟练使用统计软件等二、临床医学研究统计分析第三十八页,共68页。各阶段受试者流程。特别是报告随机分配到各组的人数、接受意向治疗(ITT)的人数、按方案完成治疗(PP)的人数以及对主要结局分析的人数。描述与计划的研究方案偏离的情况和理由。意向治疗分析一、受试者流程和分析人群第三十九页,共68页。临床试验有效性分析应包罗所有的随机化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的分析是最好的分析,其结果是每一个随机分配到试验组或对照组的受试者都应该完整地随访,记录研究结果,而不管他们的依从性如何。ITT原则(意向治疗原则Intention-To-TreatPrinciple)第四十页,共68页。三类统计分析数据集及其关系三类数据集即:符合方案数据集(Per-ProtocolSet):由完成且符合方案中各项规定的病例构成,简称PPS集

全分析数据集(FullAnalysisSet):由符合入组条件并至少做个一次疗效评价的病例构成,简称FAS集或全数据集安全性数据集(SafetySet):由使用过试验药物并至少做个一次随访且至少有部分安全性数据记录的病例构成,简称SS集第四十一页,共68页。有效性分析主要疗效指标(primaryendpoints)次要疗效指标(secondaryendpoints)同时对FAS数据集和PPS数据集作分析第四十二页,共68页。两组疗效比较的类型优效(Superiority):>或“试验组(E)优于对照组(C)”等效(Equivalence):

=或“试验组(E)与对照组(C)相当”非劣效(Non-inferiority):

或“试验组(E)与对照组(C)差但不多”第四十三页,共68页。确认试验药物疗效的假设检验方法**试验药物的效应为T,标准药物的效应为C,为界值优效性用,非劣效性用-

,等效性试验用-

和。第四十四页,共68页。差异性、等效性、非劣效性和优效性检验误用:以显著性检验代替非劣效、等效和优效性检验区别:差异性检验是和0做比较,即两总体均数是否完全不等,而不管这种差别是否有专业意义;等效性检验、非劣效性检验和优效性检验是和Δ做比较,即检验在一定允许范围内的是否相等或不等,不仅要检验差别是否存在,而且更关注这种差别是否具有专业意义。第四十五页,共68页。差异性、等效性、非劣效性和优效性检验在等效性检验、非劣效性检验和优效性检验中的Δ,即认为在一定范围内相等/等效的允许值,也叫等效临界值,一般认为应从专业角度反复论证并结合成本效益加以估计。根据以往经验,较为公认的Δ值:如血压可取为0.67kPa(5mmHg)胆固醇可取为0.52mmol/L(20mg/dl)白细胞可取为0.5×109/(500个/mm3)等当Δ难以确定时,可酌取试验组均数的1/5~1/2个标准差,或对照组均数的1/10~1/5等,在生物利用度的等效性评价中,Δ一般取标准参照品均数的1/5,两组率的等效性检验取对照组样本的1/10左右。第四十六页,共68页。患者暴露于研究药物的时间研究时间(天)=(末次随访日期-初诊日期)+1治疗时间(天)=按照患者实际用药天数计算患者用药依从性=〔(发药量-剩余量)/应服药数量〕×100%,安全性评价指标生命体征(心率、收缩压、舒张压)、体重、实验室检查(心电图)不良事件

………安全性评价第四十七页,共68页。计数资料二项分类多项分类双向有序双向无序双变量资料的分析计量资料单变量计量资料的分析样本均数与总体均数比较两个相关样本均数的比较两个独立样本均数比较多个样本均数比较单因素方差分析两因素方差分析但不分析交互作用三因素方差分析但不分析交互作用多因素方差分析且分析交互作用重复测量资料1.简单相关分析2.线性回归分析3.曲线回归分析多变量资料的分析

有应变量的多元分析无应变量的多元分析单向无序多个样本率或构成比比较χ2检验(如显著求其列联系数)分组变量有序反应变量有序χ2检验,同双向无序秩和检验或Ridit分析属性相同属性不同McNemar、Kappa检验秩相关分析、线性趋势检验临床研究中的统计学分析第四十八页,共68页。多因素方差分析(统计设计类型)协方差分析(随机设计、区组设计)多元线性回归分析(具体方法;α入;α出)Logistic回归(具体方法;α入;α出)生存分析

1)寿命表法

2)Kaplan-Meier法

3)Log-rank检验

4)Cox比例风险模型判别分析(具体方法)聚类分析(具体方法)主成分分析与因子分析(旋转方法)临床研究中的多因素分析典型相关分析对应分析统计预测综合评价综合评分法综合指数法层次分析法TOPSIS法秩和比法第四十九页,共68页。研究类型研究对象来源、选择方法【标准:诊断标准(中医、西医)、入选标准、剔除标准,等】基本原则:随机、对照、重复、盲法;(分组方法:完全随机、配对、配伍、分层随机分组等;非随机化分组。各组样本量应相等或相差不多)样本含量估计:(参数、参考文献、计算公式、软件)观察方法及评价标准:(随访:有无失访、失访比例及失访的详细阐述)、有无“知情同意”)均衡性检验:如年龄、性别、病情、病程等一般资料的具体分析结果。实验、试验或调查资料的搜集过程等。研究中统计分析结果的规范表达。临床研究设计方案统计表达第五十页,共68页。三、临床数据资料常见的统计分析方法应用问题第五十一页,共68页。1.

误用t检验分析等级资料文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验表4两组临床主要症状和结肠镜肠粘膜病变评分()※:与西药组比较,P>0.05,组间差异无统计学意义;△:与治疗前比较,P<0.05,组内差异有统计学意义;▲:与西药组比较,P<0.05,组间差异有统计学意义;

第五十二页,共68页。1.误用t检验分析等级资料疼痛性质发作次数持续时间疼痛程度第五十三页,共68页。辨析:对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。与西药组比较,P>0.05,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和P值。1.

误用t检验分析等级资料第五十四页,共68页。2.误用t检验处理重复测量的两因素试验设计文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。

辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。第五十五页,共68页。文题:开胃理脾口服液对脾虚小鼠肠功能的影响。实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组用大黄水造成脾虚模型。停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第3~5组给含10%炭末的不同剂量的开胃理脾口服液,第6组给含10%炭末的开胃理脾丸剂,第7组给含有10%炭末的儿康宁。给药30min后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。3.多因素非平衡组合设计的统计错误第五十六页,共68页。辨析:(1)实验设计各对比组间混乱。各剂量组、儿康宁组与空白组是否具有可比性?不同剂量的口服液、丸剂和儿康宁之间是否具有可比性?(2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。(3)确切的统计量和P值。

原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。3.多因素非平衡组合设计的统计错误第五十七页,共68页。改进措施:(1)在分析时将实验拆分为:组合1:空白组与模型组[说明造模成功]组合2:模型组+低剂量组+中剂量组+高剂量组[各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较]组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁[在相同剂量的情况下,口服液比丸剂和儿康宁都好](2)第一组采用成组t检验分析。其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。3.多因素非平衡组合设计的统计错误第五十八页,共68页。4.

正确处理析因设计定量资料文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学的影响设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组)和丹参组各30只,此两组造模后分别取l0、20、40、60、90min5个时点进行观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。n=30,各时点ni=6第五十九页,共68页。辨析:对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。4.正确处理析因设计定量资料第六十页,共68页。5.

误用χ2检验分析结果变量为有序变量的资料某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表χ2检验,χ2=53.33,P<0.01,认为两组疗效之间的差异有统计学意义。辨析:本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用R×C的χ2检验,R×C表χ2

检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会有改变。确切的统计量P值。第六十一页,共68页。6.误用χ2检验回答相关性问题上述资料用χ2检验得:χ2=163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?表不同年龄冠状动脉粥样硬化程度的分布第六十二页,共68页。辨析1:本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P<0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论