临床研究中的数据管理标准CDISC及其应用前景.doc_第1页
临床研究中的数据管理标准CDISC及其应用前景.doc_第2页
临床研究中的数据管理标准CDISC及其应用前景.doc_第3页
临床研究中的数据管理标准CDISC及其应用前景.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重大新药创制专项巡礼临床研究中的数据管理标准 cdisc 及其应用前景陆 芳,高 蕊,唐旭东,李 睿( 中国中医科学院西苑医院,北京 100091)摘要 数据管理标准临床数据交换标准协会( cdisc) 已广泛应用于临床研究中,它能够优化临床研究数据采集、传递、储存,并简化申办者/ 研究者向管理部门递交数据的程序,从而提高临床研究的效率。cdisc包含临床数据采集标准( cdash) 、实验室数据模型( lab) 、操作数据模型( odm) 、研究数据表格模型( sdtm) 、分析数据库模型( adam) 等模块。文中从数据管理标准在医学研究中应用的意义、已经广泛应用的 cdisc 主要模块 cdash,sdtm,adam 的介绍以及临床研究中数据管理标准 cdisc 的应用前景等方面加以阐述。关键词 数据管理; 标准; 临床数据交换标准协会; 临床数据采集标准; 研究数据表格模型; 分析 数据库模型中图分类号 r95文献标志码 b文章编号 1003 3734( 2011) 24 2400 05applications and prospects of data management standards in clinical datainterchange standards consortium in clinical researchlu fang,gao rui,tang xu-dong,li rui( xiyuan hospital,china academy of chinese medical sciences,beijing 100091,china)abstract data management standards in clinical data interchange standards consortium ( cdisc) have been extensively applied in clinical research it serves to prioritize data collection,transmission and storage,sim- plify data submission procedure from appliers / researchers to managing department,and thus improve efficiency of clinical research cdisc includes clinical data acquisition standards harmonization ( cdash) ,lab,odm,study data tabulation model ( sdtm) ,analysis dataset model ( adam) ,and so on in this paper,we described the sig- nificance of data management standards in medical research,and cdisc modules of cdash,sdtm and adam that have been applying widely at present the prospects of data management standards in cdisc in clinical re- search were also describedkey wordsdata management; standard; clinical data interchange standards consortium ( cdisc ) ; clinical data acquisition standards harmonization ( cdash) ; study data tabulation model ( sdtm) ; analysis data- set model ( adam)临 床数据交换标准协会 ( clinical其使命是发展和支持建立全球性的数据标准平台,data inter-change standards consortium,cdisc) 是一个全球性、开放、多学科、非盈利性的组织,通过建立标准来支 持采集、交换、递交和储存临床研究数据与元数据。使信息系统能够互相交流,从而促进医药研究和相关卫生保健领域研究的发展1。cdisc 创建了一系 列临床研究数据的标准,如临床数据采集标准( clini-cal data acquisition standards harmonization,cdash) 、实验室数据模型( lab) 、操作数据模型( odm) 、研基金项目 国家“重大新药创制”科技重大专项( 2008zx09312-022)作者简介 陆芳,女,副研究员,主要研究方向: 数据管理与统计分 析。联系电话: ( 010) 62835652,e-mail: deerfang 126 com。通讯作者 高蕊,女,主任医师,主要研究方向: 中医内科、临床药 理。联系电话: ( 010) 62835035,e-mail: gaor tom com。究 数 据 表 格 模 型 (study data tabulation model,sdtm) 、分 析 数 据 库 模 型 ( analysisdataset model,adam) 等。这些标准的应用能够优化数据采集、传递、储存,并简化申办者 / 研究者向管理部门递交数据的程序,从而提高临床研究的效率,加速研究药物 投入市场的进程。本文将从数据管理标准在医学研 究中应用的意义、已经广泛应用的 cdisc 主要模块 cdash,sdtm,adam 的介绍以及临床研究中数据 管理标准 cdisc 的应用前景等方面加以阐述。2cdisc 标准模型概述2 1 cdash2cdash 标准由 cdisc 于 2008 年 10 月制定,其目的是简化和规范各个临床研究中心的数据采集,为设计病例报告表提供标准。cdash 由一个基 本的数据采集字段集( 包括定义变量名称、解释、元 数据) 组成,适用于临床研究阶段绝大多数病例报 告表的设计。临床数据管理标准化的意义临床研究中标准的应用通常表现为不同研究的 数据使用相同变量名、代码、结构或格式,这样有助 于优化研究实施、数据交流、分析以及最后向管理部 门递交资料的流程,大大缩短研究周期、节省费用, 特别是曾经实施过类似的研究,其意义更加明显。 美国 fda 已经强烈推荐使用 cdisc 的 sdtm 进行 数据递交,以避免管理部门在审查研究数据时花费 较多的资源。标准化的另一益处在于不同的研究之 间数据可以非常容易和正确地匹配与组合。尽管互 联网的应用促进了科学研究数据的共享,但是其数 据共享的程度还是非常局限的,主要原因是研究者 储存数据的文件格式不同,而标准的应用不仅可以 提高数据共享的可能性,同时还增强了共享数据的 兼容性。12 1 1数据采集字段数据采集字段代表临床研究中需要收集的数据信息,cdash 将针对某个特定主题采集的一系列具 有逻辑关系的观察值归为一个领域,每个领域的名称以两个字符进行编码,它同时也是领域数据库名,并且是该领域数据库中的大多数变量名的前缀。cdash 标准将数据采集字段按照其数据信息归属的类别分为一般标识变量、时间变量和 16 个领域 ( 见表 1) 。标识变量主要采集一些如研究中心、申 办者、研究者、受试者等的标识信息,时间变量则采 集访视日期等时间信息,加上表 1 中列出的数据采 集的 16 个领域,其基本涵盖了一般临床研究中需要 采集的数据信息。表 1 cdash 和 sdtm 标准数据类别和领域类 别解释领域全称和编码csashsdtm干预类别收集那些有意加于受试者的研究处理措施、治疗措施,和外科手术伴随用药暴露 物质使用concomitant medications( cm)exposure ( ex)substance use ( su)事件类别收集那些在试验过程中发生的、与研究的干预措施评估有关的事件不良事件处理 医疗史 方案偏离 临床事件adverse events ( ae)disposition ( ds) medical history ( mh) protocol deviations ( dv) clinical events ( ce)ecg test results ( eg)inclusion / exclusion criterion( ie)laboratory test results ( lb) physical examinations ( pe) questionnaires ( qs)subject characteristics ( sc)vital signs ( vs)drug accountability ( da)microbiology specimen ( mb)发现类别收集那些计划需要评估的检测项目的观察值,如在体格检查结果、实 验室检测值、心电图结果以及量表 中的问题答案心电图检测结果纳 入 / 排 除 标 准 不 符 合的情况实验室检测结果 体格检查 调查问卷 / 量表 受试者特征 生命体征 药物依从性 微生物样本微生物敏感性测试 药代动力学浓聚物 药代动力学参数 其他结果notmetmicrobiology susceptibility test ( ms)pharmacokinetic concentrations ( pc) pharmacokinetic parameters ( pp) findings about ( fa)续表 1类 别解释领域全称和编码csashsdtm特殊目的领域人口统计学包括临床试验中描述每一例受试者标准变量集人口统计学demographics ( dm)comments ( co)注释描述了记录受试者相关信息的自由文本的解释 / 评估,或在其他领域 与记录或一组记录相关的解释注释试验设计领域受试者元素受试者访视 试验组别 试验元素 试验访视试验纳入 / 排除标准 试验摘要补充说明 相关的记录subject elements ( se)subject visits ( sv)trial arms ( ta)trial elements ( te)trial visits ( tv)trial inclusion / exclusion criteria ( ti)trial summary ( ts)supplemental qualifiers ( suppqual)related records ( relrec)与数据库相关的特殊目的2 1 2 领域表涵盖的信息cdash 都是以表的形式对表 1 中列出的 16 个 领域加以说明。每个领域一张表,表中包含了该领 域数据采集字段所涉及的问题及其相关内容等 8 项 信息( 即分为 8 列) ,分别是: 问题: 针对某项数据 采集信息而提出的问题。 提示: 数据采集字段的 简短提示。 sdtm( 下文将介绍) 或 cdash 变量 名: 本列列出建议的变量名、与 sdtm 类似的变量 名、很容易将其转换为数据递交所需要的 sdtm 变 量。 生物医学研究合作组bridg,由美国国家 研究所( nci) 、美国食品药品管理局( fda) 、医院数 据信息传输协议标准( hl7 ) 以及 cdisc 合作创建 的整合了 hl7 和 cdisc 的数据标准模型: 本列显 示在 bridg 3 0 版本中的分类。 定义: 描述采集 该项数据信息的目的。 病例报告表( case report form,crf) 填写指南: 包含如何在 crf 表中填写数 据的信息。 向申办者提供的信息: 包含一些补充 信息,如一些原理的说明和实施介绍,以及如何完成 crf 表中数据采集信息的填写。 要点: 说明临床 研究中采集该项数据信息的重要性,包含强烈建议 ( hr) 、有条件的或一般性的建议( r / c) 和可选择 的建议( o) 3 个等级。2 2 sdtm3sdtm 模型围绕着临床研究过程中采集的一系 列观察信息构建。它规定递交到药政管理部门的临 床研究数据库和数据库变量的标准,包括数据库的 结构、目的、特征和其所包含的内容,从而使评审人 员能够正确理解所递交的数据库信息。该标准由cdisc 于 2004 年发布,最近一次修订在 2009 年进行。目前,fda 强烈推荐使用 sdtm 递交临床研究 数据。变量分类表2 2 1每一类观察,如生命体征、人口统计学等,均由若干变量来描述,每个变量与数据库中的某一列相 对应,并依据作用进行分类。作用描述了变量对于每个观察所传递的信息类型以及该变量如何应用。sdtm 中变量可以分为以下 5 种作用: 标识变量:用于识别研究、参与研究的受试者( 个人或动物) 、研究领域、记录的顺序号。 主题变量: 说明观察的主要内容。 时间变量: 描述一个观察的时间 ( 如开始日期和结束日期) 。 限定语变量: 包括附 加的说明文本,或描述结果的数值,或附加的观察特 性( 如单位或描述词) 。每个领域列出的限定变量 在很大程度上依据观察的类型和各个领域的特殊性 而不同。sdtm 还将限定变量分为 5 个组,以描述 不同类型的限定语: a 组别限定语: 相同领域内的观 察值收集在一个组内,如以-cat 和-scat 结尾的变 量为分类和次级分类变量; b 结果限定语: 描述发现 数 据集中与主题变量相关的特定结 果,如 以- orres,-stresc 和-stresn 结尾的变量分别表示 测量结果的原始值、字符型标准格式和数值型标准 格式; c 同义词限定语: 指定一个观察变量的替代名 称,如以-modify 和-decod 结尾的变量表示改变 后的处理 / 事件名称和药物或治疗 / 术语的编码,其 等同于以-trt 或-term 结尾的主题变量,表示干预 处理或发生的事件; 以-test 和-loinc 结尾,表示检测和实验室检测的观测指标标识符逻辑命名与编2 3 1adam 分析数据库的结构码 系 统 (adam 标准分析数据库的结构有两种: 受试者logical observation identifiers names andcodes,loinc) 编码的变量,等同于以-testcd 结尾的表示测试短名变量; d 记录限定语: 定义观察记录 的属性,如 dm 领域的 age,sex 和 race 表示年 龄、性别和种族; 发现领域中以-blfl,-pos,-spec 和-nam 结尾的变量分别表示基线值的识别指标、 患者在测试过程中的体位、样本类型和实验室名称;e 变量限定语: 用来进一步修饰和描述一个观察中 的特定变量,他们只对指定的变量在某些内容上有 意义。例如以-orres 结尾的变量限定词包括-or- resu,-ornrhi 和-ornrlo,分别表示测量值单 位、测量值的正常值上限和下限; -dosu 表示剂量 单位,它是-dose,表示药量的变量限定词。 规 则变量: 表达运算法则或实施的方法,以定义试验开 始、结束和循环的条件。水平分析数据库( subject-level analysis dataset,ad-sl)结构和基本数据结构 ( basicdata structure,bds) ,它们分别适于不同的分析目的。adsl 结构数据集中每例受试者一条2 3 1 1记录,其变量用于描述受试者特性。该数据结构可与其他的数据集合并,如 sdtm,分析数据库等。依 据研究病种和研究方案不同,纳入到 adsl 数据集 的变量也不同。adsl 变量通常包括( 但不限于) : 人口统计学信息、疾病因素( 如发病日期、病情严重 程度等) 、分组变量 / 代码、其他一些可能影响预后 的信息、重要的事件日期( 如干预的开始和结束日期、死亡日期等) 、研究人群信息。应用上述信息,可以描述受试者的基线特征、进行随机化分层、亚组或研究人群的划分以及定义重要事件的发生情况。sdtm 数据库结构bds 结构 数据集中每个分析时点、每个2 2 22 3 1 2所有数据库的行表示观察值,列表示观察变量。观察值包括采集的原始值和衍生值( 通过标准方法 和计算所得值,如年龄) 。以能提供数据库中变量 信息的元数据定义来描述每个数据库,以“define ” 命名的数据说明文档描述元数据。define xml 文件 应用 7 个不同的元数据属性来描述 sdtm 数据库。 这 7 个属性分别是变量名、变量标签、数据类型( 字 符型或数值型) 、变量术语或代码、变量的来源、变 量的作用以及其他相关信息。分析指标、每例受试者有一条或多条记录,它包含一个描述分析指标的主要变量集和用于分析的变量 值,其他变量则提供诸如受试者识别、变量描述及衍 生过程、分组变量、协变量信息等。bds 结构的数据可支持参数和非参数分析,包括: 方差、协方差分析、分类分析、logistic 回归、cmh 2 检验、秩和检验、生存分析等。它不支持不良事件发生率或其他发生率 的统计以及多个反应变量同时分析。2 3 22 3 2 1adam 元数据分析数据库元数据 对数据集的总体描2 2 3标准的领域与 cdash 类似,sdtm 也将变量分为若干领域,这些领域又分为 6 个类别,具体的类别、领域名 称及其编码见表 1。2 3 adam4adam 主要描述创建分析数据库和相关的元数 据时需要遵循的基本原理和标准。分析数据库包括 分析数据和分析结果,其结构和内容必须清晰,易于 理解,能满足审评人员或其他数据分析人员对临床 研究的数据从收集到分析直至结果的得出都了解得 非常清楚,并且可以应用最简短的程序和数据准备 过程( 不需要经过数据转换或转置) 实现统计分析 结果的审查。元数据是“关于数据的数据”,是对分 析数据库进行说明的数据信息。为了同时记录分析 数据库的创建和分析结果的产生过程,元数据可以 包含与统计程序、统计分析计划、方案等其他文件相述通常包括数据集的名称、简要描述、数据集的存放路径、数据集的结构、关键变量、数据集的类别( 是adsl 还是 bds) 以及描述源数据、数据处理步骤、与创建数据集相关的分析决策文档等 7 项内容。分析变量元数据 对分析数据库中变量2 3 2 2的描述包括变量属性和定义,通常需要描述下列内容: 数据集名称、变量名称、变量标注( 对变量的简 要说明) 、变量类型( 是文本型、整型或浮点型) 、显示格式、变量代码 / 术语、源数据和衍生变量信息 ( 简要说明产生衍生变量的算法和程序) 。分析指标值水平元数据 采用 bds 结构2 3 2 3的分析数据库包含多个分析指标。在 bds 数据集中变量 param 对数据集中的分析指标进行描述,变量 paramcd 是与 param 一一对应的包含分析指标的短名( 描述一个分析指标的测量或分析终点时需要特别说明) 。2 3 2 4 分析结果元数据 描述分析结果,包括得 出这个分析结果所使用的分析数据库和应用的统计 分析方法的信息。该元数据有以下一些内容: 统计 分析结果的标识( 如表格或数字编号) 、统计分析结 果的名称、结果标识( 在一个分析报告中标识特定 的结果) 、分析指标、分析指标短名、分析变量、分析 目的( 说明分析的理由) 、使用的数据库、选择准则( 当不是选用全部记录进行分析时,需要给出详细 的子集选择准则) 、文档( 描述分析的过程,如选用 的统计分析模型、如何处理缺失数据等) 、统计程序 ( 用于分析的统计程序代码) 。3 临床研究中标准 cdisc 的应用前景整合了 hl7 和 cdisc 标准,可以减少数据流从临床医师到研究人员过程中产生的潜在错误,并使得数 据传递过程更合理。cdisc 目前还创建了一个方案描述模型( prm) 标准,其目的在于设计一项研究、选择研究单位、开发数据采集工具、以及描述分析计划和研究过程时都有标准参照。这个模型确定、定 义和描述了超过 300 个通用方案元素,并将这些元 素映射到 bridg 模型中的元素中7。我国对临床研究的数据管理目前还没有统一标 准,不能实现新药临床试验数据信息流的流通,也不 能实现与发达国家的数据互认和交流。不同术语集的数据库之间交换数据时,要转换成统一的术语集,时间的延误、数据资料的损失在所难免,极大地阻碍了国际间临床研究资料的交换。目前 cdisc 标准 在我国临床研究中的应用还处于探索阶段,随着临 床研究要求和国际接轨,临床研究获得的数据及数 据管理需要实现与发达国家双边或多边互认,从而 进行国际多中心临床试验的合作与交流,学习和应 用这些标准势在必行。cdisc 标准的应用促进了医学研究活动在临床研究中为每一个不同的研究设计 crf 时,有一些页的结构和内容在大部分研究是可以通 用的,如不良事件 ( ae ) 、病史 ( mh ) 、人口统计学 ( dm) 等,即使有变化,也只是些细小的改变。如果 采用 cdash 设计一些标准的 crf,在需要时可以直 接拿来使用或做少量改变,从而减少 crf 设计的时 间,提高效率。如果有了标准的 crf,那么 dm 的其 他和 crf 相关的文档,如 crf 填写指南、逻辑核查说明,也可以制定标准的模版,这样就可以节省更多的 时间。众所周知,项目启动的准备工作越早完成,就 给客户带来越多的利益。另据报道,临床研究实验室 检测如采用 lab 模型估计可以节约 30% 50% 的实 验室费用。考虑到约有 60% 80% 的临床数据来自 实验室,所以对整个临床试验的费用有巨大影响5。3 1参 考 文 献1cdisc mission principleseb / ol ( 2010 12 20 ) ht-tp: / / www cdisc org / mission-and-principlescdisc cdash project team clinical data acquisition standards harmonization ( cdash,version 1 0) clinical data interchange standards consortiumeb / ol ( 2008 10 01 ) http: / / www cdisc org / cdash / index htmlcdisc submissions data standards team study data tabula

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论