




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据管理与质量控制 童新元 解放军总医院医学统计教研室 2005年11月3日 统计学中特别强调统计学中特别强调, ,有缺陷的数有缺陷的数 据得不出明确的结论据得不出明确的结论! ! 皮尔逊 (英国统计学家,1895- 1980) 数据与信息 数据是一种物理符号序列,指能被输入至 计算机储存和处理的各种数字、字母、汉 字、符号、图像、声音及其组合。 信息是现实世界中事物的状态、运动方式 和相互关系的表现形式,是自然界、人类 社会和人类思维活动中普遍存在的一切物 质和事物的属性。 数据与信息的关系 数据是反映客观的记录符号; 信息是潜在于数据中的意义; 医学研究中有海量的数据; 有了数据不等于有了信息,数据只 有经过科学加工整理、统计分析后才 转化成信息。 数据是科学研究的最直接产物,也是 科学研究进一步分析的基础 数据管理与质量控制的目的在于把获得 的数据迅速、完整、无误地记录与保存 ,保证数据的准确性、可靠性和完整性 。 一、数据管理 中国国家SFDA在药品临床试验管理规 范第五一条中明确规定,数据管理的 目的在于把得自受试者的数据迅速、完 整、无误地纳入报告,所有涉及数据管 理的各种步骤均需记录在案,以便对数 据质量及试验实施进行检查。用适当的 标准操作规程保证数据库的保密性,应 具有计算机数据库的维护和支持程序。 开始试验前需设计可被计算机阅读与输 入的临床报告表及相应的计算机程序。 数据管理的内容 数据的获取 数据的整理 数据的储存 (1) 数据的获取 数据的获取是数据管理的第一步,它是 按照研究设计的要求,用较少的人力、 物力、时间获取原始数据。数据的获取 有有直接观察法和采访法两种, 直接观 察法是由研究员对试验对象进行直接检 查、测量、观察来获取得数据。取得的 资料比较真实可信,能保证有较高的应 答率。 采访法是采用访问、信访、电 话调查和开调查会来获取得数据。 医学数据主要来源 统计工作报表和报告卡 由医疗卫生机构根据国家的卫生制度和 相关规定逐级上报的统计报表和报告卡 ,如法定传染病报表、恶性肿瘤报告卡 等,比较全面地记录了居民健康状况和 医疗卫生机构的工作情况,内容较真实 、可靠,但是也存在漏报、错报等现象 。 常规保存的工作记录 如医疗部门的门诊记录、住院病历、化 验和检查报告单,卫生防疫部门的疫苗 接种情况和经常性的卫生监测,计划生 育部门和妇幼保健院的出生缺陷登记和 孕产妇女健康记录,公安系统的出生登 记和死亡登记,企事业单位职工的常规 健康档案,保险部门的健康和疾病记录 等。 专项调查和实验研究资料 是指为了解决某个或某些医学科研 问题而专门进行搜集的资料,比如 为了解某地一般人群的帕金森氏病 的患病情况而搜集的资料。 (2) 问题数据典型案例 2005年10在院门诊楼展示的 301,304,309医院存在的问题病案如下: 男性53岁 月经史 13岁初潮 入院年龄36岁.出院年龄45岁 入院记录XXX女48岁, 院期间老年 男性 4)诊断:右舌部鳞状细胞癌,手术:颌下脓肿 切开引流手术 5) 主诉:右上肢外伤后疼痛 诊断:右小腿开放性损伤 6) 计划采用全脑血管造影+右侧颈内动脉闭 塞术, 手术记录:全脑血管造影+左侧颈内动脉 闭塞术 现代科学研究的过程管理,甚至比所得 到的结果更为重要, 数据的质量是科研 工作的生命,没有严格的数据管理与质 量控制,科学研究的真实性和科学性就 会受了怀疑,得出错误和虚假的信息, 甚至导致研究的失败。 数据管理与质量控制技术是科学研究中 统计工作的一项十分重要工作。 (3)数据整理 数据整理就是根据研究的目的将原始数 据进行汇集、排序、分组、合并,如产 生亚组、中间变量、新的指标等工作, 使分散的数据条理化,系统化。 数据整理时要十分小心,不应在整理中 出现错误,产生过失误差。数据整理主 要是为资料的进一步分析做准备。 数据整理主要内容 原始数据的人工检查、核对 在资料 的搜集过程中,可能会出现漏项、记录 差错等。将数据资料输入计算机前,应 由调查员本人或专门人员进行仔细地检 查、核对,以保证资料正确无误。 输入计算机、建立数据库 数据资料 经编码分类后,由录入人员将其输入计 算机,建立数据库。可以直接在统计分 析软件中建立数据库。 对数据库资料进行计算机检查 可以 利用数据库软件或统计分析软件对资料 进行专业检查和逻辑关系检查,比如通 过编写计算机程序,把身高低于1米的 成年人、文化程度是文盲或小学的中学 教师的资料找出来,查明是数据录入错 误还是原始资料记录有误。 (4)数据储存 数据储存是将数据以适当的形式保存, 如原始数据、调查表、数据记录表、病 历的集中保存,电子数据的以何种形式 保存,如硬盘、U盘,光盘等,保存的 适当的地方、备份数等以备将来核对、 查阅。同时,要考虑数据的安全性和保 密工作。 (5) 数据管理计划 作为数据管理的开始,制定一份全面而 详细的管理计划,将使整个数据管理过 程有章可循、有据可依。 数据管理计划应以对研究的分析为前提 ,包括研究方案、数据记录表、研究的 时间表,数据结构、变量名称等。 数据管理计划将作为整个数据管理过程 的指导性文件,之后所有过程均应按照 其中定义的时间与方法进行操作。 数据管理计划内容 研究的总体情况,如研究申请报告、 研究方案等; 研究进展时间安排表,如阶段、中期 进展及调整计划等; 数据记录方法,如制定调查表、观测 记录表等; 相关人员与职责,选定数据管理负责 人、执行人、第三方监察人员; 需要使用的资源,如计算机、网络、 扫描仪等; 数据库的选择,数据库的创建、数据 库结构、变量名称和格式; 数据的录入、核查、整理、数据锁定 、移交和存档; 数据的安全与保密措施。 (6) 数据库创建 常用数据库软件 数据库的说明 数据库的确认 数据库 数据库(database)顾名思义是存放着大 量数据的仓库。但数据在仓库中不是杂 乱无章的堆放,数据库是一种内部结构 强、独立性高、对应关系明确、联系密 切、有安全可靠性,并可以用户查寻、 检索、更新等功能的数据集合。数据库 要实现对数据进行管理,如进行排序、 检索、分组、计算、更新、维护、合并 与分解等功能,这正是数据库与用文字 处理软件编辑的数据文件的不同。 数据库软件的选择 目前较流行的数据库软件: EPI Info 、 ORACLE、MS-Access、SQL- Server 、 SAS CHISS EXCEL 选择用于录入数据的软件 选择提交进行最终统计分析数据的软件 数据库的说明 在正式创建数据库之前,需对原始记录 的变量进行说明,如定义数据库中将纳 入的记录项目及相应的变量名称与变量 类型,如:年龄,身高定义为age,height ,类型为数值型,宽度为3,不含小数位 。 数据编码 原始数据中,有些重要的项目是以文本 形式记录的,如不良事件、伴随疾病、 合并用药等,为了分析时归纳与总结的 方便,常需要对这些部分进行分类与编 码。目前,国际上有成熟的编码系统, 国内已有部分编码词典的中文版本,但 在使用这些编码词典方面比较欠缺。 数据库的确认 数据库的建立将以以上工作为基础,依据说 明、按照数据库软件的规则进行。同时还需 为数据录入设计适当的录入界面。 在数据库建立之后,还应对其进行确认,确 认内容包括:名称是否与注释相一致、录入 界面与规则是否方便录入、软件的输出结果 是否与录入内容相同等。 数据库确认的通常做法是,首先创建一 至两份模拟的病例报告表及其它相关材 料,然后按录入界面的指示将其录入数 据库,然后输出数据库内容,并与原始 材料进行比较,通过这一过程检验并最 终确认数据库结构、录入界面乃至最终 数据库的准确性与合理性。 (7) 数据录入 数据录入员应进行相应的培训 独立双份录入原则 某些场合,单份录入结合手工核对也是 可取的 (8)常见的数据问题 研究对象不符合入选标准 数据缺失 数据不合逻辑 未严格按照研究计划执行导致的偏差等 数据录入错误 (9)疑问表与数据确认 得到需确认问题的清单,整理产生关于 数据的疑问表。疑问表将由研究者进行 核查、确认或更正,然后返回给数据管 理员,根据数据确认的结果对数据库进 行修改与更新。此过程循环往复,直至 所有疑问均得到明确的答复。 二、质量控制(quality control) 质量控制(quality control)就是运用先进 的科学技术和统计方法控制科学试验及 其过程,使获得的结果符合事先设计的 标准,同时试验数据真实可靠。 质量控制包括两个阶段,即试验前条件 控制和试验过程中状态监测。 试验前条件控制是指在试验开始之前,要确保 可能影响试验结果的各种试验条件符合要求, 它是质量控制的基本要求,主要有四个方面: 受试者的入选标准和排除标准; 实验操作人员的技术能力的合格要求; 仪器设备、实验材料和试剂等规格统一; 良好的实验室操作和测量操作规范。 试验过程中状态的控制是指在试验过程 中,定期或随机地抽查样品,测量其观察 数据,考查其真实性、准确性和可靠性, 以及其变化是否超过允许的差异波动范 围内。要确保良好试验数据质量, 一方面对参加研究人员必须进行培训,使他们 能够掌握并应用统一的诊断标准、测量方法 和实验操作技术,使得不同操作者对同一个样 品观察结果一致等, 另一方面要明确规定对测量指标的要求,如数 据的分布类型、变化范围、数据间的逻辑关 系、数据的可靠性与稳定性。此外,还需要考 虑是否存在偏倚、混杂因素、数据的缺失等 等。 (1)数据质量控制技术 观念上重视质量 试验主要负责人必 须高度重视数据质量, 树立过程质量管 理的概念,制定严格的操作规程。同时 ,对科研课题检收也必须考查其试验质 量问题。 人员培训与组织 对于一项大型科研 课题,应有专门负责的质量监查员、数 据管理员、数据录入人员,并进行对他 们相应的培训;在正式开始之前,要在 小范围内做预试验,预试验的方式应与 正式试验的方式相同,目的在于检验试 验的实用性和可行性,并通过预试验反 愦的信息作必要的修改。 观察过程控制 数据收集前要求对每个被观察对象建立 观察的时间表;观测记录表格的填写明 确观察方式,在进行观察的同时进行; 要求做到全部观察项目都获取数据; 数据的核查 对重要的指标要进行普 查,其它数据进行抽样调查。临床观测 记录表格数据的录入要遵守数据独立双 份录入原则及修正原则,录入方式主要 有二次录入、校对录入和自动扫描录入 。然后存入数据库的过程,需采用特制 的观测记录表格收集数据,表格填写也 有一定的规定。 对代表主要指标的关键变量需要进行100%的 核查,即:将数据库中的关键变量以记录为 单位输出,与原始记录、观测记录表及疑问 表进行核对,在相当多的情况下要求关键变 量100%正确。 对非关键变量,通常不需进行100%核查,而 是采用按一定比例抽样的方法进行抽查部分 数据(一般总数字信息的20)观察数据错 误率,对非关键变量,通常允许一定的错误 率,如0.5%或0.1%等。 校对与质疑 录入的数据应进行复查 以了解全面的录入质量,尽量防止录入 错误。双份独立录入,编写程序对数据 库中的数据进行一致性检查,生成核查 表,校对、修改直至两个库完全相同; 利用专业知识对各变量的可能取值范围 及它们之间的逻辑关系进行核查; 根据返回的核查表进行相应的修改, 及时清理数据疑问; 数据锁定与保存。 重要的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-江苏-江苏经济岗位工五级(初级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏堤灌维护工三级(高级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广东-广东造林管护工四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东放射技术员四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-北京-北京信号工-机车信号设备维修二级(技师)历年参考题库典型考点含答案解析
- 热风焊机基本知识培训
- 2025年银行金融类-银行招聘-农村信用社招聘历年参考题库含答案解析
- 2025年银行金融类-金融考试-银行业专业人员中级(法规+公司信贷)历年参考题库典型考点含答案解析
- 2025年职业技能鉴定-石雕工-石雕工(中级)历年参考题库含答案解析(5套)
- 2025年职业技能鉴定-灭火救援专业士兵-灭火救援专业士兵(中级)历年参考题库含答案解析(5套)
- 管道吊装方案范本
- 拍摄与剪辑基础知识培训课件
- 人事经理工作汇报
- 水质分析 题库及答案
- 2025年小学英语教师业务理论考试试题及答案
- 2025-2030中国消费电子产业创新趋势及市场需求与投资回报分析报告
- 2025年广东省中考物理真题(含答案解析)
- 四川省自贡市2024-2025学年八年级下学期期末物理试题(含答案)
- 2025年土木工程建筑技能考试-工程造价技能大赛历年参考题库含答案解析(5套典型题)
- 2025年初中物理教师教材教法考试测试卷及参考答案(共三套)
- 2025年有限空间作业专项安全培训试题及答案
评论
0/150
提交评论