提高医学科研数据计算机录入质量的方法.docx_第1页
提高医学科研数据计算机录入质量的方法.docx_第2页
提高医学科研数据计算机录入质量的方法.docx_第3页
提高医学科研数据计算机录入质量的方法.docx_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

提高医学科研数据计算机录入质量的方法孙业桓李盛吕(安徽医科大学流行病学教研室桦合肥230032)随着计算机技术的提高和计算机的普及 ,越来越多的非计算机学科的一般科研人员开始采用 计算机处理科研数据 。在完成实验和调查工作 , 获得了准确的基础数据后 ,原始数据的录入是整个计算机处理数据工作的根本基础 ,录入的原始 数据中差错的多少将直接影响到整个计算机数据处理结果的正确性和可用性 ,直接关系到整个计算机数据处理工作的成败 。对于录入差错太多的 原始数据 ,不论其先前所收集的资料多么准确 ,其后续的数据处理工作如何精确 ,其结果都是错误 的 ,不可信的 ,也是毫无意义的 ,甚至是十分有害的 ,整个计算机数据处理工作也就是失败的 。因此 ,在数据录入过程中 ,必须采取一些必要的质量 控制措施来保证数据录入工作的质量 ,对一般科 研人员 ,特别是对计算机编程不熟悉的人员 ,以下方法可以有助于其提高数据录入的质量 。1 人工静态检验人工静态检验是最简单 、直接的一种校对方 法 , 即把已经录入的原始数据由计算机按预定的格式在打印机上打印出来 (或显示在显示器屏幕 上) , 与原始调查表进行直接的人工校对 。这种 检验方法简单省事 , 适用于任何录入方式录入的数据 , 但这种方法也是最耗费人力的 、最笨的方 法 , 且可靠性差 , 尤其当录入的数据量较大时 ,则难以保证能有好的检验质量 。所以一般来说 ,本法只适用于录入数据量很小 , 并且要求不高的 情况下 。采用人工静态检验时应注意如下两点 :第一 , 计算机输出的原始数据格式应尽量与 原始表格一致 , 做到直观 、清晰 、明了 。这样校对起来比较方便 , 容易发现错误 。第二 , 对同一批原始数据应该由不同的人进 行多次的校对 , 这样可以防止人为的疏忽和习惯 性误差 , 这比同一人校对多次的效果要好 。2 复录比较检验的 , 最根本 、直接 、有效 、检验质量最高的一种保证数据录入正确性的方法 。它是对已经录入了 的一批原始资料数据重新再录入一遍 , 并把二次 录入的数据用程序进行逐个字符的比较 , 同时把所有二次录入不一致的字符按预定的格式显示或 打印出来 , 然后通过与原始数据核对 , 来判定这些不一致的字符中哪一个是错误的 , 并对已录入的数据进行校正 。 本校验方法的原理是基于人工击键录入数据时出现的击键差错是 “随机的”, 所以只要是两 次录入不一致的字符 ( 数据) , 必然至少有一个是错的 , 甚至两个都是错的 , 而两次录入相同的数据 , 则可 以 认 为 是 正 确 的 。当 然 , 从 理 论 上 讲 , 如果两次录入时在同一字符出现完全相同的 击键错误 , 则采用此法是查不出来的 。但在实际工作中 , 录入过程击键差错率本来就很小 , 所以两次录入时在同一字符上出现完全相同击键差错 的概率是非常小的 。因此 , 它是非常有效的保证 数据录入质量的方法 , 但双重录入数据使得工作量扩大了一倍 。复录比较方式有以下两种 。第一 , 即时复录比较方式 。即在进行复录数 据录入时 , 每录入一个字符或一份调查表 (一个记录) 程序立即将它与第一遍已经录入了的原始 数据中对应的字符进行比较 , 若两个字符相同或二遍录入的调查表完全相同则继续往下录入下一项数据或第二份调查表 , 若两个字符不同或两遍 录入的调查表有不同 , 则程序不允许往下继续录入数据 , 而是立即在 “出错”的字符下方显示出第一遍已经录入了的原始数据中的对应的字符 ,并且让光标锁定在 “出错”的项目位置上 , 同时 报警提示录入人员注意 。这时录入人员应查对原 始表格并立即改正出错的字符 。即时复录比较减少了调查资料反复搬运工作 , 简化了录入管理工 作 。但它的缺点是复录程序的设计比较困难 , 改错速度慢 。入时 , 并不立即将每个录入的字符与第一遍已经录入的原始数据进行比较 , 而是待这批数据全部 复录完毕形成一个复录数据文件之后 , 再用程序 将它与第一遍录入的数据文件进行逐个字符的比 较 , 并将所有存在不同字符的数据记录及不同的字符用直观 、明了的格式打印出来 (输出复录比 较报告单) , 然后 , 将报告单与 原 始 数 据 核 对 , 改正出错的字符 , 最后对原始数据文件进行成批 的查错改错操作 。成批复录比较对于组织大型的 数据录入工作 , 录入质量的控制和管理工作非常有利 , 并且成批录入比较方式可以对任何录入方 法 (键盘输入或 光 电 输 入) 录 入 的 数 据 进 行 检 验 。复录比较检验应注意以下几个问题 :第一 , 为了避免某些录入人员可能出现的习 惯性击键差错以及其它人为出错因素 ( 包括作弊) 的影响 , 对同一批调查资料的录入和复录工作应由两个不同的录入人员来分别录入 。第二 , 究竟是采用即时复录比较方式还是采 用成批复录比较方式为好 , 应根据实际工作的需要来选定 。一般来说 , 原始调查 资 料 数 据 量 较 少 , 数据格式比较简单时 , 程序设计也就比较容 易 , 可以采用即时复录比较方式 ; 而数据量很大 时则宜采用成批复录比较方式 。第三 , 在采用成批复录比较方式时 , 可以根据实际工作的需要和条件来确定复录数据的比 例 。即当原始资料数据量不大时 , 或者录入数据 非常重要 , 质量要求很高时 , 应采用 100 %全面 复录比较 (并且 100 %改正差错) 的方式来保证 录入数据的质量 。而原始数据量太大 , 或者对数据质量要求不必太高 , 允许有一定的误差时 , 可 以采用随机抽取一定比例的原始资料进行部分复 录比较 , 来判定这批录入数据的录入质量情况 。 此时应注意抽样必须遵循随机化原则 , 抽样比例 要适当 , 并明确规定质量标准 , 规定当差错率超过标准时必须采取的处理办法和具体措施 。3 预编辑检验前面提及的录入数据检验方法 , 都是在数据 录入之后再来检验录入数据是否有错 , 属事后检 验法 。如果我们能在数据录入期间进行错误检测 , 并拒绝错误数据的录入 , 那将会更有效 。显 然要完全做到这一点是不可能的 , 但我们完全有 部分达到即时检验的可能 。预编辑检验法就是一 种数据输入期间的 “即时检验法”。预编辑检验法是根据原始数据中数据记录内数据项的允许取值范围和数据项与数据项之间的 逻辑关系 , 以及记录与记录之间的逻辑关系 , 在 编制原始数据录入程序时加进即时检验的功能 , 当通过键盘击键录入数据时 , 可以立即通过逻辑检验判断出键入的数据是否出错 , 并拒绝错误数 据的进入 , 同时报警提示用户注意改正 。这样可 以阻止相当大一部分的错误数据录入 , 大大减少 事后查错改错的工作量 。但此种方法对于键入的 非逻辑错误或键入数据项取值范围的错误数据 ,以及对于取值完全是独立的 、任意的数据项的键 入错误 , 则无法进行检验 。4 数据录入工作常用质量控制方法的选用在实际的原始数据录入工作中 , 要根据应用 工作的特点和质量要求的水平来恰当地选用合适的质量控制方法 。一般来说 , 当原始资料数据量不大 、要求也 不太高时可以采用人工静态检验法 , 特别是对那 些临时性的小批量数据录入工作 。在大多数情况 下 , 为了确保录入数据的质量 , 应采用复录比较检验法 。从手工输入数据的情况来看 , 要使数据 输入尽可能做到准确无误 , 可先考虑采用预编辑 检验方法防止逻辑性错误数据的输入 , 然后再结 合应用复录比较检验方法 。5 应用 epi info 软件进行数据录入质量控制简介epi info 软 件1 ,2 是 由 美 国 疾 病 控 制 中 心(cdc) 流 行 病 学 软 件 研 究 室 和 世 界 卫 生 组 织( w ho) 艾滋病全球控制小组合作编制的一组微 机程序 , 可用于处理和分析调查数据 、组织研究 设计 、撰写研究报告 , 寓文本编辑 、数据库 、统 计分析 、绘图等多种功能为一体的数据管理与统 计分析软件 。该软件易学易用 , 能方便地建立全 屏 幕 调 查 表 , 用 于 数 据 录 入 。数 据 核 对( ch ec k) 模块 , 可以根据录入程序建立的数据 文件 , 通过功能键即可方便 、快速地制定数据输 入范围 、合法数值 、自动编码 、空白项目条件跳 转 , 并支持变量间的算术或逻辑运算 、复杂的跳 跃模 式 等 。文 件 比 较 ( val ida t e) 模 块 , 可 以快速地对复录文件进行比较检验 , 并报告存在 的不同点 , 无需应用者再编制程序即可达到数据 录入校检的目的 。运行 val ida t e 模块之前 , 必须有两个被比较的同一批数据输入的文件 , 比 如 : f il e11r ec 和 f il e21r ec 。若文件 f il e1与 文 件 f il e2 的 记 录 顺 序 不 一 致 , 则f il e11r ec 和 f il e21r ec 必 须 有 一 个 相 同 的 指示变 量 。比 如 这 两 个 文 件 都 有 字 段 “n u m2b er”, val ida t e 程 序 将 用 “n u mb er”对f il e11r ec 文 件 及 f il e21r ec 文 件 进 行 匹 配 比较 。运行 val ida t e 模块根据屏幕上提示输入两个文件的名字 ( 可省略 1r ec) , 如果两个文件记录的顺序相同 , 按回车键 enter, 跳过 指示变量 ; 如果文件记录的顺序不相同 , 则给出 指示变量 。屏幕的最下端询问将结果送至何处 ,可输入 pr in t er ( 输到打印机) 或输入一个文 件名 (该文件可以用 do s 命令 t yp e 或在文本 编辑 ep ed 程序及其它文字处理器上显示) 。再 按f4键 , val ida t e 就报告比较结果 。epi info 6 . 0 版3 在录入模块提供了即时复录比较方式 ,对已录入一批数据的数据文件进行即时复录比较 ,先进入录入模块 ,从菜单选择项中选择第 4 项 ( reenter and verif y reco rds in existing data file) 即可进行即时复录比较校验 。鉴于 epi info 软 件 的 易 学 、易 用 、实 用 的 特 点 ,为此 w ho 将此软件向 全 球 推 广 , 国 内 已 有5 . 0 版的汉化版 ,但 6 . 0 版迄今未见汉化版问世 。 笔者认为该软件不仅对于医学科研工作者 ,而且 对于非医学科研人员也是值得推荐应用的一个数 据管理与统计分析软件 。参考文献dean a g ,burto n j h ,dicker rc. epi info ,versio n 5 us2ers guide. cdc ,u sa. 1990曾光主编 . 现代流行病学方法与应用 . 北京医科大学 中国协和医科大学联合出版社 , 第 1 版 . 北京 : 1994 ,457484dean a g. epi info ,versio n 6 manual . cdc ,u sa. 1994收稿日期 1997 - 12 - 06123世界交通科技信息动态后上海出租车得到发展 。1913 年 ,法国人在北京开办“飞燕汽车车行”,经营出租车业 。1915 年 ,马来西亚华侨在 广州经营出租车业 。最早的城市公共汽车公司 我国最早的城市公共汽 车公司是上海商人董汉生经营的 ,行驶于租界愚园路至 兆丰公园之间 ,使用英国梯林斯蒂厂生产的敞篷公共汽 车 。该车没有排挡 ,没有挡风玻璃 , 没有照明 , 连起动也 得用手摇 ,轮胎十分破旧 。最早的长途汽车公司 1917 由商人景学龄等人在华 北开办的 大 成 张 库 汽 车 公 司 是 我 国 最 早 的 长 途 汽 车 公 司 ,经营路线从张家口到蒙古的库伦 。我国汽车运输之最出现最早汽车 1900 年 ,居住在上海的匈牙利人李恩时从国外购买两辆福特公司制造的汽车 ,是我国出现 最早的汽车 。上海公共租界工部局捐务处不知道这东西 属何类物品 ,就把它列入马车类 。获第 1 号牌照的汽车 1904 年 ,上海租界当局颁发 汽车牌照 ,一辆由南京路上“快利脚踏车行”售出的“奥兹 莫比尔”牌汽车领到了第 1 号牌照 。最早的汽车修理行 1905 年 ,由汪福昌开设了汽车 修理行 。1912 年 ,上海宝昌机器厂也兼营汽车修配业务 , 是我国自己最早的汽车配件厂 ,后发展成“宝昌汽车材料 厂”。最早的城市有轨电车 1908 年 2 月 ,上海法租界的 法兰西电车公司开出了第一辆有轨电车 。3 月 5 日 ,英商 上海制电气有限公司的子公司 上海电车公司的深绿 色有轨电车也通车了 。市民们以为坐电车会触电 ,所以 生意清淡 。英国人雇用一批失业者当专业坐车人 ,还向 乘客赠送花露水 、牙粉 、香皂等礼物 ,生意才好转 。最早的城市出租车业 据说在外侨颇多的北方冰城 哈尔滨 ,早在 1903 年就有出租车行驶 。1908 年 ,美商环 球供应公司百货商场在上海开设汽车出租部 ,使用可乘 坐 4 人的“凯迪拉克”牌汽车 ,可用电话叫车和订车 。之最早的汽车制造公司1934 年 ,何应钦拟建中国汽车制造公 司 , 次 年 由 曾 养 埔 创 办 , 与 德 国 奔 驰 柴 油 车 合作 ,请来 20 名德国专家 ,装配“奔驰”3 吨载重汽车 ,命名 为“中园”牌 ,仅装配 100 辆 ,日

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论