《EpiData——自由建库专家》

上传人：5*** IP属地：湖北上传时间：2022-03-06 格式：DOC 页数：88 大小：5.74MB 积分：30 举报 版权申诉

已阅读5页，还剩83页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、核心功能应用手册卫生统计软件系列EpiData自由建库专家Edition 1西安交通大学卫生管理与政策研究所谨将此书献给：西安交通大学卫生管理与政策研究所的所有老师们！卫管所04级研究生零五年五月前言“自由啊!即使在这荒漠的世界上，他还是一心想把你寻找出来。”高加索俘虏憧憬自由是人类的天性，崇尚创新是人类进步的源泉，随性自由的表格设计，温馨惬意的录入界面，人性化的录入助手，隐蔽安全的数据内容，多格式支持的数据导出，在EpiData的天空下，一切都是那么的简单与亲切，享受建库，享受录入，享受生活，陈钢 2005年5月13日夜目录前言-3目录-4 卷一:初识EpiData-5 研发背景-5 软

2、件安装-6 界面向导-9 文件类型-13卷二: EpiData建库-14 建库第一步制表-14 建库第二步美工-28 建库第三步核查-38卷三：EpiData操作-47 数据录入-47 数据库维护-54 数据查询-63 数据导出-71 数据导入-78 文件关联-79参考书目-80小记-81卷一初识EpiData研发背景EpiData 是一个免费的数据录入和数据管理软件。开发者是丹麦欧登塞（Odense, Denmark）的一个非盈利组织，即 The EpiData Association（http:/www.epidata.dk/）。程序设计者为 Jens M. Lauritsen,

3、Michael Bruus 和 Mark Myatt。EpiData 的研发工作最早由丹麦的 Jens M. Lauritsen 发起。最初是作为 Funen 县开展的“预防意外伤害行动”（Initiative for Accident Prevention）中的一部分。但是随着视窗（Windows）程序的发展，很多使用者发现很难应付19901995年开发出的 Epi Info 的 DOS 模块。而商业化的程序一般不针对数据的管理，使用起来也没有那么简单，也不具备双录入核查的功能。1999年末，Jens M. Lauritsen、Mark Myatt 和 Michael Bruus 组成研发小

4、组。Michael Bruus 是一位专业的 Pascal（帕其卡语言，一种高水平的计算机编程语言）程序设计员，编程工作主要由他完成。工作小组希望将 EpiData 开发成为一个简单、易用、独立的应用程序。这个程序不需要任何专门的数据库系统驱动（基于dll）。EpiData 的工作原理源自 DOS 版本的 Epi Info 6，但是工作界面为 Windows 版。EpiData 的安装、运行不会依赖系统文件夹中的任何文件，也不会在你的系统文件夹中安装或替代任何 DLL 文件。程序设置等参数被保存在 EpiData.ini 的文件中。你可以通过 setup.exe 在计算机中安装这个程序；也可以

5、直接拷贝 EpiData.exe 文件到计算机中，同样可以运行。软件安装目前，大家较多接触到的 EpiData 软件有2个版本，V3.02 和 V3.1。本手册采用 EpiData V3.1 版作为操作平台。双击安装程序 setup_epidata_cn.exe ；在软件的提示下选择合适的安装路径，建立相应的安装目录；“选择附加的任务”一栏中包括2部分内容（见下图）:“Extra icons”部分询问.是否在桌面添加图标？.是否建立快速启动按钮？“Field naming principle”部分有2个选项，不同的选择生成的软件在数据库定义变量名时有所不同。1)如果你选择上者，程序会自动将变

6、量编码左侧解释性文字中的第一个单词认作是变量名。如调查表中有这样的问题“What is you name ？_”,则导出后，转化变量名为“what”。如果第一个单词的长度超过10个字符，程序只保留该单词的前10个字符作为变量名。当一个变量名已经使用过，再次出现时，程序会自动添加一个数字，以保证变量名的唯一性。你可以通过文件选项生成 REC 文件中，勾选上“更新问题为实际文件名”（见下图），来转变变量名的定义方式。2)下者生成的变量名为编者在 EpiData 软件中给予的变量名的前10个字母，如调查表中有这样的问题“What is you name ？_”,则 EpiData 会根据变量编码前的

7、解释性文字，自动生成变量名，可能为“whatisyoun”。变量名第一个字符一定为字母（A-Z），之后可以包含字母（A-Z）和数字（0-9），最多10个字符。程序不识别国际字母，例如丹麦字母 æ、Ø 和 å 会被自动转换成 ae、oe 和 aa。定义变量名时，程序会遵循以下几个原则：序号原则1.优先采用大括号中的文字作为变量名。所以，若大家想用自己熟悉的变量名请用大括号来定义。例如，如果变量编码前的解释性文字为“my first field”，则自动定义的变量名为MYFIELD。2.一些常用词会被忽略（即，类似“what”、“the”、“of”、“and”等的词

8、）。例如，“What did you do?”，程序采用的变量名称将会是YOUDO。3.如果变量编码前没有任何解释性的文字，那么程序会延续上一个变量的名字，同时在末尾加上一个数字。例如，前一个变量的名称为MYFIELD，那么接下来的变量（如果没有任何解释性文字的话）名会是MYFIELD1。如果前面一个变量名为V31，那么下一个变量名会是V32。如果前面没有变量，则默认的变量名为FIELD1。4.如果可生成变量名的第一个单词是一个数字，程序会自动在数字前插入字母N。例如，“3 little mice”的变量名会是N3LITTLEMI。如果是中文变量名，则导出时自动转换为“field1”的形式，“

9、field1”，“field2” 如调查表中有这样的问题“姓名:_”,则导出后，软件自动转化变量名为“field1”。建议选择选项“Automatic field names”以便导出时容易区分不同变量。完成安装！双击安装目录下的应用程序 EpiData.exe 即可启动程序。界面向导首次运行时软件会自动弹出一个欢迎窗口（见下图），选择“下次不再显示此页”后，点击“关闭”，即可开始使用软件。在本卷中，我们的任务是熟悉这个 EpiData 软件的各种界面以及菜单的大体构成，具体内容将在下一卷中结合问卷设计具体讲解。（1）菜单构成（见下图）：它包括一个主菜单和两个工具条。（2）界面种类（见下图）

10、：在本书中，把我们所将经常接触到的界面分4种：初始界面，制表界面，录入界面和编程界面。初始界面：制表界面：这个界面即为制作数字调查表的场所，我们可以发挥自己的想象力，在这里做出自己想要的数据库录入界面，具有所见即所得的效果！这是本书推荐用 EpiData 软件建立数据库的原因之一随性，自由，建你所欲建！在这里，建库界面的背景颜色也是可以自行设计的，软件的默认颜色是白色，字体是 ThinFix 体，黑色，小五号字。与 Word 软件相似，软件提供了简单的字体设置，包括：字体、字形、大小、效果（下划线、删除线）、颜色以及字符集。录入界面：将做好的调查表直接生成 REC 文件后，我们要建的数据库的模

11、型也就算是做好了。默认生成的界面格式如上图，录入界面的背景颜色默认为白色，字体是 ThinFix 体，黑色，小五号字。蓝色框内为当前录入区，黄色框内为待录入区。编程界面：在对生成的库文件进行质控设置时所要接触到的一个窗口。在 EpiData 软件中，相应的质控设置可有不同方法，采用编程法可在对大批量相同设置时节省时间和体力。具体内容将在下一卷中详细介绍。文件类型使用 EpiData 软件之前，先认识一下该软件中的三种基本的文件类型： QES 文件：数据库结构文件，决定数据库结构。 REC 文件：数据文件，主要用于存放数据。 CHK 文件：核对文件，存放控制数据录入的核对规则，起质量控制作用。

12、记得要将这 REC 文件与 CHK 文件放在同一个文件夹内。本卷终卷二 EpiData建库建库第一步制表数据库的建立可分2种情况，一种是在先有了调查表等文字资料后建立数据库，一种是在什么都没有的状况下建立数据库。对于第一种情况，数据库的建立会相对简单些，因为很多逻辑关系的设置在调查表的设计里都考虑到了，我们所要做的仅仅是把那调查表搬进电脑里；对于第二种情况，一个好的数据库的建立就需要我们的严谨构思与反复测试。但是不管怎么说，我们都得从生成调查表文件（QES 文件）开始。1、生成调查表文件：3种方法。初始界面à文件à生成调查表文件(QES 文件)【快捷键 Ctrl+N】初

13、始界面à工作流程栏à建立新QES文件初始界面à2、进入制表界面：3、下面以“互助医疗非参保户处方录入系统 v1.0”为例，介绍建库的大体步骤以及建库过程中可能会用到的菜单及工具。（1）数据库命名给数据库起一个好的名字是很重要的。对建库者来说，命名的过程就是其自身对建库目的的提炼升华过程。对使用者来说，数据库名可以从第一视角告诉他这个数据库的大体内容与作用。对一个处于开发初期或开发中的不成熟数据库，可以加上一个版本号，如本例中的“v1.0”。见下图。对建库者来说，版本号的改变可能标志着数据库内容或功能的完善过程，可能标志着数据库的不同适用对象。对使用者来说，版本号的

14、存在使得其更能关心数据库的更新，关心数据库的“成长”。（2）变量设计变量应尽可能包含调查的原始数据的各个方面，并在此基础上有所凝练。变量分类。变量分类是建库者对原始数据的初次归类整理。在本例中，原始资料是各种处方笺，我们知道处方一般由三部分组成，即前记（包括医疗、预防、保健机构名称，处方编号，费别，患者姓名、性别、年龄，门诊或住院病历号，科别或病室和床位号，临床诊断，开具日期等，并可添列专科要求的项目）、正文（以或标示，分列药品名称、规格、数量、用法用量）、后记（医师签名或加盖专用签章，药品金额以及审核、调配、核对、发药的药学专业技术人员签名）。通过变量分类，删除了一些无意义变量，把有意义

15、的变量划分为基础信息、患者信息、疾病信息、药品信息、费用信息五部份。清晰地标明了数据库的五大组成部分。区分编码设置。区分编码的有效设置可以使导出的每条数据记录有效区分开，而且应有利于以后的统计分析。但也要考虑到录入的可操作性。在本例中，第一分类变量基础信息起到的就是这个作用。见下图。由上所示，“第<IDNUM>张处方”将自动给录入的每张处方按顺序编号，既有利于录入过程中的查找，也利于数据导出后编码；另在本例中为了今后统计分析的需要，还建立了3种编码。上图中出现了一个很重要的符号“#”，那就让我们谈谈 EpiData 软件中允许的变量类型吧。在制表界面下，点击图标即会弹出字段编辑器。

16、见下图。EpiData 软件中允许的变量类型可分为4类，9种。下面分别介绍。数值型变量#.#.#数值型变量允许录入数字、减号和小数点。在 QES 文件中和数据录入过程中，你可以用圆点“.”或逗号“,”来表示小数点。一个变量中只允许输入一个小数点，这意味着，你不能用逗号作为千位的分隔符（例如：1,000,000）。字符“#”的数目表示变量的长度，小数点占一位字符。变量最长允许14个字符。如果人为将变量长度加到最多18位字符也是允许的。但是，字符长度为17（或18位）时，录入的最后1 位（或2位）会自动更改，无法满足录入要求。字符型变量_字符型变量允许输入所有字符。用下划线字符“_”的数目表示变量

17、的长度。变量最长允许80个字符。若输入中文，则一个中文字需占用2个字符。大写文本的字符型变量<A><A >大写文本的字符型变量中可以录入任意字符，但程序会自动将录入的字母转换为大写，若录入中文，则仍为中文。变量的长度即“<”和“>”间的字符数，其中包括大写字母“A”所占的1个字符。上面例子中，第一个变量的长度为1，第二个变量的长度为5。加密字段<E >加密变量是一种特殊的字符型变量。加密变量的内容以可读的形式显示在屏幕上，但以密码形式保存在磁盘中。使用的运算法则是被称作 Rijndael AES 的超强加密。如果你想了解更多的这方面的内容，可查阅

18、网站：http:/www.esat.kuleuven.ac.be/rijmen/rijndael/ 和/CryptoToolkit/aes/rijndael/。利用加密变量，你可以实现对某些数据（如私人信息）的保护。但千万别忘了你设置的密码，因为根据文件内容，你根本无法破坏或猜测密码。如果真的忘记了，你会丢失掉这些信息。如果你建立的 QES 文件中含有一个或多个加密变量，当你在此基础上开始创建新的数据库时，程序会自动弹出对话框，询问你想设置的密码，该密码将被保存在数据库中。当对该数据库进行有关操作（例如，创建或编辑 CHECK 文件、打开数据库、输出数据库

19、等）时，程序都会首先弹出一个对话框，只有输入了正确的密码，下一步操作才会继续。在 CHECK 文件中，加密变量可以按字符型变量处理。例如：LET encrypt1=”XJTU”日期变量<dd/mm/yyyy><mm/dd/yyyy><yyyy/mm/dd>EpiData v3.1 中有三种类型的日期变量：欧式日期（日/月/年）、美式日期（月/日/年）和中国习惯的日期格式（年/月/日）。日期变量的长度通常是10个字符。在数据录入过程中，允许录入的字符包括数字和斜线（/）。录入时，若你把日期数字按完整的格式输入，中间可以不加“/”。例如，2005年6月1日，对于

20、中国日期格式的变量，你可以键入20050601，后按“Enter”键或“Tab”键，当下一个变量被激活时，这个日期变量会自动变为标准的格式（2005/06/01）。若你把日期数字未按完整的格式输入，则年月日间要加“/”，例如上述日期可以这样键入：2005/6/1。EpiData 只支持用4位数表示年。但录入的时候，不一定要键入10个数字。如，在中国日期格式下，录入050601，程序会自动将其转换为2005/06/01。用2位数表示“年”时，程序会把5099默认为20世纪，即19501999；而把0049默认为21世纪，即20002049。如在中国日期格式下，仅输入0601，则当前的年份会被自动

21、加入。如当前是2005年，则该变量自动显示为2005/06/01。当天日期变量（Todays Date Fields）<today-dmy><today-mdy><today-ymd>在本汉化版中，“当天日期变量”被翻译成了“自动插入日期”。程序会用当天日期（即计算机的系统日期）自动填充这个变量。该型变量不允许使用者录入，不会被激活。如果现在编辑一个以前保存过的记录，该记录中含有一个“当天日期”变量，当修改了的记录再次被保存时，修改当天的日期会自动更新“当天日期”变量。需要注意的是，该变量中 dmy 和 ymd 两种格式是在 EpiData 中才出现的，Ep

22、i Info中没有，这一点是不兼容的。自动 ID 号<IDNUM><IDNUM >IDNUM 是一个能够自动生成 ID 号的变量，每录入一条新记录，ID 号会自动加1。在数据录入过程中，ID 号不能修改。在一个新数据库中，ID 号默认从1开始，不过你可以在：初始界面à文件à选项à高级设置（见下图）中修改。此变量长度为5-14个字符。声音提示（声索引变量）（Soundex Fields）<S ><S >该变量可以输入任何字符，但是如果字符间有空格的话，只有录入的最后一个词用来创建 Soundex 码。在需要匿名时需要使

23、用 Soundex 型变量。例如，输入“My surname is Chen”，而程序只会用最后一个词“Chen”去创建声索引变量。例如利用该变量对被调查者的“姓”进行重新编码，该功能主要适用于英语语系国家。程序自动将输入的被调查者的“姓”转换为一个索引字母和3位数字的编码。索引字母就是“姓”的第一个字母。3位数字是根据“姓”中余下的字母计算出来的。此时被调查者的“姓”按发音归类，而不是按照确切的拼写进行归类。这样做很好地保护了被调查者的隐私，研究者无法从发音编码中确定被调查者的姓名，因此不会暴露被调查者。而对于研究者来说，根据这个声索引变量，加上人口学数据（如出生日期、性别等），仍然可以判断

24、出哪些记录是重复报告的，不会影响分析。声索引变量的格式为一个大写字母、一个连字符、加上3个数字，例如：A-999。创建声索引变量的原则如下：a. 词的第一个字母总是保存，余下的字母会被转换为3位数字;b. 第一个字母后面的辅音字母按其出现顺序被依次编码;c. 编码中只含第一个字母，加上3位数字，之后多出来的字母将被忽略;d. 如果可转换的字母数不够，可以用0填充;e. 连续重复的字母，只转换一个,不够用0填充;f. 相邻的、同属一个编码组的字母，只转换前一个；g. 如果第二个字母与第一个字母同属一个编码组，则忽略第二个字母；h. 忽略单引号“”和连字符“-”；i. 来自相同编码组、中间以W或H

25、相隔的字母，只编码前一个；j. 编码表字母原则A E I O U Y H W 不编码B F P V编码为1C G J K Q S X Z编码为2D T编码为3L编码为4M N编码为5R编码为6逻辑（是/否）变量（布尔逻辑变量）（Boolean Fields, Yes/No Fields）逻辑（是/否）变量只允许录入Y、N、1、0。录入“1”，程序会自动将其转换为“Y”，录入“0”，则自动转换为“N”。逻辑（是/否）变量的长度仅为1。编号设置定义变量名。一个数据库中录入变量的名称可以根据 QES 文件的内容自动创建。但到当前的版本为止，EpiData 不支持用中文定义变量名。为了解决这个问题

26、，我们在建立 QES 文件的时候引入编号。引入的编号即解决了不支持中文的问题，又增加了变量的条理性，见下图：生成的录入系统见下图：此时，当导出数据时，变量将自动按 n1,n2命名，不包含中文名称。建议当最后导出成其它格式文件（如*.sps 文件,*.xls 文件）后重新给变量命名，使变量更好识别。若用英文来定义变量名，则不需要加编号。不知大家还记得否，在上一卷安装软件部分的最后几步，在“选择附加的任务”中就涉及到英文变量名的相关问题，大家可以从前卷查阅。定义变量长度。变量长度的有效设置对减轻录入时的工作量以及控制录入质量均有帮助。恰当的变量长度可以免去录入工作者敲击Enter键或Tab键的必要

27、，而自动跳到下一的待录入变量。若长度过少，则会碰到待录入内容过多而无法录入的现象；相反，若长度过长，虽然保证了录入时所有可能遇到情况的完整性，但必然会加重录入人员敲击Enter键或Tab键的敲击量，并可能增加录入错误的可能性。定义变量长度有2种方法。1)直接定义。在变量名后手动给出变量长度。注意：在用户自己写入字段格式时，必须注意要在英文状态下数入，否则 EpiData 视为无效，比如数值型字段的表示方式为用英文状态下的“#”号，如果使用了中文全角状态下的“”号，则 EpiData 认为不正确。 2)利用编码书写器定义。借助于编码书写器可以很方便的实现对变量类型和长度的定义。如何用编码书写器定

28、义来定义变量长度呢？在制表界面下，点击图标即进入编码书写器状态。此时就可以开始进行变量的定义，程序会自动完成编码，或者主动询问你有关变量长度的信息。在你想要定义变量长度的地方键入相应的字符键，例如，当你键入字符“#”，程序会认为你要键入数值型变量，随后弹出一个对话框，询问数值型变量的长度。当你键入需要的长度后，在光标当前所在位置上会自动插入相应长度的数值型变量的编码（见下图）。下表中列出了编码书写器识别的一些字符串组合。字符说明#数值型变量程序会询问你变量的长度键入5，会得到一个有5位数字的整数变量（#）键入5.2或5,2，得到的变量为：小数点前5位数，小数点后2位数（#.#）_(下划线)字

29、符型变量程序会询问你变量的长度<A大写英文字母的字符型变量程序会询问你变量的长度<d插入欧式日期<dd/mm/yyyy><m插入美式日期<mm/dd/yyyy><y插入布尔逻辑变量<Y><i插入自动编码的ID 号程序会询问你变量的长度默认的长度是5个字符（即允许的最小长度）<s声索引变量程序会询问你变量的长度4、数据库预览。定义完变量后，相信大家已经迫不及待的要看看自己建立的数据库是什么样子的吧，这也是在最终生成数据库文件前的重要一步。一方面我们可以对数据库的格式及外观进行必要的调整使其更加符合我们的审美观；另一方面

30、我们可以在预览界面里进行试录入，确保变量类型及长度是正确的。（1）进行数据库预览：3种方法。制表界面àREC文件à数据表预览【快捷键 Ctrl+T】制表界面à工作流程栏à数据格式预览制表界面à（2）进入数据格式预览界面：建库第二步美工一个好的数据库不仅应有良好的数据录入设置，而且应有一个“悦眼”的录入界面，这对需要长期在电脑面前作录入的工作人员来说是非常重要的。建库第二步重点讲解 EpiData 中的一些可以调整美观的功能。原来数据库可以更美的-1、关于“对齐” 在数据录入的表格中，各个变量录入框的位置取决于变量前解释性文字的长度。由于各行解

31、释性文字长度不一，使得前后变量很难对齐，观感较差。如下图：其QES文件如下图：要想使界面输入框对齐，变成如下所示的界面，有两种方式。（1）手动对齐。在制表界面上根据自身设计，不断地调整间距，调整到一个自己满意的界面。（2）制表符对齐。“”是 pi Data大体步骤以及建库过程中可能会用到的菜单及工具。EpiData 软件里用来实现前后变量的对齐的专用符号，Epi Info 中不存在这种使用方法。使用制表符，只会改变变量录入框在表格中的位置，而不会对变量或 REC 数据库产生其它不良影响。在变量编码前插入，可以将这个变量对齐到下一个制表位置。初始界面/制表界面à文件à选项&#

32、224;生成REC文件à“使用内的内容自动添加字段名”。设置制表位置间的间隔。不同的数值设置会有不同的效果出现。初始界面à文件à选项àREC文件显示à设置“字段名与数据框间象素数”。上例中的设置见下图：插入“”。插入的与变量编码间不能有空格。上例中插入“”的方式见下图：2、关于“颜色” EpiData 提供了丰富的背景色彩及字体格式设置来满足人们日益“苛刻”的视觉要求。有三个界面可以让我们自由发挥，改变背景颜色及字体格式。分别是制表界面、录入界面和输出报表界面。相应的修改会致使相应界面的显示发生变化。（1）初始界面/制表界面à文件&#

33、224;选项àQES文件显示/REC文件显示/有关资料。（2）字体修改。见下图：（3）背景颜色修改。见下图：（4）修改实例。以修改“青海互助单病种住院常见疾病医疗费用数据库”的 REC 文件格式为例。修改字体。如果你发现用你的 EpiData 编辑器打开的含有中文的调查表文件显示为乱码，你可以尝试在这里更换一下显示的字体，很有可能是因为你的系统中不具备指定的字体，才导致乱码的出现。修改背景。预览效果。如上图所示，修改后的界面以绿色为背景色，降低了长时间录入的视觉疲劳（默认的白色背景长时间注视容易造成视觉疲劳）。当前录入框为黑色，立体感强；非激活字段颜色与背景色融为一体，空间感强。发挥

34、自己的想象力吧！3、其它设置以上介绍了最主要的几处修改方案，当然，还有很多细小的设置不太常用，需要大家在实战中慢慢体验。初始界面/制表界面à文件à选项“QES文件显示”中：你可以修改按Tab键时，插入的空格数。EpiData 中不能使用 Tab 字符，所以当你打开一个文件，或从另外一个程序中拷贝文本，粘贴到 EpiData 的编辑器中时，程序会自动用空格替代原有的 Tab 字符。“REC文件显示”中：设置录入变量框的外观（3D 形式、平面式有边缘、平面式无边缘）、行间距。“生成REC文件”中：可以设置变量的命名方式，以及变量名是大写、小写、还是按 QES 文件中键入的实际情

35、况显示。“有关资料”中：可以定义输出报表（例如，数据一览表、数据简单分析表等）的编辑器窗口的外观（字体、背景）。建库第三步核查这是本书推荐用 EpiData 软件建立数据库的原因之一规划并监控录入过程！在做好以上工作后，就要进入一个相对枯燥但是却非常有用的工作建立核查文件（CHECK 文件）。在用其它数据库软件录入完数据后，你可能需要花费一定的功夫去检查数据录入得是否合理、正确。但是在 EpiData 软件中，如果在录入数据前设置了CHECK 文件，在数据的录入过程中，程序会自动根据你设置的条件，实时检查录入数据的合理性、正确性，起到保障数据录入质量的作用。同时，通过 CHECK 文件，你还

36、可以控制数据录入的流程（例如，根据录入的数值，自动从一个变量跳转到另一个变量）。注意：在数据录入过程中不要使用鼠标。数据录入过程中，核对文件对用户的鼠标操作不能进行控制，而且可能导致产生无效数据。 CHECK 的文件名必须与数据库的文件名相同，唯一不同的就是扩展名，前者为*.chk，后者为*.rec。1、数据库生成。在进行 CHECK 文件设置前，需要先生成数据库文件（ REC 文件）。（1）生成数据库：2种方法。制表界面àREC文件à生成REC文件à根据相应的“QES文件”建立“REC文件”（见下图）。制表界面à工作流程栏à生成REC文件

37、à根据相应的“QES文件”建立“REC文件”（见下图）。使用者可以给数据库输入一段简短的描述性文字（最长不超过50个字符），我们将其称为数据库标签（data file label）。数据库标签会作为数据库的一部分被保存起来，输出报表时也会一同显示。但一些分析 Epi Info 文件格式的数据分析软件可能无法读取有这种标签的文件。建议可以不必输入数据库标签，直接点击确定。见下图：2、核查文件生成初始界面à数据录入质控à添加/修改录入质控程序à弹出设置窗口（见下图）。初始界面à工作流程栏à选择要建立“CHECK文件”的“REC文件”

38、24;弹出设置窗口（见下图）。注意：核查文件的名称必须与数据文件的名称相同，而且与数据文件放在同一个文件夹下。 3、常用的核查设置在本书中，我们仅介绍最常用的核查设置，更为复杂的 CHECK 编辑将在下一本书中作专门介绍。常用的 CHECK 设置均在窗口中完成，见下图：（1）选择变量，添加CHECK 命令，常用以下两种方式：在数据录入表格窗口中，通过鼠标点击，或者按Tab 键、或Enter 键可以激活目标变量；在 CHECK 设置窗口中，最上方有一个可以选择变量名的下拉列表，你可以从这个列表中选择目标变量，变量的顺序与数据表格中的顺序一致，见下图：（2）基本CHECK 命令的设置数值允许范围及

39、允许值（Range, Legal）在 Range, Legal 的定义框中键入允许录入的最小值和最大值，并用连字符“-”连接。例如，在“互助医疗非参保户处方录入系统”中 N1 的数值允许范围及允许值键入“101-135”，表示当前变量只允许录入这35个数值。如果只对最大值有限制，则用“-INF”（负无穷大）表示最小值。如果只对最小值有限制，则可以用“INF”（无穷大）表示最大值。例如，键入“-INF-5”表示当前变量录入的数值必须5。键入“0-INF”表示录入的数值必须0。允许值（legal）是在 Range, Legal 的定义框中键入所有允许输入的数值，数值之间以逗号或空格间隔。如果使用空

40、格作间隔，程序也会自动将其转换为逗号间隔。例如，键入“201,202,301,302,303,304,305,999”表示当前变量只允许录入这8个数值。如果你的设置中既有允许的范围，又有允许值，那么范围值必须放在前面，允许值放在后面。例如，键入“101-135, 201,202,301,302,303,304,305,999”表示允许录入这43个数值。但若键入“201,202,301,302,303,304,305,999, 101-135”，程序会提示错误。如果你想用逗号作为小数点分隔符，而不是常用的圆点，请用双引号将这个定义括起来。跳转（Jumps）如果当前变量设置了跳转功能，则表示在输入

41、某个指定的数值后，程序会自动跳到某个对应的变量上。例如，在“互助医疗非参保户处方录入系统”中 N2 的跳转设置为：JUMPS 11 n4 12 n4 31 n4 32 n4 99 n4 END意思为处方类型为11，12，31，32，99的跳过不录入医生编码。设置跳转功能时，请依次键入跳转值、大于号（>）、跳转的目标变量名。跳转语句间用逗号分隔。如上例应敲入：11>n4,12>n4,31>n4,32>n4,99>n4。如果定义中包含空格或逗号，请用双引号把整个定义括起来。例如，”2.5>n30”, ”3,5>n35”除了可以指定跳转的目标变量外，还

42、可以使用另外两种跳转方式，即 END 和WRITE。END 表示“跳转到数据录入表格的最后一个变量”，WRITE 表示“将当前记录存盘”。例如，设置跳转为“1>n30,2>END,3>WRITE”表示：当输入1 时，跳转到变量n30；如果输入2，直接跳转到最后一个变量；如果输入3，将当前记录存盘。如果键入跳转命令：AUTOJUMP n30这表示不管当前变量录入什么数值，都直接跳转到变量N30。如果使用 AUTOJUMP 命令，跳转的设置框中就只能输入这一个命令。AUTOJUMP 这个命令特别适用于那种不按正常的从左到右、从上到下顺序设计的表格。为了使跳转设置更加便捷，你可以采

43、用下面的快捷设置方式。当键入完跳转值和“>”后，用鼠标直接点击跳转的目标变量。这时，点击变量的变量名会自动插入到“>”后面。必须录入（Must Enter）这个命令要求必须给当前变量输入数值，否则无法进入下一个变量。重复（Repeat）如果选择“Yes”（是），则前一条记录在当前变量上录入的数据将在接下来的新记录上重复显示。在数据录入过程中，重复显示的数据可以修改。如果某些录入内容在不同记录间改动很少（例如，调查员姓名、调查者所属地区等），这项重复功能可以省去很多重复键入的工作。数值标签（Value Labels）数值标签是一组数值加上对应的文字注释，可以解释每个数值代表的涵义。

44、例如，在“互助医疗非参保户处方录入系统”中 N4 用1 表示男性，2 表示女性。如果设置了这个数值标签，在数据录入过程中，当你按F9，或数字键盘上的+时，程序会自动弹出一张表，告诉你1 和2 各自对应的涵义。1) 定义新标签点击 CHECK 设置窗口中“Value label”旁边的+钮，会弹出一个“编辑标记”的编辑窗口。值“1”、“2”前面可以不输入空格，但是加上空格可以使阅读起来层次更加清楚。另外，如果标签的注释性文字中带有空格，请用引号括起来。例如，编写上例 N4 的标签，见下图：编辑完毕后，可以按菜单上的确定并关闭或者Alt+A 键关闭编辑窗口。这时，新标签的名字会显示在Value

45、label 的下拉列表中。打开 REC 文件，当录入到变量N4时，按F9则自动弹出一个窗口，录入人员可以直接选择相应的标签值，见下图：2) 编辑已有的标签在Value label 的下拉列表中选择你要编辑的数值标签的名字，然后点击右侧的钮，编辑窗口弹出。修改后按菜单上的确定并关闭或者Alt+A 键，保存并关闭编辑窗口。3) 变量指定已有的标签在对应的变量上，从Value label旁的下拉列表中选择相关的标签。不同的变量可以共用相同的数值标签，你只需要定义一次。4) 清除变量的数值标签在对应的变量上，从Value label的下拉列表中选择none，即可清除在该变量上设置的数值标签。5) 使用

46、预设的标签在安装 EpiData 时，同时会有一个数值标签库被保存在 EpiData 的程序文件夹下。该库的文件名叫 EpiData.lbl。在设置不同的数据库时，可能会用到相同的数值标签。这时，利用这个软件会省去重复设置的麻烦。点击Value label旁的下拉列表，你可以看到该库中保存的数值标签的名字，然后选择你想采用的数值标签。默认安装的数值标签库（EpiData.lbl）中有3个标签，性别（sex）、年龄组（agegroups）、洲（continent）。但是，本版本的软件提供的数值标签库中有错误，看不到洲（continent）的标签。另外，由于未知的原因，下拉列表中显示的标签名内含乱

47、码。如果你确实想在 EpiData.lbl 库中添加更多的数值标签，可以在编辑器中或其它字处理软件（如 Windows 自带的写字板、WORD 等）中添加、修改。到此为止，我们共同感受了建库的3大步骤，一个完整的数据库基本建成了，接下来的一卷里，我们将一起探讨录入数据，修改数据库等等录入时及录入结束后可能遇到的问题。本卷终卷三 EpiData操作数据录入1、界面数据录入工作在录入界面下完成，见下图：当前录入区为淡蓝框区域，黄框区域为非激活区域。依顺序录入相应变量至末条变量，按Enter键，此时系统会询问是否将记录存盘，选择“是”保存此条记录，并自动进入下一条记录录入窗口；选择“否”，放弃保存，

48、并将光标跳回本条记录的第一个变量录入区。录入的数据资料均保存在REC库文件中。2、转换（1）变量间转换激活下一个变量，你可以使用Enter、Tab、键、或用鼠标直接点击目标变量。注意：在数据录入过程中，如果你使用鼠标实现在变量间的跳转，则CHECK 文件中设置的录入规则通常无效。如果想回到上一个变量，可以按Shift+Tab 键，或键。按Ctrl+Home 键可以直接回到数据录入表格的第一个变量。选择Ctrl+End则可以直接跳转到最后一个变量。（2）记录间转换与修改、删除在录入界面的左下角有一个导航条（红笔圈出），见下图。按 “”、“”表示转至前一条或后一条记录；按 “|<” 、“|

49、”表示跳到首条记录或末条记录；按“*”为开始录入新记录。按“×”为删除当前记录，出现“DEL”，此时，记录只是被标记为删除，但实际上，这条记录仍然存在于数据库中，是可恢复的。再按“×”按钮后 “DEL”消失，即表示记录恢复。若想永久删除记录，则：初始界面à工具à清理REC文件（将有删除标记的记录彻底清楚）。即可彻底删除所有标记为删除的记录，记录数会自动减少。系统在删除记录前会自动把原库另存一份备用。在此例中，显示数据库中共有5条记录，这是第5条记录,并且这条记录是被删除的，（按“×”按钮后出现“DEL”，如上图）再按“×”按钮后 “D

50、EL”消失，即表示记录恢复。（3）关联数据库间转换当打开一组关联的数据库（即，有 RELATE 命令的数据库）时，数据表格的左侧会显示“关联树”（relatetree）。根据关联树，我们可以清楚地了解数据库间的关系，并实现在数据库间的转换。点击关联数据库的名字，可以浏览数据库的内容，但是仍处于只读模式，不能修改、录入数据。你只能从激活的数据库开始，经含 RELATE 命令的变量激活、进入关联数据库，进行录入或修改。3、查找（1）界面录入界面à查找à见下图：（2）方式可以通过字段查找，也可以通过记录号查找。按字段查找，选择“查找字段”，会出现如下图所示窗口，在程序弹出的当前数

51、据库的所有变量列表中输入/选择要寻找的变量名，按Enter键,即可跳到该变量。按记录号查找，选择“定位记录”，出现如下图所示窗口，直接输入记录号即可。若不知道记录号，则选择“查找记录”，会弹出如下窗口：搜索可以同时在最多10个不同的变量上进行。可以设置的参数包括：等于（“=”可写、可不写）、不等于（<>）、大于（>）、小于（<）、以此开始（abcd*）、以此结束（*abcd）、或包含（*abcd*）。另外，在设置“等于”条件时，建议条件的写法与设置好的变量类型保持一致。例如，一个数值型变量设置为3 位整数、2 位小数。则如果欲搜寻该变量等于100 的记录，则应该写条件为

52、“=100.00”，而不能简单的写为“=100”。按F3或选择“再次查找”可以用相同的搜索条件继续搜索。在搜索过程中，按Esc键可以终止搜索。4、过滤在数据录入过程中，我们可以限制哪些记录被显示出来。要实现该功能必须预先在设置 CHECK 文件时使用 KEY 语句给是其所设置的变量创建了一个索引。这部分将结合 CHECK 语句的编辑在下一本手册中作专门介绍。数据库维护1、修改数据库如果你只是想在原有数据库的基础上作一些调整，但又不想丢失已有的数据，例如，增加一个变量或者改变已有变量的类型，请你选择：初始界面/制表界面à工具à根据修改的QES文件更新REC文件。（1）修改步骤

53、打开调查表文件（*.qes）进行修改。如果手头上没有现成的调查表文件，你也可以用已有的数据库（*.rec）反过来创建一个新的调查表文件，即：初始界面/制表界面à工具à根据REC文件生成QES文件；编辑/修改调查表文件（*.qes），例如，增加新变量、删除变量、改变变量类型等；保存修改后的调查表文件，然后关闭该文件；选择：初始界面/制表界面à工具à根据修改的QES文件更新REC文件；选择修改好的调查表文件（*.qes）和准备修改的数据库（*.rec）；如果你删除了某些变量，或者修改了变量名，你会丢失一些数据。请认真检查修改了的数据库，避免错误操作。不过，即使操作失误，原来的数据库还是可以恢复的，它现在已

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《EpiData——自由建库专家》

文档简介

温馨提示

最新文档

评论

《EpiData——自由建库专家》

文档简介

温馨提示

最新文档

评论

相关文档