




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据录入和数据管理软件EpiData 10/10/20221epidata 软件使用数据录入和数据管理软件EpiData 10/9/20221e1.软件使用简介简介(Introduction) EpiData是一个免费的数据录入和数据管理软件。由美国CDC(疾病控制中心)和WHO(世界卫生组织)联合发布的,是一款免费软件。主要用于数据录入、核对、管理和数据报告。该软件的功能是建立数字化的调查表格,使收集的资料信息录入计算机更加方便。该软件不但可以在数据录入过程中对数据中的错误进行核对,而且可以在数据录入完成后对数据进行核对,如双录入的数据核查。10/10/20222epidata 软件使用1.
2、软件使用简介简介(Introduction)10/9/2EpiData的安装、运行不会依赖系统文件夹中的任何文件,可以通过setup.exe在计算机中安装这个程序;也可以直接拷贝EpiData.exe文件到计算机中,同样可以运行。该程序的最大特点是对录入的记录数没有限制。但在实际应用中,记录数一般不要超过200,000300,000。整个录入界面不能超过999行。对数值或字符串编码进行解释的文字长度最多80个字符,编码长度最多为30个字符。使用Pascal语言进行程序设计,EpiData与早期的与Epi Info兼容,10/10/20223epidata 软件使用EpiData的安装、运行不会
3、依赖系统文件夹中的任何文件,可2 数据库创建过程在使用EpiData软件之前,先对该软件中用到的三种基本的文件类型进行简单介绍:.QES文件:调查表文件即数据库结构文件,决定数据库结构。.REC文件:数据库文件,主要用于存放数据。.CHK文件:核对文件,存放控制数据录入的核对规则,起质量控制作用。EpiData由数据库结构文件(.qes),来决定数据库结构,然后根据该数据库结构文件生成数据文件(.rec)。10/10/20224epidata 软件使用2 数据库创建过程在使用EpiData软件之前,先对该软件中一个最简单的创建数据库的工作至少要包括以下两步:1、建立调查表文件根据调查表制作数据
4、库结构文件即调查表文件(.qes)2、生成数据库文件根据调查表文件生成数据库文件(.rec)。理论上说,有了数据库文件就可以进行数据录入了,但是在实际工作中,往往需要对数据录入进行质量控制,比如对某些字段设置合法值、跳转等等。这些质量控制工作需要专门的核对文件来完成(.chk)。因此,在数据库创建过程一般还包括:3、编写核对程序即生成数据核对文件(.chk).在EpiData软件中,在其主界面的上形象的标示出了数据库创建过程:10/10/20225epidata 软件使用一个最简单的创建数据库的工作至少要包括以下两步:10/9/22.1建立数据库结构文件(Create Questionnair
5、e File)表 1 工资调查表A1 编号A2 姓名A3 性别(1)男 (2)女A4 出生日期年 月 日B1 基本工资B2 奖金10/10/20226epidata 软件使用2.1建立数据库结构文件(Create Questionna2.1.1定义变量名建立调查表文件是建立数据库、实现数据录入和管理的第一步。调查表结构文件在编辑器窗口建立10/10/20227epidata 软件使用2.1.1定义变量名建立调查表文件是建立数据库、实现数据录编辑器窗口的使用1、打开EPDATA 软件,可以单击菜单中的“文件生成调查表文件”,在工作流程栏(Work Process Toolbar)上点击“建立新的
6、QES文件”,单击工具栏上的“新记录”按钮这时窗口中会自动显示一个空白的文档,你可以在这里输入调查表,也可以把WORD中建立的调查表复制/粘贴过来再进行编辑。调查表实际上就是数据录入表格的框架。编辑完成后,将此调查表文件保存,文件的扩展名统一为.QES。10/10/20228epidata 软件使用编辑器窗口的使用1、打开EPDATA 软件,可以单击菜单中的2、编辑器(Editor)主要功能是创建和编辑调查表(.QES文件)。这个调查表定义了数据库结构。编辑器的使用和其它字处理软件基本一致,由菜单栏,工作流程栏、工具栏和文本编辑区组成。也可以使用编辑器处理程序输出的报表,以及编辑CHECK文件
7、。10/10/20229epidata 软件使用2、编辑器(Editor)主要功能是创建和编辑调查表(.QE2.1.2 定义变量名(Field Names)输入的信息要保存在变量中因此需要定义变量名。一个数据库中录入变量的名称可以根据QES文件的内容自动创建。EpiData中命名变量的方式有两种:1)将第一个单词作为变量名(First word in question is field name)2)根据规则自动定义变量名(Automatic field names)执行“文件选项”命令打开“生成REC文件”(FileOptionsCreate data file)选项卡。(1)QES文件字体
8、设置:变量名称的字体及其大小可以在QES文件显示(Show data form)中设置. 。10/10/202210epidata 软件使用2.1.2 定义变量名(Field Names)输入的信息要(2)REC文件字体设置:更改REC文件变量名称的字体及其大小。(3)首字符为汉字变量命名方法:系统不支持中文作为变量名,在如何生成字段名(How to generate field names)标签中选择定义变量名的方法。在选择“将第一个单词作为变量名”时,如第一列为汉字(如去除调查表中的A1,A2,A3等变量名),则系统自动生成变量名如Field1,field2和field3,同时REC表中中
9、文文字也不再显示。因此,建议事先以字母形式定义变量名。变量名的英文字母是大写(Upper-case)还是小写(Lower-case)或维持输入时的大小写状态(Leave as is)也可以在此修改。10/10/202211epidata 软件使用(2)REC文件字体设置:更改REC文件变量名称的字体及其大(4)首字符为字母的变量命名,系统默认为将自动将变量编码左侧解释性文字中的第一个单词认作是变量名(First Word in Question is Field Name)。如果第一个单词的长度超过10个字符,程序只保留该单词的前10个字符作为变量名。例如:1)如果输入:A1 Enter nu
10、mber # 程序会创建一个变量名为“A1”的4位整数变量。2)如果输入:Enter number # 程序会创建一个变量名为“Enter”的4位整数变量。此时也可选择自动定义变量名(Automatic field names)的方式。 3)A1 编号 # 则变量名为A1 ,注意A1与编号间要由一空格。10/10/202212epidata 软件使用(4)首字符为字母的变量命名,系统默认为将自动将变量编码左侧4)当一个变量名已经使用过,再次出现时,程序会自动添加一个数字,以保证变量名的唯一性。如有三个A1变量,则自动以A1,A2,A3命名,并以此类推,建议变量起名时具有唯一性,以免混淆。选择生
11、成REC文件中的“更新问题为实际文件名”(Update question to actual field name),这样,即使创建调查表文件时有重复的变量名,在创建的数据库中,程序会自动将其更新为其实际的变量名。10/10/202213epidata 软件使用4)当一个变量名已经使用过,再次出现时,程序会自动添加一个数4)在英文版本中。如果同时出现中文和英文,程序会自动选择第一个出现的英文单词作为变量名。10/10/202214epidata 软件使用4)在英文版本中。如果同时出现中文和英文,程序会自动选择第一(5)选中“使用内的内容自动添加字段名(Automatic Field Names
12、)根据变量编码前的解释性文字,自动生成变量名。变量名第一个字符一定为字母(A-Z),之后可以包含字母(A-Z)和数字(0-9),最多10个字符。程序会遵循以下几个原则:如希望定义的变量名不是第一个,则可将需要定义的变量名用大于号括起,如 Enter Number 则变量名为Number ,系统优先使用大括号中的文字作为变量名。如为 Enter age ,则自动定义的变量名为nage。因此为了定义确切的变量名,尽量使用大括号来定义有意义的变量名。.一些常用词会被忽略(即,类似“what”、“the”、“of”、“and”等的词)。例如,“What are you doing?”,程序采用的变量名
13、称将会是youdoing。10/10/202215epidata 软件使用(5)选中“使用内的内容自动添加字段名(Automati(6)如果变量编码前没有任何解释性的文字,那么程序会延续上一个变量的名字,同时在末尾加上一个数字。例如,前一个变量的名称为A1,如果没有任何解释性文字的下一个变量A2。如果前面没有变量,则默认的变量名为FIELD1。10/10/202216epidata 软件使用(6)如果变量编码前没有任何解释性的文字,那么程序会延续上一(7)如果问题(提示符)以数字开头,程序会自动在数字前插入字母N。例如,“1、姓名”的变量名会是“N1 10/10/202217epidata 软
14、件使用(7)如果问题(提示符)以数字开头,程序会自动在数字前插入字2.1.3定义变量标签变量标签(Variable Labels)变量标签是对一个变量所含数据内容的描述。在EpiData中,程序会根据QES文件中,变量编码左侧的解释性文字自动生成变量标签。如果选择了“文件选项”中的“将第一个词作为变量名”(First word in question is field name),则扣除作为变量名的第一个单词后,自左向右的文字会被作为变量标签。例如:“A1 Age of patient#”,变量名为“A1”,变量标签为“Age of patient”。中文问题(提示符)虽然不能不能作为变量名,
15、但是可以自动的作为变量标签。如果选择了“自动添加字段名”(Automatic field names),则变量名为“A1ageofp”,变量标签为“A1 Age of patient”。10/10/202218epidata 软件使用2.1.3定义变量标签变量标签(Variable Label2.1.4定义变量类型执行“编辑字段编辑器”命令(EditField Pick List),或者按Ctrl+Q键,或者在编辑器工具栏(Editor Toolbar)单击字段编辑器按钮,可以打开变量类型选择对话框,从中选择适当的变量类型单击“插入”按钮即可。10/10/202219epidata 软件使用2
16、.1.4定义变量类型执行“编辑字段编辑器”命令(Edit1.自动编码字段自动ID号变量(IDNUM)是一个数值型变量,其值由计算机自动生成。其赋值原则是随着每一条记录的输入,变量值加1。在数据录入过程中它的值不能修改,只能自动增加。该变量的初始值默认为1,但是用户可以在“文件”菜单的“选项”中的“高级设置”中进行设置(FileOptionsAdvancedID number fieldsFirst IDnumber in new data file:1)。此变量长度为5-18个字符。10/10/202220epidata 软件使用1.自动编码字段自动ID号变量(IDNUM)是2 数值型字段(N
17、umeric Fields) 数值型变量#.#中只能用来接受从0到9的数字,数值可以是整数也可以是小数。一个#号代表一位数,用户可以根据需要定义所需的数值位数,但包括小数点在内最大为14位。在数据录入过程中和.QES文件中你可以用圆点(.)或逗号(,)来表示小数点。一个变量中只允许输入一个小数点,这意味着,你不能用逗号作为千位的分隔符(例如:1,000,000)。字符“#”的数目表示变量的长度,小数点占一位字符。10/10/202221epidata 软件使用2 数值型字段(Numeric Fields) 数值型变3文本(字符)型字段(Text Fields)下划线_定义字符型变量的位数。字符
18、型变量内可以输入任何字符。该类型变量的最大长度为80个字符。下划线字符的数目表示变量的长度。字符型变量允许输入所有字符。变量最长允许80个字符。如果输入中文,请注意,一个中文字需占用2个字符。大写字母的字符型变量(Upper-case Text)大写字母的字符型变量中可以录入任意字符,但程序会自动将录入的字母转换为大写。变量的长度即“”间的字符数,其中包括大写字母“A”所占的1个字符。上面例子中,第一个变量的长度为1,第二个变量的长度为5。10/10/202222epidata 软件使用3文本(字符)型字段(Text Fields)10/9/204大写型字符字段(Upper-case Text
19、)大写字母的字符型变量中可以录入任意字符,但程序会自动将录入的字母转换为大写。变量的长度即“”间的字符数,其中包括大写字母“A”所占的1个字符。上面例子中,第一个变量的长度为1,第二个变量的长度为5。10/10/202223epidata 软件使用4大写型字符字段(Upper-case Text)大写字母的5逻辑(布尔)型字段(Boolean Fields,Yes/No Fields)逻辑型变量内只可以存放Y,N,1,0和空格。当输入1时计算机自动将其转换为Y。同样,当录入0时则自动转换成N。变量的长度仅为1位。.10/10/202224epidata 软件使用5逻辑(布尔)型字段(Boole
20、an Fields,Yes/6日期型字段(Date Fields)有三种类型的日期变量:欧式日期(日/月/年)、美式日期(月/日/年)习惯格式(年/月/日)。日期变量的长度通常是10个字符。在数据录入过程中,允许录入的字符包括数字和斜线(/)。如果你可以把日期数字按完整的格式输入,中间可以不加“/”。日期型变量的长度总是10位。在数据录入过程中,能录入的字符为数字和斜线(/)。如果所有日月年数值都录入则不必录入斜线。比如2008年10月1日可以在数据录入时直接键入20081001。在光标移入下一个字段后,字段内的值自动变为标准的2008/10/01。如果录入的两位数的年份在50到99之间的话,
21、则被默认为20世纪,前面加“19”。如果年份值在00和49.之间的话则被默认为21世纪,前面加“20”。如果只录入0405,则计算机系统年份自动加入到字段中。在录入完成后计算机会对录入的日期进行核对,以保证录入的日期值是合法的日期值。系统只认四位数年份。10/10/202225epidata 软件使用6日期型字段(Date Fields)有三种类型的日期变量:7当天型日期字段(Todays Date Fields)当天型字段(自动插入日期字段)内自动的填入当前计算机的系统日期值。该类型的字段不能编辑,光标也不能移入。在数据录入时今天型子段为当前日期,如果下一次该纪录被修改时,则该今天型字段中则
22、储存的日期值为修改的日期,因此可以用今天型日期子段来记录数据的最后一次修改日期。10/10/202226epidata 软件使用7当天型日期字段(Todays Date Fields)当8声音提示(Soundex)型字段声音提示Soundex型变量可以输入任何字符,但只有录入的最后一个词用来创建声音Soundex码。在需要匿名时需要使用Soundex型变量。比如参与调查人的姓名需要匿名,则要使用Soundex型变量。Soundex型变量编码总是用A-999格式,其中包括一个大写字母,一个连字符和一个3位数值。将录入的姓转换为一个字符和3个数字。用于保护被调查者的隐私。10/10/202227e
23、pidata 软件使用8声音提示(Soundex)型字段声音提示Soundex型变9、加密型字段加密型字段是一种特殊类型的字符型字段。加密型字段在屏幕上显示为可读的文字,但在保存时加密。在数据文件保存时,EpiData会提示设置密码,则只有在输入密码的情况下,才能打开该数据文件。 10/10/202228epidata 软件使用9、加密型字段加密型字段是一种特殊类型的字符型字段。加10、隔位符(Tabulator Code)在根据.QES文件创建.REC文件时,字段的位置由.QES文件中问题的位置决定,问题在数据录入框的左侧。但这会引起字段不能对齐,隔位符可以应用在.QES文件中来解决这一问题
24、。隔位符除了影响字段的位置外对.REC文件无影响。例如:A1#A2#.QES文件中的这两个语句可以产生两个4位数的字段。字段名称(A1和A2)显示在屏幕的左边。数据录入框和字段名称间的距离由计算机确定,默认值为40像素。这些可以在“文件”菜单的“选择项”下进行设置。实现前后变量的对齐。使用制表符,只会改变变量录入框在表格中的位置,而不会对变量或REC数据库产生其它不良影响。 10/10/202229epidata 软件使用10、隔位符(Tabulator Code)在根据.QE在变量编码前插入,可以将这个变量对齐到下一个制表位置。每个制表位置间的间隔可以在文件(File)选项(Options)
25、REC文件显示(Show data form)表(Tabs/Indents)字段名和数据框间像素(Tab stop in data form every pixels)中进行设置。默认值为40。注意,插入的与变量编码间不能有空格。另外,请确认文件(File)选项(Options)生成REC数据文件(Create data file)如何生成字段名(How to generate field names)选择自动添加字段名(Automatic field names)。只有在这种设置情况下,才能实现制表符的这项功能。10/10/202230epidata 软件使用在变量编码前插入,可以将这个变量
26、对齐到下一个制表位置。每个2.4预览数据录入表格(Preview Data Form)在Rec文件(Data File)菜单中点击数据表预览(PreviewData Form),按Ctrl+T,在编辑器工具栏(Editor Toolbar)中点击“Rec文件预览”按钮,在工作流程栏(Work processtoolbar)上点击2生成REC文件(.Make Data File)数据格式预览(Preview Data Form),我们可以在尚未建立数据库(*.rec)的情况下,先预览数据录入时的调查表布局。预览时,因为尚未建立数据库,因此CHECK功能还无法发挥作用。当修改了调查表文件(*.qe
27、s)后,预览的数据表格不会自动更新,必须再按预览键来看更新的调查表格式。关闭预览窗口,可以点击菜单文件(File)关闭数据表(Close Form),或按Ctrl+F4。10/10/202231epidata 软件使用2.4预览数据录入表格(Preview Data Form)2.2编码书写器(Code Writer)在输入变量时,利用编码书写器可以很方便的实现对变量类型和长度的定义。单击编辑菜单(Edit)编辑器(Code Writer),或者按Ctrl+W键,也可在编辑器工具栏(Editor Toolbar)中点击图标。这时,当设置变量类型时,只要输入一些信息,程序会自动完成编码,或者主动
28、询问你有关变量长度的信息。例如,当键入字符#,程序会认为你要键入数值型变量,随后弹出一个对话框,询问数值型变量的长度。当键入需要的长度后,在光标当前所在位置上会自动插入相应长度的数值型变量的编码。10/10/202232epidata 软件使用2.2编码书写器(Code Writer)在输入变量时,利用下表中列出了编码书写器识别的一些字符串组合。#数值型变量,_(下划线)字符型变量,A大写英文字母的字符型变量,d插入欧式日期,m插入美式日期,y插入布尔逻辑变量,)、跳转的目标变量名。跳转语句间用逗号分隔。例如,1B1,2B2表示输入1时,跳转到变量B1;输入2时,跳转到变量B2。如果定义中包含
29、空格或逗号,可用双引号把整个定义括起来。例如,“1,6C10”,”7,5F35” 10/10/202269epidata 软件使用跳转格式为:跳转值、大于号()、跳转的目标变量名。10/9除了可以指定跳转的目标变量外,还可以使用另外两种跳转方式,即END和WRITE。END表示“跳转到数据录入表格的最后一个变量”,WRITE表示“将当前记录存盘”。例如,设置跳转为“1B30,5END,8WRITE”表示:当输入1时,跳转到变量B30;如果输入5,直接跳转到最后一个变量;如果输入8,将当前记录存盘。如果键入跳转命令:AUTOJUMP B20这表示不管当前变量录入何值,直接跳转到变量B20。该命令
30、适用于那种不按正常顺序录入的调查表。跳转中输入变量时可直接用鼠标单击跳转的目标变量。10/10/202270epidata 软件使用除了可以指定跳转的目标变量外,还可以使用另外两种跳转方式,即(4)必须录入(Must Enter)要求必须给当前变量输入数值,否则无法进入下一个变量。10/10/202271epidata 软件使用(4)必须录入(Must Enter)要求必须给当前变量输入(5)重复(Repeat)如果选择“Yes”(是),则前一条记录在当前变量上录入的数据将在接下来的新记录上重复显示。在数据录入过程中,重复显示的数据可以修改。如果某些录入内容在不同记录间改动很少(例如,调查员姓
31、名、调查者所属地区等),这项重复功能可以省去很多重复键入的工作。10/10/202272epidata 软件使用(5)重复(Repeat)如果选择“Yes”(是),则前一条(6)数值标签(Value Labels)数值标签是一组数值加上对应的文字注释,可以解释每个数值代表的涵义。例如,创建一个性别变量,用1表示男性,2表示女性。如果设置了这个数值标签,在数据录入过程中,当你按F9,或数字键盘上的+时,程序会自动弹出一张表,告诉你1和2各自对应的涵义。10/10/202273epidata 软件使用(6)数值标签(Value Labels)数值标签是一组数值定义新标签 点击CHECK设置窗口中V
32、alue label旁边的“+“按钮,会弹出一个编辑标记(Edit valuelabels)的窗口。可以对变量数值添加标签 1 男 2 女。10/10/202274epidata 软件使用定义新标签 10/9/202274epidata 软件使用LABEL后面的标记_a3是根据变量名起的,也可以修改。数值“1”、“2”前面也可以不输入空格,如果标签的注释性文字中带有空格,需用引号括起来。编辑完毕后,可以按菜单上的“确定并关闭”(Accept and Close)按钮关闭编辑窗口。标签的名字会显示在Value label(数值标签)的下拉列表中。选择要编辑的数值标签的名字,单击数值标签右侧的“+
33、”按钮,编辑窗口弹出。修改后保存并关闭编辑窗口。10/10/202275epidata 软件使用LABEL后面的标记_a3是根据变量名起的,也可以修改。数值给变量指定已有的标签 选择相应的变量,从Value label(数值标签)旁的下拉列表中选择需要的标签。不同的变量可以共用相同的数值标签,不需重复定义。10/10/202276epidata 软件使用给变量指定已有的标签 选择相应的变量,从Value lab清除变量的数值标签,选择变量,从Value label的下拉列表中选择none,即可清除在该变量上设置的数值标签。10/10/202277epidata 软件使用清除变量的数值标签,选择
34、变量,从Value label的下使用预设的标签在安装EpiData时,同时会有一个数值标签库被保存在EpiData的程序文件夹下。该库的文件名叫EpiData.lbl。在设置不同的数据库时,可能会用到相同的数值标签。可以使用这些标签省去重复设置的麻烦。点击Value label旁的”+”下拉列表,可以看到库中保存的数值标签的名字,然后根据需要选择数值标签。默认安装的数值标签库(EpiData.lbl)中有3个标签,性别(sex)、年龄组(agegroups)、洲(continent)。选择标签名后,点击旁边的“+”进入编辑窗口,修改标签名,10/10/202278epidata 软件使用使用
35、预设的标签在安装EpiData时,同时会有一个数值标签7.3编辑当前变量的所有CHECK语句 单击CHECK设置窗口中的“编辑“(Edit)按钮,弹出编辑窗口,可直接编辑当前变量的所有CHECK语句,就像用编辑器编辑整个CHECK文件一样。如果当前变量没有设置CHECK命令,这时的编辑窗口中只会显示变量名(表示变量块开始)和END(表示变量块结束)。同时,可以编辑或添加新的命令。修改后按”取消“(Esc)按钮放弃修改。单击确定并关闭按钮(Acceptand close)保存修改 10/10/202279epidata 软件使用7.3编辑当前变量的所有CHECK语句 单击CHECK设置窗可以使用
36、“CHECK的文件结构”和“CHECK命令列表”,编辑复杂的CHECK命令。使用“数据录入质控“命令不能编辑除变量块以外的CHECK文件块(fileblock),要编辑需使用编辑器或其它字处理软件来编辑整个CHECK文件(*.chk)。保存核查程序时,程序会自动检查你编辑的CHECK命令。如果没有发现错误,编辑窗口会自动关闭。如果发现错误,编辑窗口会被分成两个窗口。上面的窗口显示CHECK命令,下面的窗口显示发现的错误,以及错误所在的行号。修改错误后保存即可。但程序对表达式和计算式不进行检错。10/10/202280epidata 软件使用可以使用“CHECK的文件结构”和“CHECK命令列表
37、”,编8 查找记录如果已知要寻找的记录号,可以从菜单GotoGoto Record或按Ctrl+G,在弹出的对话框中输入要寻找的记录号,即可转换到该条记录上。如果不知道记录号,也可以使用Goto菜单中的Find Record或按Ctrl+F,程序会自动弹出一个对话框。 10/10/202281epidata 软件使用8 查找记录如果已知要寻找的记录号,可以从菜单GotoGo10/10/202282epidata 软件使用10/9/202282epidata 软件使用程序默认在当前变量(即选择Find Record时正处于激活状态的那个变量)上进行搜索,也可以按F4选择其它变量。其中也包括那些不
38、能激活的变量,如IDNUM变量。搜索可以同时在最多输入10个不同的变量。可以设置的参数包括:等于(“=”可写、可不写)、不等于()、大于()、小于()、以此开始(abcd*)、以此结束(*abcd)、或包含(*abcd*)。另外,在设置“等于”条件时,建议条件的写法与设置好的变量类型保持一致。如搜索基本工资为300的职工,则应该写条件为“=300.00”,因设置结构中有两位小数。选项中可选是否区别大小写等。找到后如需继续查找可按F3或选择Find Again。按Esc或按Cancel可以终止搜索。10/10/202283epidata 软件使用程序默认在当前变量(即选择Find Record时
39、正处于激活9过滤记录(Filter)在数据录入过程中,可以限制记录的显示,操作步骤:设置滤过规则,把光标放在想要设置滤过功能的变量上。该变量必须是KEY或KEYUNIQUE变量。选择菜单上的过滤(Filter)定义过滤(Define Filter)键入滤过值。这时,只有符合条件的记录才被显示。解除滤过执行“选择”(Filter)去除过滤(Deactivate Filter),可以解除前面设置的滤过功能。10/10/202284epidata 软件使用9过滤记录(Filter)在数据录入过程中,可以限制记录的显10 .数据库的管理和维护10/10/202285epidata 软件使用10 .数据
40、库的管理和维护10/9/202285epidat10.1数据库的追加与合并(Append/Merge Data Files)该项功能可以将两个数据库合并建成另一个新的数据库。追加(append)是将两个数据结构完全一样或基本上一样的数据库连起来。如一个数据库两个人输入,每人输入100份,把数据合并到一起共200份,又称串联或端对端(end to end),是一种纵向追加记录。而合并(merge)是将两个结构不同、但是有1-3个相同变量(如,ID变量或key变量)的数据库合并。例如,一个数据库中录入的是病人基本情况结果,而另一个数据库中录入的是同一批患者的化验检查结果。两个数据库都含有一个相同的
41、信息即病历号。这样的两个数据库可以按病历号相同的原则合并到一起,这种合并是边对边(side-to-side),又称并联,是横向合并字段。10/10/202286epidata 软件使用10.1数据库的追加与合并(Append/Merge Dat10.1.1据库的追加(Append)(1)执行数据(Data)导入导出(In/Out)命令,选择菜单中选择”纵向追加记录/横向合并字段”(Append/Merge)命令,输入准备合并的两个数据库的文件名,单击确定打开对话框。10/10/202287epidata 软件使用10.1.1据库的追加(Append)(1)执行数据(Dat可以使用“CHECK的
42、文件结构”和“CHECK命令列表”,编辑复杂的CHECK命令。使用“数据录入质控“命令不能编辑除变量块以外的CHECK文件块(fileblock),要编辑需使用编辑器或其它字处理软件来编辑整个CHECK文件(*.chk)。保存核查程序时,程序会自动检查你编辑的CHECK命令。如果没有发现错误,编辑窗口会自动关闭。如果发现错误,编辑窗口会被分成两个窗口。上面的窗口显示CHECK命令,下面的窗口显示发现的错误,以及错误所在的行号。修改错误后保存即可。但程序对表达式和计算式不进行检错。10/10/202288epidata 软件使用可以使用“CHECK的文件结构”和“CHECK命令列表”,编10/1
43、0/202289epidata 软件使用10/9/202289epidata 软件使用(2)弹出的对话框中会显示两个数据库的情况。键入准备建立的新的数据库(包含两个数据库的内容)的文件名。追加的方式有两种:(1)在A的末记录后追加两者公用字段的记录,即有相同的变量。数据库B中的数据,只有与数据库A相同的变量才会被追加到新的数据库中,数据库A中没有的变量会被忽略。(2)在A的末记录后追加B中所有的字段和记录新的数据库中包括所有数据库A中的变量和数据库B中的变量。注意,这里数据库A被看作是“主”数据文件。如果数据库A和数据库B中含有相同名称的变量,则追加、新创建的数据库中对应的变量类型将以数据库A
44、中的为准。如果数据库A或数据库B有CHECK文件,追加/合并功能会将其引入新的合并后的数据库。使用者应该仔细检查和确认合并后的数据库的CHECK设置是否合适。10/10/202290epidata 软件使用(2)弹出的对话框中会显示两个数据库的情况。键入准备建立的新单击“追加”命令即可完成数据合并,追加程序执行完毕后,程序会显示新建的这个合并数据库的简要情况。这些内容同时会被添加到新建的合并数据库的数据录入备忘录文件(data entry notesfile)中。10/10/202291epidata 软件使用单击“追加”命令即可完成数据合并,追加程序执行完毕后,程序会10.1.2合并方式(M
45、erge)如选择了“合并”选项卡则打开对话框10/10/202292epidata 软件使用10.1.2合并方式(Merge)如选择了“合并”选项卡则打合并功能要求两个数据库都必须有一个或多个标识变量,以便匹配数据库A和数据库B中对应的记录。最多可以选择3个标识变量。标识变量不一定要设置为KEY或KEY UNIQUE,但是必须是在两个数据文件中都存在。选择Merge页,右侧显示了数据库A和数据库B共有的变量列表。如果没有共同的变量,合并将无法继续。从共有的变量列表中选择1-3个变量。这些标识变量在两个数据库中都必须是唯一的。10/10/202293epidata 软件使用合并功能要求两个数据库
46、都必须有一个或多个标识变量,以便匹配数合并的方式有两种:(1)在A的末字段后合并B的部分记录,只合并那些与A匹配字段值相同的记录。(2)合并来自B的所有字段和记录。这个操作可能会使很多变量出现缺失值,因为来自数据库B的一些记录,在数据库A中没有匹配的记录。如果数据库A或数据库B有CHECK文件,追加/合并功能会将其引入新的合并后的数据库。10/10/202294epidata 软件使用合并的方式有两种:(1)在A的末字段后合并B的部分记录,只合11 双录入核查(Double Entry and Validation)由于数据录入过程难免会出现错误,特别是当进行大批量数据录入时,因长时间录入会导
47、致错误率的上升。影响研究结果的可信性。因此,一项要求严格的研究都要求数据进行双录入,并进行核对。数据双录入并进行核对是避免数据录入最有效的方法之一。同一份问卷由不同的数据录入员录入两次,然后将这两个人录入的数据进行比较,如果两个人录入的数据完全一致,则我们认为该份问卷录入正确。如果对于一个变量,两个录入员录入的结果不同,则需要对原始数据进行核实。出现该问题有两种可能性:1)一个人录入正确,另一个人则错误;2)两个人都错误。这时就需要查原始问卷,进行判断,并进行修改,最大限度的排除错误。10/10/202295epidata 软件使用11 双录入核查(Double Entry and Vali应
48、该说明,经过数据双录入核对比较后的数据,除非两个不同的录入员同时出错,而且连错误都是完全一样的,出现这种情况的概率是非常小的。因此双录入有效降低了录入错误10/10/202296epidata 软件使用应该说明,经过数据双录入核对比较后的数据,除非两个不同的录入(1)准备双录入:在准备数据双录入过程中,可能需要复制数据库REC文件结构,使两个人输入的数据库REC文件结构一致,该功能可以通过“工具”菜单的“复制REC文件结构”选项完成,同时可以进行数据库结构拷贝选项设置,比如不包括字符型变量,因为字符型变量很少进行双录入。10/10/202297epidata 软件使用(1)准备双录入:在准备数
49、据双录入过程中,可能需要复制数据库数据双录入完成后,可以执行“数据处理菜单”菜单下的“一致性经验”选项进行数据比较核对,用户可以选择需要进行双录入核对的数据文件。在单击“确定”后,则出现如图3.161所示窗口。10/10/202298epidata 软件使用数据双录入完成后,可以执行“数据处理菜单”菜单下的“一致性经10/10/202299epidata 软件使用10/9/202299epidata 软件使用用户对双录入核对进行设置。具体的操作包括:(1)、选择匹配字段为了进行数据比较,必须至少指定一个关键字段。关键字段的作用是使两次录入的数据在比较时进行匹配。在下拉框中供选择的关键字段都是两个文件中同时存在的字段。如果不指定关键字段,则第一个文件和第二个文件按记录号进行比较。如第一个文件中的第一条记录和第二个文件中的第一条记录比较。但是这种比较方式只有在问卷录入顺序完全相同的情况下才有意义。10/10/2022100epidata 软件使用用户对双录入核对进行设置。具体的操作包括:(1)、选择匹配字(2)、选择项:不考虑已删除的记录(Ignore deleted records):在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度跨境金融服务合同
- 二零二五年度民间借贷合同范本样本含数据安全保护条款
- 二零二五版智慧社区房地产项目联合开发合作协议书
- 二零二五年度高校法制副校长选拔与聘用协议
- 二零二五年度房产租赁转售买卖三方合同范本
- 二零二五版酒店空调设备安装与能源管理总包合同
- 2025版环保技术公司股权激励与转让合同
- 2025版股权分割与继承合同范本2919
- 税法宣传课件
- 2025版高端人才代理兼职招聘服务协议
- 制药设备操作培训
- 空调维修工程管理制度
- 全国畜牧业发展“十五五”规划
- 新能源汽修管理制度
- 反兴奋剂知识试题及答案
- 员工压力与情绪管理培训课件
- GB/T 10250-2025船舶电气与电子设备电磁兼容性金属船体船舶
- 2025年人教版小学数学一年级上册期中考试题(带答案)
- 静脉输液不良反应及处理 课件
- 2025-2030中国红景天苷行业市场现状供需分析及投资评估规划分析研究报告
- 2024年矿井主要灾害事故防治及应急避险
评论
0/150
提交评论