




已阅读5页,还剩85页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学研究数据管理与统计分析 DATA MANAGEMENT &ANALYSIS,预防医学系 陈 燕,医学研究的数据管理与分析(第2版)目录,2,Dbase, FoxBase,Visual FoxPro,Lotus,数据录入和管理软件,3,EpiData软件概述,一、EpiData的设计 设计者:丹麦的Jens M、Michael Bruus和英国的Mark Myatt 编程者:丹麦的Michael Bruus 开发思路和原理:Epi Info 6.0 二、软件下载和登记注册 下载地址:http:/www.epidata.dk/ download.htm 三、版本信息 EpiData 1.5(2001年2月22日);EpiData 2.1a(2002年) EpiData 3.02(2004); EpiData 3.10(NOW) 四、安装和系统要求 可在Windows 95/98/NT/2000/XP版本操作系统下运行 3.02和3.10版直接安装中文程序即可。,4,Epidata软件分为两个模块,EpiData Entry用于数据录入与数据管理 EpiData Analysis用于基本的统计描述/分析与制图。,5,EpiData Entry,理论上,EpiData程序对录入的记录数没有限制。而实际应用中,记录数最好不要超过200,000300,000。 在设计录入界面时整个录入界面不能超过999行。 对数值或字符串编码进行解释的文字长度最多80 个字符。 编码长度最多为30 个字符。,6,EpiData Entry 的特点,调查表设计便捷 数据核查功能强大且实现简便 与调查表形式一致的可视数据录入界面 数据转换功能强大,7,EpiData Analysis的特点,EpiData Analysis 用于对EpiData Entry生成的数据文件进行初步整理和分析,如,描述性统计(Describe)、频数分析(Freq)、平均数分析(Means)、列联表分析(TablesEpiTables)、相关分析(Correlate)、回归分析(Regress)、秩和检验(kwallis)等。,可以绘制统计图形,如,散点图(Scatter diagram)、 线图 (Line graph)、 直方图 (Histogram)、直条图(Bar graph)、 箱式图(Box plot)、饼图 (Pie graph)等。,8,讲了半天, EpiData究竟长什么样?,9,请同学们打开电脑上EpiData主程序,为何我的电脑上没有欢迎使用EpiData?,10,EpiData软件的窗口介绍,11,编辑过程工具条,工具栏,数据表预览,粘贴,字段编辑器,编码编辑器,12,用EpiData软件进行数据录入和管理,将产生三种基本的文件; 每种文件具有固定的后缀,在数据录入和管理中发挥不同作用。 (1)调查表文件:后缀为.QES。通过建立调查表文件,系统根据特定规则自动定义数据文件的结构,包括变量名、变量类型和长度等,用于数据录入。 (2)数据文件:后缀为.REC。数据文件包含录入的数据信息以及已经定义好的编码,用于数据的统计分析。 (3)核对文件:后缀为.CHK。通过建立核对文件,系统将定义数据录入的有效性规则。,EpiData Entry 的文件组成,13,14,15,建立调查表文件,建立调查表文件是建立数据库、实现数据录入和管理的第一步。,16,调查表文件的建立,数据文件: 原始数据 文件结构(库结构) 字段名 字段类型 字段长度,调查表信息 数据文件(.qes),17,建立调查表文件有以下三种方法:,第一种:在菜单中,点击 “文件”(File)“生成调查表文件QES文件” 第二种:在工作栏的工作流程中,点击“1. 打开文件”(1.Define Data)“建立新QES文件” 第三种:在按钮栏中,点击 ,这时窗口中会在工作区显示一个空白的文档,你可以在此文档中键入调查表内容和框架,编辑完成后,将调查表文件保存,文件的扩展名统一为.QES。,18,假定现有一调查表如下,如何建立.QES文件?,调查表 姓名:_ 性别:(1)男 (2)女 身高:_._ CM 出生日期:_年_月_日,19,如果按原调查表格式直接建立数据库,结果会怎样?,20,必须定义字段名和字段类型,21,调用字段编辑器: 第一种方法:直接按CTRL-Q键。 第二种方法:在编辑器工具条上点击字段编辑器图标。,手工输入或使用字段编辑器,22,字段类型介绍,数值型字段:#,#.# ;仅接受数字和空格,不输按空格处理,分析时作缺失值处理,以“.”显示。数字位数由“#”个数决定,小数位数由小数点右边的“#”个数确定。最长可达14位,小数点按1个字符计算。,23,文本型字段:包括三种。一种是常用的文本(或下划线、或底线)型字段:_;该型字段由连续下划线来定义,长度由下划线字符个数决定,最大值为80,空白字段(字段内容空缺)时,数据管理时将按缺失值处理。另一种为大写文本型字段:。,24,日期型字段:包括两种。一种为常用日期字段:、,分美式、英式两种,输入时即进行合法性检验;只需输入日期,系统自动插入斜杠。另一种为自动日期型字段:、 ;储存或修改数据时该字段自动输入系统日期,如系统日期正确,也即当天日期。,25,自动ID号型字段:;这是一种专用字段,用作记录识别号,文件的第一个记录为1,以后记录自动赋值顺次较前增加1,并自动保证编号的唯一性。输入数据时光标跳过此字段。如需使第一个记录号大于1,则可在“文件”菜单“选择项”中的“高级设置”中设置。 逻辑型字段(即布尔函数型字段):;只接受Y、N、空格或回车键。后两者作缺失值处理。Y、N字符输入后即转为大写字母。,26,我们按照这些要求重新建立数据库,这次应该成功了吧?,先预览一下,27,怎么会这样?,28,定义字段名(Field Names),以调查表中字段的第一个词命名 (First word in question is field names) 使用 内的内容自动添加字段名(Automatic field names),29,定义字段名(Field Names),“文件”(File)“选项”(Option)“生成REC文件”(Create data file) 在“如何生成字段名”(How to generate field names)中选择字段的命名方式。,30,用输入字段左面的文本的第一个单词作为输入字段名。 如果这个单词超过8个字符就使用前8个字符作为字段名。 例如:v1 Enter age of patient # “v1”。 又如:Enter age of patient # “Enter” 如果一个字段名已被使用,再出现时会增加一个数字作为字段名。 例如:在一个调查表中有下列行: v1 Enter age of patient # “v1” v1 Height of patient # “v2”,以调查表的第一个词作为字段名,31,“更新问题为实际文件名”如果未勾选,32,预览显示的并非真实的字段名,如“姓名”, 真实的字段名是Field1,33,34,EpiData将根据字段的“问题”(即输入字段左面的文本)自动产生一个字段名,字段名是以英文字母(A-Z)开始,最长8个英文字符。其它国际字符将被跳过。字段名的产生从字段“问题”字母开始。,使用 的内容自动添加字段名,What did you do?_,35,在普通文本中优先选择“ ”括进的文本。如果问题是my firstfield?那末字段名将为MYFIELD;如果问题是“姓名name?”,产生的字段名为name。 通用常见单词不予考虑(即What? Who?If?etc.)。What did you do?产生的字段名为YOUDO。 如果字段前没有“问题”文本,字段名就取前一个字段名再加上一个数字。如果前一个字段名是dMY字段,那末下一个字段(如果没有“问题”文本)就是dMY1。如果前一个字段是dV31,则下一个字段名就是dV32。如果不存在前一个字段名则使用隐含字段名FIELD1。 如果第一个字符是数字则在第一个字符前插入一个字母N。例如 3 little mice?产生的字段名为N3LITTLE。,自动添加字段名基本规则,36,按 命名规则修改调查表,然后预览生成REC文件,37,别忘了修改“选项”,,否则会是这样的,38,制作调查表文件可用EpiData编辑器进行。 也可用Word或其它文本编辑器编写。注意,必须以纯文本格式存盘,文件后缀名必须是“.qes”。 也可在其它文本编辑器编写,再粘贴到EpiData编辑器窗口。,如何编写调查表文件,39,编写调查表文件注意事项(一),编写过程中及时保存文件,文件类型为.qes文件。 系统只会根据“特殊符号”来定义一个输入字段(包括类型和长度),并根据符号前的字符给字段命名。建议在编写过程中利用“字段快速清单”插入“特殊符号”,即:选择字段类型,定义好长度后,按“插入”图标,可避免由于“特殊符号”输入错误而不能产生有效的输入字段。 调查表用中文编写时,可用定界符(“”)将字段名定义为英文字符(英文字母或英文字母阿拉伯数字),有利于数据库的管理和其他软件的统计分析。注意:“”必须为半角型,而不能是全角型(“”)。,40,尽可能把字段定义数值型,有利于统计分析。如糖尿病史“dmhis”可定义为数值型字段,“1”表示“有”,“0”表示“无”。 调查表文件格式尽可能和原调查表一致,有利于直观录入数据。 如果用其他文本编辑器编写.qes文件,在运行EpiData后,打开该.qes文件即可编辑。 调查表文件的编写是否符合要求,可通过“数据表预览”来查看。,编写调查表文件注意事项(二),41,数据文件的产生和修改,主菜单选择数据导入/导出菜单“根据QES文件生成REC文件” 在工作过程工具条按第二个按钮“生成REC文件” 在编辑器菜单REC文件菜单选择“生成REC文件”,42,生成REC文件,43,44,请大家根据EPIDATA建立调查表库data.qes,生成数据库,保存为data.rec,45,调查表 姓名:_ 性别:(1)男 (2)女 身高:_._ CM 出生日期:_年_月_日,现在我们已经有了两个文件: *.QES 调查表文件 *.REC 数据文件 *.REC文件是根据QES文件生成的,用于数据录入,万一我的QES文件丢了怎么办?,46,数据文件结构的修改,47,调查表结构重新修改后怎么办?,数据库建立后又重新修改了调查表,可以根据修改后的QES文件更新REC文件。,48,我一边QQ聊天,一边录入数据,万一录错了,软件会通知我吗?,49,核对文件的建立,核对文件:检查文件、CHECK文件或 .CHK文件,范围/合法值(Range/Legal) 跳转(Jumps) 必须输入(MustEnter) 重复输入(Repeat),50,51,光标悬停,会提示你命令格式,52,录入错误时,软件会弹出警告,53,关键字段的定义,以编号code2为例,这个编号具有唯一性,为避免重复输入,可在CHK文件中定义: code2 KEY UNIQUE 1 MUSTENTER END,54,练习,请大家根据下列调查表内容,利用EPIDATA建立调查表数据库,保存为data1.qes,并生成data1.rec用于录入资料。,55,调查表 1.地区号: N J 2.调查表编号: 3. 录入ID号: 4.姓名:_ 5.性别:(1)男 (2)女 6.你吸烟吗? (1)否跳问7 (2)是 续问6.1 6.1 你多在年龄开始吸烟的? _ 岁 6.2 平均每天吸烟支数? _ 支 7.身高:_._ CM 8.血压值(收缩压/舒张压): _ /_mmHg 9.出生日期:_月_日_年 10. 你是否具有下列症状?如有请在相应症状前打勾。 咳嗽 咳痰 发热 胸痛 呼吸困难 咯血 11.调查表录入日期: _月_日_年,56,录入时自动编码,请大家根据data1.rec数据库,建立CHK文件,保存为data1.chk 要求: (1)地区号自动录入 (2)编号、姓名必须录入 (3)性别只能填1或2 (4)是否吸烟只能填1、2或9 (5)是否吸烟能够实现跳转 (6)平均每天吸烟支数的范围在1-40之间或填99 并请尝试录入35份调查表,存盘。,57,记录删除,此处仅是在记录加上删除标记, 彻底删除需至“工具”清理REC文件”,点击,58,如果研究对象是(1)男性,而我却录成了(2)女性,软件好象不会弹出警告嘛 !,59,双录入核对 double entry,为了确保录入质量,可以采用双人录入法进行核对。 首先利用工具-复制REC文件结构,复制已建立好的数据库(包括CHK文件),另存为一新库,但已录入的数据不会被复制。,60,双录入核对 double entry,如需要,可不复制字符型变量 因为家庭住址、工作单位等很少有人愿意录入两次。,61,两次录入的一致性检验,双轨录入完成后可进行一致检验 比较两次录入不同的地方 注意选择两数据库中的匹配字段用于比较,62,63,64,调查表录入两次,比较后发现错误再修改,好象太麻烦! 有没有边录入边比较的方法?,65,双录入实时校验,先点击工具-准备双录入实时校验,66,双录入实时校验,指定第1 次已录入的REC文件 创建1新的REC文件,用于双录入,67,双录入实时校验,68,应注意录入调查表的顺序,显示数据,69,浏览数据库,其它一些常用功能,打印调查表 (在数据录入窗体下)文件-打印数据表,70,将数据库存档,工具-创建压缩文件 可以将指定目录下所有文件、仅EPIDATA文件或单个文件压缩、打包和保存。(ZIP) 需要的时候再利用“工具-解压缩文件”解压缩,71,描述数据,72,简单描述和分析数据,数据文件的导出和导入,73,数据库的纵向追加与横向合并,74,数据库的纵向追加(头-尾),一般用于追加记录,如同学甲录了50份,同学乙录入了60份,现将两数据库合并成个库,共110份记录。,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天津市景点管理办法
- 木本料基金管理办法
- 新津投融资管理办法
- 水环境治理管理办法
- 卫生村长效管理办法
- 托幼儿机构管理办法
- 水库溢洪道管理办法
- 地铁风险源管理办法
- 地方贮备粮管理办法
- 政企通平台管理办法
- 新消费系列报告:解构“第五消费时代”-民生证券
- 收心启航+课件-2025-2026学年高三上学期开学主题班会
- 2025年混凝土搅拌站试验员资格考试试题及答案
- 装修公司与工人合同范本
- 工人入场安全教育考核试卷(答案)
- 百色辅警考试题及答案
- 电子仓库考试试题及答案
- 2025消防安全知识培训试题及答案
- ICU鼻饲护理小讲课
- 2025至2030中国厚膜电路陶瓷基板市场竞争态势与未来投资方向预测报告
- 茂名党校科研管理制度
评论
0/150
提交评论