(仪器科学与技术专业论文)毕业生就业信息光电录入及管理系统研究与实现.pdf_第1页
(仪器科学与技术专业论文)毕业生就业信息光电录入及管理系统研究与实现.pdf_第2页
(仪器科学与技术专业论文)毕业生就业信息光电录入及管理系统研究与实现.pdf_第3页
(仪器科学与技术专业论文)毕业生就业信息光电录入及管理系统研究与实现.pdf_第4页
(仪器科学与技术专业论文)毕业生就业信息光电录入及管理系统研究与实现.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(仪器科学与技术专业论文)毕业生就业信息光电录入及管理系统研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆大学硕士学位论文 中文摘要 摘要 在高校毕业生就业过程中,需要对大量的信息进行分析和管理,采用计算机 管理,可以提高工作效率,节约运行成本,方便、快捷地完成高校毕业生就业信 息管理工作。 针对教育部对高校的就业工作要求,本文研究了高校毕业生就业信息采集及 管理流程,通过对高校毕业生就业工作及任务的需求分析,提出了采用先进的光 电录入技术和数据库管理等技术实现的毕业生就业信息管理系统的结构化设计方 法。对于大量的毕业生就业信息,利用o c r ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) 和 o m r ( o p t i c a l m a r kr e c o g n i t i o n ) 混合自动录入技术,辅以逻辑校验和入库校验技术 相结合,实现了快速准确的自动录入,解决了就业信息的录入难的瓶颈问题。通 过对毕业生就业信息管理工作的内容进行了的分析和研究,得出了系统的整体架 构,利用面向对象的编程技术和数据库技术,全面实现对录入数据的有效管理。 对系统的性能进行了测试,测试结果达到了设计要求。 实践证明:本系统有效地解决了毕业生就业信息管理的需求,提高了就业管 理工作效率。 关键词:毕业生信息录入管理 重庆大学硕士学位论文英文摘要 a b s t r a c t i nt h ep r o c e s so ft h ee m p l o y m e n to fc o l l e g eg r a d u a t e s ,i tn e e d st o a n a l y z ea n d m a n a g el a r g ea m o u n t so fi n f o r m a t i o n ,h o w e v e r , c o m p u t e rm a n a g e m e n tc a ne n h a n c et h e w o r k i n ge f f i c i e n c y , r e d u c et h er u n n i n gc o s t 嬲w e l la sc o m p l e t et h ee m p l o y m e n t i n f o r m a t i o nw o r kc o n v e n i e n t l ya n dq u i c k l y i nv i e w o fm i n i s t r yo fe d u c a t i o nt ou n i v e r s i t i e s e m p l o y m e n tw o r kr e q u i r e m e n t s , t h i sa r t i c l es t u d i e dc o l l e g eg r a d u a t e s j o bi n f o r m a t i o ng a t h e r i n ga n dm a n a g e m e n t p r o c e s s t h r o u g hc o l l e g eg r a d u a t e s e m p l o y m e n tw o r ka n dt a s ka n a l y s i s ,i tp u tf o r w a r d t h es t r u c t u r a l i z e dd e s i g nm e t h o do fg r a d u a t e s e m p l o y m e n ti n f o r m a t i o nm a n a g e m e n t s y s t e mb yu s i n go p t o e l e c t r o n i cr e c o r d i n gt e c h n o l o g ya n dd a t a b a s em a n a g e m e n t t e c h n o l o g y f a c e dw i lm a s s i v ee m p l o y m e n ti n f o r m a t i o n , i tr e a l i z e df a s ta n da c c u r a t e a u t o m a t i ci n p u ta n ds o l v e dt h eb o t t l e n e c ko f i n p u t t i n ge m p l o y m e n ti n f o r m a t i o nb yo c r ( o p t i c a l c h a r a c t e r r e c o g n i t i o n ) a n do m r ( o p t i c a lm a r kr e c o g n i t i o n ) m i x e d a u t o m a t i ci n p u tt e c h n o l o g ya s s i s t e dw i t ht h ec o m b i n a t i o no ft h ei o g i ca n ds t o r a g e v e r i f i c a t i o nt e c h n o l o g y i ta l s od r e wo u tas y s t e m a t i co v e r a l ls t r u c t u r et h r o u g ha n a l y z i n g a n dr e s e a r c h i n go nt h ec o n t e n to fg r a d u a t e s e m p l o y m e n ti n f o r m a t i o nm a n a g e m e n t w o r k b ya p p l y i n go b j e c t o r i e n t e dp r o g r a m m i n ga n d d a t a b a s e t e c h n o l o g y i t c o m p r e h e n s i v e l yr e a l i z e dt h ee f f e c t i v em a n a g e m e n to fd a t ai n p u t ,a n dt h et e s tr e s u l t so f t h es y s t e mp e r f o r mh a sm e tt h ed e s i g n i n gr e q u i r e m e n t s i th a sb e e np r o v e dt h a tt h i ss y s t e me f f i c i e n t l yf u l f i l l st h en e e d so fg r a d u a t e s e m p l o y m e n ti n f o r m a t i o nm a n a g e m e n ta n dh a si m p r o v e dt h ee m p l o y m e n tm a n a g e m e n t e f f i c i e n c y k e y w o r d s :g r a d u a t ei n f o r m a t i o ni n p u tm a n a g e m e n t 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重迭太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:重红兽签字日期:7 司年j 月罗一日 学位论文版权使用授权书 本学位论文作者完全了解重庞太堂有关保留、使用学位论文的 规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许 论文被查阅和借阅。本人授权重鏖太堂可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存、汇编学位论文。 保密() ,在年解密后适用本授权书。 本学位论文属于 不保密( v ) 。 ( 请只在上述一个括号内打“”) 学位论文作者签名:亘红互导师签名:浼j 习次 签字日期:7 v 7 年j 月多一e t 签字日期:砌7 年5 月弓pe t 重庆大学硕士学位论文1 绪论 1 绪论 1 1 概述 经济全球化社会信息化的浪潮不仅加快了人类社会历史发展的进程,而且日 益深刻地改变着人们的工作生活和思维方式,信息经济已成为世界经济发展的新 动力和新增长点,信息产业升级为发达国家的支柱产业,信息化成为当代国际竞 争的战略制高点。随着计算机技术发展,信息将越来越多的影响人们的生活、工 作和学习。以计算机技术为基础的现代管理方式逐渐形成,使得各种管理信息快 速地向数字化方向发展。面对这种挑战,如果缺乏相对完善的信息采集手段和数 字化管理方案不仅会造成管理工作与社会发展相脱节,而且各领域的信息化进程 必然会受到影响和制约。为了充分发挥数字化管理的价值,解决好信息的保存和 利用的问题,这就要求信息管理工作必须要采用新的技术和手段提高管理水平以 适应社会发展对信息管理的需要。 1 2 计算机管理已成为发展趋势 计算机应用已经渗透到日常工作的许多方面,人们已经认识到计算机管理 的重要性,已经或正准备投入高额资金,建立大规模的计算机管理信息系统( m i s ) 。 计算机管理信息系统采用先进的计算机技术、数据库技术,建立起一个信息集成、 资源共享、功能强大的管理的工作平台,结合工作的特点,对信息和流程进行明 确的、规范的全面管理,以提高各项工作的管理水平和工作效率。 1 3 信息时代的发展需要信息能够方便和快速采集和识别 网络通讯技术的迅速发展,使得获取信息的速度大为提高,但同时又出现一 个问题,信息仅仅是能够迅速地在网上传递是不够的,它还得及时地输入计算机 才能维持其时效性。 对于一般的文字信息,人们是通过键盘输入的,信息量小时采用键盘输入尚 能接受,但当数据需要大规模采集时,采用键盘就远远不能满足要求了,而且采 用键盘输入对录入人员的素质提出了相当的要求。尤其是随着计算机速度的不断 提高,键盘输入方式在大规模数据处理时工作非常繁重而且速度十分缓慢,与急 需进行的信息采集、分析处理产生突出矛盾,已成为实现信息化的瓶颈问题。如 何方便、快速的将文字信息送入计算机,已成为计算机研究的一个热门方向。为 此,人们创造了多种多样的信息进入计算机的采集方式,如手写录入、光电录入 等方式。配合这些录入方式,人们创造了各种各样的文字识别技术,对输入的字 重庆大学硕士学位论文1 绪论 符进行识别,达到对信息进行管理的目的。 字符识别根据识别对象的性质,又可分为印刷体识别和手写字符识别;印刷 体字符由于相对规范,比手写字符的识别的难度要小得多。常用的方法是对每一 个字符构建标准模板,以此模板为标准,识别时进行比较判别。对于英文手写体 而言,由于种类较少,常常采用逐个比较的方法,找出其中最为接近的字符作为 识别结果;而中文汉字数量太多,进行一一比较显然工作量很大,因而一般采用 树形判别器,逐步分类直到得到最后结果。印刷体的识别软件现在已相当普遍, 并且已经到达一定精度。如清华的尚书汉字识别系统等。 手写字符由于文字的变形多、模糊性大、书写风格因人而异,是识别难度最 大的。因此对字符特征的选取、提取方法也就提出了更高的要求。联机手写字符 由于同时提供了书写时的笔画顺序信息,其难度要相对低一些。英文虽然笔画少, 通常只需一两笔就可完成一个字符的书写,但由于其笔画变形很大,所以识别难 度较高;汉字由于普遍笔画较多、结构相对复杂,在联机识别时与英文相比反而 容易些,目前市场上已有该类软件销售,如汉王书写板、摩托罗拉的慧笔等。脱 机识别由于少了书写的笔画信息,难度更高,无论汉字或是英文在这方面的进展 都是缓慢,其精度和速度都远远未达到实用的阶段。 1 4 课题研究概述 本系统结合了重庆大学毕业生就业指导中心具体工作和实际需求,针对教育 部对高校的就业工作的要求而设计。 1 4 1 高校毕业生就业工作的发展状况 近年来,大学生面临的就业问题越来越多地成为社会关注的话题,高校毕业 生是国家宝贵的人才资源,其就业问题关系到国家经济发展、社会稳定和广大人 民群众切身利益,关系到高等教育的持续健康协调发展。 2 0 世纪9 0 年代以来,随着国家经济制度、人事制度的改革,高校毕业生就业 分配制度也相应改变,从国家包分配的计划模式转变成为双向选择的市场模式。 9 7 年以后全国高校开始扩招,高校毕业生数量从2 0 0 1 年的1 1 5 万猛增到2 0 0 6 年 的4 1 3 万;另一方面,随着我国加入w t o ,市场经济蓬勃发展,也给大学生提供 了越来越多的就业岗位。这些形势的发展都导致高校毕业生就业信息的流通量成 几何倍数增长。毕业生就业工作已日益成为跨部委、跨省市自治区、跨行业、政 策性强、时间紧、层次多、涉及面广、信息处理复杂的系统工程。 党和国家高度重视大学生就业工作,要求各高校切实落实“一把手”工程,即 党政一把手全面负责,坚持以就业为导向的办学理念,努力实现就业工作的全程化、 专业化、信息化、网络化的四化工作目标,使毕业生就业工作出现新的局面。 2 重庆大学硕士学位论文1 绪论 1 4 2 高校毕业生信息光电录入及管理系统的研制的重要性 高校是毕业生就业过程中的基础单位,教育部对各高校的就业工作提出了明 确的要求,各个高校负责汇总本学校的毕业生资源情况,上报学校所在的省、自 治区、直辖市毕业生就业主管部门,抄报学校上级主管部门;收集用人单位对本 校毕业生的需求信息;制定本校毕业生就业派遣建议计划并且上报毕业生就业主 管部门审批,最后按照批准的计划派遣毕业生;进行毕业生就业信息的汇总、统 计、分析工作。总之,对毕业生信息的规范管理是整个毕业生就业工作的核心, 对毕业生信息进行准确及时地录入、维护、上报、统计是毕业生就业管理工作的 主要工作。 高校扩招以后,各个学校的毕业生人数都增加了几倍,重庆大学每年的毕业 生人数就多达七千余人。由于毕业生人数众多,每个学生的就业信息涉及面广, 再加上日益增加的单位需求信息,就业信息录入和管理的工作任务相当繁重。重 庆大学原有的手工管理模式明显不能适应现代管理的需求,主要存在以下问题: 面对如此大规模的就业管理工作,手工操作显然远不能适应信息管理发展的需要。 原有管理采用简单的数据报表模式,不能实现对就业信息准确、及时、规范的管 理。另外,大量的毕业生信息只有以传统的手工方式采集,不仅浪费人力、物力, 而且因为手工工作量太大、速度慢、准确率低等缺点而制约着对就业信息进行准 确、及时、规范的管理,就业信息的传统的手工采集方式已经成为高效完成就业 管理工作的瓶颈。 上述存在的问题,迫切需要我们充分利用现代化管理手段,体现时代特色, 从而更快捷、更高效地进行毕业生就业管理工作。为此,我们开发设计了毕业生 信息光电录入及数据处理系统,成功地实现了就业信息的快速录入和就业信息的 规范管理。该系统的研制对高校就业管理工作的顺利开展具有非常重要的意义。 1 4 3 高校就业信息计算机录入及管理系统的研制方法 本系统首先解决了毕业生的大量信息的录入瓶颈问题,利用0 ( 2 r ( o p t i c a l c h a r a c t e rr e c o g n i t i o n ) 和o m r ( o p t i e a lm a r kr e c o g n i t i o n ) 字符识别技术,在整体 上实现了就业信息的快速采集;同时利用面向对象编程技术和现代数据库技术, 全面实现了对录入的数据的有效管理。 总之,本系统研究了高校毕业生就业信息光电录入及管理系统,通过对需求 任务的分析提出了总体设计方案,运用字符识别技术和现代数据库技术,圆满地 解决了毕业生就业信息录入及管理的需求,是一套设计合理、功能完善的毕业生 信息管理系统,在重庆大学毕业生就业指导中心得到了成功的应用。结果表明, 该系统大大地提高了工作效率,识别效果和系统的可维护性等方面优于同类系统。 重庆大学硕士学位论文1 绪论 1 5 本论文的组织 本论文的内容共分为以下六章来论述: 第一章是本文的绪论部分,主要介绍了高校就业信息管理的现状、发展情况, 毕业生就业管理系统研制的重要性和意义,以及研制方法。 第二章对高校就业信息管理工作的需求进行了分析,介绍了光电录入系统和 就业信息管理系统的功能,提出了解决问题的总体设计方案。 第三章详细介绍了光电录入系统的工作原理、功能、组成、设计方法,并对 录入流程进行了详细得分析,给出了设计所实现的功能。 第四章详细介绍了就业信息管理系统的工作原理、功能、组成,分析了数据 库的规划和设计方法即使用工具,并给出了设计所实现的功能。 第五章给出了系统的测试数据。 第六章全文工作总结。 4 重庆大学硕士学位论文 2 系统方案总体设计 2 系统方案总体设计 2 1 总体需求分析 2 1 1 高校毕业生就业管理工作简介 高校毕业生是国家宝贵的人才资源,其就业问题关系到国家经济发展、社会 稳定和广大人民群众切身利益,关系到高等教育的持续健康协调发展。毕业生就 业工作是一项政策性强、时间紧、层次多、涉及面广、信息处理复杂的系统工程。 高校是毕业生就业过程中的基础管理单位,生源信息的汇总、需求信息的收 集发布到就业计划的上报审核以及派遣报到证的管理,是贯穿每年度就业工作的 主要流程,对毕业生信息的规范管理是整个毕业生就业工作的核心。 2 1 2 高校毕业生就业管理的主要工作 生源信息的汇总:毕业生就业的最基础的工作就是要对毕业生基本情况的 信息进行收集管理,并且需要向上级主管部门上报生源数据。 需求信息的收集发布:需求信息来源于社会各行各业,从一定程度上反映 了社会对高校人才培养质量的认同,需求信息的广泛收集与发布也为毕业生顺利 择业提供了更加广阔的空间。 就业计划的制定与管理:毕业生就业计划是毕业生派遣的唯一依据,就业 计划的制定与管理是非常严肃的一项工作,要求每一位毕业生的就业计划绝对准 确无误。 就业信息的统计分析:高校毕业生就业统计工作是高校毕业生就业工作和 制度建设的重要内容。坚持以就业为导向的办学理念,科学客观地统计、测算和 分析高校毕业生就业状况,积极为高校学科专业结构调整、深化高等教育改革服 务,从而使高等教育走向健康发展轨道的生命线。 毕业生就业信息管理系统的功能必须满足高等院校毕业生就业管理部门所要 完成的各项毕业生就业管理工作。主要涉及到毕业生生源信息管理、单位需求信 息管理、就业计划信息管理、派遣报到证管理等方面。需要实现信息导入导出、 修改查询、统计分析、报表等诸多功能,完成所有毕业生就业信息的管理工作。 并且管理系统还应具备自定义系列功能,用以完成任意数据的管理工作、对系统 内部生源信息等基本数据库的自定义多维统计功能。 2 1 3 毕业生就业信息采集工作的具体需求 以重庆大学毕业生就业指导中心的业务工作为例,以前每年度的毕业生就业 工作具体的工作流程如下: 生源信息的汇总:各二级学院按要求报送毕业生名单,包括毕业生姓名、 重庆大学硕士学位论文2 系统方案总体设计 性别、学号、专业、家庭所在地、出生年月、政治面貌、学历、培养方式、定向 或委培单位名称、主修外语语种、外语级别、奖惩情况等信息,就业中心进行数 据采集,并打印交回各二级学院进行校对( 往往需要反复校对多次) 。最后汇总上 报教育部。 需求信息的收集发布:通过各种渠道收集需求信息,由就业中心统一进行 数据采集,最后向毕业生公布。 就业计划的制定与管理:毕业生与用人单位签定就业协议后,到就业中心 加盖学校公章,协议生效并作为毕业生派遣的依据。就业中心也同样需要进行数 据采集,每条就业计划包括毕业生生源信息以及单位名称、单位所在地、单位隶 属、单位性质等单位信息。最后生成就业建议计划,上报教育部审批并派遣毕业 生。 要实现毕业生就业信息管理计算机化,首先需要解决大量的毕业生生源信息、 毕业生需求信息、毕业生就业信息的录入需求,原有的处理方式工作量太大、速 度慢、准确率低等客观因素,不能准确、及时、规范地管理,为此,用户也迫切 需要一套毕业生就业信息管理系统和快捷、准确、高效地完成大量信息录入工作 的设备,从而提高工作效率,确保就业信息的时效性。 2 2 总体设计方案 为了对高校毕业生就业信息进行严谨、科学的现代化管理,根据毕业生就业 信息管理的实际情况,设计了一套技术可行、功能完善、使用方便的高校毕业生 就业信息管理系统。 本系统主要由两部分组成,“毕业生就业信息光电录入系统”和“高校毕业生 就业信息管理系统”。两部分配套使用,解决毕业生就业管理工作中的数据录入问 题和信息管理问题。其总体结构框图如图2 1 所示 图2 1 总体系统结构框图 f i 9 2 1g e n e r a ls y s t e m a t i cs t r u c t u r a lf r a m e 6 重庆大学硕士学位论文 2 系统方案总体设计 2 2 1 系统主要特点 实用性: 系统针对毕业生就业管理的模式而开发,管理的主要信息、处理流程、统计 分析报表的内容形式,以至界面、操作都充分结合学校的具体情况设计,实用性 强。采用光电录入识别系统使采集过程复杂、计算机使用效率低、人工录入客观 因素大、准确率低的问题迎刃而解,确保了数据的一致性、安全性。毕业生就业 信息管理系统实现了信息导入导出、修改查询、统计分析、报表等诸多功能。高 效的信息处理、管理手段使就业信息的管理及时、准确。 安全性: 采用了硬盘镜像技术,保证了当一个硬盘破坏时,系统数据能被完好的保存。 使用磁带机能定期备份数据库,当数据库被破坏( 虽然这种情况很难发生) 时, 可以被恢复。在应用中,系统管理员可以增删用户,为用户设置登录口令及权限 ( 修改数据权和浏览数据权) ,防止与本系统无关的人员进入系统修改数据。 可靠性: 。 系统容错性强,采用o c r 加键盘补充录入方式,在录入数据时,o c r 采用 了多种技术手段,如表格数据逻辑关系校验、计算机代入库校验等,数据保存时 自动检查数据的合理性等。键盘补充录入多采用编辑屏蔽,防止无效的输入。 先进性: 1 ) 支持拖放的操作方式,操作简便,形象生动,趣味性强; 2 ) 功能强大的任意条件查询,但可以保存读取查询条件; 3 ) 使用存储过程数据源,充分利用计算机的性能,运行速度快; 4 ) 统计、查询时,系统自动提交,防止了统计查询时长时间销表。 可扩充性: 系统的代码开放,用户可根据实际需要增加删除某列下拉列表的内容,当这 些代码被修改时,系统自动修改库中的数据,是库中的内容与代码表中的代码一 致。 2 2 2 系统主要功能 系统的总体功能如图2 2 所示 7 重庆大学硕士学位论文 2 系统方案总体设计 图2 2 总体功能框图 f i g2 2g e n e r a lf u n c t i o n a lf l a m e 系统功能从总体上来说,要有数据录入功能,数据校验功能,数据的导入与 导出功能,数据查询和统计功能,完善的修改备份数据维护与管理功能,还要有 数据打印和便于使用的系统帮助功能。 2 2 3 系统设计思路 总体设计方案 整个系统的总体设计方案可由下图表示: 光电录入设备l 接口软一。蓑尝喜果, 程序 接口软佳 - - - - _ 1 逻辑校验 图2 3 系统结构框图 f i g2 3s y s t e m a t i cf u n c t i o n a lf r a l i l e 毕业生就业 信息管理系统 系统设计原则 硬件系统设计应考虑高可靠性、系统扩展升级的灵活性,可根据需要灵活、 方便地改变网络配置和工作任务。 软件设计应遵“循操作简单、功能完善、配置灵活、界面美观”的原则。 系统工作流程 系统工作流程及框图如下: 重庆大学硕士学位论文2 系统方案总体设计 图2 4 工作流程图 f i g2 4w o r kf l o wc h a r t 1 ) 将毕业生生源信息、就业计划信息和单位的信息编排为三张表格,毕业生生 源信息、就业计划信息由学生本人填写; 2 1 通过光电录入将表格图像扫描后输入计算机; 3 1 经识别后,提取出表格上填写的数据,存到临时数据库;最后,将每次录入 临时数据库的数据导入数据管理系统统一进行管理。 录入表格设计 该系统设计三种表格:毕业生基本情况登记卡、毕业生就业信息登记卡、毕 业生需求信息登记卡。“毕业生基本情况登记卡”和“毕业生就业信息登记卡”为 o m r ( 光学标记识别) 表格,而“毕业生需求信息登记卡”为o c r ( 光学字符识 别) 表格。o m r 表格分选择题和非选择题,非选择题按8 4 2 1 码添涂;o c r 直接 填代码或号码。 1 1 毕业生基本情况登记卡 该卡录入的信息有:学号、专业代码、家庭地址代码、出生年月日、政治面 貌、姓名、性别、学历、培养方式、入学年月日、定向或委培单位、主修外语语 种、外语级别和奖惩类别。 2 ) 毕业生就业信息登记卡 该卡录入的信息有:学号、单位隶属代码、单位所在地代码、单位性质、毕 业去向、单位名称、获取就业信息的主要渠道、签约时间段、签约单位与期望是 否符合、对学校工作是否满意。 3 ) 毕业生需求信息登记卡 该卡录入的信息有:单位代码、单位隶属、单位所在地代码、单位性质、经 济类型、邮政编码、需求年度、单位电话、单位电子邮箱及十个专业代码、学历 代码和人数。 系统配置及初始化: 在系统运行时,必须对系统进行配置和初始化操作,包括:软件注册,设置 学校代码,数据库配置及数据库引擎的连接,表格阅读机参数设置等。 表格学习: 第一次录入表格时,需要对表格进行学习,通过表格学习获得某张表格的各 项参数,如行数,列数,填写字符的位置,o m r 与o c r 识别区域,o m r 识别 9 重庆大学硕士学位论文2 系统方案总体设计 阈值等。此外,通过表格学习实现对表格图像的倾斜矫正、位置修正,以便根据 录入机的实际状态对图像进行调整,提供一个后续录入表格的模板。 数据录入: 这一阶段的任务是完成表格数据的提取。数据的表达有三种方式,对选择项, 采用o m r 识别学生将选择的一项或多项涂黑即可;数字和英文字母直接书写,利 用识别器进行识别;而手写汉字由于其识别精度还不能达到令人满意的效果,在 本系统中将汉字识别转化为相应的位码识别,区位码就是数字,所以同样利用识 别器进行识别。 数据校验 学生填写的数据可能出现各种各样的错误,在程序里应能保证这些错误能检 查出来并得到及时的改正。数据校验又分为逻辑校验和数据入库校验。逻辑校验 主要检查一些低级错误,如:单项选择不能多选或漏选,汉字区位码应在一定的 范围内,年月日的数据是否合理,代码是否完整等。数据入库的校验有两大作用, 一是保证代码的存在,否则后续管理将提取不出数据;二是检查学号的唯一与存 在,这是由于数据管理都是以学号来排序,查找和实现表间连接,作为数据表的 主键,这种校验是非常重要的。 1 1 逻辑校验 a 对于毕业生基本情况登记卡,主要进行下面几种判断: 8 4 2 1 码是否漏涂或大于9 ; 区位码是否能转化为汉字和规定的其他符号; 区位码的四个数字中是否出现空格; 数字字段中是否出现空格; 单项选择是否多选或漏选; 年月日数据是否合理。 b 对毕业生就业信息登记卡,主要进行下面几种判断: 8 4 2 1 码是否漏涂或大于9 ; 区位码是否能转化为汉字和规定和其他符号; 区位码的四个数字中是否出现空格; 数字字段中是否出现空格; 单项选择是否多选或漏选。 c 毕业生需求信息登记卡,主要进行下面几种判断: 对o c r 识别结果进行确认,不对的数字应手工修改; 表格信息是否完整; 字段间是否有空格或未识别的内容。 i o 重庆大学硕士学位论文 2 系统方案总体设计 2 ) 入库校验 整个系统涉及不少代码库,录入数据中有不少是代码,有必要校验这些代码 是否在代码库中存在。毕业生需求信息登记卡中的“单位代码”由“单位所在地 代码”前四位加“电话号码”( 不含电话区号) 组成。“学生基本情况库”从“毕 业生就业信息管理系统”中导出,而“毕业生就业信息管理系统”中学生基本情 况的数据来源于“毕业生基本情况登记卡”,由于“毕业生就业信息登记卡”录入 后将从“学生基本情况库”中提取数据并对该库的“学号”进行校验,所以应先 录入某一学生的“毕业生基本情况登记卡”再录入其“毕业生就业信息登记卡”。 a 毕业生基本情况登记卡,主要进行下面几种校验: 专业代码在“专业代码库”中是否存在; 单位所在地代码在“所在地代码库”中是否存在。 b 毕业生就业信息登记卡,主要进行下面几种校验: 就业信息卡上学生的信息在“学生基本情况库”中是否存在; 在本库中学号是否重复; 单位隶属代码在“单位隶属代码库”中是否存在; 单位所在地代码在“所在地代码库”中是否存在。 c 毕业生需求信息登记卡,主要进行下面几种校验: 单位代码在“单位代码库”中是否存在: 单位所在地代码在“所在地代码库”中是否存在; 单位性质在“单位性质库”中是否存在; 经济类型在“经济类型库”中是否存在; 专业代码在“专业代码库”中是否存在; 学历代码在“学历代码库”中是否存在。 数据管理 这部分功能很多,主要有:临时数据库的导入,数据库中数据的导出,代码 的维护,数据的查询、添加、删除、排序和统计,数据表的连接,字段的选择, 以及报表打印,输出结果等等。 结果查询 使用d a t a b a s e d e s k t o p 或s q l e x p l o r e r ( 该软件附带工具) 能查询三种表格录 入的数据,并可以在此进行修改。另外,“毕业生需求信息登记卡”还提供图象查 询功能 2 2 4 系统设计方法 系统设计的发展已有很长的一段历史,大致可分为下面几个阶段:早期的设 计工作集中于开发模块程序所需要的准则;接着出现了自项向下逐步求精的软件 重庆大学硕士学位论文 2 系统方案总体设计 结构的方法;然后又出现了结构化程序设计的原则;现在又提出了把数据流或数 据结构翻译成设计定义的方法。在本课题中我们采用的是自顶向下逐步求精的设 计方法。 自顶向下设计是按层次把设计细分,是一种设计过程组织化,争取有效地、 高可靠地进行设计的方法。将设计过程分割成几个阶段在每个设计阶段都要明确 区别该阶段的工作内容和目标,详细探讨不同程度的细节内容。各阶段的分析过 程是通过从上到下来研究,按阶段找出复杂问题,然后使其简化的过程。 将系统分成几个级别的层次,从上到下进行分析。每个级别的层次分别由动 作及特性已经规定好了的低位级别的基本要素的集合体构成。这些低位级别的要 素对本级别来说,都有明确所需的外部特性。然而,其内部动作很隐蔽其详细的 分析必须在下个阶段进行。将低位功能黑盒化,就可以防止由于详细级别表面化 而容易产生的混乱,使设计者的注意力真正集中到所需的地方。被分割开来的每 个构成单元也可以单独进行研究。对待这些组成部分也可以用同样的手法再一次 地细分为基本成分,然后进行分析重复这个过程,就可以使系统分出层次,明确 定义各组成部分的相互关系。 自顶向下的研究是从整个系统开始向细节推进的研究方法,设计人员可以从 概况到细节分阶段的整理自己的设计思想,这样就可以提高系统的可靠性和维护 效率。从这个意义上讲,自顶向下的设计对设计和理解系统是一种非常有效的方 法,已经成为系统设计中非常重要的研究方法。 在本课题中,从一开始就采用自顶向下的设计方法,并将该方法应用到系统 的软件和硬件的设计中去。 1 2 重庆大学硕士学位论文 3 光电录入系统的组成与实现 3 光电录入系统的组成与实现 光电录入系统是为了解决大量信息的快速录入问题而设计的,完成数据的采 集和对采集到的数据进行识别,并将识别的信息传输给管理系统用于管理。其主 要由两个部分构成:表格录入机和字符识别软件。表格录入机利用光电转换技术 来完成表格的扫描工作,获取表格的图像信息,字符识别软件则利用字符识别技 术完成把表格图像转换为相应字符的任务。 3 1 光电录入系统的组成 光电录入机通过接口电路与计算机相连,在计算机的控制和管理下完成录入 和识别任务,录入系统的硬件组成框图如图3 1 所示,由一台录入机和一台计算机 通过接口电路连接而构成。 f i 9 3 1i n p u ts y s t e m a t i ch a r d w a r ec o m p o n e n t sf r a m e 录入系统的软件主要有字符识别软件,完成识别。 3 2 光电录入系统的工作流程 毕业生就业信息录入的流程如图3 2 所示, 图3 2 录入流程框图 f i 9 3 2i n p u tf l o wf r a m e 重庆大学硕士学位论文3 光电录入系统的组成与实现 学生按照要求,将所需的信息填写在特制的表格中,交到管理中心进行统一 录入,所有数据输入计算机后存储并进行信息数据处理。 3 3 表格数据的设计 数据表格是录入系统的信息来源,其合理的设计直接影响到录入及识别的效 果。根据教育部对报表的要求,结合学校的实际情况,将学生和单位的录入数据 分别填写在三张表格上,以单位需求表为例,如图3 3 。表格均采用红色,目的是 在扫描录入时滤掉表格图像,仅留下定位标记和填写的有效数据。定位标记的作 用是确定每个字符或o m r 标记的填写区域,这样字符图像的分割就更加简单而准 确。 熏痨i 大擎2 # 薅霉簪娥警篱壤缓耪耪诞母:,豢滩霉攀颦萋鬃雾警l #8 营峨f 月。嘏“ 撵# g 黄誊砖 譬4 # 鲤三! 0 二童j 鎏。蓬魏凌薹露霆耄瑟鑫囊囊羔羹囊熏蘧囊盔熏雯囊玉 一羔赶毪 ” i 。一墨巍一警 艿否1 1 一薯牵葛褒f 絮薯1 l ; ;i ;n 门一 _ _ | 一,“1 l4 i 1 1 。! ”! 一 * 镕羲镕;毫蜓 霉 j 。盟璺一。一2 # ! # 一j 。k 一 美蓑耍蘩器罩霭囊蘩曩萎萄熟 疆蘸臻囊翟臻馥墨至 豢1 “ 0nq 。蝴 鞋 十 畦目鐾 盘嚣箍3 互3 罐囊要辽葵王 霎嚣霆器羹荽登瑟 3 翟t 嚣墨; ;+# # 目 # j 轴。 毒 一 # - 镕# 蒜_ 媾- 辫# 霸毳蝥蕊= 堕嚣疑 + 3 国羹五 琵要囊囊霆弱程鼋五l 翳蜀 , tt“b 7 “攀曼 # 摊q tti 震嚣菱互蘑t 鏖受季互羹正瑟嚣夔强霞跫壹臻 琶嚣。嚣孽j ,曼一蠼8 8 + 。# ; l-l 自4 ”“ 燮曼l 羔一 耍嚣 薹蓼考季虿l 孑l 毯塞! 二l = 登嚣! 0 羹j l 叠! 图3 3 需求信息卡 f i 9 3 3n e e di n f o r m a t i o nc a r d 3 4 光电录入系统的工作原理 光电录入系统由表格录入机和字符识别软件组成。录入机作为系统组成的一 部分,在表格录入中起着极为重要的作用。它首先将表格数据转化为计算机能够 处理的数字信号,再由系统的另一组成部分一识别软件对其进行识别,正确识 别出的信息就用于管理。下面就其工作原理作详细的介绍。 3 4 1 硬件组成及设计原理 系统的硬件由扫描仪、控制器、识别单元、图像接口板以及计算机等组成, 如图3 5 所示,其中扫描仪主要包括光学系统、c c d 传感器、信号处理器及输纸 机构等。 1 4 一 i l j * h # _ 重庆大学硕士学位论文 3 光电录入系统的组成与实现 图3 4 录入系统硬件组成 f i 9 3 4i n p u ts y s t e m a t i ch a r d w a r ec o m p o n e n t s 工作原理 当主机已经准备就绪,可以开始接收数据,就通过控制电路通知录入机开始 走纸。在录入时,输入的表格通过扫描仪的光学系统成像再c c d 图像传感器的光 敏面上,光路中设置了光缝和特殊开关的光栏,清除或减轻了照度不均匀对信号 的影响,提高成像质量。在控制器的作用下,c c d 图像传感器对文件横向扫描, 输纸机构使文件纵向运动,完成二维扫描。由c c d 送出的原始图像信号经过放大、 对消、采样、保持、浮动阀值、二值化等一系列处理,消除或减轻了纸张背景明 暗变化、光强变化、开关噪声、高低频干扰等对系统的影响,获得高质量的二值 化图像,经控制器控制。二值化图像信号以串行方式送入图像接口板,图像板对 图像信号进行压缩、存储,并在适当的时候将图像数据送至计算机。 整个录入系统的协调同步工作是由计算机通过控制电路来实现的,计算机完 成对系统的控制,要将图像接口板送来的信号进行分割、去噪、规一化等预处理, 还要完成数据逻辑校验、数据入库及校验等处理工作。走纸和接收是同步进行的, 图像接口板接收完一页数据后,通知主机前来收取数据,数据传递完成后再由主 机通知录入机进行下一步扫描。由于图像接口板和主机之间的数据传输速度非常 快( m s 数量级) ,所以虽然两页表格之间由于数据传递的关系,有一短暂的间隔, 但人的感觉是连续的。录入机走纸,图像板接收数据,主机处理上一页数据,三 种工作同时进行,加快了整个系统的速度。 硬件设计原理介绍 1 1 录入机的设计 录入机硬件主要包括输纸机构、光学系统、c c d 传感器、信号处理电路控制 重庆大学硕士学位论文 3 光电录入系统的组成与实现 器等,如图3 5 所示。 输纸机构的驱动电路必须要求输纸的平稳,输纸速度恒定,才能保证扫描质 量,选用步进电机来驱动录入机走纸。步进电机的驱动电路框图如图3 6 所示: 图3 5 步进电机的驱动电路框图 f i 9 3 5d r i v i n gc i r c u i tf r a m eo f s t e pm o t o r 作为图像信号的来源,图像传感器的正确选取与否现得尤为重要,线列图像 传感器能完成一维扫描,所以通过平移被扫描物或图像传感器来获得二维图像, 它的扫描速度相对较慢,但它的驱动电路、图像处理电路、及线光源的设计也相 对简单,要求另一维的运动平衡、适合于连续扫描,本系统中选用了线列的固体 图像传感器,采用的c c d 为2 0 4 8 位,驱动方式为两相驱动;采用机械走纸的方 式完成二维图像的扫描,走纸的同时在p c 机上进行上一页表格的校核以及数据的 存储,p c 上进行表格校核的时间和表格的填写质量有关,填写质量好的表格可一 次通过,一般的也只需3 4 秒,这和录入速度是匹配的。c c d 的驱动电路框图如 图3 7 所示。 图3 6c c d 的驱动电路框图 f i 9 3 6d r i v i n gc i r c u i t 佃m eo f c c d 1 6 重庆大学硕士学位论文3 光电录入系统的组成与实现 由于采用的固体图像传感器是c c d 线阵,就不能用点光源提供给c c d ,而光 源的合理设计与c c d 的成像质量有很大关系,系统使用若干发光二级管排成一排, 在其中央部分发出的光近拟于平面光,通过一条狭缝后,就得到我们所需的线光 源。背景颜色即为二极管所发出光线的颜色,因而表格上除了定位块以外都采用 红色印刷,待提取信息的颜色即为定位块和手写字符的颜色黑色。 录入机的光学系统如图3 8 所示; 表 格 图3 7 录入机的光学系统图 f i 9 3 7o p t i c a ls y s t e mc h a r to f i n p u tm a c h i n e 在信号处理电路设计中,为了提高器件的抗干扰能力,c c d 在输出图像信号 的同时,也输出用以补偿器件工作时产生的噪声的暗信号,将此二路信号差分后 可以减少器件噪声,以提高信噪比,因此加入了去噪电路。由c c d 送出的图像信 号是离散的电信号,c c d 在完成光电转换的同时也是将图像信号进行调制的过程, 因而设计了采样保持电路将图像信号进行解调,提高了信号的精度,抑制了开关 噪声及迟滞爬坡现象,减少了信号的失真。由于纸张的质量、印刷等原因,造成 表格纸张背景的不同,使得c c d 对于不同纸张输出的背景白电平是不同的;同时 由于大量走纸,造成纸屑掉在灯管上,造成光线变暗,因此,即使是对于同种纸 张,若处在不同的走纸位置,c c d 输出的纸张背景白电平也是有可能不同的。为 减少诸如此类的种种原因对图像质量造成的影响,还设计了白电平保持电路来使 不同情况下电路的白电平输出幅值保持相对稳定。采用浮动阈值电路,补偿由于 线阵c c d 传感器在制造过程中,由于材料、工艺等多方面的因素,造成的输出信 号的不均匀。 信号处理电路的运用,提高了图像质量,整个系统的拒识率明显的降低了。 整个电路运行的稳定可靠,非常有效的。 2 ) 计算机接口电路设计 二值化后的图像必须通过接口电路才能送入p c 机进行下一步的出路,因为这 块接口电路卡是传递图像数据的,所以我们又称它为图像接口卡。在大量表格需 重庆大学硕士学位论文 3 光电录入系统的组成与实现 要录入的情况下,系统的录入速度是非常重要的。为加快系统总体的数据处理速 度、提高录入机的利用率,我们要求图像接1 :3 卡能够连续接收数据。图像接1 3 卡 一次性接收完一页数据后,再次给p c :其组成框图如下: 图3 8 图像接口卡组成框图 f i 9 3 8c o m p o n e n t sf r a m eo f i m a g ei n t e r f a c ec a r d p c 可控制器控制录入机走纸、图像接口卡的c p u 复位。工作中,图像信号经 串并转换后变成并行数据,c p u 将其存入卡上的存储器,待一页表格接受完毕后 通知p c ,可以通过应答的方式完成图像卡到p c 的数据传递,数据传递完毕,p c 命令录入机继续走纸,开始下一页的扫描。由于图像卡与p c 的数据传递速度非常 快,所以仍然可以看作是连续走纸。 因此,由于图像卡和p c 之间是流水线的工作方式,p c 有了更多的时间来处 理自己的事务;同时由于图像卡的任务单一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论