




已阅读5页,还剩51页未读, 继续免费阅读
(计算机应用技术专业论文)面向专门文档的高速录入识别和管理系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 本文从企事业单位日常大量的专门文档处理工作的数字化出发,通过对几个 实际的数字影像系统项目的总结,提出了面向专门文档的高速录入识别和管理系 统的开发框架,把可以重复使用的软件功能模块和需要针对具体需求进行研发的 功能模块从逻辑上分开。主要给出了前者的分析、设计和实现以指导实际的系统 开发工作。 面向专门文档的高速录入识别和管理系统集成了高速扫描技术、o c r 光学智 能识别技术、海量存储技术、网络技术、数据库技术和i n t e r n e t 技术等,能迅速、 准确地将大量有价值的纸张信息数字化,提取关键的信息并有效地存储起来,方 便用户进行有效的查询与应用,推动各行各业信息化的进程。 本文参照软件工程文档的结构,给出了系统的需求分析、应用技术研究、软 件系统设计和软件系统实现细节的要点: 1 系统的需求分析部分给出了问题陈述、系统框图、系统约束、行业用户的 需求概览以及扫描子系统、信息加工,挖掘子系统、网络查询管理子系统、 数据库子系统的系统定义。 2 应用技术研究讨论了扫描图像获取技术、t w a i n 接口编程和一系列与系 统相关的数字图像处理方面的内容。 3 软件系统设计中,根据各个子系统的需求特点,采用不同的设计方法,开 发出各个子系统的设计模型。 4 最后针对本系统实现、实施中的具体阿题,探讨了一些实现、实施细节中 的要点。 从本文给出的系统框架出发,可以有效地减少重复的开发工作,从而将注意 力集中到可以提供更多附加价值的影像信息加i 挖掘功能的研发上和结合客户 已有的系统来实现客户的具体需求上。 关键字:文档;高速;扫描;管理:识剐;系统 a b s t r a c t a b s t r a c t t h i sp a p e rs t a r t sf r o mt h ed i g i t a l i z a t i o no ft h eg r e a td e a lo fs p e c i f i cd o c u m e n t s p r o c e s s e db yo r g a n i z a t i o n se v e r y d a y t h r o u g h t h es u m m a r i z a t i o no fs e v e r a lp r a c t i c a l d i g i t a li m a g i n gs y s t e mp r o j e c t s ,t h ef r a m e w o r k o f h i g h s p e e ds c a n n i n ga n d r e c o g n i z i n ga n dm a n a g e m e n ts y s t e m o ns p e c i f i cd o c u m e n t si sp r o p o s e d ,w h i c h s e p a r a t e sr e u s a b l es o f t w a r ef u n c t i o nm o d u l e sa n d c u s t o m i z a b l em o d u l e sl o g i c a l l y a n a l y s i s ,d e s i g na n di m p l e m e n t a t i o no f t h ef o r m e ro n ea r eg i v e ni no r d e rt og u i d et h e d e v e l o p m e n tp r a c t i c e h i g h s p e e ds c a n n i n ga n dr e c o g n i z i n ga n dm a n a g e m e n ts y s t e m o ns p e c i f i c d o c u m e n t si n t e g r a t e sh i g hs p e e ds c a n n i n gt e c h n o l o g y ,o p t i c a lc h a r a c t e rr e c o g n i t i o n t e c h n o l o g y ,u l t r al a r g ec a p a c i t ys t o r a g et e c h n o l o g y ,n e t w o r kt e c h n o l o g ya n d i n t e r n e t t e c h n o l o g ya n dt h u sb ea b l et od i g i t i z eg r e a td e a l o fv a l u a b l ep a p e ri n f o r m a t i o nf a s t a n da c c u r a t e l y ,e x t r a c ta n ds t o r et h ek e yi n f o r m a t i o ne f f e c t i v e l y ,m a k eq u e r ya n d u t i l i z a t i o nc o n v e n i e n ta n db o o s tt h ed i g i t i z a t i o np r o c e s so fo r g a n i z a t i o n s r e f e r r i n gt ot h es t r u c t u r eo fs o f t w a r ee n g i n e e r i n gd o c u m e n t t h i sp a p e rg i v e s s y s t e mr e q u i r e m e n ta n a l y s i s ,s t u d yo fa p p l i e dt e c h n o l o g y ,s o f t w a r es y s t e md e s i g n a n d t h em a i np o i n t si ns o f t w a r es y s t e mi m p l e m e n t a t i o n : 1 p r o b l e md e c l a r a t i o n ,s y s t e mb l o c kd i a g r a m ,s y s t e mc o n s t r a i n t s ,b r i e f r e q u i r e m e n t so f b u s i n e s sc l i e n t sa n ds y s t e md e f i n i t i o no fs c a ns u bs y s t e m , i n f o r m a t i o nd r o c e s s e x t r a c t i o ns u bs y s t e m ,n e t w o r kq u e r y m a n a g e m e n t s u b s y s t e ma n dd a t a b a s es u bs y s t e m 2 i nt h es t u d yo fa p p l i e dt e c h n o l o g ys c a n n e di m a g ea c q u i s i t i o nt e c h n o l o g y , t w a i ni n t e r f a c ep r o g r a m m i n ga n ds o m ec o n t e n ta b o u td i g i t a li m a g e p r o c e s s i n gr e l a t e dt ot h es y s t e ma r ed i s c u s s e d 3 i ns o f t w a r es y s t e md e s i g na c c o r d i n gt oc h a r a c t e r i s t i co f e a c hs u bs y s t e m , d i f f e r e n td e s i g nm e t h o d sa r ea d o p t e dt od e v e l o p t h ed e s i g nm o d e lo fe a c hs u b s y s t e m 4 f i n a l l y ,i s s u e si ns y s t e mi m p l e m e n t a t i o n a n do p e r a t i o na r ce x p l o r e da n d s o l u t i o nd e t a i l sa r eg i v e na c c o r d i n g l y s t a r t sf r o mt h ef r a m e w o r kp r e s e n t e di nt h i sp a p e r ,r e d u n d a n td e v e l o p m e n t c a nb e r e d u c e de f f e c t i v e l y a t t e n t i o nt h u sc a nb ef o c u s e do nt h ed e v e l o p m e n t o fm o r e v a l u a b l ef u n c t i o n ss u c ha si m a g ei n f o r m a t i o ne x t r a c t i o na n d t h es a t i s f a c t i o no fc l i e n t r e q u i r e m e n t s k e y w o r d s :d o c u m e n t ;h i g h - s p e e d ;s c a n ;m a n a g e m e n t ;r e c o g n i t i o n ;s y s t e m 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取 得的研究成果。除了文中特别加以标注弓 用的内容外,本论文不包含任何其 他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果 由本人承担。 作者签名:讯超日期:劲。q ,年6 月1 日 i 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅。本人授权华南理工大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本 学位论文。 保密口,在一年解密后适用本授权书。 本学位论文属于 不保密匦。 ( 请在以上相应方框内打“”) 作者签名:谛 超 导师签名 日期:2 0 0 4 - 年6 月f 日 日期:2 。d 午年6 月 日 第一章绪论 1 1 研究背景 第一章绪论 纸张,自其诞生之日起,就成为信息记载的主要媒体。即使在高度数字化的 今天,这种情况也并没有得到根本改变。据统计,约9 5 的信息量仍存在于纸张 上。然而,传统的纸张媒体信息存在着诸如保管困难,不便于共享、查阅及备份 等等诸多管理上的困扰,无法满足信息时代高速、高效的工作要求。 专门文档是纸张媒体的一种,是指大量的保存对于企事业单位具有重要意义 信息的纸质文档。它有两个特点:一是处理量大,专门文档是企事业单位在同常 工作中产生的大量与专项工作相关的文档;二是保存有重要信息,专门文档通常 保存有大量有意义的且有助于企事业单位决策的重要信息,所以在业务工作中就 带来了文档保存和查询等问题。 民航飞机票的管理就是专门文档的管理中一个很好的例子。根据有关规定, 飞机票要保存5 年以上( 国泰航空为7 年) ,有的航空公司考虑存放飞机票要占用 大量面积,园市区租金昂贵,为了节约另设存放库房。根据管理要求结算中心又 需要经常与飞机票库房联系查询,费人、费时、费力。使得查询愈发困难。所有 这些飞机票一旦丢失或损坏将会给航空公司带来无法弥补的损失,因此要动不少 脑筋妥善保存这些票据,防止纸张因受潮、发霉等自然因素而受到损坏,特别是 要注意防火。 此外,由于纸质票据查阅及传递速度慢,不能共享,查阅过程中易丢失或损 伤原件,所以要想在需要的时候从大量的票据中快速准确的查找到所需的并不容 易做到。想要异地查询,或是对票据中的数据所含信息进行深层次挖掘。更是不 可能实现。很显然,这样一种票据管理的现状远不能满足当今竞争激烈、面向世 界、加入w t o 时代的要求。 结果,大量票据变成了航空公司的一块心病,一个不得不背的包袱。而换个 角度来看,大量飞机票中所含的信息本应该是航空公司一笔宝贵的财富。关键在 于自动收集信息,并对信息进行深层次加工。当然首先是要求快速、高效地把纸 质票据电子化、数字化,解决票据的存储和检索的阿题,然后再对票据中所含的 各种信息迸行处理,和结算系统等结合起来,发挥进一步的作用,为领导决策提 供支持。 华南理工大学工学硕十学位论文 1 2 研究目的与意义 面向专门文档的高速录入识别和管理系统是几个相关项目的经验总结和技术 提升。本文提出通过分析、设计和实现一个系统框架来加快类似系统的开发速度 和进一步地扩展系统的功能。 面向专门文档的高速录入识别和管理系统集成了高速扫描技术、o c r 光学智 能识别技术、海量存储技术、网络技术、数据库技术和i n t e r n e t 技术等,能迅速、 准确地将大量有价值的纸张信息数字化,提取关键的信息并有效地存储起来,方 便用户进行有效的查询与应用,推动各行各业信息化的进程。 面向专门文档的高速录入识别和管理系统对客户的益处: 提高了客户服务质量:因为可以及时访问支持文档的信息; 提高了工作效率:因为工作人员可以把精力放在工作上而不需要考虑分发 工作任务或寻找信息; 加快了工作流程周期:因为系统消除了工作流程各步骤之间的时间延迟; 提高了效益:因为更高的工作流程速度可以转化成对商业机会的更快的响 应时间; 、 加强了对文档和工作流的控制能力:因为系统实现了更佳的专业化水平, 减少了风险; 减少或取消了占用空间:因为系统减少或取消了文档存放和管理的占用空 阳f 。 1 3 论文结构 本文参照软件工程文档中的分析、设计和实现来划分内容m ,除了第一章绪论 外,第二和第三章是属于软件系统分析的部分,其中第二章着重于需求分析,而 第三章着重于应用技术分析( 研究) ,第四章是软件系统设计,第五章是软件系 统实现。 第二章需求分析与系统定义 第二章需求分析与系统定义 2 1 行业应用需求分析 2 1 1 问题陈述 软件人员用于建立当今企业应用程序的工具和技术的能力在最近几年里呈现 出空前的增长:新的程序设计语言增加了抽象级别,提高了我们解决用户问题的 能力;面向对象方法的应用使得开发出的软件更加健壮,可扩展性也更好:各种 各样的工具,比如版本管理、需求管理、设计和分析、缺陷跟踪以及自动测试, 都极大地帮助了软件开放人员管理数以千计的需求及数十万行代码的复杂系统。 随着软件开放环境效率的提高,开放满足真正的商业需求的系统变得更容易 了,但是我们始终面临着真正理解和满足这些商业需求的能力的挑战。在未充分 理解所要解决问题的情况下提供的技术解决方案不可能很好地满足用户和其他风 险承担人的需要。 由于大多数的系统的开发是为了解决特定的问题,所以问题分析技术可以用 来确认我们真正理解了问题是什么。问题分析w 就是理解现实世界中的问题和用 户的需要,并提出解决方案来满足这些需求。问题分析的目标是在开始开发之前 对要解决的问题有一个更好的理解。 问题分析过程中首要的一步就是进行问题定义。而问题陈述就是把问题用标 准化的格式写下来,以期定义要解决的问题。从不同的风险承担人角度和用户角 度可以开发出不同的问题陈述。问题陈述的标准化格式包括四个要素:问题、影 响、结果和优点。问题要素中的内容是对问题的描述;影响要素中的内容是确定 受问题影响的风险承担人;结果要素中的内容是确定问题对风险承担人和商业活 动的影响;优点要素中的内容是指出解决方案并列出主要优点。 对于本系统的开发,可以从客户、用户、开发人员、研究人员的角度开发出 四个的问题陈述。 表2 1 从客户角度来陈述的河题 t a b l e2 一lc l i e n tp r o b l e md e c l a r a t i o n 问题缺乏高效率的电子内容( 专门文档的数字影像) 获取和管理系统 影响需要处理大量专门文档的公司,单位 其结果不得不以人工方式来处理大量的文档,效率低且人力成本高 华南理工大学工学硕士学位论文 优点面向专门文档的高速录入识别和管理系统将包括: 专门文档高质量数字影像的高速自动获取 数字影像的海量数据库储存 网络访问和管理 数字影像的内容挖掘 工作流效率的提升和总成本的降低 表2 - 2 从用户角度来陈述的问题 t a b l e2 - 2u s e rp r o b l e md e c l a r a t i o n 问题 现有的扫描软件功能单一,不能有效地处理和管理大量的专门文档 影响对大量专门文档进行扫描、管理和查询的最终用户 其结果 工作效率低,限制了对影像信息的利用程度 优点自动化处理和管理专门文档数字影像的系统应该是: 可以对文档影像进行校正 可以识别文档影像某区域中的信息 可以按要求储存大量文档影像 可以快速查询文档影像 表2 3 从开发人员角度来陈述的问题 t a b l e2 - 3d e v e l o p e rp r o b l e md e c l a r a t i o n 问题 缺乏个面向专门文档的数字影像获取和处理的系统框架 影响 信息系统项目中的开发人员 其结果 不同信息系统项目中数字影像处理、管理功能的重复开发 优点 面向专门文档的数字影像获取和处理的系统框架应该包括: 可复用的数字影像获取模块 可复用的数字影像处理模块 可复用的文档管理系统部件 第二章需求分析与系统定义 襄2 - 4 从研究人员角度来陈述的问题 t a b l e2 - 4r e s e a r c h e rp r o b l e md e c l a r a t i o n 问题 缺乏一致的数字图像处理接口 影响研究各种图像处理和图像识别算法的研究人员 其结果针对不同的数字图像处理接口开发重复的算法实现 优点一个便于功能改进和扩展的数字图像处理系统应该: 提供一致的数字图像处理接口 提供可复用的数字图像处理算法实现 2 1 2 带有确定参与者的系统框图 在完成了问题陈述( 定义问题) 并确定了用户和风险承担人之后,就可以开 始定义系统,解决己发现的问题了。在这个过渡阶段中,对问题的理解以及对潜 在解决方案的考虑是很重要的。 接下来重要的一步是确定解决方案系统的界限。系统的界限确定了解决方案 以及包围解决方案的现实世界之间的边界。换句话说,系统界限描述了包含系统 解决方案的包络线。信息以输入和输出的形式流入系统并由系统流向系统外的用 户。所有和系统的交互都是通过系统和外界的接口进行的。 换句话说,如果我们要建立或修改它,那它就是解决方案的一部分并处于系 统之中;如果不是,那它就是处于系统之外。因此,我们把世界分成两类我们关 心的事物: 1 )我们的系统。 2 )和我们的系统进行交互的事物。 我们可以简单地把“和我们的系统进行交互的事物”认为是“我们系统的参 与者”。因为它们在使系统完成其任务时扮演了某种角色。可以用一个简单的小 棍人图标表示参与者。参与者就是系统外与系统进行交互的某个人或某种事物。 在需求分析的过程中,系统工程可以帮助我们理解问题空间的需要以及加在 解决方案上的需求。在这一环境下,系统工程有助于我们理解加在运行在解决方 案系统中的任何软件应用上的需求。也就是说我们可以把系统工程用作一种问题 分析技术来帮助我们理解软件应用的需求。而系统工程准财的一个子集给出了一 个完成问题分析的过程,即不断地把复杂系统分解为简单系统的过程。 s 华南理工大学工学硕士学位论文 在这个过程中,一个复杂的问题即系统被分解为小的问题即子系统。对每一 个子系统都可以被解释和证明、成功地设计与制造、最后再集成为整个系统。支 持这一系统分解方法的系统原则蕴含在系统定义的属性中,如理解操作特性、可 制造性、可测试性等。 应用以上的分析原则,我们可以得出面向专门文档的高速录入识别和管理系 统的框图及其子系统的框图( 带有确定参与者) 。 基仪鑫罴 o 大 客户查询人员 图2 1 面向专门文档的高速录入识别和管理系统的框图及其子系统的框图 f i g2 - 1s y s t e mb l o c kd i a g r a m 2 1 3 加在解决方案上的约束 约束是对提出解决方案时我们拥有的自由度的限制。作为需求分析过程的一 部分,必须仔细考虑每条约束和不同的约束源:包括进度、投资收益、人员和设 备预算、环境问题、操作系统、数据库、主机和客户机系统、技术问题、机构内 的行政问题、已有的软件、公司总体战略和程序、工具和语言的选择、人员及其 他资源限制等等的众多考虑。同时,确定约束的原因也是有益的,一方面可以更 好地理解约束的前景,另一方面可以知道什么时候约束对解决方案不再适用。 下表列出了面向专门文档的高速录入识别和管理系统的约束、约束源以及理 由。 6 - 。,! 薹三兰重耋坌篓主至釜塞兰 : 表2 - 5 面向专门文档的高速录入识别和管理系统的约柬、约柬源以及理由 t a b l e2 - 5s y s t e mc o n s t r a i n t s ,s o u r c ea n dr e a s o n 约束源约束 理由 2 。1 4 行业用户需求概览 在进行了系统级的需求分析之后,下一步就是了解系统的具体功能需求。由 于各种行业客户处理的专门文档及其处理、管理方式的不同,建造一个能够满足 所有行业客户需求的系统是不可能的。然而研究的目的是给出一个系统的框架, 希望可以利用这个框架为一个行业客户更快、更好地建造个定制的专门文档的 高速录入识别和管理系统。以下是几个不同行业客户的需求概览。 国泰航空公司票据处理中心; 从k o d a kd s 2 5 0 0 高速单色扫描仪获取机票影像 对机票影像进行纠偏 获取的机票影像没有黑边 每分钟处理机票张数应在5 0 以上 每个机票影像占用的存储空间大小不超过5 0 k b 按处理的批组对机票影像进行分类和管理 国家安全局广州分局: 从k o d a k i 2 6 0 高速彩色扫描仪获取彩色文档影像( 每张文档正、反面两个 影像) 对每个彩色影像进行纠偏和去黑边 自动检测每张文档的背面影像是否没有填写内容以决定是否保存该影像 按照扫描时获取文档影像的顺序来自动编号以建立影像的索引 按照每个影像的索引与原有的数据库中相应的数据项匹配并保存影像到 内容数据库中 建立基于b s 架构的文档影像查询系统 华南理工人学工学硕士学位论文 上海航空公司: 从k o d a kd s 2 5 0 0 高速单色扫描仪和k o d a ki 2 6 0 高速彩色扫描仪获取机票 影像 对机票影像进行纠偏和去黑边 每分钟处理机票张数应在4 0 以上 只保存机票的灰度影像且每个机票影像占用的存储空间大小不超过5 0 k b 按处理的批组对机票影像进行分类和管理 识别每张机票的票联号、航空公司代号、机票顺序号和检查位 识别每张机票的舱位等级和票价 把机票影像和相应的识别结果保存到数据库中 建立基于b s 架构的机票影像查询系统 2 2 系统定义 分析了高层需求、划分了系统界限、确定了解决方案的约束、也了解了各个 行业用户的需求以后,详细的系统定义( 软件需求) 可以通过细化之前所收集的 系统特征和系统功能说明来获得m 。 面向专门文档的高速录入识别和管理系统的定义( 软件规格说明) : 2 2 1 扫描子系统 扫描子系统的用例图: - s 第二章需求分析与系统定义 p 十 入 高速扫描仪 酬2 2 扫描子系统用例图 f i g2 - 2u s ec a s cd i a g r a mo fs c a ns u bs y s t e m 扫描子系统的用例: 设置扫描仪 简明描述该用例描述了扫描处理员如何设置高速扫描仪的操作选项。 基本流程 1 扫描处理员选择设置扫描仪功能。 2 调用高速扫描仪的驱动程序以显示相应的操作选项设置对话框。 3 扫描处理员设置高速扫描仪的操作选项。 4 扫描处理员结束对扫描仪的设置。 替换事件流程无 前置条件已经连接高速扫描仪:已经装载高速扫描仪的驱动程序。 后置条件高速扫描仪的操作选项被设置( 修改) 。 扩展点无 扫描一批文档,票据 简明描述该用例描述了扫描处理员如何扫描一批文档,票据。 基本流程 1 扫描处理员选择批量扫描功能。 华南理t 大学工学硕士学位论文 2 调用高速扫描仪的驱动程序以激活扫描仪并开始获取扫描影像。 3 从扫描仪获取影像直至这一批文档,票据扫描完毕。 4 已经获取了全部的文档,票据影像,扫描仪返回到不激活状态。 替换事件流程扫描过程可能被中断( 扫描仪进纸出现问题或扫描处理 员中断扫描) 3 从扫描仪获取影像直至扫描过程被中断而且扫描仪返回到不激活 状态。 4 扫描处理员对扫描仪进行必要的调整以使扫描可以继续进行;或 者放弃本批扫描结果并重新开始( 结束本用例) 。 5 扫描处理员选择批量扫描功能。 6 调用高速扫描仪的驱动程序以激活扫描仪并开始获取扫描影像。 7 从扫描仪获取影像直至这一批文档,票据扫描完毕。 8 已经获取了全部的文档,票据影像,扫描仪返回到不激活状态。 前置条件已经连接高速扫描仪;已经装载高速扫描仪的驱动程序。待 扫描的文档票据己准备就绪。 后置条件扫描获取了本批所有文档,票据的影像。 扩展点无 识别一批文档,票据影像 简明描述该用例描述了如何对一批文档,票据的影像进行识别。 基本流程 1 扫描处理员选择批量识别功能。 2 调用信息加工,挖掘子系统对每个影像进行识别并得到识别结果。 3 显示所有文档,票据影像相应的识别结果。 4 扫描处理员验证识别结果及对结果进行必要的编辑。 替换事件流程无 前置条件已经扫描获取了一批文档票据影像。 后置条件所有文档,票据的影像都得到相应的识别结果。 扩展点无 保存一批文档,票据影像 简明描述该用例描述了扫描处理员如何保存一批文档,票据的影像。 基本流程 1 扫描处理员选择保存影像功能。 2 保存本批扫描获取的所有影像及其相应的识别结果到本地的存储 设备中。 3 扫描处理员可以选择清空本批扫描获取的所有影像以准备进行下 1 0 - 第二章需求分析与系统定义 一批文档,票据的扫描。 替换事件流程无 前置条件已经扫描获取了一批文档,票据影像;所有文档,票据的影像 都得到相应的识别结果。 后置条件本批所有文档,票据的影像及其相应的识别结果都被保存到 本地的存储设备中。 扩展点无 删除一个文档,票据影像 简明描述该用例描述了扫描处理员如何删除一个文档票据影像。 基本流程 1 扫描处理员选择要删除的影像。 2 扫描处理员选择删除一个影像的功能。 3 被选择的文档票据影像被删除。 替换事件流程无 前置条件已经扫描获取了一批文档,票据影像。 后置条件一个文档,票据影像被处理员删除。 扩展点无 2 2 2 信息加工,挖掘子系统 信息加工,挖掘子系统的主要参与者是研究人员,他们的任务是研究并开发各 种图像处理、识别算法以最终满足客户在信息加工,挖掘方面的专门需求。在本系 统框架之中,并不包括各种具体算法的设计和实现,这是因为不同客户的需求是 不一样的,这些部分也就成为了针对客户进行具体定制的内容之一。 保存影像文件是使用j p e g 格式压缩,从t w a i n 接口获取影像数据是通过 d i b 格式传递,显示影像又要转换成d d b 格式;可见如果图像处理是直接在具 体的图像数据格式上进行时,就会因为要为不同的存储格式开发相应的算法而带 来大量的重复工作,并且给维护和扩展带来极大的困难。 为了提供一个一致的二维数字图像处理接口,在信息加工,挖掘子系统中,通 过提供一个数字图像处理的核心类i m a g e m a t r i x 及它的派生类g r e y s c a l e m a t r i x 和 r g b m a t r i x 来满足图像处理算法研究和开发人员的需求以及隔离各种具体的图像 文件保存格式对算法设计的影响。下面的类关系图表达了这种需求的定义: 华南理t 大学工学硕士学位论文 具体 数字 各种 幽2 3 图像处理类关系图 f i g2 - 3r e l a t i o n s h i po fi m a g ep r o c e s s i n gc l a s s e s i m a g e m a t r i x 类封装了数字图像处理中对于数字图像最常用的操作以及图像数 据本身,它的派生类是针对各种具体的数字图像类型,如基于灰度像素点的图像 和基于r g b 像素点的图像。如果有算法处理的需求,同样也可以派生出基于 y c b c r 像素点的图像。下面的u m l 类图描述了i m a g e m a r t i x 类的公开接口( 属 性及方法) 以作为本子系统的需求定义之一: k n a g e m a t r i x w i d t h :i n t h e i g h t :i n t i m a g e m a t r i x 0 【i m a g e m a t r i x ( w :j r 惶,h :i n t ) il m a g e m a t r i x ( i m :i m a g e m a t 峨l lg e t p i x e l ( x :i n i ,y :l 嗍:p i x e l t y p e s e t p i x e l ( x :i n t ,y :i n t ,p i x :p l ! x e r r y p e ) :谢d 图2 - 4l m a g e m a t r i x 类的公开接口 f i g2 - 4p u b l i ci n t e r f a c eo fl m a g e m a t r i xc l a s s 1 2 第二章需求分析与系统定义 2 2 3 网络查询,管理子系统 网络查询管理子系统的用例图 吴 数据库管 0 t 客户查询人员 图2 - 5 网络查询管理子系统的用例剖 f i g2 - 5u s e c a s ed i a g r a mo fn e t w o r kq u e r y m a n a g e m e n ts u bs y s t e m 网络查询,管理子系统的用例: 登录 简明描述该用例描述了用户( 包括数据库管理员和客户,查询人员) 如何登录到系统。 基本流程 1 用户选择登录功能。 2 用户输入帐号和密码。 3 如果输入的帐号和密码正确,用户登录到系统并获得相应的系统 使用权限。否则跳到2 。 替换事件流程无 前置条件用户未登录到系统。 后置条件用户登录到系统并获得相应的系统使用权限。 扩展点无 1 1 华南理t 大学工学硕士学位论文 = = 日= = _ - l l _ _ 日i _ _ e l $ 口自i l _ _ e _ 4 l - - i i _ | _ l $ 目_ i _ - _ _ 日_ 自l _ _ i i _ - _ _ _ l _ _ l _ - i - l 一 注销 简明描述该用例描述了已经登录的用户如何从系统注销。 基本流程 1 用户选择注销功能。 2 用户从系统注销。 替换事件流程无 前置条件用户已经登录到系统。 后置条件用户从系统注销。 扩展点无 与数据库管理员相关的用例: 增加查询用户 简明描述该用例描述了数据库管理员如何增加查询用户。 基本流程 1 数据库管理员选择增加查询用户的功能。 2 数据库管理员输入新增查询用户的信息并设定其权限。 替换事件流程无 前置条件数据库管理员已经登录到系统。 后置条件系统新增个查询用户。 扩展点无 删除查询用户 简明描述该用例描述了数据库管理员如何删除查询用户。 基本流程 1 数据库管理员选择删除查询用户的功能。 2 数掘库管理员从已有的查询用户中选择将要删除的用户并删除 之。 替换事件流程无 前置条件数据库管理员已经登录到系统;系统中已有一个或以上的查 询用户。 后置条件一个查询用户从系统中删除。 扩展点无 修改查询用户 简明描述该用例描述了数据库管理员如何修改一个查询用户。 基本流程 1 ,数据库管理员选择修改查询用户的功能。 t 4 - 第二章需求分析与系统定义 _ _ l _ _ _ _ _ e e e e l 自_ _ l l 目e l j _ l _ l _ _ _ - _ - 2 数据库管理员从已有的查询用户中选择一个将要修改的用户。 3 数据库管理员修改用户的信息或权限。 替换事件流程无 前置条件数据库管理员已经登录到系统:系统中已有个或以上的查 询用户。 后置条件一个查询用户的信息或权限被修改。 扩展点无 与客户,查询人员相关的用例: 查询影像记录 简明描述该用例描述了客户,查询人员如何查询影像记录。 基本流程 1 客户查询人员选择查询影像记录的功能。 2 客户,查询人员输入查询条件。 3 客户查询人员得到符合查询条件的所有影像记录。 替换事件流程无 前置条件客户,查询人员己经登录到系统。 后置条件无 扩展点无 修改记录数据 简踢描述该用例描述了客户,查询人员如何修改记录数据。 基本流程 1 客户查询人员查询影像记录。 2 客户查询人员从查询得到的影像记录中选择要修改的记录。 3 客户查询人员选择修改记录数据的功能。 4 客户查询人员修改记录中的数据项。 替换事件流程无 前置条件客户,查询人员已经登录到系统;客户查询人员具有修改记 录数据的权限。 后置条件记录数据被修改。 扩展点基本流程中的l 可扩展为用例“查询影像记录” 删除影像记录 简明描述该用例描述了客户,查询人员如何删除影像记录。 基本流程 1 客户查询人员查询影像记录。 t s 华南理工大学工学硕士学位论文 2 客户查询人员从查询得到的影像记录中选择要删除的记录。 3 客户,查询人员选择删除影像记录的功能。 4 影像记录被删除。 。 替换事件流程无 前置条件客户,查询人员已经登录到系统;客户,查询人员具有删除影 像记录的权限。 后置条件影像记录被删除。 扩展点基本流程中的1 可扩展为用例“查询影像记录” 2 2 4 数据库子系统 数据库子系统的需求定义有两部分:一部分是关于影像数据记录在数据库中 的数据关系和结构,也就是数据库的表结构;一部分则是与影像数据上传功能有 关的需求。影像数据的上传指的是把扫描处理员操作的计算机上获取的影像及其 加工( 识别) 后的数据通过高速局域网传递存储到数据库服务器中相应的数据表 里,因为客户要求所有的影像数据必须集中存储以便于查询,同时也要求系统可 以支持一台以上的扫描处理设备。 不同客户处理的影像数据是不同的,所以数据库的表结构部分的需求也是要 针对专门客户进行具体的定制。上传功能的需求虽然也会因为数据表结构的改变 而需要相应的变动,但是上传的处理过程是一致的。以下就是数据库子系统中上 传功能的需求定义( 处理过程) 。 第二章需求分析与系统定义 开始上传 图2 - 6 数据库子系统中上传功能的处理过程 f i g2 - 6p r o c e s so fd a t au p l o a df u n c t i o ni nd a t a b a s es u bs y s t e m 冲突发生在本地影像数据的主索弓 ( 主键) 与数据库中某个影像数据记录的 主索引( 主键) 相同的时候,解决冲突的四种方式定义如下: 修改本地影像数据的主索引,然后上传本地影像数据 修改数据库影像数据记录的主索弓f ,然后上传本地影像数据 放弃本地影像数据的上传 删除数据库影像数据记录,然后上传本地影像数据 1 7 华南理工大学工学硕士学位论文 第三章应用技术研究 3 1 扫描图像获取技术 2 0 世纪以来,信息技术一同千里,计算机技术渗透到日常生活和工作的各个 领域。一方面,办公电子自动化广泛的应用于各种事务处理,极大的提高了工作 效率;另一方面,在相当长的一段时间内较大数量的纸质文档仍然普遍存在。打 印机、扫描仪、传真机以及数码相机的出现,再附以日益增多的图象处理软件, 为电子文档和纸质文档之间的方便转换架起了桥梁。然而,随着各种数码产品日 益增多,性能不断改善:应用程序开发者面临着一个令人沮丧的现实:一旦为某 一特定的图像设备编写了支撑软件后,他们必须不断的对软件进行升级以适应该 图像设备新的功能和属性。而且各种设备的软件较难重用反过来也阻碍了硬件设 备的推广。因此,图像获取设备开发商和应用软件开发商都迫切的希望能够制定 一个统一的接口标准来实现数码产品和应用程序问的通信。当今世乔上主要有2 种此类的标准:t w a i n 工作组制定的开放性标准t w a i n ;以及p i x e l t r a n s l a t i o n i n c 公司制定的i s i s ( a n i m a g ea n d s c a n n e r i n t e r f a c es p e c i f i c a t i o n ) 标准,它是美 国工业标准a n s i a i i mm s 6 1 1 9 9 6 的基础。 t w a i n 和i s i s 标准都是描述扫描仪驱动程序和应用程序的相互通信、相互作 用的,它们有许多共同点,包括同扫描仪通信的方式、从驱动器获取数据的方式, 还可以通过编程改变驱动器的属性而不调用驱动程序的用户界面等等。但是它们 在下列几个方面还是有区别的: 1 t w a i n 使用复杂的消息流协议把控制权从应用程序交给可执行的扫描 仪驱程,要求应用程序每个窗口的消息循环都要根据处理t w a i n 消息 的需要而改变。i s i s 则直接使用a p i 调用把控制权从应用程序交给扫描 仪驱程的动态连接库。 2 t w a i n 包括了一系列的状态和状态间的转换;而i s i s 事实上是无状态 的,它由一系列的功能模组构成,各模组被链合成管道以实现具体的图 像功能。图像数据以8 k b 的小包形式沿着i s i s 管道在各模组之间顺序 处理,因此极少需要在内存中缓存整个图像数据。 3 t w a i n 着重于对图形用户接口的控制,而i s i s 则专注于通过多种可选 的用户接口对设备进行程序上的控制。 4 t w a i n 经历了多个升级版本,因此必要时需要对应用程序进行重建; 相对而言,i s i s 的兼容性和a p i 的稳定性更好。 1 8 - 第三章应用技术研究 3 2t w a i n 接口编程 3 2 1t w a i n 简介 t w a i n 工作组成立于1 9 9 0 年,是由a l d u s 、c a e r e 、k o d a k 、h p 、l o g i t e c h 、 a d o b e 、h o w t e k 和s o f t w a r e a r c h i t e c h s 八家国际知名公司发起成立的。它是专门 研究并实施图像扫描仪软件接口的非盈利性组织,由它推出的扫描仪接口标准, 就称为t w a i n 标准。现在市场上绝大部分出售的扫描仪都符合该标准,目前的 t w a i n 标准版本号为1 9 。 t w a i n 标准描述了一种软件协议:一种用于图象识别硬件和图像应用程序之 间的应用编程接口。它的产生和发展是实际应用的需要。通过该接口,扫描仪能 很方便地被更多的程序所使用,而程序编制人员在编程过程中也无须考虑具体的 扫描仪型号。采用t w a i n 标准,对编程人员来说,可以编制出直接使用扫描仪 的软件;也无须为软件指定特定的扫描仪型号或为不同的扫描仪编制不同的程序; 编程人员还可在程序中直接设定扫描仪的相关参数。即可以在驱动程序级直接控 制扫描仪,能在编程上提供最大的灵活性和可控性,这也是本系统采用t w a i n 标 准的原因。 采用t w a i n 标准,对设备制造商来说,能大大增加与产品配套的软件数量, 硬件设备商只需为一种熟悉的硬件输入设备编写t w a i n 驱动程序就能使用于其 他设备,为产品的升级提供方便。而对扫描仪用户来说,这就使复杂的操作得到了 简化。因此用户也不必为了要扫描图像,而离开正在使用的软件去使用特定的扫 描软件。这种协议标准可以用于平板扫描仪,框架拾取仪( 用于和c c d 摄像机 的接口) 和图像数据库等等。 为实现应用软件和图像获得设备( 即扫描仪等) 之问的通讯,t w a i n 定义了 一套标准软件协议和应用程序接口( a p i ) ,主要包括三个部分:即应用软件( t h e a p p l i c a t i o ns o f t w a r e ) 、数据源管理软件( t h ed a t as o u r c em a n a g e rs o f t w a r e ) 和 数据源软件( t h ed a t as o u r c es o f t w a r e ) 。应用软件中必须含有使用t w a i n 的程 序段;数据源软件直接控制图像获得设备,它一般是由设备制造商提供的,现在 市场上出售的符合t w a i n 标准的设备基本都配有该类软件;数据源管理软件起 到管理应用软件,并与数据源软件间联系的作用。现在通常所指的d s m 是 t w a i n 3 2 d l l 。三者的关系如下图: 华南理工大学工学硕士学位论文 应用软件 数据源管理软件 数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国邮政2025庆阳市秋招社区团购运营岗位高频笔试题库含答案
- 石嘴山市烟草公司2025秋招品牌推广岗位高频笔试题库含答案
- 2025中国中检河南公司子公司总经理岗位招聘考试参考题库及答案解析
- 职称计算机模拟题库含答案详解(模拟题)
- 赣州市中心血站2025年劳务派遣制工作人员招聘考试参考题库及答案解析
- 2025广东茂名滨海新区渔港服务中心招聘项目管理人员1人考试参考题库及答案解析
- 2024自考专业(金融)通关题库【典型题】附答案详解
- 2025上海市大数据中心招聘15人考试参考题库及答案解析
- 颈椎影像解读课件
- 2025河南新乡市世青实验学校招聘宿管老师考试参考题库及答案解析
- 档案分类和保管期限表
- ISO 15609-1 金属材料焊接工艺规程及评定-焊接工艺规范中文版
- 人居环境科学市公开课一等奖省赛课微课金奖课件
- 高级电工证考试题库电工考试题库
- 2023译林版新教材高中英语选择性必修第一册同步练习-Unit 1 Food matters
- 糖尿病足中医辩证治疗
- 脑膜瘤的护理诊断与护理措施
- 铝合金门窗安装流程
- T-ZJFS 010-2024 银行业金融机构转型贷款实施规范
- 高职应用语文教程(第二版)课件 1《老子》三章
- 药物临床试验突发事件应急预案
评论
0/150
提交评论