




已阅读5页,还剩64页未读, 继续免费阅读
(计算机应用技术专业论文)电子阅读笔中的关键技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北工业大学硕士学位论文 摘要 摘要 随着大规模集成电路的快速发展,数字信号处理器( d s p ) 的各项性能得到了 很大的提升。基于图像处理的嵌入式系统也逐渐走向实用,但市场同时需要嵌入 式系统具有低功耗,小型化,易维护,易升级等特点。电子阅读笔主要实现文本 图像的扫描、识别、翻译和存储等功能。电子阅读笔定位为便携式消费类电子产 品,具有小型化、低功耗和低成本的特点。本文通过对电子阅读笔系统的研究, 探讨嵌入式图像处理系统在设计和实现中的关键技术。整个电子阅读笔系统是由 一个开发团队设计实现的。本人主要的工作集中在部分算法设计、硬件系统设计、 和部分的嵌入式软件开发。论文主要从电子阅读笔系统的算法设计、硬件设计、 软件设计三个方面展开讨论。 在算法设计的关键技术研究方面,本文讨论了如何在资源有限的环境下的设 计和实现图像处理算法。本文提出了采用中位宽度的汉字分割方法和改进直方图 投影的英文字符分割方法,在不降低分割准确率的前提下,有效地提高了分割速 度。在英文字符的特征提取方面,本文提出采用英文字符和数字的6 4 维k l 变 换系数作为分类特征。在分类器设计方面,本文采用r b f 神经网络的分类器对 英文字符和数字进行分类识别,大大提高了英文字符和数字的识别率。 在硬件设计的关键技术研究方面,本文结合电子阅读笔的硬件平台,探讨了 如何设计满足低功耗、小尺寸要求的嵌入式平台。本文同时设计了一种采用a a 电池供电的高效率稳压电源方案,大大延长了电子阅读笔的待机时间。 在软件设计的关键技术研究方面,本文针对电子阅读笔系统对自启动装载程 序的需求,设计了一个适合电子阅读笔系统的b o o t l o a d e r ,实现了电子阅读笔的 丌机自动装载。本文根据电子阅读笔系统本身具有大容量n a n df l a s h 的资源 特点,设计了一个适合于电子阅读笔的大容量n a j q df l a s h 文件系统。该文件 系统实现了对底层硬件的抽象,加快了嵌入式软件的开发,同时还方便了用户对 模板库和资源库的管理和更新。 关键词:电子阅读笔d s p 文字识别嵌入式系统低功耗电源系统b o o d o a d e r f a t 3 2 文件系统 西北工业大学顶士学位论文 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fv l s i ,t h ep e r f o r m a n c eo fd s p ( d i g i t a ls i g n a l p r o c e s s o r ) h a sb e e ni m p r o v e dg r e a t l yt h e r e f o r et h et i m e so fi m a g ep r o c e s s i n g b a s e de m b e d d e da p p l i c a t i o ni sc o m i n g h o w e v e r , t h em a r k e ta l s on e e ds u c hk i n d e m b e d d e ds y s t e m sh a v et h ec h a r a c t e r i s t i c so ft h el e s ss p a c ea n dp o w e rc o n s u m p t i o n a n dt h e a b i l i t yo fu p d a t i n g a n dm a i n t e n a n c e r e a d i n gp e ns y s t e mw a n t st o i m p l e m e n ts u c hf e a t u r e s :s c a n n i n gt h et e x td o c u m e n t ,r e c o g n i z ei t ,t r a n s l a t et h e m i n t od e s i r e dl a n g u a g ea n df i n a l l yr e s t o r e dt h e mi n t ot h ep e n o u rr e a d i n gp e ni sa i m t ot h em a r k e to ft h e p o r t a b l ec o n s u m i n ge l e c t r o n i c a l l yp r o d u c t s w i t ht h e c h a r a c t e r i s t i c so fc o s t ,s i z ea n dp o w e rc o n s u m p t i o ns a v i n g s i nt h i sp a p e r , w e d i s c u s s e dt h ek e yt e e h n o l o g i e si nt h ep r o c e s so fd e s i g na n di m p l e m e n tt h er e a d i n g p e n w ee x t e n do u rp a p e ri nt h ed i r e c t i o n so fa l g o r i t h md e s i g n ,h a r d w a r ed e s i g na n d s o f t w a r ed e s i g n i na l g o r i t h md e s i g n ,t h i sp a p e rd i s c u s s e dh o wt od e s i g ne f f e c t i v ei m a g ea l g o r i t h m s u n d e rt h ec o n d i t i o no fl i m i t e dh a r d w a r er e s o u r c ea n dh i g hq u a l i t yr e q u i r e m e n t s i n p a p e rt h em e d i u mw i d t hb a s e dc h i n e s ec h a r a c t e rs e g m e n t a t i o na l g o r i t h ma n d i m p r o v e dh i s t o g r a mb a s e de n g l i s hc h a r a c t e rs e g m e n t a t i o na l g o r i t h mh a v e b e e n p r o p o s e d t h e s ea l g o r i t h m si m p r o v e dt h es p e e do fs e g m e n t a t i o np r o c e s su n d e rk e e p t h es e g m e n t a t i o n sp r e c i s i o n i ne n g l i s hc h a r a c t e rf e a t u r eg e n e r a t i o np r o c e s s ,w e u s e d6 4d i m e n s i o nk lt r a n s f o n i lt o e 伍c i e n t sa sf e a t u r e so fc l a s s i f i c a t i o i l i n r e c o g n i t i o np r o c e s s ,w eu s e dr b fn e u r a ln e t w o r ka sac l a s s i f i e rt oc l a s s i f ye n g l i s h c h a r a c t e r sa n dd i g i t s i nr b fn e u r a ln e t w o r k ,6 4d i m e n s i o nf e a t u r e sa si n p u t r e a d i n gp e nt r a i n e dt h en e u r a ln e t w o r ko np ca n du s e di to nd s p ;t h ec l a s s i f i e rh a s a c h i e v e dh i g ha c c u r a c yi ne n g l i s ha n dd i g i t sr e c o g n i t i o n i nh a r d w a r ed e s i g n ,t h i sp a p e rb a s e do nt h er e a d i n gp e nh a r d w a r ed e s i g np r o c e s s , d i s c u s s e ds o m ek e yt e c h n o l o g i e si nh o wt oi m p l e m e n tt h ep o w e rs a v i n ga n ds m a l l s i z ef e a t u r e si ne m b e d d e ds y s t e m s a l s oi nt h ep a p e r , w ed e s i g n e da na ab a t t e r y s u p p l i e dh i g he f f i c i e n c ys t e p u pv o l t a g ep o w e r i tb r i n g st h er e a d i n gp e ni n t o p o r t a b l e i ns o f t w a r e d e s i g p w ed e s i g n e da b o o tl o a d e rf o rr e a d i n gp e nh a r d w a r ea n d i m p l e m e n t e dt h ef e a t u r eo fs e l f - l o a d i n g + i nt h i sp a p e r , w ea l s od e s i g n e daf i l es y s t e m f o rn a n df l a s h t h ef i l es y s t e mi m p l e m e n t e dt h eh i d ll e v e la b s t r a c to fh a r d w a r e f o re m b e d d e ds y s t e md e v e l o p m e n t t h ef i l es y s t e ma l s oi m p r o v e st h eu s a b i l i t yo f t h er e a d i n gp e n k e yw o r d s :r e a d i n gp e n ,d s p , o c r ,e m b e d d e ds y s t e m p o w e rs u p p l i e r , l o w p o w e rc o n s u m p t i o n ,b o o t l o a d e r , f a t 3 2 ,f i l es y s t e m 西北工业大学硕士学位论文 第一章、绪论 第一章、绪论 随着大规模集成电路的快速发展,数字信号处理器( d s p ) f f o 各项性能得到了 不断的提升。基于图像处理的嵌入式系统也逐渐走向实用。本文通过对电子阅 读笔软硬件方面的研究,探讨嵌入式图像处理系统在设计和实现中的关键技术。 1 1 选题的意义和研究目的 数字信号处理芯片( d i g i t a ls i g n a lp r o c e s s o r ,简称d s p ) 在2 0 多年之间得 到了飞速的发展。d s p 应用技术作为一门新兴的并且应用前景广泛的技术,在 许多专业领域起着关键的作用,尤其是在数字图象处理、语音处理和工业控制 等方面,d s p 应用技术发挥着不可替代的作用。近年来,以d s p 为核一t l , 器件, d s p 应用技术为核心技术的通用消费类电子产品越来越多,市场的发展促使 d s p 从单纯的理论研究过渡到产业化的进程,这一技术为社会创造了很多极具 价值的应用产品。d s p 技术已经成为计算机应用领域不可或缺的关键性技术。 因此,我们选择这一技术作为研究课题,以期能尽快掌握该技术的理论知识并 将其应用在实际工作中,较快地将数字图像处理、数字语音处理的科研成果硬 件化、产品化,推动科研项目的产业化速度,促成科学技术研究与产品经济运 作的良好结合。 本项课题来源于省科学技术研究发展计划项目:电子阅读笔的研制。在陕 西省科委的积极支持下,我们研发电子阅读笔产品,该产品给用户提供了一种 快速准确的中英文文件直接阅读工具,以对书面文件直接扫描的方式,实现中 英双向单词互译,解决在大量印刷品文献阅读中可能遇到的语言障碍。该系统 将可以实现自动扫入待翻译的单词图像,继而快速识别并输出翻译结果。整个 系统操作简单,识别率高,速度快,用户容易掌握,其识别翻译过程无需用户 干预。它将成为电子词典的强有力补充。 电子阅读笔研究目的如下:在硬件上构建一个基于d s p 技术的硬件实验系 统,并将其最终调试成功,达到预期的硬件要求。同时要求该硬件系统尽可能 得接近产品化。在软件部份,要求设计专门适合于d s p 系统的文字识别算法, 和管理程序,以期识别算法最终达到9 6 的i = : 别率。管理软件能够实现简单的 管理,使阅读笔系统尽可能地接近产品要求。本论文所承担的主要工作是针对 电子阅读笔中的几个关键技术问题进行深入的研究,并给出解决方案。 西北工业大学硕士学位论文第一豪、绪论 1 2 电子阅读笔项目介绍 1 2 1 项目介绍 随着国际间交流合作的不断增多,普通人接触到的外文文档越来越多。从 日常的使用说明书到专业论文很多都是用英文书写的。普通人直接阅读英文材 料存在着一些困难,市场需要一种简单易用的便携式电子设备帮助人们进行中 英文的识别和互译。现在市面上常见的该类产品包括电子词典和p d a 等。在陕 西省科委的积极支持下,我们开始研发电子阅读笔产品,该产品将给用户提供 一种低成本的中英文文件直接阅读工具,以对书面文件直接扫描的方式,实现 中英双向单词互译,解决在大量印刷品文献阅读中可能遇到的语言障碍。 1 2 2 研究现状 在硬件平台方面,在市场上比较流行的几种基于p d a 平台实现的嵌入式文 字识别环境如下 l 、w i z c o m e l o 】 代表性的产品是q u i c kd i c t i o n a r yi ip e n ,硬件上采用a r m 7 t d m i 处理器, 1 9 2 k b 的r a m 空间,4 m b 的r o m 空间。 软件上可以识别印刷体,并具有某些p d a 功能。它可以通过串口或红外接 口将数据传送给p c 。 2 、c p e n f l l j 代表性的产品是c p e n8 0 0 0 ,硬件上采用了7 2 m h z 处理器,6 m b f l a s h 和4 m 的r a m 空间,3 3 x 1 6 8 像素的l c d 显示屏。c p e n8 0 0 0 拥有较强的在 线处理器,在笔上完成数据处理,包括识别和翻译,还集成了如地址簿、字典 等p d a 功能。 3 、i r i sp e n u 柏 代表性的产品是i r 的s p e ni i ,它通过u s b 或并行电缆与p c 机相连,数 据主要在p c 机端处理。是一种在线的识别系统。 现有典型的扫译笔系统或者采用比较高级的a s i c 芯片将所有的处理功能 集成在一个芯片上,或者依赖于p c 机处理数据。前一种方案使得系统的升级 成本比较高,升级的难度也比较大。另外这种方案的系统功耗比较高,电池使 用时间短。后一种方案,无法实现便携式。 在参考文献f 2 1 中提到一种和p d a 交互的扫描笔的结构。他们将扫描笔定位 2 西北工业大学硕士学位论文 第一章、鳍论 于p d a 的功能扩展,主要完成图像数据的采集过程和一部分的图像预处理,在 p d a 一端完成图像的最终处理结果。 在硬件设计方面,采用d s p 芯片作为扫描笔的运算核心,用c p l d 作为扫 描笔的控制核心,加上其它的辅助模块构建了扫描笔的硬件平台,另外他们采 用目前流行的手机作为和扫描笔交互的p d a 设备。在软件的实现方面,主要 关于图像处理算法在p d a 的实现方案。 这种设计方案的缺点在于需要p d a 之类的支持和对本身硬件资源的利用 不够充分。因为在这种方案中具备了一个完整功能扫译笔所需要的所有硬件环 境,而没有必要把数据传到p d a 端进行处理,使得硬件资源没有得到充分的发 挥。 在软件平台方面由于提到的产品绝大部分是国外的产品,针对中文的处理 不是特别出色。在汉字的识别方面也仅能识别特定的字体和特定环境下的单个 字。这对那些科技文献阅读者和汉字,英文、数字符号混排的情况基本上无能 为力。现有文字识别领域,虽然文字识别方法有很多,大多也能取得了比较高 的识别率,但是一般都是基于p c 环境的,不需要考率太多的算法时间复杂度 和空间复杂度。但是对应适用于嵌入式平台的文字识别软件,不仅仅需要较高 的识别率,还需要考虑怎样缩短处理时间和减小存储空间。所以电子阅读笔系 统软件在核心算法,一方面兼顾各种字体的识别和中英文混排的情况,另一方 面还需要考虑嵌入式软件的特殊需求。使得软件能够在嵌入式平台上各种文字 环境下都能够达到较高的识别率。 1 3 本课题的研究内容 本文主要研究的内容是整个阅读笔软硬件平台实现过程中几个关键技术的 研究和解决。这些关键技术可以分为识别算法方面、硬件方面和软件方面。 在核心识别算法方面,影响识别率提高的主要因素有图像预处理、特征提 取和分类算法三个方丽。 图像的预处理主要包括图像的二值化和图像的分割。图像的二值化在光照 不是很均匀的情况下很难得到比较好的二值化结果。文字的分割,特别是英文 的分割是比较困难的情况。文字的特征提取部分,是整个识别算法的关键,是 分类的依据。因为文字的字体比较多,虽然是同一个字母的但是外形相差比较 大。现在使用文字的轮廓特征作为文字分类的特征,这个特征对汉字是适用的 但是对英文和数字不是特别适用。因此要采用更加适合的特征来提高分类器的 分类效果。在分类器的设计上,由于现在中英文都采用的距离分类器。为了提 1 翌! ! 三些查兰堡:兰兰壁垒兰 笙二茎:堕丝 高识别率。可以采用一些比较更好的分类器使得分类效果达到最好。 在硬件方面,现在困扰整个便携式设备开发领域的几个主要难题就是功耗 问题、体积问题、可升级问题。在硬件平台方颟,我们需要达到的这样的目的: 一方面,我们尽可能地降低电子阅读笔系统的功耗和减小系统的体积;另一方 面,通过设计一个高效率的电源方案使得便携式设备的电池可以使用更长的时 间。因此我们的研究方向也主要集中在这两个方向: 1 、降低系统功耗 在一般的便携设备中显示模块和核心处理模块是主要的能量消耗部件。对 于处理核一t l , 部分,我们准备采用低功耗的器件代替原有器件,使得尺寸进一步 减小,并且功耗进一步降低。另外在d s p 核心中运行的程序尽量减小对外围器 件的访问次数和适当的休眠机制使得处理核一t l , 仅仅在需要处理数据的时候进入 运行模式。 对于显示模块,现有的液晶显示模块占整个系统功耗的几乎三分之二强, 对系统降低功耗极为关键。一方面我们采用低功耗的液晶模块,一方面我么可 以设计对应的程序使得液晶模块对电源进行适当的管理降低功耗。 其他的外设也会影响系统的功耗,我们也采用适当的芯片替代来降低系统 的功耗。 2 、提高电源效率 在电子阅读笔系统中,液晶显示屏的工作电压是5 v ,d s p 的工作电压是 3 3 v 和1 8 v 。用7 号电池供电就必须需要升压芯片。如果直接使用常见的7 8 0 5 方案进行d c - - d c 的升压,那么在电路诉常工作的情况下,会造成3 0 5 0 的能量损耗。为此我们需要一套离效率的电源方案,该电源能在极低电压下都 能正常工作,可以负载较大工作电流,转换效率达到9 0 以上。这样系统就可 以通过该电源方案,直接用两节普通的7 号电池供电,实现便携式。 在软件方面,电子阅读笔系统需要实现加电自启动功能和解决对字典库的 管理和识别库升级的问题。需要设计合适的软件帮组用户对特定字典进行选择 和对字库内文字的增加和删除。 电子阅读笔系统本身具有大容量n a n df l a s h 存储空间。该芯片为识别 库和字典库,提供了充足的空间。但是由于大容量n a n df l a s h 本身具有的 特点,需要一套程序对n a n df l a s h 的坏块进行管理。另外当用户升级时, 用户是无法直接访问f l a s h 硬件的,必须需要设计一套与p c 机系统相兼容的 文件系统对f l a s h 进行管理。即我们需要设计一个与常见p c 机兼容的基于 n a n df l a s h 的文件系统。 西北工业大学硕士学位论文 第一章、绪论 1 4 本文的主要工作 本文针对电子阅读笔系统软硬件设计过程中的关键问题,对目前广泛采用 的一些算法和方案进行认真的学 - j , 1 1 总结。在阅读了大量的相关文献和代码的 基础上,对各种现有算法和方案进行对比分析。我们针对实际的问题,设计了 一些算法、软硬件方案,构建了一个电子阅读笔的产品原型,为今后的应用研 究和产品开发奠定一定的基础。 本文的主要工作和创新点有: i 、本文针对图像预处理的算法进行了研究。并对中文和英文字符的分割算 法进行了改进。提出了一种基于中位宽度的汉字分割算法和改进直方图投影的 英文字符分割算法。在不降低分割效果的情况下,有效提高了分割的速度。 2 、本文对英文和数字字符的特征提取和分类识别进行了研究。对英文和数 字字符提取6 4 维的k l 变换系数作为分类特征,采用r b f 神经网络作为分类 器。取得了较高的识别率。 3 、本文针对电路系统的低功耗和小型化进行了研究。利用高密度焊球阵列 ( b g a ) 芯片作为核心器件,4 层p c b 板为载体,采用高密度布局、布线搭建了 一个低功耗小尺寸的硬件系统。 4 、本文对针对高效率的电源方案作了大量调研和实验。最终采用s t 公司 的l 6 9 2 0 d 这款芯片为变换芯片,设计了针对于阅读笔的高效率电源方案。该 方案实现直接利用两节7 号电池供电,提供1 a 负载,电池转换效率达到9 2 。 5 、本文针对d s p 系统自举程序进行了研究。设计了一个针对于电子阅读 笔系统的自举系统。使得电子阅读笔可以脱离仿真器环境直接运行。 6 、本文对n a n df l a s h 的特点和f a t 3 2 文件系统进行了深入的研究。 设计了一个针对大容量n a n df l a s h 的f a t 3 2 文件系统。使得d s p 透明地管 理n a n df l a s h 的存储空间。另外用户也可以方便地通过p c 机更新字典库 和识别库。 1 5 本文组织结构 本文的主要内容分为六章,安排如下: 第一章介绍了电子阅读笔的项目背景和研究现状,指出了本文所要研究的 主要内容。 第二章介绍了电子阅读笔的系统设计方案。对系统的软硬件和工作原理进 行一个简单的介绍。 西北工业大学硕士学位论义第一章、绪论 第三章介绍电子阅读笔的算法设计中的关键技术。包括图像分割,特征提 取和分类识别。对其中的关键问题进行必要的分析,并提出相应的解决方案。 第四章介绍了电子阅读笔的硬件设计中的关键技术。主要包括d s p 型号选 择,低功耗设计、小尺寸设计和电源方案的设计。 第五章介绍了电子阅读笔的软件设计中的关键技术。主要包括d s pb o o t l o a d e r 的设计和基于n a n df l a s h 文件系统的设计。 第六章是全文的总结与展望。 1 5 本章小结 本章作为全文的绪论部分,对d s p 技术的应用和电子阅读笔的项目情况做 了简单介绍,提出以d s p 处理器为核心实现电子阅读笔硬件系统的设计方案, 并确定了本课题的研究目的和研究内容。 西北工业犬学硕j 荨位论文第一章、电子阅读笔系统设计 第二章电子阅读笔系统设计 电子阅读笔系统,在硬件方面,主要由数字信号处理器,镜头与感光元器件、 大容量存储器、控制器、液晶显示屏、电源、壳体、测速机构等组成。在软件方 面由在d s p 上的光电扫描、文字识别、数据库管理、显示、管理等软件和在p c 机上的通讯控制软件组成。 电子阅读笔系统作为一个实用的嵌入式电子系统,在系统设计的过程中需要 综合考虑到电子阅读笔的成本、生产、调试、使用等方方面面的因素,尽可能在 各个方面之间取得一个平衡。 本章我们概要地介绍一下系统的软硬件设计方案。电子阅读笔硬件设计中的 关键技术在第四章中进行详细讨论,电子阅读笔软件设计中的关键技术在第五章 进行详细讨论。 2 1 系统总体设计的目标 电子阅读笔作为一个面向便携式电子消费品的产品原型,在设计过程中尽可 能考虑到市场对系统的要求。特别是在硬件系统方面,系统对成本比较敏感,因 此在系统设计的过程中尽可能在成本和性能之间达到一个平衡,最终达到在实现 功能的前提下最大限度压缩电子阅读笔的成本。 电子阅读笔系统总体设计的目标是:在硬件上,设计成一个小尺寸,低功耗, 待机时间长且易于携带的系统:在功能上,达到较高的识别率,快速的响应时间 和准确的中英文互译。在软件上,达到操作方便,易于更新维护。外形上,美观 大方,耐用结实。尽可能地接近市场对主流便携式电子产品的要求。 2 2 系统的架构和工作原理 针对电子阅读笔总体设计的目标,整个系统可以被划分为硬件系统和软件系 统 2 5 , 2 6 , 2 7 1 两大部分。 硬件系统可以根据功能的不同,划分为不同的功能模块进行设计。硬件系统 主要划分为d s p 核心处理模块,图像采集模块,液晶显示模块、存储管理模块, u i 交互模块和p c 通讯模块。各个硬件模块均以d s p 处理模块为核心模块( 参见 图2 1o 软件系统部分可以分为d s p 的控制、管理和文字识别两个子系统模块。 其中的d s p 控制和管理是硬件系统与软件算法系统的桥梁,起着对硬件的控制 和对软件的调度作用。 西北工业大学硕士学位论文 第二章、电子阅读笔系统设计 i 一0 1 j 警型! ! j 图2 1 电子阅读笔系统结构图 d s p 的控制和管理模块由字典库的快速检索模块,d s p 与p c 机的通讯模块, u s b 接口的驱动模块【2 “,d s pb o o t l o a d e r ,模块和存储管理模块等构成。其中 字典库的快速检索模块,d s p 与p c 机之间的通讯模块和u s b 的接口驱动程序 模块在参考文献f 2 “中已经实现,只需要通过简单的移植,就可以在这一版的电 子阅读笔上实现。而d s pb o o t l o a d e r 模块和存储管理模块是针对新的需求新增加 的。文字识别软件主要是实现从对采集图像的处理,到文字分割,文字识别和翻 译完成嵌入式o c r 系统的作用。文字识别算法根据文字识别的流程可以划分 为,图像预处理模块,行切分模块,字符切分模块,特征提取模块、分类识别模 块和后处理模块。 j 恭麓釜 、簸誊。; 长蔫。! j *骞强趁删呸1 - 烈删幅t 卜,? :宅揎剐j 图2 2 电子阅读笔的工作原理 电子阅读笔的工作原理如上图所示:当用户通过任务开关进行中英或英中翻 译的工作模式。用扫描头逐行扫过中文或英文句子,摄像器件把采集得到的转换 成数字图像,并送入图像存储器中。d s p 对输入图像进行预处理、文字识别、翻 译和后处理,最后,通过液晶显示器显示翻译结果。当用户选择了任务开关中的 记录按钮时,系统仅执行文字扫描输入、数字化、压缩编码和存储的操作。 西北工业大学硕士学位论文 第二章、电子阅读笔系统设计 2 3 硬件系统 硬件系统为电子阅读笔的功能需求提供一种可靠的物理实现。电子阅读笔的 硬件系统主要划分为d s p 核心处理模块,图像采集模块,液晶显示模块、存储 管理模块,u i 交互模块和与p c 通讯模块。电子阅读笔样机和各部件如下图( 图 2 3 ) 所示。 图2 3 电子阅读笔样机图a 整机图b 核心电路版图c 打开上盖样机图 电子阅读笔各模块功能介绍如下: 1 、d s p 核心处理模块:该模块以t m s 3 2 0 v c 5 4 系列d s p 为核心,主要完 成图像采集及处理、图像识剐算法、字库管理、字库查询和存储管理等功能。 2 、图像采集子模块:该系统以线阵c c d 件为图像采集器,摄像器件与d s p 相连,使用同步信号作为d s p 的中断信号,通过中断处理来实现图像的采集功 能。 3 、液晶显示模块:该模块采用低功耗高亮度液晶显示屏为显示器件,通过 d s p 总线来实现对它的控制。 4 、存储管理模块:该模块采用大容量n a n df l a s h 为固态存储器件,低 功耗s r a m 为动态存储器件。实现字典库、模式库的存储程序快速运行等功能。 5 、u i 交互模块:采用小型按键实现和用户的操作进行交互。 6 、p c 通讯模块:同时使用并口和u s b 口与p c 进行通汛。 我们为样机专门设计了两套外壳,图2 3 为其中的一套。这一套是通过c a d 设计后用快速成型法制作的。一方面满足实验的要求,另一方面为大规模生产奠 定基础。电子阅读笔的核心电路板是一个四层板,布线密度非常高。在电路板的 9 西北工业大学硕士学位论文 第二章、电子阅读笔系统设计 两侧同时放着些器件。图中是液晶板的背侧,主要放着s r a m 、d s p 和大容 量f l a s h 芯片。 图2 4 电子阅读笔硬件模块之间的关系图 d s p 核心处理器是整个系统的处理中心,它通过c p l d 地址译码,实现对 核一t l , 电路其他部分电路的控制。d s p 通过响应按键接口k e y 的中断来实现对控 制按键的连接和通讯,猷便响应控制按键对应的操作。摄像测速模块主要由光学 镜头和测速滚轮构成,将纸面上的图像传到核心电路的感光器件中,核心处理器 d s p 通过摄像测速模块接口c a m e r a 实现对摄像测速模块的连接和通讯,以便 从该模块获取图像信息和钡4 速信恩。显示模块采用标准的液晶图像显示屏模块, 核心处理器d s p 通过液晶显示模块接口l c d 实现对液晶显示模块的连接和通 讯,将输出的英文和汉语文字显示到显示屏上。核心处理器d s p 通过与大容量 存储芯片n a n d f l a s h 的连接和通讯,可以获得存储在其中的字典信息和大量 其他数据信息。核心处理器d s p 通过与内存扩展芯片s 黜m 的连接与通讯, 可以获得更大的运行内存空间来运行复杂的识别算法等程序。d s p 通过与小容 量存储芯片s s t f l a s h 的连接和通讯,可以实现启动运行程序代码的装载。3 3 v 和1 8 v 电源芯片p o w e r 为核心处理器d s p 和其他各部分电路提供3 3 v 和 1 8 v 稳定的电源供应。5 v 电源芯片l 6 9 2 0 d 利用两节a a 电池为液晶显示模 块和3 3 v 和1 8 v 电源芯片稳定的5 v 电源供应。 2 3 1 、图像采集模块 图像采集器件一般可以分为c m o s 器件和c c d 器件。c m o s 器件的特点是 成本低,但是成像效果差,噪声比较大。常见的低档摄像头都是以c m o s 芯片 为图像采集器件的。c c d 可以分为面阵和线阵c d d ,面阵c c d 常用在高端数 码相机和摄像机中,成本比较高,成像效果好。线阵c d d 是通过逐行扫描进行 图像获取,对于文字类静态物体有着较高的性价比,一般常见的扫描仪都使用线 1 0 西北工业大学硕上学位论文 第二章、电子阅读笔系统设计 阵c c d 。电子阅读笔系统需要对扫描进来的图像进行文字识别,因此前端采集 的图像质量尽可能要好一些。所以本系统采用线阵c c d 为图像采集器件。我们 选择数字输出的线阵摄像器件作为系统的图像采集器件,它具有1 0 2 l 像素、 3 0 0 d p i 分辨率、片上d a ,a d ,线阵摄像器件的数字输出接口一般是采用 串行工作方式通讯,可以和d s p 的通用i o 接口,实现图像数据的采集,刚好 适合电子阅读笔的应用。将线阵摄像器件的数据总线通过一个总线驱动芯片接入 d s p ,在不采集的状态,将总线驱动芯片关闭,这样并不影响d s p 的工作。在 采集状态使能该芯片,读取摄像器件传来的数据。d s p 可在中断处理程序中将 图像每个象素的数据准确的保存下来,从而实现采集。 将摄像器件的场同步f s t 接到d s p 中断i n t l 上,该同步信号告知d s p 每 场开始的时刻:将摄像器件的行同步l s t 接到d s p 中断i n t 2 上,该同步信号 告知d s p 每行开始的时刻;将摄像器件的象素同步p v b 接到d s p 中断i n t 3 上,该同步信号告知d s p 每个象素到来的时刻。采用中断方式的采集方案有两 个优点:一是使图像采集子系统的设计方案得到了最大的简化。二是简化了电路, 缩小了体积,适合要求体积比较小的产品。d s p 可在中断处理程序中将图像每 个象素的数据准确的保存下来从而实现采集。摄像器件要感光必须通过合适的 光学结构来将图像聚焦到感光芯片上。经过多种方案的论证,电子阅读笔采用阵 列式微镜头,并配合支架完成聚焦图像的功能。作为手持的扫描设备,一个必须 解决的问题是要用扫描时的速度进行图像修正,只有这样才能得到和被扫描的图 像比例一致的图像数据。因此,必须采用合适的测速机制,才能实现速度的反馈。 最终采用红外对管,配合有孔滚轮的方式,得到了较好的测速结果。 2 3 2 、存储管理模块 随着产品的不算改进,字典库不断增加,一个英文单词的解释变的越来越全 面,使用语境也变得越来越清楚。同时对应于不同字体的模板库也在不断地扩充。 但是同时也使得系统要求有更大的固定存储空间。因此我们根据需要扩展了一片 大容量n a n df l a s h 作为固定存储空间。该f l a s h 通过时分复用8 个i o 端口 刺内部逻辑单元的寻址和内容的读取。电路连接原理图( 图2 5 ) 如下图所示,d s p 通过a 0 0 和a 0 l 实现和u s b 接口芯片复用数据总线进行f l a s h 的读写操作。 d s p 的控制线用来控制f l a s h 的控制端口。最终能够利用d s p 的软件灵活性实 现读写、擦除f l a s h 的操作。 在原理图中,核心处理器d s p 通过与大容量存储芯片n a n d f l a s h 的连 接和通讯,可以获得存储在其中的字典信息和大量其他数据信息。核,t 5 处理器 d s p 与大容量存储:芭:片n a n d f l a s h 通过如下几组信号实现连接:一部分是 西北工业大学硕士学位论文 第二章、电子阅读笔系统设计 数据总线d o - - d 7 ,实现数据的传送;一部分是地址总线a 0 和a l ,实现地址 的划分;一部分是地址选通信号,是通过可编程逻辑器件c p l d 的译码后的 n r e 、n w e 和n c e 三个信号,实现对该模块的正确地址划分和访问。 r u , 5 4 8 0 a 咄飘、一旺 南蛩- a 4 八八l a l e n a 蚶u 嘲 聚勰 2 9 ) 0 0 诖 1 1 0 2器 ) 0 l 2 c l e l t 0 3 3 + 札e i 0 4,4 r 1 一m 孺减互 二二 ) 0 5 6 6 d 【帕7 ) 0 7 d c 0 0 :0 7 】 v c c 1 2、肛l v c c 1 3 6 n oj 口 i 铡d 图2 5n a n df l a s h 与d s p 的接口原理图 2 3 3 、l c d 模块 文字识别的结果和基本操作的提示都需要通过液晶显示屏与用户交互。常见 液晶显示屏的工作电压是5 v 。液晶显示屏是整个电路中的能量重要消耗者。太 大的液晶显示屏视觉效果比较好,但是成本非常大,而且功耗非常高。太小的液 晶显示屏,不能显示完整的行,影响用户的使用。因此在我们的方案中选用在电 子词典中经常使用的采用1 2 2 3 2 点阵的图形液晶显示屏( l c d ) 。该显示屏 由两个控制芯片组成,通过8 位并行数据总线来传输数据,通过两个独立的选 通信号来选择对那一个控制芯片操作。控制芯片内部有一些控制寄存器,是通过 8 位并行总线来设置的。 d s p 与l c d 的连接过程中需要将显示屏的端口地址映射到d s p 的i o 空间 中,这样d s p 才可以通过对应i o 端口的读写来实现对显示屏的控制。在我们的 方案中: 数据线的连接方法:将l c d 的8 位并行数据线接到d s p 数据总线的低8 位上: l c d 的片选信号的连接方法:由于l c d 的片选信号e 1 和e 2 是高电平有 效的脉冲驱动,而且分别对应l c d 内部的两个芯片,因此采用地址线a 1 2 和 a 1 3 来区分它们,同时用d s p 的i o 区脉冲型选通信号i o s t r b 来共同组合分 别选通e 1 和e 2 : 西北工业大学硕士学位论文第二章、电于阅读笔系统设计 l c d 的读写信号和地址信号的连接方法:l c d 有一个读写信号用于控制 l c d 数据线的传输方向;一个地址信号用于选择对l c d 内部的寄存器读写或 是对数据读写,这里采用两个地址线来控制。这一方案只要对对应的地址读写就 可实现对应的控制功能。电路连接方式如下图( 图2 6 ) 所示。 n l i 2 4 软件系统 图2 6 d s p 与l c d 的连接原理图 电子阅读笔的软件系统部分可以分为控制管理软件和文字识别算法软件。控 制管理软件主要对硬件各个子模块综合控制和管理,设置硬件的工作状态,调度 文字识别算法软件处理。 电子阅读笔开机后的整个工作过程就是按部就班的自动执行在固化在b o o t f l a s h 中的代码。首先将代码解压,然后搬运到内存中,对系统进行初始化设 置然后进入等待扫描状态。文字识别算法软件主要是实现从对采集图像的处理, 到文字分割,文字识别和翻译,完成嵌入式o c r 系统的作用。电子阅读笔的工 作流程如下图所示。 图2 7 电子阅读笔的控制管理软件的工作流程 另外除了在d s p 端,编写实现上图中各个功能模块的程序,还要在p c 端编写对应的接口程序。如在p c 端,还要编写u s b 接口的驱动程序和e p p 接 口的驱动程序,另外还要编写对应的更新升级库文件的程序。在p c 端有大量软 西北工业大学硕士学位论文 第二章、电子阅读笔系统设计 件包供复用,因此相应的软件实现起来相对简单一些。 2 5 本章小结 本章首先从电子阅读笔系统设计的角度,介绍了电子阅读笔的设计目标和设 计框架,包括硬件系统和软件系统的设计方案。比较详细地介绍了电子阅读笔硬 件系统,包括各个子模块的设计原理和方案。概要介绍了电子阅读笔的软件系统 设计方案。 在硬件设计方案中,d s p 器件作为核心器件,由线阵摄像头、大容量f l a s h 及图形液晶显示屏构建了三个功能予系统:图像采集子系统、字库字典库存储 子系统和图像显示予系统。其余的关键部分在第四章中进行详细的介绍。 在软件设计方案中我们介绍各个模块的划分和各个模块之间的关系。 需要说明的是,整个电子阅读笔系统是由一个研制小组共同设计完成的,其 中,本人的工作主要集中对电子阅读笔中关键技术的研究上。主要体现在对硬件 电路进行重新设计,以及底层接口软件的开发和部分的算法设计上。 西北工业大学硕士学位论文 第三章、电子i 辫读笔算法中的燕键技术 第三章、电子阅读笔算法中的关键技术 上一章对整个电子阅读笔系统设计概要地做了介绍,说明了阅读笔系统的架 构及工作原理。本章主要针对电子阅读笔的特点,详细讨论针对特定硬件环境的 算法设计。 算法设计的优劣直接决定了软件系统的效率和准确率,是整个系统能否实现 功能的关键。识别系统从模块上可以划分为扫描输入、图像预处理、特征提取、 模式分类、后处理等部分。在本章中我们主要讨论其中的图像预处理、特征提取 和模式分类这三个关键部分。 在o c r 理论方面,学术界有很多成熟的算法【2 4 , 2 9 , 5 4 , 5 6 , 6 0 i ,但是这些算法往往 是基于p c 机设计的。d s p 系统的工作环境与p c 机完全不同,d s p 的内存容量 有限,速度有一定限制,以及实时性要求等,因此很多算法根本无法直接移植到 d s p 环境下。因此需要根据电子阅读笔的硬件环境设计合适的图像处理算法,在 系统所具备的有限资源和高识别率和低延时之间取得一个平衡。 我们在算法设计的过程中,针对d s p 系统的特点,尽量考虑系统的实时性、 功耗以及存储容量的限制,并兼顾了系统的识别率和响应时间,设计了一套适合 d s p 系统的实用脱机o c r 算法,取得了很好的效果。 3 1 图像的预处理 图像的预处理是文字识别的流程中十分重要的一步,预处理结果的好坏将直 接影响到识别结果的好坏。预处理工作做得好,字符的本质特征得到保留甚至突 出出来,识别就容易进行,识别结果就较好。反之,就会使识别变得困难。因此, 本文在预处理阶段,对图像进行了较为完善的预处理,包括平滑、去噪、分割、 大小归一化和细化,从而得到了较理想的符号点阵,为后续的特征提取和文字识 别打下了良好的基础。图像预处理的流程如下图所示,本节主要着重讨论图像的 二值化和字符分割算法。 图3 ,1 图像预处理流程 西北工业大学硕士学位论文 第三章、电子阅读笔算法中的关键技术 3 1 1 图像的二值化 二值图像是指整幅图中仅含黑、白二色的图像。在数字图像处理中,二值图 像占有非常
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 时间状语从句课件导入
- 护士带教师资培训
- 网络暴力幼儿课件
- 创意画冲浪课件
- 时尚表演基础知识培训课件
- 二零二五年度珠宝行业知识产权保护合同
- 二零二五年钢筋工程新技术研发与应用合同
- 2025版智慧社区智能家居设计代理合同
- 二零二五年调味品品牌孵化与推广合作协议
- 二零二五年度心理咨询劳务服务居间合同
- 架线导地线各种弧垂的含义及计算方法(附计算表格)彻底弄懂弧垂
- 疲劳影响量表(FIS)
- 网络营销:推广与策划(第3版 慕课版)课件 项目一认知网络营销(知识基石)
- 精益管理课件
- 电竞行业用户分析
- 建筑防火基础知识
- 首诊负责制度检查分析报告
- 新药研发方案及计划书模板
- 不良资产项目律师法律尽调报告(模板)
- 木磨锯工安全操作规程
- 输血不良反应报告表
评论
0/150
提交评论