(计算机系统结构专业论文)适合快速移动识别的语音信息图形编码设计与实现.pdf_第1页
(计算机系统结构专业论文)适合快速移动识别的语音信息图形编码设计与实现.pdf_第2页
(计算机系统结构专业论文)适合快速移动识别的语音信息图形编码设计与实现.pdf_第3页
(计算机系统结构专业论文)适合快速移动识别的语音信息图形编码设计与实现.pdf_第4页
(计算机系统结构专业论文)适合快速移动识别的语音信息图形编码设计与实现.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(计算机系统结构专业论文)适合快速移动识别的语音信息图形编码设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

适合快速移动识别的语音信息图形编码设计与实现 摘要 二维条码技术是当前研究和应用的一个活跃领域,产业界与研究界在这一领 域的工作正在不断地拓展与加深。除传统的商贸、制造业、医疗卫生、物流等行 业外,二维条码技术的新的应用点正在被积极探索中。 如何使用二维条码对语音进行处理,即对语音进行图形化的编码解码这样一 个很有价值的研究领域,国内外的研究正处在起步阶段,尚未取得突破性的成果。 这一领域综合了语音数字化编码压缩技术、二维条码技术、嵌入式系统设计和微 电子技术等,相应的成果具有极大的市场空间。本文介绍了我们在这一领域的相 关工作,重点是语音信息的二维图形化编码与解码。 文章首先对二维条码技术作了阐述,在对已有的码图结构和编码规则进行分 析与研究的基础上,提出了针对本课题的应用所设计语音二维图形条码结构及码 制的基本方案。其中详尽阐述了这种新码字的编码原理及解码算法,包括建立在 数学理论基础上的模式匹配、双线性插值几何校正等算法的设计。 在此基础上,进一步提出了新码字的改进方案。对码字的快速定位识别、连 续的码字流中码字标识( i d ) 顺序的确定、码内的非线性失真校正等方面进行了 优化,并增加了合适的纠错编码技术,即在理论分析与大量试验的基础上将 r e e d s o l 伽o n ( r s ) 码引入到新码制中并进行了合理的实现,重点分析研究它在新 条码中的应用方法,并详尽地推导了在伽罗瓦域g f ( 2 7 ) 域内r s 码的编译码方法。 通过提出一种查表方法,可以快捷地确定待编码信息在g f ( ( 2 7 ) 内所对应的本原 元的幂次,从而快速而准确地计算出纠错码生成多项式的系数及错误伴随式,显 著提高纠错效率。 这种新二维条码码字结构和编码规则具有信息存储量适当、算法识别速度 快、并带有必要的校验位信息以满足应用需求的特点,能承受一定的倾斜、变形、 噪声、照度不匀等各种类型的失真,以及一定的容错纠错能力。 另外对实现系统的总体架构、硬件体系结构以及声音的数字化编码、解码、 播放等进行了必要的介绍。 上述工作所形成的结果是一套完整的、适合记录语音信息、适合手持设备快 速阅读的图形矩阵码编码方案、相应的快速识别及解码算法以及实现系统。 最后对本文的主要工作进行了概括和总结,同时提出了进一步的研究方向。 关键词二维条码语音信息编码r s 纠错码 中图分类号t p 3 9 1 复日大学顾 论文 3 适合快速移动识别的语音信息图形编码设计与实现 a b s t r a c t c u r r e n t l yt w od i m e n t i o n a lb a r e o d e ( 2 db a r c o d e ) t e c h n o l o g yi sa l la c t i v ef i e l di n b o t hr e s e a r c ha n da p p l i c a t i o n t h er e s e a r c hw o r ko fi n d u s t r ya n da c a d e m i ai nt h i s f i e l di sb r o a d e n i n ga n dd e e p e n i n g b e s i d e st r a d i t i o n a li n d u s t r i e ss u c ha st r a d e m a n u f a c t u r i n g , l o g i s t i c s ,e t c ,n e wa p p l i c a t i o np o i n t sa l eb e i n ge x p l o r e d h o wt ot r e a tv i d e oi n f o r m a t i o nw i t ht w od i m e n t i o n a lb a r e o d e ,i e ,t h eg r a p h i c a l e n c o d i n ga n dd e c o d i n go fv i d e os i g n a l s ,i sav a l u a b l er e s e a r c hf i e l d h o w e v e r , i ti s s t i l li ni n i t i a ls c a g c ,n ob r e a k t h r o u g hr e s e a r c hf i n d i n g sb e i n gr e p o r t e d t h i sf i e l d i n t e g r a t e sd i g i t a le n c o d i n ga n dc o m p r e s s i n gt e c h n o l o g yo fv i d e oi n f o r m a t i o n , 2 d b a r e o d et e c h n o l o g y , e m b e d d e ds y s t e md e s i g nt e c h n o l o g ya n dm i c r oe l e c t r o n i c s ,e t c , a n di th a sh u g em a r k e t i n gs p a c e t h i sp a p e rp r e s e n t so u rr e s e a c hw o r ki nt h ef i e l d w e p u te m p h a s i so n t w o - d i m e n t i o ng r a p h i c a le n c o d i n g d e c o d i n go f v i d e oi n f o r m a t i o n w eg i v eab 酊e fs u r v e yo n2 db a r c o d et e c h n o l o g ya tf i r s t t h e nb a s e do no u r a n a l y s e st os o m ee x i s t i n gb a r c o d e s ,w ep u tf o r w a r dab a s i cg r a p h i c a lb a r c o d es c h e m e d e s i g n e df o rv i d e oi n f o r m a t i o ne x p r e s s i o n ,w h i c hd e p i c t si n d e t a i li t s s t r u c t u r e , e n c o d i n gr u l e s ,r e c o g n i t i o na n dd e c o d i n ga l g o r i t h m s , i n c l u d i n gt h ed e s i g no fs o m e a l g o r i t h m ss u c ha sp a t t e r nm a t c h i n ga l g o r i t h m ,b i l i n e a rv a l u e i n s e r t i o ng e o g r a p h i c a l r e v i s i o na l g o r i t h m ,e t c ,w h i c ha 1 - cb a s e do ns o u n dm a t h e m a t i c a lt h e o r y f u r t h e r m o r e ,w eg i v ear e v i s e dv e r s i o no ft h ei n i t i n a ls c h e m e ,w h i c hm a i n l y f o c u s e so nt h ea s c e r t a i n m e n to fb a r c o d ei d e n t i f i e ri nac o n t i n u o u sb a r c o d ef l o w , a n d t h es u i t a b l ee r r o r - c o r r e c t i o nm e c h a n i s m t h r o u g ht h e o r e t i c a la n a l y s i sa n db u l l 【 e x p e r i m e n t s ,w ei n t r o d u c er e c d s o l o m o n ( r s ) c o d ei n t ot h i sn e w s c h e m ea n dp r e s e n t ar a t i o n a li m p l e m e n t a t i o n b e s i d e s , w ea l s og i v es o m en e c e s s a r yi n t r o d u c t i o no fo u ri m p l e m e n t a t i o ns y s t e m f o rt h i sn e wb a r c o d e ,i n c l u d i n gs y s t e ms t r u c t u r e ,h a r d w a r ea r c h i t e c t u r e ,d i g i t a l e n c o d i n g , d e c o d i n g , p l a yo f v i d e oi n f o r m a t i o n ,e t c f i n a l l y , w eg i v eab r i e fs u m m a r i z a t i o na n dp u tf o r w a r ds o m e f u t u r ew o r k s k e yw o r d :2 db a r e o d e ,v i d e oi n f o r m a t i o ne n c o d i n g , r s c o d e 复口大学硕上论文 4 适合快速移动识别的语音信息图形编码设计与实现 第一章引言 1 1 研究背景及课题来源 二维条码技术作为自动识别与数据采集( a u t o m a t i ci d e n t i f i c a t i o na n d d a t ac a p t u r e ,a i d c ) 技术的重要组成部分,在全球范围内正在广泛应用,产 生了良好的经济和社会效益 1 。这种正处在完善过程中的自动识别和防伪技术 有着其他自动识别技术无法比拟的优势,一出现便受到我国条码管理部门和有关 政府部门的重视。我国是国际条码组织的成员国,随着对二维条码优越性认识的 提高及应用需求的扩大,二维条码将在我国出版、交通运输、商贸、制造业、医 疗卫生、仓储等领域有广阔应用前景。 二维条码具有信息容量大、可靠性高、纠错能力强、容易制作及复制、成本 低、形状灵活、应用范围广、防伪及安全性好等特点,可以用它表述语音、数据 文件( 包括汉字文件) 、图片等。二维条码是各种证件及卡片等大容量、高可靠 性信息实现存贮、携带、自动识读并能实现网络化信息管理的最理想方法之一 二维条码的产生是由于传统条码( 即一维条码) 的许多局限性:信息密度低、 信息容量小、没有纠错能力( 只能通过校验字符进行错误校验) 、保密防伪性较 差、使用可靠性差等。一维条码只能完成对物品的标识,无法对物品本身进行描 述,必须依赖数据库的存在,并且表示汉字信息十分困难。为克服一维条码的局 限性,在有限的几何空间内表示更多的信息,二维条码的研究得到重视。 目前二维条形码的方案主要分两类,一类是堆积型,在一维条形码的基础上 向二维条形码方向发展,其缺点是信息量的增加比较少,适用范围有限:另一类 是矩阵型二维图形编码,它需要使用图像识别技术,编译码过程相对比较复杂, 但由于它具有信息容量大、可靠性高等特点,成为研究和应用的重点。 二十世纪9 0 年代,国际上对二维条形码进行了广泛的研究,取得了很多成 果。美国s y m b o l ( ; 宝) 公司研制了p d f 4 1 7 码,目前应用最广。美国伟林( w e l c h a l l y n ) 公司推出了m a x ic o d e ,最多可容纳3 8 3 2 个数字或3 0 6 7 个字母字符或 9 1 7 个字节的数据。另一家美国公司研制的d a t am a t r i x 码主要用于电子行业小 零件的标识。日本d e n s o 公司于1 9 9 4 年9 月研制了矩阵二维条形码符号q r c o d e ,它除具有一维条形码以及其他二维条形码所具有的信息容量大,可靠性 高等特点外,还具有可标识汉字等多种文字信息、保密防伪性强等优点。相比于 其他的二维条形码例如p d f 4 1 7 等,q r 码有着信息容量更大、识别速度更快的 优点。 复日大学硕l 论文 5 适合快速移动识别的语音信息图形编码设计与实现 从i e e e 、a c m 等的已有文献来看,2 0 0 0 年以来,国外在这二维条码方面 的研究依然很活跃,研究的内容正在向广度与深度两个方向发展,研究的重点是 二维条码的新的编码方式、更有效的解码算法、读码器以及二维条码技术在新的 领域的应用等。如美国的l i p 实验室正在研究一种高保真的图形编码符号以及一 套可靠的编码解码系统,可以对包括签名、图形等在内的信息进行有效处理【2 】。 美国的r u t g e r s 大学正在研究适应用多频率多信道超带宽解码系统的树形三重正 交二维码1 3 】。加拿大的g u e l p h 等大学正在研究基于二维条码的视力受损者辨别 及导引协助系统【4 】【5 】。日本的n e c 实验室正在研究二维条码在手机摄像头下的 应用等【6 】。 但是国内的二维条码应用却没有能够达到与世界先进国家发展同步的水平。 长期以来,国内常见的二维条码( 包括相应的国家标准) 都源自于国外技术,如 美国的p d f 4 1 7 码、日本的q r 码等。这些二维条码由于没有为汉字进行特别的 设计优化,因此对汉字的编码效率较低。此外,相关的识读设备核心技术几乎都 掌握在国外厂商手中,因而在国内进行销售的大多是国外厂商的代理或组装产 品,其高昂的生产成本及严格的专利保护导致了国内的二维条码识读设备价格昂 贵,从而严重制约了二维条码在国内的广泛应用。 作为科技创新的主体,自2 0 0 0 年以来,为满足国内外市场对自动识别领域 与数据采集领域技术与产品不断增长的应用需求,国内多家公司都己立项进行研 发,以改变我国自动识别与数据采集技术长期落后的现状,加速我国各行业信息 化建设的发展。如深圳矽感科技有限公司成功研发出矽感c m 、矽感g m 二维条 码技术及其识读设备,包括矽感c m 二维条码技术、矽感g m 二维条码技术、 s p c 2 1 0 型教育卡学习机等系列产品【7 】。上海龙贝信息科技有限公司开发的龙贝 码可以对所有汉字进行编码、适用于各种类型的识读器、最多可使用多达3 2 种 语言系统、具有多向编码译码功能、极强的抗畸变性能、可对任意大小及长宽 比的二维条形码进行编码和译码【8 】。 但是,在如何用二维条码对语音进行处理,即语音图像的编码解码这样一个 很有研究价值的领域,国内外的研究并没有取得突破性的成果。上述所有编码方 式在运用于存储语音信息的纸介质有声读物时并不是非常适合。一方面,对语音 进行编码与对文字等其他信息的编码在码字结构上存在差异。语音的容量要远远 大于其他信息,这样通常情况下一个单独的矩阵码码字是无法承载的,需要用数 量不确定的多个码字连续连接在一起来表达,即要求连续码,同时又是非定长码。 而上述编码方式均是面向单个矩阵码的,即使某些编码方式经过版本扩充,支持 多个码字链接表达信息,但其可链接的码字个数是有固定上限的( 如q r 码,支 持1 6 个以内的码字链接【9 】;p d f 4 1 7 扩展宏的码字可链接个数同样是有限个 复口大学顾t 论文 6 适合快速移动识别的语音信息图形编码设计与实现 【1 0 】) ,在用数量不受限的多个矩阵码来表达长度不确定的语音信息时其空间利 用率要受到很大影响;另一方面,在码字容错、识别速度上也存在差异,纸介质 有声读物所能接受的阅读设备应该是一个微型化的以手持方式工作的装置,以快 速“划扫”方式来完成语音信息的阅读,要求编码方式能适应因快速移动而造成 的扭曲、变形等失真,尤其是普通图像传感器( c c d 或c m o s ) 因各扫描线扫 描时间的差异而产生的非线性失真,而上述编码方式并不具备这种纠正矩阵码内 部非线性失真的机制,使得对快速“划扫”方式的速度均匀性提出很高要求,增 加了使用难度。此外,识别算法的复杂度也是一个关注点,编码方式应该支持更 加快速的识别算法,如一个普通的r i s c 嵌入式处理机在1 3 0 秒( 普通图像传感 器的帧周期) 内能完成一帧内可能的多个矩阵码的识别,而以上编码方式均无法 达到这样的要求。 这一领域当前在国外正处在研究起步阶段,国内的研究取得了一定的成果, 走在研究的前沿。然而从各研究机构、公司所公布的技术资料看看,目前尚未有 一种编码解码技术是针对语音图像这一研究方向的。如尽管龙贝码与矽感c m 均 可以对码字图形的长宽比进行调整,但是这种调整是在一个单独的码字内部的, 依然没有解决多个码字连续编码的问题。龙贝码强调的是多向性编码和译码功 能,多重信息加密功能、多种及多重语言系统、数据的结构化压缩和编码、零剩 余位、零剩余码字【6 1 ;而矽感c m 码虽然对语音教育系统进行了研究,并推出 了s p c 2 1 0 卡通王学习机等产品,但是首先该产品所能解码的只是单个码字,一 次所能播放的声音长度不超过8 秒;其次对该码字的识别是需要专用设备匀速扫 描阴,这两大限制使得该研究成果及产品在语音图形化编码领域的应用很难扩 大。其背后的根源是该编码解码技术并非针对语音图形化编码这一研究领域的, 因此也将很难解决这一领域的技术关键。 基于国内外的研究现状,上海市科委将“语音图形化编码技术及其在出版行 业的应用”立项为2 0 0 4 - - 2 0 0 5 年度上海市重点科技攻关项目。本文即是在此基础 上对适合非线性连续快速移动识别的语音信息二维图形编码解码技术研究及实 现这一课题所做的部分工作。这项技术将使得普通纸张上可印刷、打印各种各样 的语音信息,成为有声读物。而声音还原装置是一个微型化的手持装置,其成本 可以为一般认接受,任何人不需任何训练即可轻松完成以“划扫”形式进行的声 音信息“阅读还原”过程。 语音信息二维图形编码的开发成功还将会创造出一种新的出版媒体。声 音可以印刷在纸上”,据此可以出版“会说话的图书和报刊”。这将为传统的书刊 出版物增添新的出版内容,为我国出版业引导出一系列新的需求和新的产品,开 拓出一个很大的新市场空间。 复旦大学硕l 论文 7 适合快速移动识别的语音信息图形编码设计与实现 1 2 本文研究内容 本课题的主要研究内容是设计一种针对语音信息的基于图形矩阵码的编码 方式及相应的识别算法,它用于在普通纸张上真实地记录语音信息,它可以因所 记录的语音信息的信息量需求的不同而让多个图形矩阵码拼连续接形成不定长 的码字序列,所生成的码字序列可以由普通的激光或喷墨打印机打印,也可以印 刷,通过一个微型化的手持装置以快速“划扫”方式来完成多个图形矩阵码的连 续阅读,同时能提供有效的校正机制纠正因手持识别装置快速“划扫”过程在速 度、方向上的不均匀而造成的图形失真,达到正确识别的目的。此外,为将手持 的阅读装置的实现成本、体积、功耗等因素约束在一个合理范围内,码字的识别 能够快速完成,借助一个普通的r i s c 嵌入式处理机,一帧内可能的多个图形矩 阵码的全部识别时间一般不超过图像传感器的帧周期,确保码字序列识别的完整 性。 针对上述f l 标,本课题的研究内容主要分这样几个部分: 第一是设计一种新的适合语音信息的图形化条码,包括码字结构、编码及解 码方案。它是连续码,必须是非定长码,应具备码内的非线性失真校正功能,可 以纠正因手持装置快速“划扫”过程在速度、方向上与图像传感器扫描线运动过 程的不一致、不均匀而造成的图形失真;同时利于码字的快速定位识别与连续的 码字流中码字标识( i d ) 顺序的确定,在一幅扫描的帧图像中能迅速、正确地确 定内含的多个图形矩阵码的基本坐标位置并确定其各自编号序列,支持后续的进 一步识别以及将多个码字按照标识进行拼接; 第二是合适的纠错编码技术。包括基于识别技术的纠错以及基于编码技术的 纠错,基于识别技术的纠错主要用于解决图像采集过程中的噪声等问题,而基于 编码技术的纠错主要指寻找到合适的码字交叉方案和r s 码编码方案。上述工作 所形成的结果是一套完整的、适合记录语音信息、适合手持设备快速阅读的图形 矩阵码编码格式以及相应的快速识别算法。 针对上述内容,我们在参考国外先进技术实现前提下,设计了一种图形编码 格式,它以“四角黑圆点”方案作为定位技术的关键,辅之“校正点”技术,以 及一定的索引、容错编码技术,这种图形编码格式与传统的二维条形编码格式如 q r 码的方形定位孔技术相比,在抗倾斜、变形、噪声、照度不匀以及快速识别 等方面具有明显优势。 此外,研究还在试验验证的基础上研制了一套将语音转换成有声读物并还原 成语音的样机系统,包括编码软件、解码软件、硬件平台、微型扫描阅读器的样 机等。该实现系统总体架构上包括如下部分: 复旦大学硕士论文 8 适合快速移动识别的语音信息图形编码设计与实现 声音采集子系统、声音压缩编码子系统、码图生成及打印子系统、码图识别 子系统、声音解码子系统、声音输出子系统等。 硬件结构可分为图像采集及处理模块和声音输出模块。其中,图像采集及处 理模块拟采用e p s o n 公司的微处理器s i c 3 3 2 0 9 及其外围组件和p x i 公司的图 像传感器p a s l 0 6 b c b 构成,通过1 2 c 接口控制,采集的图像数据经高速d m a 进入内存,使得图像采集过程和软件运行可以完全并发,最大程度提高运行速率。 声音输出模块由微处理器s i c 3 3 2 0 9 利用p w m 技术控制声音输出电路构成。 1 3 本文结构 本文共由五章构成。 第一章引言,介绍了本文的研究背景、课题来源以及研究内容。 第二章对二维条码技术作了阐述,介绍了二维条码的历史、特点、研究及应 用现状,并对两种有代表性的二维码进行了概述。 第三章阐述了新的语音图像二维条码的码制及解码算法,并重点介绍了将 r s 码引入到新码制中所做的工作。 第四章阐述了实现系统的总体架构、硬件体系结构以及声音的编码、解码、 播放。 第五章是全文的总结。对本课题所做的主要工作的作了概括和总结,同时提 出了进一步的研究方向。 复日大学硕上论文 9 适合快速移动识别的语音信息图形编码设计与实现 第二章条码技术概述 本章对条形码技术的历史、发展及其现状做了简要综述。 2 1 条形码概述 条形码技术是在计算机应用中产生并发展的一种广泛应用于商业、邮政、图 书管理、仓储、工业生产过程控制、交通等领域的自动识别技术,具有输入速度 快、准确度高、成本低、可靠性强等优点,在当今的自动识别技术中占有重要的 地位。条码系统是由条码符号设计、制作及扫描阅读组成的自动识别系统【1 1 】。 条形码的概念 条形码是由一组规则排列的条、空以及对应的字符组成的标记,“条”指对 光线反射率较低的部分,“空”指对光线反射率较高的部分,这些条和空组成的 数据表达一定的信息,并能够用特定的设备识读,转换成与计算机兼容的二进制 和十进制信息l m 。 条码术语:【1 3 】 条码的码制:是指条码符号的类型( 编码方法) ,每种类型的条码符号都是由符 号特定编码规则的条和空组合而成。每种码制都具有固定的编码容 量和所规定的条码字符集。条码字符中字符总数不能大于该种码制 的编码容量。 定长条码与非定长条码:定长条码是指仅能表示固定字符个数的条码。非定长条 码是指能表示可变字符个数的条码。 连续性与非连续性:条码符号的连续性是指每个条码字符之间不存在间隔,相反, 非连续性是指每个条码字符之间存在间隔。从某种意义上讲,由于 连续性条码不存在条码字符间隔,即密度相对较高,而非连续性条 码的密度相对较低。但非连续性条码字符间隔引起误差较大,一般 规范不给出具体指标限制。而对连续性条码除了控制尺寸误差之 外,还需控制相邻条与条、空与空的相同边缘间的尺寸误差及每一 条码字符的尺寸误差。 剩余位:当编码区域不能正好被8 位的码字填满时,用于填充最后一个码字后的 空位,其值为o ,不表示数据。 剩余码字:一种填充码字,当所有的数据码字和纠错码字不能正好填满符号容量 时,用于填充所有空码字位置,它们紧跟在最后一个纠错码字之后。 复旦大学硕士论文 1 0 适合快速移动识别的语音信息图形编码设计与实现 条形码主要可以分为一维条码和二维条码两大类。 一维条码 是由宽度不同、反射率不同的条和空,按照一定的编码规则( 码制) 编制 成的,用以表达一组数字或字母符号信息的图形标识符。即条形码是一组粗细不 同,按照一定的规则安排间距的平行线条图形。 通常对于每一种物品,它的编码是唯一的,对于一维条码来说,还要通过数 据库建立条形码与商品信息的对应关系,当条形码的数据传到计算机上时,由计 算机上的应用程序对数据进行操作和处理。因此,一维条码在使用过程中仅作为 识别信息,它的意义是通过在计算机系统的数据库中提取相应的信息而实现的。 二维条码二维码( 2 d i m e n s i o n a lb a rc o d e ) 是用某种特定的几何图形按一定规律在平面( - - 维方向上) 分布的黑白相问 的图形记录数据符号信息;在代码编制上巧妙地利用构成计算机内部逻辑基础的 “0 ”、“1 ”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数 值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理:它具 有条码技术的一些共性:每种码制有其特定的字符集;每个字符占有一定的宽度; 具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形 旋转变化等特点。二维条码能够在横向和纵向两个方位同时表达信息,因此能 在很小的面积内表达大量的信息。 二维条码的特点: 1 高密度编码,信息容量大;可容纳多达1 8 5 0 个大写字母或2 7 1 0 个数字或1 1 0 8 个字节,或5 0 0 多个汉字,比普通条码信息容量约高几十倍。 2 编码范围广:该条码可以把图片、声音、文字、签字、指纹等可以数字化的 信息进行编码,用条码表示出来;可以表示多种语言文字:可表示图像数据。 3 容错能力强,具有纠错功能:这使得二维条码因穿孔、污损等引起局部损坏 时,照样可以正确得到识读,损毁面积达5 0 仍可恢复信息。 4 译码可靠性高:它比普通条码译码错误率百万分之二要低得多,误码率不超 过千万分之一。 5 可引入加密措施:保密性、防伪性好。 6 成本低,易制作,持久耐用。 7 条码符号形状、尺寸大小比例可变。 8 二维条码可以使用激光或c c d 阅读器识读1 1 4 1 。 复旦人学硕上论文 适合快速移动识别的语音信息图形编码设计与实现 2 条码诞生及发展历史过程 条码技术最早产生在二十世纪二十年代,诞生于w e s t i n g h o u s e 的实验室。一 位名叫j o h nk e r m o d e 的发明家设想对邮政单据实现自动分检,其想法是在信封 上做条码标记,条码中的信息是收信人地址的某种表示形式,类似于今天的邮政 编码。为此k e r m o d e 发明了最早的条码标识,设计方案非常的简单( 注:这种 方法称为模块比较法) ,即一个“条”表示数字“1 ”,二个“条”表示数字“2 ”, 依次类推。他又发明了由基本的元件组成的条码识读设备:一个扫描器( 能够发 射光并接收反射光) ;一个测定反射信号条和空的方法,即边缘定位线圈;使用 测定结果的方法,即译码器。 k e r m o d e 的扫描器利用当时新发明的光电池来收集反射光。“空”反射回来 的是强信号,“条”反射回来的是弱信号。与当今高速度的电子元气件应用不同 的是,k e r m o d e 利用磁性线圈来测定“条”和“空”。k e r m o d e 用一个带铁芯的 线圈在接收到“空”的信号的时候吸引一个开关,在接收到“条”的信号的时候, 释放开关并接通电路。因此,最早的条码阅读器噪音很大。开关由一系列的继电 器控制,“开”和“关”由打印在信封上“条”的数量决定。通过这种方法,条 码符号直接对信件进行分检。 之后,k e r m o d e 的合作者d o u g l a s y o u n g ,在k e r m o d e 码的基础上作了改 进。k e r m o d e 码所包含的信息量相当的低,并且很难编出十个以上的不同代码。 而y o u n g 码使用更少的条,但是利用条之间空的尺寸变化,正如今天的u p c 条 码符号使用四个不同的条空尺寸。新的条码符号可在同样大小的空间对一百个不 同的地区进行编码,而k e r m o d e 码只能对十个不同的地区进行编码。 1 9 4 9 年的专利文献中第一次有了n o r mw o o d l a n d 和b e r n a r ds i l v e r 发明的 全方位条码符号的记载,在这之前的专利文献中始终没有条码技术的记录,也没 有投入实际应用的先例。n o r mw o o d l a n d 和b e m a r ds i l v e r 的想法是利用k e r m o d e 和y o u n g 的垂直的“条”和“空”,并使之弯曲成类似于箭靶的环状。这样扫描 器通过扫描图形的中心,能够对条码符号解码,不必关心条码符号方向的朝向。 在利用这项专利技术对其进行不断改进的过程中,一位科幻小说作家 i s a a c - a z i m o v 在其著作裸露的太阳一书中讲述了使用信息编码的新方法实现 自动识别的事例。书中的条码符号看上去象是一个方格子的棋盘,这即是今天二 维矩阵条码符号的雏形。虽然此条码符号没有方向、定位和定时,但它表示的对 象是高信息密度的数字编码。 1 9 7 0 年i t e r f a c em e c h a n i s m s 公司开发出“二维码”,之后开始出现价格适于 销售的二维矩阵条码的打印和识读设备。那时二维矩阵条码用于报社排版过程的 复旦大学硕上论文 1 2 适合快速移动识别的语音信息图形编码设计与实现 自动化。二维矩阵条码印在纸带上,由今天的一维c c d 扫描器扫描识读。c c d 发出的光照在纸带上,每个光电池对准纸带的不同区域。每个光电池根据纸带上 印刷条码与否输出不同的图案,组合产生一个高密度信息图案。用这种方法可在 相同大小的空间打印上一个单一的字符,作为早期k e r m o d e 码之中的一个单一 的条。定时信息也包括在内,整个过程是合理的。第一个系统进入市场后,包括 打印和识读设备在内的全套设备约为5 0 0 0 美元。 随着l e d ( 发光二极管k 微处理器和激光二极管的不断发展,新的标识符 号( 象征学) 及其应用的快速推进,“条码工业”开始形成。这一领域的技术进步 与发展非常迅速,并且每天都有越来越多的应用领域被开发,可以预计条码技术 将会迅速普及,在很多方面改变生产、商业及人们的生活方式 1 5 1 。 2 3 二维条码 2 3 1 二维条码的分类 与一维条码一样,二维条码也有许多不同的编码方法,或称码制。就这些码制 的编码原理而言,通常可分为以下两种类型: 1 堆叠式行排式二维条码 堆叠式行排式二维条码( 又称堆积式二维条码或层排式二维条码) ,其编码 原理是建立在一维条码基础之上,按需要堆积成二行或多行。它在编码设计、校 验原理、识读方式等方面继承了一维条码的一些特点,识读设备与条码印刷与一 维条码技术兼容。但由于行数的增加,需要对行进行判定,其译码算法与软件也 不完全相同于一维条码。有代表性的行排式二维条码有;c o d e1 6 k 、c o d e4 9 、 p d f 4 1 7 等。 2 矩阵式二维码 短阵式二维条码( 又称棋盘式二维条码) 它是在一个矩形空间通过黑、白像 素在矩阵中的不同分布进行编码。在矩阵相应元素位置上,用点( 方点、圆点或 其他形状) 的出现表示二进制“1 ”,点的不出现表示二进制的“0 ”,点的排列组 合确定了矩阵式二维条码所代表的意义。矩阵式二维条码是建立在计算机图像处 理技术、组合编码原理等基础上的一种新型图形符号自动识读处理码制。具有代 表性的矩阵式二维条码有:c o d eo n e 、m a x ic o d f i 、q rc o d e 、d a t am a t r i x 等。 复垦大学硕士论文 适合快速移动识别的语音信息图形编码设计与实现 在目前几十种二维要码中,常用的码制有:p d f 4 1 7 ,d a t am a t r i x ,m a x ic o d e , o rc o d e ;,c o d e4 9 ,c o d e1 6 k ,c o d e ;o n e ;,等,除了这些常见的二维条码之外,还有 v e r i c o d e 条码、c p 条码、c o d a b l o c kf 条码、田字码、u l t r a c o d e 条码,a z t 条 码 1 6 1 。 2 3 2 二维条码的研究应用现状 国外对二维条码技术的研究始于加世纪8 0 年代末。在二维条码符号表示技 术研究方面,已研制出多种码制,常见的有p d f 4 1 7 ,o rc o d e ,c o d e ;4 9 ,c o d e 1 6 k ,c o d eo n e 等。这些二维条码的密度都比传统的一维条码有了较大的提高, 如p d f 4 1 7 的信息密度是一维条码c o d e3 9 的2 0 多倍。在二维条码标准化研究 方面,国际自动识别制造商协会( a i m ) 、美国标准化协会( a n s i ) 已完成了 p d f 4 1 7 ,o rc o d e ,c o d e4 9 ,c o d e1 6 k ,c o d eo n e 等码制的符号标准。新成立 的国际标准化组织国际电工委员会第1 联合委员会的第3 1 分委员会,即条 码自动识别技术委员会( i s o 卫b c j t c l s c 3 1 ) ,已制定了q rc o d e 的国际标准 ( i s o m c1 8 0 0 4 :2 0 0 0 自动识别与数据采集技术条码符号技术规范 q r 码) ,起草了p d f 4 1 7 ,c o d e ;1 6 k ,d a t am a t r i x ,m a x ic o d e 等二维条码的 i s o i e c 标准草案。在二维条码设备开发研制、生产方面,美国、日本等国的设 备制造商生产的识读设备、符号生成设备,已广泛应用于各类二维条码应用系统。 二维条码作为一种全新的信息存储、传递和识别技术,自诞生之日起就得到了世 界上许多国家的关注。美国、德国、日本、墨西哥、埃及、哥伦比亚、巴西、新 加坡、菲律宾、南非、加拿大等国,不仅已将二维条码技术应用于公安、外交、 军事等部门对各类证件的管理,而且也将二维条码应用于海关、税务等部门对各 类报表和票据的管理,商业、交通运输等部门对商品及货物运输的管理,邮政部 门对邮政包裹的管理,工业生产领域对工业生产线的自动化管理。 我国对二维条码技术的研究开始于1 9 9 3 年。中国物品编码中心对几种常用 的二维条码p d f 4 1 7 ,q rc o d e ;,d a t am a t r i x ,m a x ic o d e ,c o d e4 9 ,c o d e1 6 k , c o d eo n e 的技术规范进行了翻译和跟踪研究。随着我国市场经济的不断完善和 信息技术的迅速发展,国内对二维条码这一新技术的需求与日俱增。中国物品编 码中心在消化国外相关技术资料的基础上,制定了两个二维条码的国家标准: g b t1 7 1 7 2 1 9 9 7 四一七条码,g b 厂r1 8 2 8 4 - 2 0 0 0 快速响应矩阵码。为使二 维条码技术能够在我国的证照管理领域得到应用,在国外应用软件平台的基础 上,中心开发了人像照片和指纹数据压缩软件。二维条码技术已在我国的汽车行 业自动化生产线、医疗急救服务卡、涉外专利案件收费、珠宝玉石饰品管理及银 行汇票上得到了应用;1 9 9 9 年3 月在北京举行的全国人大第九届三次全体会议 复避人学硕 论史 1 4 适合快速移动识别的语音信息图形编码设计与实现 和全国政协第九届三次会议期间,在随行人员证件、记者证、旁听证上成功地应 用了二维条码技术,引起了与会代表和新闻界的极大关注;我国香港特别行政区 已将二维条码应用在特别行政区的护n 上1 1 7 。 2 3 3 典型二维条码编码规则与码字结构 本小节主要介绍p d f 4 1 7 码和q r 码,其中p d f 4 1 7 码是具有代表性的堆叠 式二维条码,而q r 码则是有代表性的矩阵式的二维条码,通过分析这两种二维 条码,从中可以发现在设计一种新的码字结构的时候所需要注意的问题。 p d f 4 1 7 二维条码 每个p d f 4 1 7 码字由空白区包围的一系列行组成,其行数为3 9 0 ,每行由 一个起始符,一个左行指示符,1 3 0 个数据字符,右行指示符和终止符组成。 p d f 4 1 7 每个数据字符包括4 个条和4 个空,每个条或者空由1 6 个模块组 成。一个数据符中,4 个条和空的总模块数为1 7 ,所以称为p d f 4 1 7 码。每个数 据符都以深色模块开始,以浅色模块结束。 p d f 4 1 7 码的符号集可以被分为三个相互独立的子集,即三个簇,每个簇均 以不同的条,空形式表示9 2 9 个符号字符值。三个簇的逻辑簇号为0 ,3 ,6 。 识读堆叠式二维条码的主要闯题在于丢失了垂直同步信号,而行编码则解决 了这一问题。一个p d f 4 1 7 码字允许3 9 0 行,每行使用一簇符号字符表示数据, 每三行重复一次,即簇号= 【( 行号) m o d 3 】3 ,如第七行符号的簇号为3 。行 指示符由行号( i ) ,符号行数( 3 到9 0 ) ,每行符号字符个数( 1 到3 0 ) 以及纠 错等级( o 到8 ) 决定。 从对称方面考虑,p d f 4 1 7 码字的起始符和终止符是唯一的,起始符的调控 组合形式是8 1 1 1 1 1 1 3 ,终止符的条空组合形式为7 1 1 3 1 1 1 2 1 。 空白区是指包围在符号四周的不印刷区域,位于起始符之前,终止符之后, 并与第一行以及最后一行相连。水平方向和垂直方向的最小空白区宽度应为2 个模块。 对于一行p d f 4 1 7 而言,符号宽度为9 0 5 8 3 ,即 左空白区( 2 ) 4 - 起始符( 1 7 ) + 左行指示符( 1 7 ) + 数据字符( 1 1 7 ) 4 - 右行指示符( 1 7 ) + 终止符( 1 8 ) + 右空白区( 2 ) = 9 0 左空白区( 2 ) + 起始符( 1 7 ) + 左行指示符( 1 7 ) + 数据字符( 3 2 1 7 ) + 右行指示符( 1 7 ) 4 - 终止符( 1 8 ) + 右空白区( 2 ) = 5 8 3 从存储有效数据的区域来看,左空白区、起始符、终止符、右空白区是用于 标识条码区域和定位条码用的,不含有效数据。左行指示符、数据字符区和右行 复q 大学硕士论文 1 5 适合快速移动识别的语音信息图形编码设计与实现 指示符则存储有效数据。尽管左右行指示符存储的是行信息,而不是真正的有效 用户数据,但是可以认为这只是p d f 4 1 7 编码规则规定这两个区域用来存储行信 息。从码字模式结构和图像识别的角度来看,这两个区域与数据字符区的模式结 构一样,都可以用来存储用户数据,并不是像起始符和终止符一样专门用于图像 模式特征识别0 0 。 q r 二维条码 o r 码是一种矩阵式二维条码,其英语名称是q u i c kr e s p o n s ec o d e 。q r 码 码字一共有4 0 种规格,分别为版本1 ,版本2 ,版本4 0 。版本1 的规格 为2 1 模块 2 1 模块,版本2 的规格为2 5 模块* 2 5 模块,以此类推,每个版本的 码字比前一个版本每边增加4 个模块,直到版本4 0 ,其规格为1 7 7 模块1 7 7 模 块。 寻像图形包括3 个相同的位置探测图形,分别位于码字的左上角,右下角和 左下角。每个位置探测图形可以看作是由3 个重叠的同心的正方形组成,它们分 别为7 * 7 个深色模块,5 * 5 个浅色模块,和3 * 3 个深色模块。位置探测图形的模 块宽度比为1 :1 :3 :1 :1 。码字中其他地方遇到类似图形的可能性极小,因此, 可以在视场中迅速地识别是否是q r 码码字。识别组成寻像图形的3 个位置探测 图形,可以明确地确定视场中码字的位置和方向。 在每个位置探测图形和编码区域之间有宽度为一个模块的分隔符,全部由浅 色模块组成。 水平和垂直定位图形分别为一个模块宽的一行和一列,由深色和浅色模块交 替组成,其开始和结尾都是深色模块。水平定位图形位于上部的两个位置探测图 形之间,码字的第6 行。垂直定位图形位于左侧的两个位置探测图形之间,码字 的第6 列。它们的作用是确定码字的密度和版本,提供决定模块坐标的基准位置 的必要信息。 每个校正图形可以看作3 个重叠的同心正方形,由5 * 5 个深色模块,3 3 个 浅色模块,以及位于中心的1 个深色模块组成。校正图形的数量视码字的版本号 而定。版本1 没有校正图形。版本2 到版本6 有1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论